Graficzne badanie normalności rozkładu

Graficzne badanie normalności rozkładu

W niniejszym artkule przedstawione zostały dwa bardzo podobne do siebie narzędzia graficzne służące do oceny zgodności rozkładu empirycznego z teoretycznym rozkładem normalnym:

  1. Wykres Kwantyl-Kwantyl (ang. Quantile–Quantile plot).
  2. Graficzny test normalności zgodnie z normą PN-ISO 5479:2002.

Obliczania i wykresy przygotowano w programie MS Excel i Minitab.

Wykres Kwantyl-Kwantyl (QQ plot)

Wykres QQ to graficzna prezentacja porównania dwóch rozkładów prawdopodobieństwa, w tym przypadku empirycznej próby z teoretycznym rozkładem normalnym, poprzez porównanie ich kwantyli na układzie współrzędnych.

Na oś Y najczęściej nanoszone są kwantyle empiryczne natomiast na oś X kwantyle rozkładu teoretycznego (choć może być odwrotnie). Jeżeli rozkłady są do siebie podobne, to pomiary rozkładać się będą wzdłuż linii y=x.

Na Rys. 1 przedstawiono dane i obliczenia, na podstawie których przygotowano wykres Kwantyl-Kwantyl (Rys.2).

Rys. 1. Dane i obliczenia do przygotowania wykresu Kwantyl-Kwantyl.

Wyjaśnienie tabeli z Rys. 1.:

W kolumnie A znajdują się pomiary empiryczne badanej cechy jakościowej. Do kolumny B skopiowano pomiary empiryczne a następnie posortowano rosnąco. W kolumnie C wprowadzono rangę kolejnego pomiaru. Ponieważ liczność próbki n wynosi 20 elementów, rangowanie kończy się na tej właśnie wartości.

W kolumnie D policzono prawdopodobieństwo dla rangi wg wzoru (1):

Do komórki D3 wprowadzono formułę: =(C2-0,5)/ILE.LICZB($A$2:$A$21) a następnie skopiowano aż do komórki D21. W kolumnie E policzono kwantyle teoretyczne rozkładu normalnego, w związku z czym do komórki E2 wprowadzono formułę: =ROZKŁAD.NORMALNY.S.ODW(D2)

Ostatnim zabiegiem było obliczenie kwantyli empirycznych na podstawie sortowanych pomiarów z kolumny B. W tym celu policzono wartość znormalizowaną wg wzoru (2):

Do komórki F2 wprowadzono formułę: =NORMALIZUJ(B2;ŚREDNIA($B$2:$B$21);ODCH.STANDARDOWE($B$2:$B$21)) a następnie kopiowano aż do komórki F21.

Na Rys. 2 przedstawiono wykres przygotowany na podstawie danych z kolumn E i F.

Rys. 2. Wykres kwantyl-kwantyl.

Ponieważ niebieskie punkty (znormalizowane pomiary empiryczne) rozkładają się wzdłuż prostej (teoretyczny rozkład normalny), to można przyjąć, że dane z kolumny A rozkładają się zgodnie z rozkładem normalnym.

Bardzo dobrym uzupełnieniem analizy graficznej jest wykonanie analitycznego testu normalności np.: Shapiro-Wilka czy Andersona-Darlinga.

Graficzny test normalności zgodnie z normą PN-ISO 5479:2002.

Postępowanie przy konstruowaniu tego wykresu w programie MS Excel jest bardzo podobne jak w przypadku wykresu QQ, z tym że do wyliczenia prawdopodobieństwa dla rangi wykorzystywany jest wzór (3).

Jeżeli chcesz otrzymać plik z kalkulatorem tego testu w programie MS Excel to napisz do nas na adres biuro@pstconsulting.pl a plik wyślemy Ci mailem zwrotnym.

Test ten przygotować można w programie Minitab.

Idąc ścieżką Stat > Basic Statistics > Normality Test wprowadza się dane do okna Variable i wybiera przycisk OK. Po wykonaniu tej procedury otrzymuje się wykres jak na Rys. 3.

Rys. 3. Graficzny test normalności zgodnie z normą PN-ISO 5479:2002. Minitab.

Ponieważ niebieskie punkty rozkładają się wzdłuż prostej (teoretyczny rozkład normalny), to można przyjąć, że dane rozkładają się zgodnie z rozkładem normalnym. Dodatkowo, automatycznie wykonany został analityczny test normalności rozkładu, w tym przypadku test Andersona-Darlinga.

Na podstawie wyniku obliczeń (p-value 0,995>alfa0,05) przyjęto hipotezę zerową, stanowiącą że rozkład empiryczny (pomiary) jest zgodny z teoretycznym rozkładem normalnym.

Podsumowanie

Określenie rozkładu populacji, z której pobrano dane (wykonano pomiary) w formie próby losowej w wielu aspektach prowadzenia analiz statystycznych np. do celów SPC, DoE jest kluczowym etapem analizy.

W wyniku analizy rozkładu dokonuje się wyboru konkretnych i najkorzystniejszych technik i testów statystycznych. W przypadku braku dostępu do programu Minitab, z powodzeniem można wykorzystać program MS Excel do wykonani obliczeń i oceny rozkładu danych.

.

Autor: dr inżRafał Popiel

Jeżeli artykuł Ci się podobał, to udostępnij go w mediach społecznościowych:

Zaufali nam:

.

Co mówią nasi zadowoleni Klienci:

.

W przypadku pytań zapraszamy do kontaktu: