Graficzne badanie normalności rozkładu

W niniejszym artkule przedstawione zostały dwa bardzo podobne do siebie narzędzia graficzne służące do oceny zgodności rozkładu empirycznego z teoretycznym rozkładem normalnym:
- Wykres Kwantyl-Kwantyl (ang. Quantile–Quantile plot).
- Graficzny test normalności zgodnie z normą PN-ISO 5479:2002.
Obliczania i wykresy przygotowano w programie MS Excel i Minitab.
Wykres Kwantyl-Kwantyl (QQ plot)
Wykres QQ to graficzna prezentacja porównania dwóch rozkładów prawdopodobieństwa, w tym przypadku empirycznej próby z teoretycznym rozkładem normalnym, poprzez porównanie ich kwantyli na układzie współrzędnych.
Na oś Y najczęściej nanoszone są kwantyle empiryczne natomiast na oś X kwantyle rozkładu teoretycznego (choć może być odwrotnie). Jeżeli rozkłady są do siebie podobne, to pomiary rozkładać się będą wzdłuż linii y=x.
Na Rys. 1 przedstawiono dane i obliczenia, na podstawie których przygotowano wykres Kwantyl-Kwantyl (Rys.2).

Wyjaśnienie tabeli z Rys. 1.:
W kolumnie A znajdują się pomiary empiryczne badanej cechy jakościowej. Do kolumny B skopiowano pomiary empiryczne a następnie posortowano rosnąco. W kolumnie C wprowadzono rangę kolejnego pomiaru. Ponieważ liczność próbki n wynosi 20 elementów, rangowanie kończy się na tej właśnie wartości.
W kolumnie D policzono prawdopodobieństwo dla rangi wg wzoru (1):

Do komórki D3 wprowadzono formułę: =(C2-0,5)/ILE.LICZB($A$2:$A$21) a następnie skopiowano aż do komórki D21. W kolumnie E policzono kwantyle teoretyczne rozkładu normalnego, w związku z czym do komórki E2 wprowadzono formułę: =ROZKŁAD.NORMALNY.S.ODW(D2)
Ostatnim zabiegiem było obliczenie kwantyli empirycznych na podstawie sortowanych pomiarów z kolumny B. W tym celu policzono wartość znormalizowaną wg wzoru (2):

Do komórki F2 wprowadzono formułę: =NORMALIZUJ(B2;ŚREDNIA($B$2:$B$21);ODCH.STANDARDOWE($B$2:$B$21)) a następnie kopiowano aż do komórki F21.
Na Rys. 2 przedstawiono wykres przygotowany na podstawie danych z kolumn E i F.

Ponieważ niebieskie punkty (znormalizowane pomiary empiryczne) rozkładają się wzdłuż prostej (teoretyczny rozkład normalny), to można przyjąć, że dane z kolumny A rozkładają się zgodnie z rozkładem normalnym.
Bardzo dobrym uzupełnieniem analizy graficznej jest wykonanie analitycznego testu normalności np.: Shapiro-Wilka czy Andersona-Darlinga.
Graficzny test normalności zgodnie z normą PN-ISO 5479:2002.
Postępowanie przy konstruowaniu tego wykresu w programie MS Excel jest bardzo podobne jak w przypadku wykresu QQ, z tym że do wyliczenia prawdopodobieństwa dla rangi wykorzystywany jest wzór (3).

Jeżeli chcesz otrzymać plik z kalkulatorem tego testu w programie MS Excel to napisz do nas na adres biuro@pstconsulting.pl a plik wyślemy Ci mailem zwrotnym.
Test ten przygotować można w programie Minitab.
Idąc ścieżką Stat > Basic Statistics > Normality Test wprowadza się dane do okna Variable i wybiera przycisk OK. Po wykonaniu tej procedury otrzymuje się wykres jak na Rys. 3.

Ponieważ niebieskie punkty rozkładają się wzdłuż prostej (teoretyczny rozkład normalny), to można przyjąć, że dane rozkładają się zgodnie z rozkładem normalnym. Dodatkowo, automatycznie wykonany został analityczny test normalności rozkładu, w tym przypadku test Andersona-Darlinga.
Na podstawie wyniku obliczeń (p-value 0,995>alfa0,05) przyjęto hipotezę zerową, stanowiącą że rozkład empiryczny (pomiary) jest zgodny z teoretycznym rozkładem normalnym.
Podsumowanie
Określenie rozkładu populacji, z której pobrano dane (wykonano pomiary) w formie próby losowej w wielu aspektach prowadzenia analiz statystycznych np. do celów SPC, DoE jest kluczowym etapem analizy.
W wyniku analizy rozkładu dokonuje się wyboru konkretnych i najkorzystniejszych technik i testów statystycznych. W przypadku braku dostępu do programu Minitab, z powodzeniem można wykorzystać program MS Excel do wykonani obliczeń i oceny rozkładu danych.
.
Autor: dr inż. Rafał Popiel
Jeżeli artykuł Ci się podobał, to udostępnij go w mediach społecznościowych:
Zaufali nam:
.
Co mówią nasi zadowoleni Klienci:
.