Test Shapiro-Wilka – badanie normalności rozkładu w programie MS Excel

Test Shapiro-Wilka – badanie normalności rozkładu w programie MS Excel

W praktyce bardzo często zdarza się, że ze względu na wysoki koszt analizy (koszt eksperymentu prowadzonego na wyrobie) powstaje potrzeba dokonania weryfikacji zgodności rozkładu danych z rozkładem normalnym dla próby o niewielkiej liczebności.
Wśród wielu testów weryfikujących zgodność rozkładów empirycznych z teoretycznymi, uwadze należy poddać test zgodności Shapiro-Wilka. Test ten uważany jest za jeden z najmocniejszych testów badających normalność rozkładu, szczególnie w przypadku badania prób „małolicznych”.
Test służy do weryfikacji hipotezy o tym, że rozkład badanej zmiennej losowej jest zgodny z rozkładem normalnym.
Weryfikacji hipotezy zerowej dokonuje się na podstawie obliczonej wartości statystyki W:

Gdzie:

  • Xn-i+1-Xi to rozstępy rzędu „i”.
  • Współczynniki ai(n) to stałe zależne od „i” oraz od liczebności próby „n”. Współczynniki odczytuje się z tablic, które opracowane zostały przez autorów testu.

Po obliczeniu statystyki testowej W, dokonuje się sprawdzenia, czy jej wartość znajduje się w przyjętym obszarze krytycznym. Dwustronny obszar krytyczny wyznaczają wartości W(α/2, n) i W(1-α/2, n). Wartości odczytuje się z tablic rozkładu W.

Hipoteza zerowa zakładająca, że rozkład danych jest normalny zostaje odrzucana w sytuacji, w której wartość statystyki W znajduje się w obszarze krytycznym w dwóch wariantach:

  • W ≥ W(1-α/2, n)
  • W ≤ W(α/2, n)

Jeżeli jednak wartość statystyki W znajduje się poza obszarem krytycznym, należy przyjąć hipotezę zerową (H0) i stwierdzić zgodność rozkładu empirycznego z rozkładem normalnym.

Przykład wykorzystania testu

Inżynier procesu w celu wykonania analizy wytrzymałości jednego z połączeń gwintowych podzespołu silnika spalinowego (głowicy silnika), dokonał analizy rozkładu danych momentu uplastycznienia połączenia (moment, w którym połączenie gwintowe zaczyna „płynąć”, czyli zanika zależność liniowa pomiędzy kątem obrotu a momentem dokręcania).

Ze względu na wysoki koszt głowicy silnika, analiza mogła zostać przeprowadzona tylko z użyciem 10 sztuk elementu. Na Rys.1. przedstawiono obliczenia wykonane z wykorzystaniem powyższego wzoru.

Rys.1. Obliczenia testu zgodności Shapiro-Wilka.

Wyjaśnienie Rys.1.:

  • W kolumnie B znajdują się pomiary uzyskanie w ramach analizy wytrzymałości 10 połączeń gwintowych.
  • Kolumna C zawiera uporządkowane malejąco pomiary wytrzymałości.
  • Zakres kolumn D i E to dane przygotowane do policzenia różnic pomiędzy pomiarami. Różnice policzono w kolumnie F.
  • Do kolumny D wprowadzono wartości współczynników ai(n) odczytane z tablic statystycznych.
  • Komórka C13 zawiera policzony licznik wzoru, natomiast komórka C14 mianownik. Wykorzystywane funkcje MS Excela przedstawiono w komórkach D13 i D14.
  • Obliczona w ten sposób wartość statystyki W znajduje się w komórce C15.
  • Komórki C18 i C19 zawierają wartości krytyczne odczytane z tablic dla liczebności n10 i poziomu istotności statystycznej α0,05. Wartości obliczone dla wnioskowania dwustronnego.

Wniosek:

Ponieważ wartość statystyki W znalazła się poza obszarem krytycznym:

W(α/2,10) < W < W(1-α/2,10), czyli 0,816 < 0,945 < 0,982,

Stwierdzono brak podstaw do odrzucenia hipotezy zerowej. Przyjęto, że rozkład pomiarów uplastycznienia połączenia gwintowego jest zgodny z rozkładem normalnym.

Na tej podstawie Inżynier podjął decyzję, że do dalszej obróbki statystycznej danych, wykorzysta statystyki i testy parametryczne.

Podsumowanie:

Określenie rozkładu populacji, z której pobierano dane w formie próby losowej, w wielu aspektach prowadzenia analiz statystycznych np. do celów SPC, DoE jest kluczowym etapem obliczeń. W wyniku analizy rozkładu dokonuje się wyboru konkretnych i najkorzystniejszych technik i testów statystycznych. W przypadku braku dostępu do programu Minitab, z powodzeniem można wykorzystać program MS Excel do oceny rozkładu danych.

Jeżeli jesteś zainteresowany otrzymaniem pliku MS Excel, który zawiera test Shapiro-Wilka i niezbędne tablice statystyczne napisz do nas na adres: rafal.popiel@pstconsulting.pl

Plik odeślemy na Twój adres.


Zapisz się do newsletter'a

Podając adres e-mail wyrażam zgodę na otrzymywanie informacji zwrotnych.
Więcej na temat naszej Polityki Prywatności