What are non-parametric tests?

Non-parametric tests make fewer assumptions about data distribution and are used when data is skewed, ordinal, or violates normality assumptions.

When should you use non-parametric tests?

Use them when your data is not normally distributed, has outliers, is ordinal, or when sample sizes are very small.

What is the Mann-Whitney U test?

The Mann-Whitney U test is a non-parametric alternative to the independent t-test that compares two groups using ranked data instead of means.

What is the difference between parametric and non-parametric tests?

Parametric tests assume specific distributions (usually normal) and use means. Non-parametric tests use ranks and make fewer assumptions.

Testy nieparametryczne

Gdy założenia normalności zawodzą

Wiele najpopularniejszych testów statystycznych, jak test t i ANOVA, zakłada, że dane pochodzą z rozkładu normalnego. Zakładają też, że dane są mierzone na skali interwałowej lub ilorazowej i że wariancje są w przybliżeniu równe między grupami. Te założenia sprawdzają się przez większość czasu, ale co się dzieje, gdy nie są spełnione?

Dane ze świata rzeczywistego są często skośne, mają wartości odstające lub przybierają formę rang albo kategorii porządkowych. Oceny satysfakcji na skali 1-5, dane o dochodach z ekstremalnymi zarobkami lub czasy reakcji z długim prawym ogonem -- wszystko to narusza założenia normalności. Zastosowanie testu t do silnie skośnych danych może dać mylące wartości p i niewiarygodne wnioski. Testy nieparametryczne stanowią solidną alternatywę.

Spójrz na wykres punktowy powyżej. Te dane mają wyraźną prawostronną skośność. Test t na takich danych mógłby być niewiarygodny. Metody nieparametryczne radzą sobie z tym elegancko, ponieważ pracują z rangami zamiast surowych wartości, co czyni je odpornymi na wartości odstające i skośność.

Podejście oparte na rangach

Główna idea większości testów nieparametrycznych jest prosta: zamiast analizować rzeczywiste wartości danych, zamieniasz je na rangi. Najmniejsza wartość otrzymuje rangę 1, następna rangę 2 itd. Następnie przeprowadzasz analizę na rangach.

Dlaczego to działa? Rangi zachowują kolejność danych bez wpływu odległości między wartościami. Niezależnie od tego, czy najwyższa wartość to 50 czy 5000, nadal otrzymuje najwyższą rangę. Kompromisem jest utrata pewnych informacji, dlatego testy nieparametryczne są generalnie mniej czułe niż ich parametryczne odpowiedniki, gdy założenia testu parametrycznego są faktycznie spełnione.

Test Manna-Whitneya U

Test Manna-Whitneya U (znany też jako test sumy rang Wilcoxona) jest nieparametryczną alternatywą dla testu t dla prób niezależnych. Stosuj go, gdy chcesz porównać dwie niezależne grupy, ale dane nie mają rozkładu normalnego, próba jest mała lub dane są porządkowe.

Przykład

Restauracja chce porównać oceny satysfakcji klientów (w skali 1-10) między obsługą lunchową i kolacyjną. Oceny nie mają rozkładu normalnego, a skala jest prawdopodobnie porządkowa. Test Manna-Whitneya ranguje wszystkie oceny razem, a następnie sprawdza, czy rangi jednej grupy mają tendencję do bycia wyższymi. Jeśli klienci lunchowi konsekwentnie otrzymują wyższe rangi, test pokaże istotną różnicę.

Test Manna-Whitneya faktycznie testuje, czy jedna grupa ma tendencję do produkowania większych wartości. Często opisuje się go jako porównanie median, co jest użytecznym uproszczeniem, choć technicznie porównuje całe rozkłady. Jest jednym z najczęściej stosowanych testów nieparametrycznych w badaniach medycznych i społecznych.

Test rang ze znakiem Wilcoxona

Test rang ze znakiem Wilcoxona jest nieparametryczną alternatywą dla sparowanego testu t. Stosuj go, gdy masz dwa powiązane pomiary od tych samych osób, jak wyniki przed i po, ale różnice nie mają rozkładu normalnego.

Test oblicza różnicę dla każdej pary, ranguje wartości bezwzględne różnic, a następnie porównuje sumę rang dla różnic dodatnich z sumą dla ujemnych. Jeśli leczenie naprawdę ma efekt, oczekujesz, że różnice dodatnie (lub ujemne) będą miały systematycznie wyższe rangi.

Na przykład, jeśli mierzysz poziomy bólu u 20 pacjentów przed i po nowej terapii, a poprawa nie jest symetrycznie rozłożona, test rang ze znakiem Wilcoxona da bardziej wiarygodną odpowiedź niż sparowany test t. Jest szczególnie powszechny w badaniach klinicznych z małymi próbami.

Test Kruskala-Wallisa

Test Kruskala-Wallisa rozszerza podejście Manna-Whitneya na trzy lub więcej niezależnych grup. Jest nieparametryczną alternatywą dla jednoczynnikowej ANOVA. Wszystkie obserwacje ze wszystkich grup są rangowane razem, a test sprawdza, czy średnie rangi różnią się istotnie między grupami.

Podobnie jak ANOVA, istotny wynik Kruskala-Wallisa mówi ci, że przynajmniej jedna grupa różni się, ale nie mówi, która. Następnie stosujesz test post-hoc (taki jak test Dunna) do porównań parami.

Przykład

Firma testuje trzy projekty stron i zbiera wyniki zaangażowania użytkowników. Wyniki są silnie skośne. Test Kruskala-Wallisa porównuje trzy projekty bez wymagania rozkładu normalnego. Jeśli wynik jest istotny, firma kontynuuje porównaniami parami.

Kiedy sięgać po testy nieparametryczne

Stosuj testy nieparametryczne, gdy dane są porządkowe, próba jest bardzo mała, dane są wyraźnie skośne lub zawierają wpływowe wartości odstające, albo gdy założenia parametrycznego odpowiednika nie mogą być spełnione. Są też właściwym wyborem przy bezpośredniej analizie rang.

Nie stosuj testów nieparametrycznych tylko dlatego, że wydają się bezpieczniejsze. Gdy dane w rozsądnym stopniu spełniają założenia parametryczne, testy parametryczne są bardziej czułe. Idealne podejście to najpierw sprawdzenie założeń, a następnie wybór odpowiedniego testu.

W praktyce wielu badaczy raportuje zarówno wyniki parametryczne, jak i nieparametryczne, gdy założenia są graniczne. Jeśli oba testy prowadzą do tego samego wniosku, możesz mieć większą pewność. Jeśli się różnią, wynik nieparametryczny jest ogólnie uważany za bardziej wiarygodny.

Kluczowy wniosek

Testy nieparametryczne są twoją siatką bezpieczeństwa, gdy dane nie mają rozkładu normalnego, zawierają wartości odstające lub są mierzone na skali porządkowej. Test Manna-Whitneya U porównuje dwie niezależne grupy, test rang ze znakiem Wilcoxona porównuje pomiary sparowane, a test Kruskala-Wallisa porównuje trzy lub więcej grup. Działają analizując rangi zamiast surowych wartości, co czyni je odpornymi, ale nieco mniej czułymi niż testy parametryczne, gdy normalność jest spełniona.