Mis on hii-ruut test?
Hii-ruut test (χ²) on statistiline test kategooriliste andmete jaoks. Kui t-test võrdleb keskmisi, siis hii-ruut test võrdleb sagedusi - kui tihti midagi juhtub võrreldes sellega, mida ootaksid.
Kasuta hii-ruut testi, kui su andmed on kategooriad (jah/ei, punane/sinine/roheline, eesti/vene/inglise), mitte numbrid.
Kaks tüüpi hii-ruut teste
1. Sobivuse test (goodness-of-fit)
Kontrollib, kas vaadeldud sagedused vastavad oodatud sagedustele.
Täringut visatakse 60 korda. Kui täring on aus, peaks iga number tulema umbes 10 korda.
Tegelikud tulemused: 1→8, 2→12, 3→9, 4→11, 5→7, 6→13
H₀: Täring on aus (kõik numbrid on võrdselt tõenäolised)
H₁: Täring ei ole aus
Hii-ruut test võrdleb tegelikke sagedusi oodatud sagedustega (10 igaühele).
2. Sõltumatuse test (test of independence)
Kontrollib, kas kaks kategoorilist muutujat on omavahel seotud.
Kas Bolt sõidu transport (auto, buss, jalgratas) sõltub linnast (Tallinn, Tartu)?
| Auto | Buss | Jalgratas | |
|---|---|---|---|
| Tallinn | 150 | 80 | 20 |
| Tartu | 90 | 40 | 45 |
H₀: Transpordivalik EI sõltu linnast
H₁: Transpordivalik sõltub linnast
Tartu elanikud sõidavad rohkem jalgrattaga - aga kas see erinevus on statistiliselt oluline?
Kuidas hii-ruut test toimib
Test võrdleb vaadeldud sagedusi (mida tegelikult nähti) oodatud sagedustega (mida näeksid, kui H₀ kehtiks).
Valem: χ² = Σ (vaadeldud − oodatud)² / oodatud
Iga kategooria jaoks: arvuta erinevus tegeliku ja oodatud vahel, võta ruutu ja jaga oodatuga. Liida kokku.
Täringunäite jätk:
Number 1: (8−10)²/10 = 4/10 = 0,4
Number 2: (12−10)²/10 = 4/10 = 0,4
Number 3: (9−10)²/10 = 1/10 = 0,1
Number 4: (11−10)²/10 = 1/10 = 0,1
Number 5: (7−10)²/10 = 9/10 = 0,9
Number 6: (13−10)²/10 = 9/10 = 0,9
χ² = 0,4+0,4+0,1+0,1+0,9+0,9 = 2,8
Vabadusastmed: 6−1 = 5. Kriitiline väärtus (α=0,05): 11,07
Kuna 2,8 < 11,07, ei lükka H₀ tagasi. Täring näib aus olevat.
Hii-ruut testi eeldused
- Andmed on kategoorilised (sagedused, mitte protsendid)
- Vaatlused on sõltumatud
- Iga lahtri oodatud sagedus peaks olema vähemalt 5
Praktiline näide: küsitlusandmed
E-residentsuse programm uurib, kas rahulolu e-teenustega sõltub riigist:
| Rahul | Neutraalne | Rahulolematu | |
|---|---|---|---|
| Euroopa | 120 | 30 | 10 |
| Aasia | 85 | 40 | 25 |
| Ameerika | 60 | 20 | 15 |
Hii-ruut test kontrollib, kas rahulolu jaotus erineb regioonide lõikes. Kui p < 0,05, järeldame, et rahulolu sõltub regioonist.
Hii-ruut vs t-test
- T-test: võrdleb keskmisi (arvulised andmed)
- Hii-ruut: võrdleb sagedusi (kategoorilised andmed)
Kui su andmed on "mitu inimest valis variandi A vs B", kasuta hii-ruut testi. Kui su andmed on "milline oli rühma A ja B keskmine skoor", kasuta t-testi.
Hii-ruut test on mõeldud kategooriliste andmete jaoks. See võrdleb vaadeldud sagedusi oodatud sagedustega. Sobivuse test kontrollib, kas andmed vastavad oodatud jaotusele. Sõltumatuse test kontrollib, kas kaks kategoorilist muutujat on seotud. Mida suurem χ² väärtus, seda rohkem erinevad andmed oodatust.