Hii-ruut test

Raskusaste: Keskmine Lugemisaeg: 12 minutit

Mis on hii-ruut test?

Hii-ruut test (χ²) on statistiline test kategooriliste andmete jaoks. Kui t-test võrdleb keskmisi, siis hii-ruut test võrdleb sagedusi - kui tihti midagi juhtub võrreldes sellega, mida ootaksid.

30 A 25 B 28 C 17 D

Kasuta hii-ruut testi, kui su andmed on kategooriad (jah/ei, punane/sinine/roheline, eesti/vene/inglise), mitte numbrid.

Kaks tüüpi hii-ruut teste

1. Sobivuse test (goodness-of-fit)

Kontrollib, kas vaadeldud sagedused vastavad oodatud sagedustele.

Näide

Täringut visatakse 60 korda. Kui täring on aus, peaks iga number tulema umbes 10 korda.

Tegelikud tulemused: 1→8, 2→12, 3→9, 4→11, 5→7, 6→13

H₀: Täring on aus (kõik numbrid on võrdselt tõenäolised)

H₁: Täring ei ole aus

Hii-ruut test võrdleb tegelikke sagedusi oodatud sagedustega (10 igaühele).

2. Sõltumatuse test (test of independence)

Kontrollib, kas kaks kategoorilist muutujat on omavahel seotud.

Näide

Kas Bolt sõidu transport (auto, buss, jalgratas) sõltub linnast (Tallinn, Tartu)?

AutoBussJalgratas
Tallinn1508020
Tartu904045

H₀: Transpordivalik EI sõltu linnast

H₁: Transpordivalik sõltub linnast

Tartu elanikud sõidavad rohkem jalgrattaga - aga kas see erinevus on statistiliselt oluline?

Kuidas hii-ruut test toimib

Test võrdleb vaadeldud sagedusi (mida tegelikult nähti) oodatud sagedustega (mida näeksid, kui H₀ kehtiks).

Valem: χ² = Σ (vaadeldud − oodatud)² / oodatud

Iga kategooria jaoks: arvuta erinevus tegeliku ja oodatud vahel, võta ruutu ja jaga oodatuga. Liida kokku.

Näide

Täringunäite jätk:

Number 1: (8−10)²/10 = 4/10 = 0,4

Number 2: (12−10)²/10 = 4/10 = 0,4

Number 3: (9−10)²/10 = 1/10 = 0,1

Number 4: (11−10)²/10 = 1/10 = 0,1

Number 5: (7−10)²/10 = 9/10 = 0,9

Number 6: (13−10)²/10 = 9/10 = 0,9

χ² = 0,4+0,4+0,1+0,1+0,9+0,9 = 2,8

Vabadusastmed: 6−1 = 5. Kriitiline väärtus (α=0,05): 11,07

Kuna 2,8 < 11,07, ei lükka H₀ tagasi. Täring näib aus olevat.

Hii-ruut testi eeldused

  • Andmed on kategoorilised (sagedused, mitte protsendid)
  • Vaatlused on sõltumatud
  • Iga lahtri oodatud sagedus peaks olema vähemalt 5

Praktiline näide: küsitlusandmed

Näide

E-residentsuse programm uurib, kas rahulolu e-teenustega sõltub riigist:

30 Vaatl A 25 Oodat A 15 Vaatl B 25 Oodat B 35 Vaatl C 25 Oodat C 20 Vaatl D 25 Oodat D
RahulNeutraalneRahulolematu
Euroopa1203010
Aasia854025
Ameerika602015

Hii-ruut test kontrollib, kas rahulolu jaotus erineb regioonide lõikes. Kui p < 0,05, järeldame, et rahulolu sõltub regioonist.

Hii-ruut vs t-test

  • T-test: võrdleb keskmisi (arvulised andmed)
  • Hii-ruut: võrdleb sagedusi (kategoorilised andmed)

Kui su andmed on "mitu inimest valis variandi A vs B", kasuta hii-ruut testi. Kui su andmed on "milline oli rühma A ja B keskmine skoor", kasuta t-testi.

Peатükk

Hii-ruut test on mõeldud kategooriliste andmete jaoks. See võrdleb vaadeldud sagedusi oodatud sagedustega. Sobivuse test kontrollib, kas andmed vastavad oodatud jaotusele. Sõltumatuse test kontrollib, kas kaks kategoorilist muutujat on seotud. Mida suurem χ² väärtus, seda rohkem erinevad andmed oodatust.