Mis on t-test?
T-test on statistiline test, mis aitab otsustada, kas kahe rühma keskmised erinevad statistiliselt oluliselt. See on üks kõige levinumaid teste ja seda kasutatakse igas valdkonnas - meditsiinist turunduseni.
Mõtle sellest nii: kahe klassi keskmine riigieksamitulemus erineb 3 punkti võrra. Kas see on tõeline erinevus või võib see olla puhas juhus? T-test aitab vastata.
Millal t-testi kasutada?
- Tahad võrrelda kahe rühma keskmisi
- Andmed on arvulised (mitte kategoorilised)
- Valim on suhteliselt väike (alla 30) VÕI sa ei tea üldkogumi standardhälvet
Kolm tüüpi t-teste
1. Ühevalimimuutujaga t-test (one-sample)
Võrdleb valimi keskmist teadaoleva väärtusega.
Bolt väidab, et keskmine ooteaeg Tallinnas on 4 minutit. Sa kogud andmeid 25 sõidu kohta ja leiad keskmise 5,2 minutit. Kas see erinevus on statistiliselt oluline?
H₀: keskmine = 4 min
H₁: keskmine ≠ 4 min
T-test annab t-statistiku ja p-väärtuse, mis ütlevad, kas erinevus on tõenäoliselt juhuslik.
2. Sõltumatu t-test (independent/two-sample)
Võrdleb KAHE erineva rühma keskmisi.
Kas eesti keele riigieksamitulemused erinevad Tallinna ja Tartu õpilaste vahel?
- Tallinn (n=150): keskmine 67 punkti, standardhälve 14
- Tartu (n=120): keskmine 71 punkti, standardhälve 12
H₀: Tallinna ja Tartu keskmine on sama
H₁: Keskmised erinevad
T-test võrdleb neid kahte rühma, arvestades nii erinevust kui hajuvust.
3. Paariline t-test (paired)
Võrdleb sama rühma tulemusi kahel erineval ajal või tingimusel.
20 õpilast teevad matemaatika testi enne ja pärast uut õppeprogrammi.
- Enne: keskmine 58 punkti
- Pärast: keskmine 65 punkti
H₀: paranemine = 0 (programm ei mõju)
H₁: paranemine > 0 (programm aitab)
Paariline test on võimsam, sest iga õpilane on oma kontrollrühm.
T-statistik
T-statistik mõõdab, kui palju standardvigu on kahe keskmise vahe. Mida suurem t, seda ebatõenäolisem on, et erinevus on juhuslik.
Lihtne valem (ühevalimimuutujaga): t = (valimi keskmine − teadaolev väärtus) / (standardhälve / √n)
Bolti näite: keskmine 5,2, väidetud väärtus 4, standardhälve 2,5, n = 25
t = (5,2 − 4) / (2,5 / √25) = 1,2 / 0,5 = 2,4
t = 2,4 on üsna suur - see viitab, et erinevus ei ole juhuslik.
Vabadusastmed
T-jaotuse kuju sõltub vabadusastmetest (df). Ühevalimimuutujaga testi puhul df = n − 1. Mida rohkem vabadusastmeid, seda lähemal on t-jaotus normaaljaotusele.
T-testi eeldused
- Arvulised andmed: Andmed peavad olema arvulised (mitte kategoorilised)
- Normaaljaotus: Andmed peaksid olema ligikaudu normaalselt jaotunud (vähem oluline suurte valimite puhul)
- Sõltumatus: Vaatlused peavad olema sõltumatud (v.a paariline test)
Tulemuste tõlgendamine
T-testi väljund sisaldab: t-statistikut, vabadusastmeid ja p-väärtust. Otsusta p-väärtuse põhjal:
- p < 0,05 → lükka H₀ tagasi → erinevus on statistiliselt oluline
- p ≥ 0,05 → ära lükka H₀ tagasi → pole piisavalt tõendeid erinevuse jaoks
T-test võrdleb keskmisi ja ütleb, kas erinevus on statistiliselt oluline. Kolm tüüpi: ühevalimimuutujaga (valim vs teadaolev väärtus), sõltumatu (kaks eraldi rühma) ja paariline (sama rühm kahel korral). T-statistik mõõdab erinevust standardvigades. Mida suurem t ja väiksem p-väärtus, seda tugevamad tõendid tõelise erinevuse jaoks.