t-testi alused

Raskusaste: Keskmine Lugemisaeg: 15 minutit

Mis on t-test?

T-test on statistiline test, mis aitab otsustada, kas kahe rühma keskmised erinevad statistiliselt oluliselt. See on üks kõige levinumaid teste ja seda kasutatakse igas valdkonnas - meditsiinist turunduseni.

Erinevus 2.1 5.2 8.3 0

Mõtle sellest nii: kahe klassi keskmine riigieksamitulemus erineb 3 punkti võrra. Kas see on tõeline erinevus või võib see olla puhas juhus? T-test aitab vastata.

Millal t-testi kasutada?

  • Tahad võrrelda kahe rühma keskmisi
  • Andmed on arvulised (mitte kategoorilised)
  • Valim on suhteliselt väike (alla 30) VÕI sa ei tea üldkogumi standardhälvet

Kolm tüüpi t-teste

1. Ühevalimimuutujaga t-test (one-sample)

Võrdleb valimi keskmist teadaoleva väärtusega.

Näide

Bolt väidab, et keskmine ooteaeg Tallinnas on 4 minutit. Sa kogud andmeid 25 sõidu kohta ja leiad keskmise 5,2 minutit. Kas see erinevus on statistiliselt oluline?

H₀: keskmine = 4 min

H₁: keskmine ≠ 4 min

T-test annab t-statistiku ja p-väärtuse, mis ütlevad, kas erinevus on tõenäoliselt juhuslik.

2. Sõltumatu t-test (independent/two-sample)

Võrdleb KAHE erineva rühma keskmisi.

Näide

Kas eesti keele riigieksamitulemused erinevad Tallinna ja Tartu õpilaste vahel?

  • Tallinn (n=150): keskmine 67 punkti, standardhälve 14
  • Tartu (n=120): keskmine 71 punkti, standardhälve 12

H₀: Tallinna ja Tartu keskmine on sama

H₁: Keskmised erinevad

T-test võrdleb neid kahte rühma, arvestades nii erinevust kui hajuvust.

3. Paariline t-test (paired)

Võrdleb sama rühma tulemusi kahel erineval ajal või tingimusel.

Näide

20 õpilast teevad matemaatika testi enne ja pärast uut õppeprogrammi.

  • Enne: keskmine 58 punkti
  • Pärast: keskmine 65 punkti

H₀: paranemine = 0 (programm ei mõju)

H₁: paranemine > 0 (programm aitab)

Paariline test on võimsam, sest iga õpilane on oma kontrollrühm.

T-statistik

T-statistik mõõdab, kui palju standardvigu on kahe keskmise vahe. Mida suurem t, seda ebatõenäolisem on, et erinevus on juhuslik.

Lihtne valem (ühevalimimuutujaga): t = (valimi keskmine − teadaolev väärtus) / (standardhälve / √n)

Näide

Bolti näite: keskmine 5,2, väidetud väärtus 4, standardhälve 2,5, n = 25

t = (5,2 − 4) / (2,5 / √25) = 1,2 / 0,5 = 2,4

t = 2,4 on üsna suur - see viitab, et erinevus ei ole juhuslik.

Vabadusastmed

T-jaotuse kuju sõltub vabadusastmetest (df). Ühevalimimuutujaga testi puhul df = n − 1. Mida rohkem vabadusastmeid, seda lähemal on t-jaotus normaaljaotusele.

-3 -2 -1 0 1 2 3

T-testi eeldused

  • Arvulised andmed: Andmed peavad olema arvulised (mitte kategoorilised)
  • Normaaljaotus: Andmed peaksid olema ligikaudu normaalselt jaotunud (vähem oluline suurte valimite puhul)
  • Sõltumatus: Vaatlused peavad olema sõltumatud (v.a paariline test)

Tulemuste tõlgendamine

T-testi väljund sisaldab: t-statistikut, vabadusastmeid ja p-väärtust. Otsusta p-väärtuse põhjal:

  • p < 0,05 → lükka H₀ tagasi → erinevus on statistiliselt oluline
  • p ≥ 0,05 → ära lükka H₀ tagasi → pole piisavalt tõendeid erinevuse jaoks
Peатükk

T-test võrdleb keskmisi ja ütleb, kas erinevus on statistiliselt oluline. Kolm tüüpi: ühevalimimuutujaga (valim vs teadaolev väärtus), sõltumatu (kaks eraldi rühma) ja paariline (sama rühm kahel korral). T-statistik mõõdab erinevust standardvigades. Mida suurem t ja väiksem p-väärtus, seda tugevamad tõendid tõelise erinevuse jaoks.