Hüpoteeside testimine

Raskusaste: Keskmine Lugemisaeg: 15 minutit

Mis on hüpotees?

Hüpotees on oletus või väide, mida saab andmetega kontrollida. Hüpoteesi testimine on protsess, kus kasutad andmeid, et otsustada, kas oletus on tõenäoliselt õige või vale.

-3 -2 -1 0 1 2 3

Mõtle sellest kui kohtupidamisest: süüdistatav on süütu, kuni tõendid näitavad teisiti. Statistikas alustame eeldusest, et "midagi ei ole muutunud" ja vaatame, kas andmed räägivad muud.

Kaks hüpoteesi

Nullhüpotees (H₀)

Vaikimisi oletus - "midagi ei ole muutunud", "vahet ei ole", "mõju puudub". See on nagu "süütu" kohtus.

Alternatiivne hüpotees (H₁ või Hₐ)

See, mida sa tegelikult tahad tõestada - "on muutus", "on vahe", "on mõju".

Näide

Tartu Ülikool uurib, kas uus õppemeetod parandab õpilaste tulemusi.

  • H₀: Uus meetod EI paranda tulemusi (keskmine on sama kui vana meetodiga)
  • H₁: Uus meetod parandab tulemusi (keskmine on kõrgem)

Andmed peavad andma piisavalt tõendeid, et lükata tagasi H₀.

Testimise sammud

  1. Seadista hüpoteesid (H₀ ja H₁)
  2. Vali olulisuse tase (tavaliselt α = 0,05 ehk 5%)
  3. Kogu andmed ja arvuta teststatistik
  4. Arvuta p-väärtus (sellest rohkem järgmises tunnis)
  5. Tee otsus: kui p-väärtus < α, lükka H₀ tagasi

Olulisuse tase (α)

Olulisuse tase on künnis, mille sa ise valid - see määrab, kui tugevaid tõendeid nõuad enne otsuse tegemist. Kõige levinum on α = 0,05, mis tähendab: "ma aktsepteerin 5% tõenäosust, et eksin."

Tulemus 0.5 2.3 4.1 0
Näide

Eesti ravimiamet hindab uut ravimit. Nad valivad α = 0,01 (1%), sest meditsiinis on vigade tagajärjed tõsised. Mida väiksem α, seda tugevamaid tõendeid nõutakse.

Kaks tüüpi vigu

I tüüpi viga (valepositiivne)

Lükad H₀ tagasi, kuigi see on tegelikult õige. Arvad, et mõju on, aga seda tegelikult ei ole. Tõenäosus: α.

-3 -2 -1 0 1 2 3

II tüüpi viga (valenegatiivne)

Ei lükka H₀ tagasi, kuigi see on tegelikult vale. Mõju on olemas, aga sa ei leidnud seda. Tõenäosus: β.

Näide

Pettuste tuvastamise süsteem Wise's:

  • I tüüpi viga: Seaduslik ülekanne märgitakse pettuseks → klient on nördinud, aga raha on kaitstud
  • II tüüpi viga: Tegelik pettus jääb avastamata → raha läheb kaotsi

Kumba viga on hullem? See sõltub kontekstist. Finantsis on II tüüpi viga tihti kulukam.

Statistiline vs praktiline olulisus

"Statistiliselt oluline" ei tähenda alati "oluline päriselus". Väga suure valimiga võib avastada statistiliselt olulisi, aga praktiliselt tähtsuseta erinevusi.

Näide

Uuring leiab, et uus õpperakendus parandab riigieksamitulemusi statistiliselt oluliselt - keskmine tõus on 0,3 punkti. Aga 0,3 punkti 100-st? Praktiliselt on see tühine. Statistiline olulisus ei tähenda automaatselt, et tulemus on sisuliselt tähtsusrikas.

Näide: täielik testimine

Näide

Bolt väidab, et nende keskmine ooteaeg Tallinnas on 5 minutit. Sa kahtlustad, et see on pikem.

H₀: keskmine ooteaeg = 5 minutit

H₁: keskmine ooteaeg > 5 minutit

α = 0,05

Kogud andmed 100 sõidu kohta. Keskmine ooteaeg: 5,8 minutit, standardhälve: 2,5 minutit.

Arvutad teststatistiku ja saad p-väärtuse 0,0007.

Kuna 0,0007 < 0,05, lükad H₀ tagasi. Järeldus: andmed näitavad, et keskmine ooteaeg on statistiliselt oluliselt pikem kui 5 minutit.

Peатükk

Hüpoteesi testimine on protsess, kus kontrollid oletust andmetega. Alusta nullhüpoteesiga (mõju puudub), kogu andmed, arvuta p-väärtus ja võrdle olulisuse tasemega. Kui p < α, lükka nullhüpotees tagasi. Pea meeles: statistiline olulisus ei tähenda alati praktilist olulisust, ja igas otsuses on vigade risk.