Tõenäosusjaotused

Raskusaste: Keskmine Lugemisaeg: 15 minutit

Mis on tõenäosusjaotus?

Tõenäosusjaotus on nagu plaan, mis näitab kõiki võimalikke tulemusi ja iga tulemuse tõenäosust. See on viis kirjeldada, kuidas tõenäosus on jaotunud erinevate väärtuste vahel.

0 9 18 27 36 45 1 2 3 4 5 6 7 8 9

Mõtle sellest nii: kui sa viskad täringut, on iga number (1-6) võrdselt tõenäoline. See on ühtaoline jaotus. Aga elus ei ole kõik asjad võrdselt tõenäolised - mõned on levinumad kui teised.

Diskreetsed jaotused

Diskreetne jaotus kirjeldab loendatavaid tulemusi (täisarve).

Ühtaoline jaotus

Kõik tulemused on võrdselt tõenäolised.

Näide

Täringuvise: iga number 1-6 on tõenäosusega 1/6. Loterii loosimisõiel on igal pallil võrdne võimalus tulla.

Binomaaljaotus

Kirjeldab õnnestumiste arvu kindla arvu katsete korral, kus iga katse on sõltumatu ja õnnestumise tõenäosus on sama.

Näide

Flora jalgpallur lööb karistuslöögiga 10 korda hooaja jooksul. Tema tabavuse tõenäosus on 75%. Binomaaljaotus aitab vastata küsimustele:

  • Mis on tõenäosus, et ta tabab täpselt 8 korda 10-st?
  • Mis on tõenäosus, et ta tabab vähemalt 7 korda?

Keskmine õnnestumiste arv: 10 × 0,75 = 7,5 tabamust

Pidevad jaotused

Pidev jaotus kirjeldab muutujaid, mis võivad võtta mistahes väärtuse mingis vahemikus.

140 150 160 170 180 190 200

Normaaljaotus (Gaussi kellkõver)

See on kõige tähtsam jaotus statistikas. Normaaljaotus on sümmeetriline kellukujuline kõver, kus enamik väärtusi koondub keskmise ümber ja äärmsed väärtused on harvad.

Näide

Eesti meeste pikkus järgib ligikaudu normaaljaotust:

  • Keskmine: umbes 179 cm
  • Standardhälve: umbes 7 cm
  • Enamik mehi (umbes 68%) on 172-186 cm pikad
  • Peaaegu kõik (umbes 95%) on 165-193 cm pikad
  • Äärmisel pikad (üle 200 cm) või lühikesed (alla 160 cm) on harvad

68-95-99,7 reegel

Normaaljaotuse jaoks kehtib lihtne reegel:

  • 68% andmetest jääb 1 standardhälbe kaugusele keskmisest
  • 95% andmetest jääb 2 standardhälbe kaugusele
  • 99,7% andmetest jääb 3 standardhälbe kaugusele
Näide

Riigieksamite matemaatika tulemused: keskmine 60 punkti, standardhälve 15 punkti.

  • 68% õpilastest sai 45-75 punkti
  • 95% õpilastest sai 30-90 punkti
  • 99,7% õpilastest sai 15-105 punkti (ehk peaaegu kõik)

Õpilane, kes sai 90 punkti, on paremas 2,5%-s - suurepärane tulemus!

Miks normaaljaotus on nii levinud?

Normaaljaotus tekib loomulikult, kui mõni tunnus on mõjutatud paljudest väikestest sõltumatutest teguritest. Inimese pikkust mõjutavad sajad geenid, toitumine, keskkond jne - kõik need väiksed mõjud kokku annavad normaaljaotuse.

Paljud asjad järgivad normaaljaotust: kehakaal, IQ-skoorid, tootmisvead, mõõtmiste ebatäpsus jne.

Jaotused, mis EI ole normaalsed

Kõik andmed ei järgi normaaljaotust:

17 1 16 2 17 3 16 4 17 5 17 6
  • Sissetulekud: parempoolse viltu jaotus - enamik teenib keskmist või alla selle, vähesed teenivad väga palju
  • Eluiga: vasakpoolse viltuga - enamik elab kaua, aga mõned surevad noorelt
  • Veebilehe külastused: valdav enamus lehti saab vähe külastusi, vähesed saavad tohutult
Näide

Eesti ettevõtete käive: enamik on väikeettevõtted käibega alla 100 000 euro. Mõned (nagu Bolt, Wise) on käibega miljardeid. See jaotus on tugevalt paremale viltu - keskmine on palju suurem kui mediaan.

Peатükk

Tõenäosusjaotus näitab kõiki võimalikke tulemusi ja nende tõenäosusi. Normaaljaotus (kellkõver) on kõige levinum - 68% andmetest on 1 standardhälbe sees, 95% on 2 standardhälbe sees. Aga mitte kõik andmed ei ole normaalselt jaotunud - sissetulekud, veebiliiklus ja paljud teised näitajad on viltu. Õige jaotuse tundmine on aluseks õigetele statistilistele järeldustele.