Mis on "keskmine"?
Kui keegi ütleb "keskmine palk" või "keskmine hinne", püüab ta kirjeldada tervet numbrirühma ühe numbriga. See üks number peaks esindama tüüpilist väärtust.
Aga siin on nipukas, mida enamik inimesi ei tea: "keskmist" saab arvutada mitut moodi. Kolm kõige levinumat on aritmeetiline keskmine, mediaan ja mood. Igaühel on erinev lugu rääkida.
Aritmeetiline keskmine: liida kokku ja jaga
Keskmine on see, mida enamik inimesi mõtleb, kui kuuleb sõna "keskmine". Liidad kõik numbrid kokku ja jagad nende arvuga.
Viie õpilase matemaatika riigieksamitulemused: 65, 72, 78, 81, 84.
Samm 1: Liida kokku: 65 + 72 + 78 + 81 + 84 = 380
Samm 2: Jaga 5-ga (sest on 5 tulemust): 380 / 5 = 76
Keskmine tulemus on 76 punkti.
Keskmine töötab hästi, kui numbrid on ühtlaselt lähedal ja äärmisväärtusi ei ole. See kasutab iga numbrit arvutuses, mis on nii tema tugevus kui nõrkus.
Kui keskmine viastab
Kujuta ette viie töötaja palku väikeses Eesti ettevõttes:
Palgad: 1 200 € · 1 400 € · 1 500 € · 1 600 € · 12 000 €
Keskmine palk: (1 200 + 1 400 + 1 500 + 1 600 + 12 000) / 5 = 3 540 €
Kas 3 540 € esindab tüüpilist töötajat? Kindlasti mitte. Neli viiest töötajast teenib sellest tunduvalt vähem. Üks väga kõrge palk - omaniku oma - tõmbas keskmise kõrgeks.
See on keskmise suurim nõrkus: see on tundlik äärmisväärtuste suhtes.
Mediaan: keskmine väärtus
Mediaan on lihtsalt keskmine number, kui järjestad kõik väärtused väikseimast suurimani. Pool numbreid on alla selle ja pool üle.
Samad palgad järjestatult: 1 200 € · 1 400 € · 1 500 € · 1 600 € · 12 000 €
Mediaan on 1 500 € - väärtus täpselt keskel.
See annab palju parema pildi tüüpilisest palgast selles ettevõttes.
Paaris arvu väärtuste korral
Kui väärtusi on paaris arv, võtad kaks keskmist ja arvutad nende keskmise.
Bolt sõidu hinnad 6 sõidu eest Tallinnas: 3 €, 4 €, 5 €, 5 €, 7 €, 9 €
Kaks keskmist väärtust on 5 € ja 5 €. Nende keskmine on (5 + 5) / 2 = 5 €
Mediaan hind on 5 €.
Mediaan on vastupidav äärmisväärtustele. Isegi kui kõige kõrgem palk meie näites oleks 120 000 € asemel 12 000 €, jääks mediaan endiselt 1 500 €.
Mood: kõige sagedasem väärtus
Mood on väärtus, mis esineb kõige sagedamini. See on kolmest kõige lihtsam ja toimib ka mittearviliste andmetega.
Selveris müüdud jalanõude suurused päeva jooksul: 38, 39, 40, 40, 41, 40, 42, 39, 40, 43
Suurus 40 esineb 4 korda - rohkem kui ükski teine. Mood on suurus 40.
See on kasulik info - pood peaks tagama, et suurust 40 on piisavalt laos.
Mood toimib ka kategooriate puhul. Kui küsitlus küsib lemmikjooki ja "kohv" on kõige populaarsem vastus, on kohv mood.
Mitu moodi?
Jah. Kui kaks väärtust on võrdselt sagedased, on andmestikul kaks moodi (bimodaalne). Kui kõik väärtused esinevad võrdselt, moodi ei ole.
Kolme võrdlemine
Unetunnid, mida 9 inimest Tartus raporteerisid: 5, 6, 7, 7, 7, 8, 8, 9, 12
Keskmine: (5+6+7+7+7+8+8+9+12) / 9 = 69 / 9 ≈ 7,7 tundi
Mediaan: keskmine väärtus (5. üheksast) = 7 tundi
Mood: 7 esineb kolm korda = 7 tundi
Siin on kõik kolm lähedal. See juhtub tihti, kui andmed on tasakaalus.
Millal millist kasutada?
Kasuta keskmist, kui: andmetes ei ole äärmisväärtusi ja andmed on ühtlaselt jaotunud. See on kõige levinum valik teadusuuringutes.
Kasuta mediaani, kui: andmetes on äärmisväärtusi või andmed on viltu. Seepärast kasutab Statistikaamet sissetulekute puhul peaaegu alati mediaani.
Kasuta moodi, kui: tahad teada kõige populaarsemat valikut. See on eriti kasulik kategooriate puhul ja praktiliste otsuste tegemisel.
Lõks, mida jälgida
Kui uudiste pealkirjas seisab "keskmine", küsi endalt: kumb keskmine? Ettevõte võib reklaamida "töötajate keskmine palk on 4 000 €", kasutades aritmeetilist keskmist, mida mõned juhtkonna liikmed kõrgeks tõmbavad - samal ajal kui mediaanpalk võib olla 2 500 €. Mõlemad numbrid on tehniliselt õiged, aga räägivad väga erinevat lugu.
Keskmine liidab kõik väärtused ja jagab nende arvuga - see on kasulik, aga tundlik äärmisväärtuste suhtes. Mediaan valib keskmise väärtuse - see on parem, kui andmetes on erandväärtusi. Mood tuvastab kõige sagedasema väärtuse - see toimib igat tüüpi andmetega. Teadmine, millist kasutada (ja millist keegi teine on kasutanud), aitab mõista, mida numbrid tegelikult räägivad.