Keskmine, mediaan ja mood

Raskusaste: Algaja Lugemisaeg: 10 minutit

Mis on "keskmine"?

Kui keegi ütleb "keskmine palk" või "keskmine hinne", püüab ta kirjeldada tervet numbrirühma ühe numbriga. See üks number peaks esindama tüüpilist väärtust.

2 5 8 11 14 15 5.5 5.0

Aga siin on nipukas, mida enamik inimesi ei tea: "keskmist" saab arvutada mitut moodi. Kolm kõige levinumat on aritmeetiline keskmine, mediaan ja mood. Igaühel on erinev lugu rääkida.

Aritmeetiline keskmine: liida kokku ja jaga

Keskmine on see, mida enamik inimesi mõtleb, kui kuuleb sõna "keskmine". Liidad kõik numbrid kokku ja jagad nende arvuga.

Näide

Viie õpilase matemaatika riigieksamitulemused: 65, 72, 78, 81, 84.

Samm 1: Liida kokku: 65 + 72 + 78 + 81 + 84 = 380

Samm 2: Jaga 5-ga (sest on 5 tulemust): 380 / 5 = 76

Keskmine tulemus on 76 punkti.

Keskmine töötab hästi, kui numbrid on ühtlaselt lähedal ja äärmisväärtusi ei ole. See kasutab iga numbrit arvutuses, mis on nii tema tugevus kui nõrkus.

Kui keskmine viastab

Kujuta ette viie töötaja palku väikeses Eesti ettevõttes:

Näide

Palgad: 1 200 € · 1 400 € · 1 500 € · 1 600 € · 12 000 €

Keskmine palk: (1 200 + 1 400 + 1 500 + 1 600 + 12 000) / 5 = 3 540 €

Kas 3 540 € esindab tüüpilist töötajat? Kindlasti mitte. Neli viiest töötajast teenib sellest tunduvalt vähem. Üks väga kõrge palk - omaniku oma - tõmbas keskmise kõrgeks.

See on keskmise suurim nõrkus: see on tundlik äärmisväärtuste suhtes.

Mediaan: keskmine väärtus

Mediaan on lihtsalt keskmine number, kui järjestad kõik väärtused väikseimast suurimani. Pool numbreid on alla selle ja pool üle.

2 1 3 2 5 3 5 4 8 5 3 6 1 7
Näide

Samad palgad järjestatult: 1 200 € · 1 400 € · 1 500 € · 1 600 € · 12 000 €

Mediaan on 1 500 € - väärtus täpselt keskel.

See annab palju parema pildi tüüpilisest palgast selles ettevõttes.

Paaris arvu väärtuste korral

Kui väärtusi on paaris arv, võtad kaks keskmist ja arvutad nende keskmise.

Näide

Bolt sõidu hinnad 6 sõidu eest Tallinnas: 3 €, 4 €, 5 €, 5 €, 7 €, 9 €

Kaks keskmist väärtust on 5 € ja 5 €. Nende keskmine on (5 + 5) / 2 = 5 €

Mediaan hind on 5 €.

Mediaan on vastupidav äärmisväärtustele. Isegi kui kõige kõrgem palk meie näites oleks 120 000 € asemel 12 000 €, jääks mediaan endiselt 1 500 €.

Mood: kõige sagedasem väärtus

Mood on väärtus, mis esineb kõige sagedamini. See on kolmest kõige lihtsam ja toimib ka mittearviliste andmetega.

Näide

Selveris müüdud jalanõude suurused päeva jooksul: 38, 39, 40, 40, 41, 40, 42, 39, 40, 43

Suurus 40 esineb 4 korda - rohkem kui ükski teine. Mood on suurus 40.

See on kasulik info - pood peaks tagama, et suurust 40 on piisavalt laos.

Mood toimib ka kategooriate puhul. Kui küsitlus küsib lemmikjooki ja "kohv" on kõige populaarsem vastus, on kohv mood.

Mitu moodi?

Jah. Kui kaks väärtust on võrdselt sagedased, on andmestikul kaks moodi (bimodaalne). Kui kõik väärtused esinevad võrdselt, moodi ei ole.

Kolme võrdlemine

Näide

Unetunnid, mida 9 inimest Tartus raporteerisid: 5, 6, 7, 7, 7, 8, 8, 9, 12

20 30 40 50 60 70 80

Keskmine: (5+6+7+7+7+8+8+9+12) / 9 = 69 / 9 ≈ 7,7 tundi

Mediaan: keskmine väärtus (5. üheksast) = 7 tundi

Mood: 7 esineb kolm korda = 7 tundi

Siin on kõik kolm lähedal. See juhtub tihti, kui andmed on tasakaalus.

Millal millist kasutada?

Kasuta keskmist, kui: andmetes ei ole äärmisväärtusi ja andmed on ühtlaselt jaotunud. See on kõige levinum valik teadusuuringutes.

Kasuta mediaani, kui: andmetes on äärmisväärtusi või andmed on viltu. Seepärast kasutab Statistikaamet sissetulekute puhul peaaegu alati mediaani.

Kasuta moodi, kui: tahad teada kõige populaarsemat valikut. See on eriti kasulik kategooriate puhul ja praktiliste otsuste tegemisel.

Lõks, mida jälgida

Kui uudiste pealkirjas seisab "keskmine", küsi endalt: kumb keskmine? Ettevõte võib reklaamida "töötajate keskmine palk on 4 000 €", kasutades aritmeetilist keskmist, mida mõned juhtkonna liikmed kõrgeks tõmbavad - samal ajal kui mediaanpalk võib olla 2 500 €. Mõlemad numbrid on tehniliselt õiged, aga räägivad väga erinevat lugu.

Peатükk

Keskmine liidab kõik väärtused ja jagab nende arvuga - see on kasulik, aga tundlik äärmisväärtuste suhtes. Mediaan valib keskmise väärtuse - see on parem, kui andmetes on erandväärtusi. Mood tuvastab kõige sagedasema väärtuse - see toimib igat tüüpi andmetega. Teadmine, millist kasutada (ja millist keegi teine on kasutanud), aitab mõista, mida numbrid tegelikult räägivad.