Miks me ei saa kõike mõõta?
Kujuta ette, et tahad teada Eesti keskmist palka. Ideaalis küsiksid iga töötava inimese käest riigis - umbes 700 000 inimest. See oleks väga aeganõudev ja kallis. Selle asemel küsitled väiksemat gruppi ja kasutad nende andmeid, et hinnata kogu rahvastiku kohta.
See on statistika üks põhimõtteid: me uurime osa, et mõista tervikut.
Üldkogum
Üldkogum on KÕIK isikud või objektid, mille kohta sa tahad järeldusi teha. See ei pea olema inimesed - üldkogum võib olla kõik Eesti ettevõtted, kõik Premium Liiga mängud või kõik Bolt sõidud Tallinnas.
Haridusministeerium tahab teada, kuidas gümnaasiumiõpilased riigieksamitega rahul on. Üldkogum on KÕIK Eesti gümnaasiumiõpilased - umbes 25 000 noort. Iga ühe küsitlemine oleks võimalik, aga väga aeganõudev.
Valim
Valim on üldkogumist valitud väiksem grupp, mida tegelikult uuritakse. Head valimit iseloomustab see, et ta esindab üldkogumit - ehk peegeldab üldkogumi omadusi nii täpselt kui võimalik.
Selle asemel, et küsitleda kõiki 25 000 gümnaasiumiõpilast, valib ministeerium juhuslikult 1 000 õpilast üle kogu Eesti. See 1 000 õpilast on valim. Nende vastuste põhjal tehakse järeldusi kõigi õpilaste kohta.
Miks valimi kvaliteet loeb
Valim on kasulik ainult siis, kui see esindab üldkogumit. Kui valim on kallutatud, on järeldused valed.
Oletame, et küsitled riigieksamite rahulolu kohta ainult Tallinna õpilasi. Tallinna koolid võivad olla paremini varustatud kui maakoolid. Sinu tulemused ei esinda kogu Eestit - valim on kallutatud. Õige lähenemine: valida õpilasi nii linnadest kui maalt, nii eesti- kui venekeelsetest koolidest.
Juhuvalim
Parim viis esindava valimi saamiseks on juhuvalik: iga üldkogumi liige peab omama võrdset võimalust valimisse sattuda. See on nagu loterii - keegi ei ole eelistatud.
Juhuvalimi tegemine: paned kõigi üldkogumi liikmete nimed nimekirja ja kasutad juhuslikku valikut (arvuti abil), et valida soovitud arv inimesi.
Valimi suurus
Kui suur valim peab olema? Üldreeglina: suurem valim annab täpsemaid tulemusi, kuid kasv ei ole lineaarne. 100 inimese valim on palju parem kui 10, aga 10 000 ei ole tingimata palju parem kui 1 000.
Eesti Pank tahab teada, kui palju eestlased säästavad. Rahvastik on 1,3 miljonit. Hästi koostatud 1 500 inimese juhuvalim annab piisavalt täpseid tulemusi - veapiiriga umbes 2,5 protsendipunkti. Kogu rahvastiku küsitlemine oleks kümneid kordi kallim, kuid täpsus paraneks vaid marginaalselt.
Levinud valimivead
- Mugavusvalim: Küsitled ainult neid, keda on lihtne kätte saada (näiteks sinu sõbrad). See ei esinda üldkogumit.
- Vabatahtlik valim: Ainult need, kes tahavad vastata, vastavad. Veebküsitlused kannatavad selle all - vastajad võivad olla teistsugused kui mittevastajad.
- Liiga väike valim: 10 inimese küsitlemine ei anna usaldusväärseid tulemusi kogu rahvastiku kohta.
Bolt tahab teada klientide rahulolu. Kui nad küsitlevad ainult neid, kes annavad hinnangu äppi kaudu peale sõitu, jäävad välja need, kes äppi ei kasuta aktiivselt. Parema tulemuse jaoks peaksid nad saatma küsitluse ka juhuslikule valikule klientidest, kes pole hiljuti tagasisidet andnud.
Parameeter vs statistik
Kaks olulist mõistet: parameeter on arv, mis kirjeldab üldkogumit (näiteks kõigi eestlaste tegelik keskmine palk). Statistik on arv, mis kirjeldab valimit (näiteks küsitletud 1 000 inimese keskmine palk). Statistikut kasutame parameetri hindamiseks.
Üldkogum on kõik, kelle kohta tahad järeldusi teha. Valim on väiksem grupp, mida tegelikult uurid. Hea valim on esindav ja piisavalt suur. Juhuvalik on parim viis esindava valimi saamiseks. Peaaegu kogu statistika põhineb sellel: me uurime osa, et mõista tervikut.