Mis on korrelatsioon statistikas?

Definitsioon

Korrelatsioon on statistiline näitaja, mis kvantifitseerib kahe muutuja vahelise lineaarse seose tugevust ja suunda. Kõige levinum mõõdik on Pearsoni korrelatsioonikoefitsient (r), mis ulatub -1-st +1-ni.

Kuidas korrelatsiooni tõlgendada

Märk ütleb suunda. Suurus ütleb tugevust.

Näide

Kool jälgib 200 õpilase õpitunde ja testitulemusi.

r = 0,82 - tugev positiivne korrelatsioon.

Õpitundide suurenedes kipuvad ka testitulemused suurenema. Kuid korrelatsioon ei tõesta, et õppimine põhjustas kõrgemaid tulemusi - motiveeritud õpilased võivad nii rohkem õppida kui ka paremini esineda muudel põhjustel.

Miks see on oluline

Korrelatsioon aitab teil tuvastada andmetes seoseid. Ettevõtted kasutavad seda, et leida, millised turunduskanalid on seotud müügiga. Arstid kasutavad seda haiguse riskitegurite tuvastamiseks. Teadlased kasutavad seda esimese sammuna enne sügevamat analüüsi nagu regressioon.

Kõige olulisem reegel: korrelatsioon ei tähenda põhjuslikkust. Kaks muutujat võivad liikuda koos ilma, et üks põhjustaks teist. Otsige alati segavaid muutujaid ja kaaluge, kas seos on loogiliselt mõistlik.

Põhi-järeldus

Korrelatsioon mõõdab, kuidas kaks muutujat koos liiguvad. Pidage alati meeles: tugev korrelatsioon ei tõesta, et üks muutuja põhjustab muutusi teises.

← Back to Glossary