Mis on dispersioon statistikas?

Definitsioon

Dispersioon on statistiline näitaja, mis kvantifitseerib, kui kaugele väärtuste kogum on keskmisest hajutatud. See arvutatakse iga väärtuse ja keskmise vaheliste erinevuste ruutude keskmistamisega. Mida suurem dispersioon, seda hajutatumad on andmed.

Kuidas dispersiooni arvutada

Leidke keskmine, lahutage see igast väärtusest, tõstke iga tulemus ruutu ja seejärel keskmistage need ruutu tõstetud erinevused.

Näide

Nädala päevased temperatuurid (Celsiuse kraadides): 20, 22, 19, 21, 23

Keskmine: (20 + 22 + 19 + 21 + 23) / 5 = 21

Ruutu tõstetud erinevused: (20-21)^2 + (22-21)^2 + (19-21)^2 + (21-21)^2 + (23-21)^2 = 1 + 1 + 4 + 0 + 4 = 10

Dispersioon: 10 / 5 = 2

Miks see on oluline

Dispersioon on paljude statistiliste meetodite ehitusplokk. See on kesksel kohal ANOVA-s (dispersioonanalüüsis), regressioonis ja rahanduse portfelliteoorias. Dispersiooni mõistmine aitab teil kvantifitseerida riski, hinnata järjepidevust ja võrrelda erinevate protsesside usaldusväärsust.

Praktikas näete sageli standardhälvet kasutatuna aruandluses, sest seda on lihtsam tõlgendada. Kuid taustal teeb matemaatilist rasket tööd dispersioon. Paljud edasijõudnud statistika valemid töötavad otse dispersiooniga, sest ruutu tõstetud väärtustel on mugavad matemaatilised omadused.

Põhi-järeldus

Dispersioon mõõdab andmete hajuvust ruutühikutes. Igapäevase tõlgendamise jaoks võtke selle ruutjuur, et saada standardhälve.

← Back to Glossary