Problem z wariancją
W poprzedniej lekcji poznaliśmy wariancję - miarę rozrzutu danych. Ale wariancja ma pewną wadę praktyczną: jest wyrażona w kwadratach oryginalnych jednostek. Jeśli mierzymy pensje w złotych, wariancja jest w "złotych kwadratowych" - co nie ma intuicyjnego sensu. Rozwiązaniem jest odchylenie standardowe.
Czym jest odchylenie standardowe?
Odchylenie standardowe to po prostu pierwiastek kwadratowy z wariancji. Dzięki temu wraca do tych samych jednostek co oryginalne dane i jest dużo łatwiejsze do interpretacji.
Jeśli wariancja pensji wynosi 4 000 000 (zł²), to odchylenie standardowe wynosi 2 000 zł. Teraz możesz powiedzieć: "typowe odchylenie pensji od średniej to około 2 000 zł."
Wyniki pięciu zawodników Ekstraklasy w strzelaniu karnych (gole w sezonie): 2, 4, 4, 6, 4
Średnia = 20 ÷ 5 = 4 gole
Odchylenia: -2, 0, 0, 2, 0
Kwadraty: 4, 0, 0, 4, 0
Wariancja = 8 ÷ 5 = 1,6
Odchylenie standardowe = √1,6 ≈ 1,26 gola
Typowy zawodnik odbiega od średniej o około 1,3 gola.
Jak interpretować odchylenie standardowe
Im mniejsze odchylenie standardowe, tym bardziej dane skupiają się wokół średniej. Im większe - tym bardziej są rozproszone.
- Małe odchylenie: dane są jednorodne, przewidywalne
- Duże odchylenie: dane są zróżnicowane, mniej przewidywalne
Dwa sklepy Żabka mierzą dzienną sprzedaż w tysiącach złotych:
Sklep A: średnia = 8 tys. zł, odchylenie = 0,5 tys. zł (stabilna sprzedaż)
Sklep B: średnia = 8 tys. zł, odchylenie = 3 tys. zł (duże wahania)
Oba mają taką samą średnią, ale Sklep B jest dużo mniej przewidywalny - w niektórych dniach sprzedaje za 5 000 zł, w innych za 11 000 zł.
Reguła 68-95-99,7 w praktyce
Dla danych o rozkładzie normalnym (krzywa dzwonowa), odchylenie standardowe daje precyzyjne informacje:
- Około 68% danych mieści się w zakresie średnia ± 1 odchylenie standardowe
- Około 95% danych mieści się w zakresie średnia ± 2 odchylenia standardowe
- Około 99,7% danych mieści się w zakresie średnia ± 3 odchylenia standardowe
Średni wynik matury z angielskiego: 65%, odchylenie standardowe: 15%. Według reguły: 68% uczniów uzyskuje między 50% a 80%. 95% uczniów uzyskuje między 35% a 95%. Uczeń z wynikiem 98% jest ponad 2 odchylenia ponad średnią - to naprawdę wybitny wynik.
Odchylenie standardowe w finansach
Na giełdzie odchylenie standardowe jest synonimem ryzyka. Inwestorzy używają go do porównywania akcji:
Dwie akcje notowane na GPW (Giełdzie Papierów Wartościowych w Warszawie): Akcja X ma średni miesięczny zwrot 2% z odchyleniem 1%. Akcja Y ma średni miesięczny zwrot 2% z odchyleniem 8%. Obie dają taki sam przeciętny zysk, ale Akcja Y jest 8 razy bardziej ryzykowna - w jednym miesiącu możesz zarobić 10%, a w następnym stracić 6%.
Odchylenie standardowe populacji vs. próby
Podobnie jak w przypadku wariancji, odchylenie standardowe obliczone z próby używa dzielenia przez n-1 (zamiast n). To drobna korekta, która poprawia dokładność oszacowania, gdy pracujesz z próbą, a nie całą populacją. Większość kalkulatorów i programów robi to automatycznie.
Kiedy odchylenie standardowe jest przydatne
- Kontrola jakości: fabryka monitoruje odchylenie wagi produktów - im mniejsze, tym lepsza kontrola
- Sport: zawodnik z małym odchyleniem wyników jest bardziej niezawodny
- Pogoda: miasto z dużym odchyleniem temperatur ma bardziej niestabilny klimat
- Edukacja: duże odchylenie wyników może wskazywać na nierówności między uczniami
Odchylenie standardowe to pierwiastek z wariancji - wyrażone w tych samych jednostkach co dane. Mówi, jak daleko typowa wartość odbiega od średniej. Małe odchylenie = dane skupione blisko średniej. Duże odchylenie = dane rozproszone. W połączeniu z regułą 68-95-99,7 pozwala dokładnie określić, jaki odsetek danych leży w danym zakresie.