Co to jest "średnia"?
Kiedy ktoś mówi "przeciętna pensja" albo "średni wynik matury", próbuje opisać całą grupę liczb jednym numerem. Ten pojedynczy numer ma reprezentować to, co jest typowe. Ale jest coś, czego większość ludzi nie wie: istnieje więcej niż jeden sposób obliczania "średniej". Trzy najczęstsze to średnia arytmetyczna, mediana i dominanta. Każda opowiada trochę inną historię.
Średnia arytmetyczna: dodaj i podziel
Średnia arytmetyczna to to, co większość ludzi rozumie pod słowem "średnia". Dodajesz wszystkie liczby i dzielisz przez ich ilość.
Pięciu przyjaciół porównuje wyniki matury z matematyki: 55, 62, 70, 75, 88.
Krok 1: Dodaj: 55 + 62 + 70 + 75 + 88 = 350
Krok 2: Podziel przez 5: 350 ÷ 5 = 70
Średnia wynosi 70 punktów.
Średnia działa dobrze, gdy liczby są dość blisko siebie i nie ma wartości ekstremalnych. Używa każdej pojedynczej liczby w obliczeniu - to zarówno jej siła, jak i słabość.
Kiedy średnia jest myląca
Wyobraź sobie zarobki w małej firmie z 5 pracownikami:
Pensje: 4 000 zł · 4 500 zł · 5 000 zł · 5 500 zł · 35 000 zł
Średnia: (4 000 + 4 500 + 5 000 + 5 500 + 35 000) ÷ 5 = 10 800 zł
Czy 10 800 zł odzwierciedla typową pensję? Absolutnie nie. Czterech z pięciu pracowników zarabia dużo mniej. Jedna bardzo wysoka pensja - prawdopodobnie szefa - przeciągnęła średnią w górę.
To największa słabość średniej: jest wrażliwa na wartości ekstremalne. Jedna bardzo duża lub bardzo mała liczba może ją istotnie zniekształcić.
Mediana: wartość środkowa
Mediana to po prostu środkowa wartość, gdy ustawisz wszystkie dane od najmniejszej do największej. Połowa wartości jest poniżej, połowa powyżej.
Te same pensje w kolejności: 4 000 zł · 4 500 zł · 5 000 zł · 5 500 zł · 35 000 zł
Mediana to 5 000 zł - wartość dokładnie w środku.
To dużo lepszy obraz typowej pensji w tej firmie.
A jeśli jest parzysta liczba wartości?
Gdy masz parzystą ilość liczb, nie ma jednej środkowej. Wtedy bierzesz dwie środkowe i obliczasz ich średnią.
Oceny z restauracji od 6 klientów: 3, 3, 4, 4, 5, 5
Dwie środkowe wartości: 4 i 4. Ich średnia: (4 + 4) ÷ 2 = 4
Mediana wynosi 4.
Mediana jest odporna na wartości ekstremalne. Nawet gdyby najwyższa pensja w naszym przykładzie wynosiła 350 000 zł zamiast 35 000 zł, mediana wciąż byłoby 5 000 zł. Dlatego GUS i media prawie zawsze podają medianę dochodów - bo kilku miliarderów mogłoby zupełnie zniekształcić średnią.
Dominanta: najczęstsza wartość
Dominanta (moda) to wartość, która pojawia się najczęściej. To najprostsze pojęcie z trzech i działa z każdym typem danych - nawet nienumerycznymi.
Sklep obuwniczy w Krakowie śledzi sprzedaż rozmiarów: 40, 42, 42, 43, 42, 44, 41, 42, 43, 42
Rozmiar 42 pojawia się 5 razy - częściej niż jakikolwiek inny. Dominanta to rozmiar 42.
To cenna informacja - sklep powinien mieć duży zapas rozmiaru 42.
Dominanta działa też dla kategorii niebędących liczbami. Jeśli ankieta pyta o ulubiony sklep i "Biedronka" jest wybierana najczęściej, to Biedronka jest dominantą.
Porównanie trzech miar
Godziny snu raportowane przez 9 osób: 5, 6, 7, 7, 7, 8, 8, 9, 12
Średnia: (5+6+7+7+7+8+8+9+12) ÷ 9 = 69 ÷ 9 ≈ 7,7 godziny
Mediana: środkowa wartość (5. z 9) = 7 godzin
Dominanta: 7 pojawia się trzy razy = 7 godzin
Tutaj wszystkie trzy są blisko siebie. To często zdarza się, gdy dane są w miarę zrównoważone.
Kiedy używać każdej miary?
Używaj średniej, gdy: dane nie mają wartości ekstremalnych i są dość równomiernie rozłożone. To najczęstszy wybór w badaniach naukowych.
Używaj mediany, gdy: dane mają wartości odstające lub są skośne. Dlatego dochody prawie zawsze raportuje się jako medianę.
Używaj dominanty, gdy: chcesz znać najpopularniejszy wybór. Szczególnie przydatna dla kategorii (ulubiony kolor, najpopularniejszy produkt).
Na co uważać
Kiedy widzisz słowo "średnia" w mediach, zapytaj się: która średnia? Firma może reklamować "średnia pensja 12 000 zł" używając średniej arytmetycznej - zawyżonej przez kilku dyrektorów - podczas gdy mediana wynosi 6 000 zł. Obie liczby są technicznie poprawne, ale opowiadają zupełnie inne historie.
Średnia arytmetyczna dodaje wszystkie wartości i dzieli przez ich ilość - przydatna, ale wrażliwa na ekstrema. Mediana wybiera środkową wartość - lepsza przy wartościach odstających. Dominanta wskazuje najczęstszą wartość - działa dla każdego typu danych. Wiedza, którą miarę wybrać (i którą ktoś inny wybrał za ciebie), pomaga zrozumieć, co liczby naprawdę mówią.