Що таке "середнє"?
Коли хтось каже "середня зарплата" або "середній бал НМТ", він намагається описати цілу групу чисел одним числом. Це число повинне відображати те, що є типовим.
Але мало хто розуміє: існує більше ніж один спосіб обчислити "середнє". Три найпоширеніші -- це середнє арифметичне (mean), медіана та мода. Кожне розповідає дещо іншу історію, і вибір правильного має значення.
Середнє арифметичне: додай і поділи
Середнє арифметичне -- це те, що більшість людей мають на увазі під словом "середнє". Додайте всі числа та поділіть на їх кількість.
П'ятеро студентів склали НМТ з математики: 135, 148, 160, 155, 172.
Крок 1: Додаємо: 135 + 148 + 160 + 155 + 172 = 770
Крок 2: Ділимо на 5: 770 ÷ 5 = 154
Середній бал -- 154.
Середнє добре працює, коли числа розташовані досить рівномірно і немає крайніх значень. Воно враховує кожне число, що одночасно є його силою і слабкістю.
Коли середнє вводить в оману
Уявіть зарплати у невеликій IT-компанії з 5 працівників:
Зарплати: 25 000 · 30 000 · 32 000 · 35 000 · 250 000 грн
Середня зарплата: (25 000 + 30 000 + 32 000 + 35 000 + 250 000) ÷ 5 = 74 400 грн
Чи відображає 74 400 грн типову зарплату? Зовсім ні. Четверо з п'яти заробляють значно менше. Одна дуже висока зарплата CEO витягнула середнє вгору.
Це головна слабкість середнього: воно чутливе до екстремальних значень. Одне дуже велике або дуже мале число може суттєво його спотворити.
Медіана: значення посередині
Медіана -- це просто число посередині, коли всі значення розташовані від найменшого до найбільшого. Половина чисел нижче, половина -- вище.
Ті самі зарплати в порядку: 25 000 · 30 000 · 32 000 · 35 000 · 250 000 грн
Медіана -- 32 000 грн -- значення точно посередині.
Це набагато краще відображає типову зарплату в компанії.
Якщо парна кількість значень?
Коли кількість чисел парна, медіана -- це середнє двох центральних значень.
Рейтинги ресторану на Google Maps від 6 відвідувачів: 3, 4, 4, 5, 5, 5
Два центральних значення: 4 і 5. Їх середнє: (4 + 5) ÷ 2 = 4,5
Медіана рейтингу -- 4,5.
Медіана стійка до екстремальних значень. Навіть якщо найвища зарплата була б 3 000 000 грн замість 250 000, медіана залишилася б 32 000. Тому Держстат зазвичай повідомляє медіанну зарплату -- кілька мільйонерів не спотворюють картину.
Мода: найчастіше значення
Мода -- це значення, яке зустрічається найчастіше. Це найпростіша з трьох мір центру, і вона працює з будь-якими даними -- навіть нечисловими.
Магазин взуття на Хрещатику відстежує розміри проданих пар за тиждень: 39, 41, 42, 42, 43, 42, 41, 42, 44, 42
Розмір 42 зустрічається 5 разів -- більше за будь-який інший. Мода -- 42.
Це практична інформація: магазин повинен мати достатній запас 42-го розміру.
Мода також працює для категорій. Якщо опитування на Rozetka показує, що найпопулярніший колір смартфона -- чорний, то чорний -- це мода.
Кілька мод або жодної
Якщо два значення мають однакову найвищу частоту -- це бімодальний розподіл. Якщо всі значення зустрічаються однаково -- моди немає.
Порівняння трьох на одному наборі
Годин сну за ніч, за даними 9 студентів: 5, 6, 7, 7, 7, 8, 8, 9, 12
Середнє: (5+6+7+7+7+8+8+9+12) ÷ 9 = 69 ÷ 9 ≈ 7,7 годин
Медіана: середнє значення (5-те з 9) = 7 годин
Мода: 7 зустрічається тричі = 7 годин
Тут усі три близькі. Це часто буває, коли дані збалансовані. Студент, що спав 12 годин, трохи підтягнув середнє, але не критично.
Коли використовувати кожне?
Середнє -- коли дані без екстремальних значень і розподілені рівномірно. Найчастіший вибір у науці та щоденних обчисленнях.
Медіану -- коли є викиди або асиметрія. Тому новини про доходи майже завжди використовують медіану -- кілька олігархів зробили б середнє оманливим.
Моду -- коли потрібно знати найпопулярніший варіант. Особливо корисна для категорій (улюблена страва, найпопулярніший товар) та практичних рішень на зразок управління запасами.
Пастка в реальному житті
Коли бачите слово "середнє" у новинах, рекламі або звіті, запитайте: яке саме середнє? Компанія може рекламувати "середню зарплату 75 000 грн", використовуючи арифметичне середнє, яке завищене кількома топ-менеджерами, тоді як медіана -- лише 40 000 грн. Обидва числа технічно правильні, але розповідають різні історії.
Середнє арифметичне додає всі значення і ділить на кількість -- корисне, але чутливе до екстремальних значень. Медіана обирає значення посередині -- краще працює при наявності викидів. Мода визначає найчастіше значення -- працює для будь-яких даних. Знання того, яку міру обрати (і яку обрав хтось інший), допомагає зрозуміти, що числа насправді кажуть.