Середнє, медіана та мода

Складність: Початковий Час читання: 10 хвилин

Що таке "середнє"?

Коли хтось каже "середня зарплата" або "середній бал НМТ", він намагається описати цілу групу чисел одним числом. Це число повинне відображати те, що є типовим.

2 5 8 11 14 15 5.5 5.0

Але мало хто розуміє: існує більше ніж один спосіб обчислити "середнє". Три найпоширеніші -- це середнє арифметичне (mean), медіана та мода. Кожне розповідає дещо іншу історію, і вибір правильного має значення.

Середнє арифметичне: додай і поділи

Середнє арифметичне -- це те, що більшість людей мають на увазі під словом "середнє". Додайте всі числа та поділіть на їх кількість.

Приклад

П'ятеро студентів склали НМТ з математики: 135, 148, 160, 155, 172.

Крок 1: Додаємо: 135 + 148 + 160 + 155 + 172 = 770

Крок 2: Ділимо на 5: 770 ÷ 5 = 154

Середній бал -- 154.

Середнє добре працює, коли числа розташовані досить рівномірно і немає крайніх значень. Воно враховує кожне число, що одночасно є його силою і слабкістю.

Коли середнє вводить в оману

Уявіть зарплати у невеликій IT-компанії з 5 працівників:

Приклад

Зарплати: 25 000 · 30 000 · 32 000 · 35 000 · 250 000 грн

Середня зарплата: (25 000 + 30 000 + 32 000 + 35 000 + 250 000) ÷ 5 = 74 400 грн

Чи відображає 74 400 грн типову зарплату? Зовсім ні. Четверо з п'яти заробляють значно менше. Одна дуже висока зарплата CEO витягнула середнє вгору.

Це головна слабкість середнього: воно чутливе до екстремальних значень. Одне дуже велике або дуже мале число може суттєво його спотворити.

Медіана: значення посередині

Медіана -- це просто число посередині, коли всі значення розташовані від найменшого до найбільшого. Половина чисел нижче, половина -- вище.

2 1 3 2 5 3 5 4 8 5 3 6 1 7
Приклад

Ті самі зарплати в порядку: 25 000 · 30 000 · 32 000 · 35 000 · 250 000 грн

Медіана -- 32 000 грн -- значення точно посередині.

Це набагато краще відображає типову зарплату в компанії.

Якщо парна кількість значень?

Коли кількість чисел парна, медіана -- це середнє двох центральних значень.

Приклад

Рейтинги ресторану на Google Maps від 6 відвідувачів: 3, 4, 4, 5, 5, 5

Два центральних значення: 4 і 5. Їх середнє: (4 + 5) ÷ 2 = 4,5

Медіана рейтингу -- 4,5.

Медіана стійка до екстремальних значень. Навіть якщо найвища зарплата була б 3 000 000 грн замість 250 000, медіана залишилася б 32 000. Тому Держстат зазвичай повідомляє медіанну зарплату -- кілька мільйонерів не спотворюють картину.

Мода: найчастіше значення

Мода -- це значення, яке зустрічається найчастіше. Це найпростіша з трьох мір центру, і вона працює з будь-якими даними -- навіть нечисловими.

Приклад

Магазин взуття на Хрещатику відстежує розміри проданих пар за тиждень: 39, 41, 42, 42, 43, 42, 41, 42, 44, 42

Розмір 42 зустрічається 5 разів -- більше за будь-який інший. Мода -- 42.

Це практична інформація: магазин повинен мати достатній запас 42-го розміру.

Мода також працює для категорій. Якщо опитування на Rozetka показує, що найпопулярніший колір смартфона -- чорний, то чорний -- це мода.

Кілька мод або жодної

Якщо два значення мають однакову найвищу частоту -- це бімодальний розподіл. Якщо всі значення зустрічаються однаково -- моди немає.

Порівняння трьох на одному наборі

Приклад

Годин сну за ніч, за даними 9 студентів: 5, 6, 7, 7, 7, 8, 8, 9, 12

20 30 40 50 60 70 80

Середнє: (5+6+7+7+7+8+8+9+12) ÷ 9 = 69 ÷ 9 ≈ 7,7 годин

Медіана: середнє значення (5-те з 9) = 7 годин

Мода: 7 зустрічається тричі = 7 годин

Тут усі три близькі. Це часто буває, коли дані збалансовані. Студент, що спав 12 годин, трохи підтягнув середнє, але не критично.

Коли використовувати кожне?

Середнє -- коли дані без екстремальних значень і розподілені рівномірно. Найчастіший вибір у науці та щоденних обчисленнях.

Медіану -- коли є викиди або асиметрія. Тому новини про доходи майже завжди використовують медіану -- кілька олігархів зробили б середнє оманливим.

Моду -- коли потрібно знати найпопулярніший варіант. Особливо корисна для категорій (улюблена страва, найпопулярніший товар) та практичних рішень на зразок управління запасами.

Пастка в реальному житті

Коли бачите слово "середнє" у новинах, рекламі або звіті, запитайте: яке саме середнє? Компанія може рекламувати "середню зарплату 75 000 грн", використовуючи арифметичне середнє, яке завищене кількома топ-менеджерами, тоді як медіана -- лише 40 000 грн. Обидва числа технічно правильні, але розповідають різні історії.

Ключовий висновок

Середнє арифметичне додає всі значення і ділить на кількість -- корисне, але чутливе до екстремальних значень. Медіана обирає значення посередині -- краще працює при наявності викидів. Мода визначає найчастіше значення -- працює для будь-яких даних. Знання того, яку міру обрати (і яку обрав хтось інший), допомагає зрозуміти, що числа насправді кажуть.