Что такое «среднее»?
Когда кто-то говорит «средняя цена квартиры» или «средний балл по контрольной», он пытается описать целую группу чисел одним числом. Это число должно отражать то, что типично.
Но вот что многие не осознают: есть несколько способов рассчитать «среднее». Три самых распространённых — среднее арифметическое, медиана и мода. Каждый рассказывает немного другую историю, и выбор правильного имеет значение.
Среднее арифметическое: сложи всё и раздели
Среднее арифметическое — это то, что большинство людей имеют в виду, когда говорят «среднее». Вы складываете все числа и делите на их количество.
Пять одноклассников сравнивают свои оценки за контрольную по математике: 3, 4, 4, 5, 4.
Шаг 1: Складываем: 3 + 4 + 4 + 5 + 4 = 20
Шаг 2: Делим на 5 (потому что оценок 5): 20 ÷ 5 = 4
Среднее арифметическое — 4.
Среднее хорошо работает, когда числа относительно близки друг к другу и нет экстремальных значений, которые тянут его в одну сторону. Оно учитывает каждое число — это и его сила, и его слабость.
Когда среднее сбивается с курса
Представьте, что вы смотрите зарплаты в небольшой компании:
Зарплаты 5 сотрудников: 40 000 · 45 000 · 48 000 · 50 000 · 500 000 рублей
Средняя зарплата: (40 000 + 45 000 + 48 000 + 50 000 + 500 000) ÷ 5 = 136 600 рублей
Отражает ли 136 600 рублей типичный заработок? Нет. Четверо из пяти сотрудников получают гораздо меньше. Одна очень высокая зарплата — возможно, директора — сильно завысила среднее.
Это главная слабость среднего арифметического: оно чувствительно к экстремальным значениям. Одно очень большое или очень маленькое число может его существенно исказить.
Медиана: значение посередине
Медиана — это просто среднее значение, когда вы выстраиваете все числа по порядку от наименьшего к наибольшему. Половина чисел — ниже, половина — выше.
Те же зарплаты по порядку: 40 000 · 45 000 · 48 000 · 50 000 · 500 000 рублей
Медиана — 48 000 рублей — значение прямо посередине.
Это гораздо лучше описывает типичную зарплату в этой компании.
Что если чисел чётное количество?
Когда чисел чётное количество, одного среднего значения нет. В этом случае берём два средних числа и находим их среднее арифметическое.
Оценки 6 покупателей на Яндекс.Маркете: 3, 4, 4, 5, 5, 5
Два средних значения — 4 и 5. Их среднее: (4 + 5) ÷ 2 = 4,5
Медиана оценки — 4,5.
Медиана устойчива к экстремальным значениям. Даже если бы самая высокая зарплата в нашем примере была 5 000 000 вместо 500 000 рублей, медиана всё равно осталась бы 48 000. Поэтому медиану часто предпочитают, когда в данных есть выбросы.
Мода: самое частое значение
Мода — это значение, которое встречается чаще всего. Это самый простой из трёх показателей, и он работает с любыми данными — даже не числовыми.
Магазин обуви отслеживает, какие размеры продаются лучше всего за неделю: 39, 41, 42, 42, 42, 43, 41, 42, 43, 42
Размер 42 встречается 5 раз — чаще, чем любой другой. Мода — 42-й размер.
Полезная информация: магазину стоит убедиться, что 42-го размера всегда достаточно на складе.
Мода работает и для категорий, которые не являются числами. Если опрос ВЦИОМ спрашивает людей об их любимом виде отдыха и «дача» выбирается чаще всего — дача является модой.
Может ли быть несколько мод?
Да. Если два значения разделили первенство по количеству появлений — у вас две моды (бимодальное распределение). Если три или более — мод несколько. А если каждое значение встречается одинаково часто — моды нет вовсе.
Сравнение трёх показателей
Посмотрим на один набор данных через все три призмы.
Часы сна, о которых сообщили 9 человек: 5, 6, 7, 7, 7, 8, 8, 9, 12
Среднее: (5+6+7+7+7+8+8+9+12) ÷ 9 = 69 ÷ 9 ≈ 7,7 часов
Медиана: среднее значение (5-е из 9) = 7 часов
Мода: 7 встречается три раза = 7 часов
Здесь все три показателя близки друг к другу. Так часто бывает, когда данные достаточно сбалансированы. Человек, спавший 12 часов, немного подтянул среднее вверх, но не критично.
Когда что использовать?
Единого «лучшего» среднего не существует. Правильный выбор зависит от данных и того, что вы хотите показать.
Используйте среднее арифметическое, когда: данные не содержат экстремальных значений и распределены достаточно равномерно. Это самый распространённый выбор в научных исследованиях и повседневных расчётах.
Используйте медиану, когда: данные содержат выбросы или скошены в одну сторону. Именно поэтому Росстат при обсуждении доходов населения публикует медианную зарплату — несколько очень высоких зарплат исказили бы среднее.
Используйте моду, когда: хотите узнать самый популярный или частый вариант. Мода особенно полезна для категорий (любимый цвет, самый покупаемый товар) и для практических решений вроде формирования складских запасов.
Ловушка, на которую стоит обратить внимание
Когда вы видите слово «средний» в новостном заголовке, рекламе или отчёте, спросите себя: какое среднее? Компания может объявить, что «средняя зарплата сотрудников 120 000 рублей», используя среднее арифметическое, завышенное несколькими топ-менеджерами, тогда как медианная зарплата может быть 55 000. Оба числа технически верны, но рассказывают совершенно разные истории.
Понимание разницы между средним, медианой и модой — мощный инструмент для того, чтобы видеть за вводящей в заблуждение статистикой.
Среднее арифметическое складывает все значения и делит на количество — оно полезно, но чувствительно к экстремальным значениям. Медиана выбирает значение посередине — она лучше, когда есть выбросы. Мода определяет самое частое значение — работает для любых данных. Знание того, какой показатель использовать (и какой выбрал кто-то другой), помогает понять, что на самом деле говорят числа.