Стандартное отклонение

Сложность: Начальный Время чтения: 12 минут

От дисперсии к стандартному отклонению

В предыдущем уроке мы познакомились с дисперсией — мерой разброса значений. Дисперсия — мощный инструмент, но у неё есть практическая проблема: она измеряется в квадратных единицах. Если вы анализируете баллы ЕГЭ, дисперсия получается в «квадратных баллах». Это трудно интерпретировать.

55 70 85 100 115 130 145

Стандартное отклонение решает проблему, извлекая квадратный корень из дисперсии. Это возвращает измерение в исходные единицы — баллы, рубли, градусы, килограммы или что угодно другое.

Стандартное отклонение = √дисперсия

Пример

Из нашего примера с зарплатами в предыдущем уроке дисперсия составила 12 500 000 (в «квадратных рублях»).

Стандартное отклонение = √12 500 000 ≈ 3 536 рублей

Теперь мы можем сказать: в среднем зарплата каждого сотрудника отличается от средней примерно на 3 500 рублей. Это число, которое можно понять и использовать.

Что стандартное отклонение на самом деле означает

Представьте стандартное отклонение как среднее расстояние от среднего. Технически это не совсем среднее расстояние (в математике задействованы возведение в квадрат и извлечение корня), но эта интуиция очень близка к реальности и чрезвычайно полезна.

Маленькое стандартное отклонение означает, что данные плотно сгруппированы вокруг среднего. Большое — что они разбросаны далеко.

Пример

Две кофейни отслеживают время ожидания заказа (в минутах) за 5 визитов:

Кофейня А: 3, 4, 4, 5, 4 → Среднее = 4 мин, Станд. откл. ≈ 0,6 мин

Кофейня Б: 1, 2, 4, 6, 7 → Среднее = 4 мин, Станд. откл. ≈ 2,3 мин

Обе кофейни с одинаковым средним временем ожидания, но кофейня А гораздо стабильнее. Если вы не любите непредсказуемости — вам в кофейню А.

Вычисление стандартного отклонения шаг за шагом

Разберём полный расчёт, чтобы вы увидели, как это работает. Не нужно запоминать формулу — важно понять идею.

68 70 72 74 76 78 80 73.1
Пример

Оценки ученика за 6 контрольных: 70, 80, 75, 85, 90, 80

Шаг 1 — Найдём среднее:
(70 + 80 + 75 + 85 + 90 + 80) ÷ 6 = 480 ÷ 6 = 80

Шаг 2 — Найдём расстояние каждой оценки от среднего:

  • 70 − 80 = −10
  • 80 − 80 = 0
  • 75 − 80 = −5
  • 85 − 80 = +5
  • 90 − 80 = +10
  • 80 − 80 = 0

Шаг 3 — Возведём каждое расстояние в квадрат: 100, 0, 25, 25, 100, 0

Шаг 4 — Найдём среднее квадратов (дисперсию):
(100 + 0 + 25 + 25 + 100 + 0) ÷ 6 = 250 ÷ 6 ≈ 41,7

Шаг 5 — Извлечём квадратный корень: √41,7 ≈ 6,5

Стандартное отклонение — около 6,5 баллов. Это значит, что оценки ученика обычно отклоняются от среднего (80) примерно на 6–7 баллов.

Правило 68-95-99,7

Когда данные имеют колоколообразную форму (а так бывает со многими реальными измерениями — рост, давление, результаты экзаменов), существует удивительно устойчивая закономерность распределения данных вокруг среднего. Это правило 68-95-99,7, иногда называемое эмпирическим правилом.

  • Около 68% значений попадают в пределы 1 стандартного отклонения от среднего
  • Около 95% значений попадают в пределы 2 стандартных отклонений от среднего
  • Около 99,7% значений попадают в пределы 3 стандартных отклонений от среднего

Посмотрим, как это выглядит на реальном примере.

Пример

Допустим, баллы ЕГЭ по русскому языку в большом потоке имеют среднее 65 и стандартное отклонение 12.

68% учеников набрали от 53 до 77 баллов (65 ± 12)

95% учеников набрали от 41 до 89 баллов (65 ± 24)

99,7% учеников набрали от 29 до 101 балла (65 ± 36)

Если кто-то набрал 40, он более чем на 2 стандартных отклонения ниже среднего — только около 2,5% учеников показали результат хуже. Это очень низкий балл относительно потока.

Это правило невероятно полезно, потому что позволяет быстро оценить, является ли конкретное значение обычным или необычным, без сложных вычислений.

Стандартное отклонение в реальной жизни

Здоровье: показатели давления

Врач говорит, что нормальное систолическое давление имеет среднее около 120 мм рт. ст. со стандартным отклонением около 15. По правилу 68-95-99,7 большинство людей попадают в диапазон от 105 до 135. Показатель 160 — это почти 3 стандартных отклонения выше среднего, что необычно и заслуживает внимания.

0 9 18 27 36 45 60 65 70 75 80 85 90 95 100

Производство: контроль качества

Завод производит болты длиной 10,0 см. Стандартное отклонение производственного процесса — 0,02 см. Значит, 95% болтов имеют длину от 9,96 до 10,04 см. Если болт длиной 10,1 см — это 5 стандартных отклонений от нормы — со станком явно что-то не так.

Финансы: волатильность на рынке

Когда финансовые аналитики говорят о «волатильности», они часто имеют в виду стандартное отклонение. Акция со стандартным отклонением дневной доходности 2% — относительно стабильна. Акция с отклонением 8% — настоящие американские горки. Это помогает инвесторам подбирать вложения под свой уровень допустимого риска.

Пример

Два инвестиционных фонда показывали среднюю доходность 7% годовых за последнее десятилетие.

Фонд А: Станд. откл. 3% → В большинстве лет доходность была от 4% до 10%.

Фонд Б: Станд. откл. 12% → В некоторые годы доходность 19%, в другие — минус 5%.

Пенсионер, которому нужен стабильный доход, скорее всего, выберет Фонд А. Молодой инвестор с десятилетиями впереди может согласиться на взлёты и падения Фонда Б ради шанса на высокую прибыль.

Распространённые заблуждения

«Большое стандартное отклонение означает, что данные плохие»

Не обязательно. Некоторые вещи по своей природе сильно варьируются. Суточные температуры в Якутии имеют большое стандартное отклонение, потому что там реально бывают и −50°C, и +30°C. Данные не «плохие» — они точно отражают реальность.

«Стандартное отклонение работает только для колоколообразных данных»

Правило 68-95-99,7 применимо именно к нормальным (колоколообразным) распределениям. Но само стандартное отклонение можно вычислить для любого набора данных. Оно всегда является полезной мерой разброса, даже если точные проценты эмпирического правила не применяются идеально.

«Нужно выучить формулу наизусть»

На практике калькуляторы, электронные таблицы и программы вычисляют стандартное отклонение мгновенно. Важно понимать, что это число означает и как его использовать. Если кто-то говорит, что стандартное отклонение равно 5, вы должны знать, что большинство значений находятся примерно в пределах 5 единиц от среднего — это главная идея.

Стандартное отклонение в двух словах

Вот быстрый способ думать о разных размерах стандартного отклонения относительно среднего:

  • Маленькое (относительно среднего): данные плотно сгруппированы. Высокая стабильность. Как точный термометр или пунктуальное расписание «Сапсана».
  • Среднее: обычный уровень вариации. Большинство реальных данных попадают сюда.
  • Большое (относительно среднего): данные широко разбросаны. Высокая вариативность. Как выручка стартапа или количество шагов в день, которое скачет от 500 до 15 000.
Ключевой вывод

Стандартное отклонение показывает, в понятных единицах, насколько далеко значения обычно отклоняются от среднего. Маленькое стандартное отклонение — стабильность, большое — значительный разброс. Правило 68-95-99,7 даёт быстрый способ оценить, является ли значение обычным или нет: около двух третей значений попадают в пределы одного стандартного отклонения от среднего, а почти все — в пределы трёх. Это единственное число — один из самых полезных инструментов во всей статистике.