Что такое медиана в статистике?

Определение

Медиана - это серединное значение в наборе данных, когда все значения расположены по порядку от наименьшего к наибольшему. Ровно половина значений находится ниже медианы и половина - выше. В отличие от среднего, медиана не подвержена влиянию экстремальных значений, что делает ее устойчивой мерой центральной тенденции.

Как найти медиану

Упорядочьте данные от меньшего к большему. Если количество значений нечетное, медиана - это значение прямо в середине. Если четное, возьмите среднее двух серединных значений.

Пример

Цены домов на улице (в тысячах): $150, $180, $200, $210, $950

При упорядочивании от меньшего к большему серединное значение - третье: $200,000.

Среднее составило бы $338,000 - завышенное из-за дома за $950,000. Медиана в $200,000 лучше отражает типичную цену.

Почему это важно

Медиана - предпочтительная мера центра, когда данные асимметричны или содержат выбросы. Поэтому государственные органы сообщают "медианный доход домохозяйства", а не "средний доход домохозяйства" - несколько чрезвычайно богатых домохозяйств исказили бы среднее. Медиана дает более честную картину типичного.

Медиана также является основой диаграмм размаха и анализов на основе процентилей. 50-й процентиль - это, по определению, медиана.

Ключевой вывод

Используйте медиану, когда данные асимметричны или содержат выбросы. Она показывает, каково типичное значение на самом деле, без искажения экстремумами.

← Back to Glossary