Розподіли ймовірностей

Складність: Середній Час читання: 15 хвилин

Що таке розподіл?

Розподіл ймовірностей -- це карта, яка показує, наскільки ймовірне кожне можливе значення. Уявіть, що ви кидаєте кубик 600 разів і записуєте результати. Кожне число від 1 до 6 випаде приблизно 100 разів. Це рівномірний розподіл: всі значення однаково ймовірні.

0 9 18 27 36 45 1 2 3 4 5 6 7 8 9

Але більшість речей у реальному житті розподілені нерівномірно. Зріст людей, бали НМТ, зарплати -- у кожного свій характерний розподіл.

Нормальний розподіл: дзвоноподібна крива

Нормальний розподіл -- найвідоміший і найважливіший. Його графік нагадує дзвін: більшість значень зосереджені навколо середнього, а крайні значення трапляються рідко. Він описується двома параметрами: середнє значення (центр дзвона) та стандартне відхилення (ширина дзвона).

Приклад

Зріст дорослих чоловіків в Україні має приблизно нормальний розподіл із середнім 176 см та стандартним відхиленням 7 см. Це означає: більшість чоловіків мають зріст від 169 до 183 см (одне відхилення). Дуже мало хто нижчий за 155 см чи вищий за 197 см (три відхилення). Дзвоноподібна крива ідеально описує цю ситуацію.

Правило 68-95-99,7

Для нормального розподілу існує просте правило:

140 150 160 170 180 190 200
  • 68% даних потрапляє в межі одного стандартного відхилення від середнього.
  • 95% -- в межах двох відхилень.
  • 99,7% -- в межах трьох відхилень.
Приклад

Бали НМТ з математики мають середнє 150 та стандартне відхилення 15. За правилом 68-95-99,7: 68% абітурієнтів набрали від 135 до 165 балів. 95% -- від 120 до 180. 99,7% -- від 105 до 195. Якщо хтось набрав 190 -- це верхні 2,5% (більш ніж два відхилення вгору).

Біноміальний розподіл

Біноміальний розподіл описує кількість "успіхів" у фіксованій кількості спроб, де кожна спроба має два результати (так/ні).

Приклад

Нова Пошта доставляє 95% посилок вчасно. Ви очікуєте 20 посилок. Скільки з них прийдуть вчасно? Біноміальний розподіл каже: найімовірніше 19 (95% від 20), але є шанс, що вчасно прийдуть 18 або навіть всі 20. Розподіл показує ймовірність кожного варіанту.

Розподіл Пуассона

Розподіл Пуассона описує кількість подій за фіксований проміжок часу або простору, коли події трапляються незалежно одна від одної.

17 1 16 2 17 3 16 4 17 5 17 6
Приклад

Служба підтримки Monobank отримує в середньому 50 дзвінків на годину. Розподіл Пуассона допомагає відповісти на запитання: яка ймовірність отримати більше 70 дзвінків за годину? Це потрібно для планування кількості операторів.

Рівномірний розподіл

Найпростіший розподіл: усі значення однаково ймовірні. Кубик -- класичний приклад. Генератор випадкових чисел від 0 до 1 -- теж рівномірний розподіл.

Асиметричні розподіли

Не всі дані симетричні. Доходи зазвичай мають правосторонню асиметрію: більшість людей заробляють помірно, але невелика кількість має дуже високий дохід, що "витягує" хвіст вправо.

Приклад

Зарплати в Україні: медіана -- близько 16 000 грн, а середнє -- близько 19 000 грн. Середнє більше за медіану, бо невелика кількість дуже високих зарплат тягне його вправо. Це типова правостороння асиметрія. Ось чому для доходів часто використовують медіану, а не середнє.

Чому розподіли важливі?

Знаючи розподіл даних, ви можете:

  • Оцінити, наскільки типовим є конкретне спостереження.
  • Обчислити ймовірність рідкісних подій.
  • Обрати правильний статистичний тест (багато тестів вимагають нормального розподілу).
  • Прогнозувати майбутні значення.
Ключовий висновок

Розподіл ймовірностей -- це карта, яка показує, наскільки ймовірне кожне значення. Нормальний (дзвоноподібний) розподіл найпоширеніший і описується правилом 68-95-99,7. Біноміальний розподіл рахує успіхи в серії спроб. Розподіл Пуассона описує рідкісні події за період часу. Розуміння розподілу ваших даних -- ключ до правильного аналізу та обґрунтованих висновків.