Теорема Баєса простою мовою

Складність: Середній Час читання: 15 хвилин

Навчитися змінювати думку

Уявіть: ви чуєте гуркіт на вулиці. Перша думка -- грім. Але потім ви бачите безхмарне небо. Ваша оцінка змінюється: мабуть, це будівельна техніка. Ви щойно інтуїтивно застосували теорему Баєса -- оновили свою початкову оцінку на основі нового доказу.

0.01 +Хвороба 0.99 -Хвороба 0.95 +Тест 0.05 -Тест 0.05 +Тест 0.95 -Тест

Теорема Баєса формалізує цей процес. Вона показує, як перейти від початкової ймовірності (до отримання інформації) до оновленої ймовірності (після отримання інформації).

Формула

P(A|B) = P(B|A) × P(A) / P(B)

Де:

  • P(A) -- апріорна ймовірність: наша початкова оцінка до отримання нової інформації.
  • P(B|A) -- правдоподібність: наскільки ймовірне спостереження B, якщо A істинне.
  • P(B) -- загальна ймовірність спостереження B.
  • P(A|B) -- апостеріорна ймовірність: оновлена оцінка після врахування B.
Приклад

На заводі "Рошен" дві лінії виробляють цукерки. Лінія 1 -- 60% продукції, Лінія 2 -- 40%. Лінія 1 має 3% браку, Лінія 2 -- 5% браку. Ви знайшли браковану цукерку. Яка ймовірність, що вона з Лінії 1?

P(Л1) = 0,60. P(брак|Л1) = 0,03. P(брак|Л2) = 0,05. P(брак) = 0,60 × 0,03 + 0,40 × 0,05 = 0,018 + 0,020 = 0,038.

P(Л1|брак) = 0,60 × 0,03 / 0,038 = 0,018 / 0,038 ≈ 0,47 (47%).

Хоча Лінія 1 виробляє 60% продукції, серед браку її частка лише 47%, бо в неї нижчий відсоток дефектів.

Медичний приклад (через Баєса)

Пригадаємо приклад з попереднього уроку про медичний тест -- тепер вирішимо його через формулу Баєса.

Приклад

Хвороба вражає 1 з 1 000 людей. Тест має чутливість 99% і специфічність 95%. Тест позитивний. Яка ймовірність хвороби?

P(хвороба) = 0,001. P("+" | хвороба) = 0,99. P("+" | здоровий) = 0,05.

P("+") = 0,001 × 0,99 + 0,999 × 0,05 = 0,00099 + 0,04995 = 0,05094.

P(хвороба | "+") = 0,001 × 0,99 / 0,05094 = 0,00099 / 0,05094 ≈ 0,019 (1,9%).

Ймовірність хвороби лише 1,9%, хоча тест "позитивний". Це тому, що хвороба дуже рідкісна (мала апріорна ймовірність).

Байєсівське мислення у повсякденному житті

Теорема Баєса -- це не тільки формула, а й спосіб мислення. Починайте з початкової оцінки, потім оновлюйте її при появі нових даних.

Приклад

Ви замовили товар на Rozetka. За статистикою, 90% замовлень доставляються вчасно. Це ваша апріорна оцінка: 90% ймовірність вчасної доставки. Потім ви бачите, що статус замовлення не оновлювався 2 дні. Це нова інформація, яка знижує ймовірність вчасної доставки. Ваша апостеріорна оцінка може впасти до 50%. Потім ви отримуєте SMS "посилка у відділенні" -- і ймовірність знову зростає до 95%. Кожен новий доказ оновлює вашу оцінку.

Загальна ймовірність: знаменник формули

Найскладніша частина формули Баєса -- P(B), загальна ймовірність. Її обчислюють за формулою повної ймовірності: розглядають усі можливі "шляхи" до події B.

1 Апріорна 16 Апостеріорна

P(B) = P(B|A) × P(A) + P(B|не A) × P(не A)

Це як сказати: "подія B може статися через A або не через A -- порахуємо обидва варіанти."

Чому Баєс важливий?

Теорема Баєса лежить в основі:

  • Спам-фільтрів: Gmail оновлює ймовірність "це спам" на основі кожного нового слова в листі.
  • Медичної діагностики: лікарі (іноді несвідомо) оновлюють ймовірність діагнозу з кожним новим аналізом.
  • Судової практики: нові докази оновлюють ймовірність вини підозрюваного.
  • Машинного навчання: баєсівські алгоритми класифікують тексти, зображення та інші дані.

Поширені помилки

  • Ігнорування базової ймовірності: це найчастіша помилка. Навіть дуже точний тест дає багато хибних результатів, якщо те, що ви шукаєте, рідкісне.
  • Плутання P(A|B) і P(B|A): ймовірність позитивного тесту за умови хвороби -- це не те саме, що ймовірність хвороби за умови позитивного тесту.
Ключовий висновок

Теорема Баєса -- це формальний спосіб оновлювати свої переконання при появі нових доказів. Вона комбінує апріорну ймовірність (що ви знали раніше), правдоподібність (наскільки новий доказ узгоджується з гіпотезою) та загальну ймовірність доказу. Найважливіший практичний урок: завжди враховуйте базову ймовірність події, інакше навіть точні тести можуть вас ввести в оману.