Навчитися змінювати думку
Уявіть: ви чуєте гуркіт на вулиці. Перша думка -- грім. Але потім ви бачите безхмарне небо. Ваша оцінка змінюється: мабуть, це будівельна техніка. Ви щойно інтуїтивно застосували теорему Баєса -- оновили свою початкову оцінку на основі нового доказу.
Теорема Баєса формалізує цей процес. Вона показує, як перейти від початкової ймовірності (до отримання інформації) до оновленої ймовірності (після отримання інформації).
Формула
P(A|B) = P(B|A) × P(A) / P(B)
Де:
- P(A) -- апріорна ймовірність: наша початкова оцінка до отримання нової інформації.
- P(B|A) -- правдоподібність: наскільки ймовірне спостереження B, якщо A істинне.
- P(B) -- загальна ймовірність спостереження B.
- P(A|B) -- апостеріорна ймовірність: оновлена оцінка після врахування B.
На заводі "Рошен" дві лінії виробляють цукерки. Лінія 1 -- 60% продукції, Лінія 2 -- 40%. Лінія 1 має 3% браку, Лінія 2 -- 5% браку. Ви знайшли браковану цукерку. Яка ймовірність, що вона з Лінії 1?
P(Л1) = 0,60. P(брак|Л1) = 0,03. P(брак|Л2) = 0,05. P(брак) = 0,60 × 0,03 + 0,40 × 0,05 = 0,018 + 0,020 = 0,038.
P(Л1|брак) = 0,60 × 0,03 / 0,038 = 0,018 / 0,038 ≈ 0,47 (47%).
Хоча Лінія 1 виробляє 60% продукції, серед браку її частка лише 47%, бо в неї нижчий відсоток дефектів.
Медичний приклад (через Баєса)
Пригадаємо приклад з попереднього уроку про медичний тест -- тепер вирішимо його через формулу Баєса.
Хвороба вражає 1 з 1 000 людей. Тест має чутливість 99% і специфічність 95%. Тест позитивний. Яка ймовірність хвороби?
P(хвороба) = 0,001. P("+" | хвороба) = 0,99. P("+" | здоровий) = 0,05.
P("+") = 0,001 × 0,99 + 0,999 × 0,05 = 0,00099 + 0,04995 = 0,05094.
P(хвороба | "+") = 0,001 × 0,99 / 0,05094 = 0,00099 / 0,05094 ≈ 0,019 (1,9%).
Ймовірність хвороби лише 1,9%, хоча тест "позитивний". Це тому, що хвороба дуже рідкісна (мала апріорна ймовірність).
Байєсівське мислення у повсякденному житті
Теорема Баєса -- це не тільки формула, а й спосіб мислення. Починайте з початкової оцінки, потім оновлюйте її при появі нових даних.
Ви замовили товар на Rozetka. За статистикою, 90% замовлень доставляються вчасно. Це ваша апріорна оцінка: 90% ймовірність вчасної доставки. Потім ви бачите, що статус замовлення не оновлювався 2 дні. Це нова інформація, яка знижує ймовірність вчасної доставки. Ваша апостеріорна оцінка може впасти до 50%. Потім ви отримуєте SMS "посилка у відділенні" -- і ймовірність знову зростає до 95%. Кожен новий доказ оновлює вашу оцінку.
Загальна ймовірність: знаменник формули
Найскладніша частина формули Баєса -- P(B), загальна ймовірність. Її обчислюють за формулою повної ймовірності: розглядають усі можливі "шляхи" до події B.
P(B) = P(B|A) × P(A) + P(B|не A) × P(не A)
Це як сказати: "подія B може статися через A або не через A -- порахуємо обидва варіанти."
Чому Баєс важливий?
Теорема Баєса лежить в основі:
- Спам-фільтрів: Gmail оновлює ймовірність "це спам" на основі кожного нового слова в листі.
- Медичної діагностики: лікарі (іноді несвідомо) оновлюють ймовірність діагнозу з кожним новим аналізом.
- Судової практики: нові докази оновлюють ймовірність вини підозрюваного.
- Машинного навчання: баєсівські алгоритми класифікують тексти, зображення та інші дані.
Поширені помилки
- Ігнорування базової ймовірності: це найчастіша помилка. Навіть дуже точний тест дає багато хибних результатів, якщо те, що ви шукаєте, рідкісне.
- Плутання P(A|B) і P(B|A): ймовірність позитивного тесту за умови хвороби -- це не те саме, що ймовірність хвороби за умови позитивного тесту.
Теорема Баєса -- це формальний спосіб оновлювати свої переконання при появі нових доказів. Вона комбінує апріорну ймовірність (що ви знали раніше), правдоподібність (наскільки новий доказ узгоджується з гіпотезою) та загальну ймовірність доказу. Найважливіший практичний урок: завжди враховуйте базову ймовірність події, інакше навіть точні тести можуть вас ввести в оману.