Что такое теорема Байеса?

Определение

Теорема Байеса - это математическая формула, которая описывает, как обновить вероятность гипотезы при появлении новых данных. Она связывает предварительные знания с наблюдаемыми данными для получения пересмотренной вероятности.

Как это работает

Вы начинаете с начального убеждения (априорной вероятности), наблюдаете новые доказательства, а затем вычисляете обновленное убеждение (апостериорную вероятность).

Пример

Болезнь поражает 1% населения. Тест на болезнь имеет точность 90% (он правильно определяет 90% больных и 90% здоровых).

Ваш результат положительный. Какова вероятность того, что вы действительно больны?

Используя теорему Байеса: P(болен|положительный) = (0.90 x 0.01) / ((0.90 x 0.01) + (0.10 x 0.99)) = 0.009 / 0.108 = примерно 8.3%

Несмотря на "90% точный" тест, вероятность того, что вы действительно больны, составляет всего 8.3%. Низкая базовая частота (1%) означает, что большинство положительных результатов - ложноположительные.

Почему это важно

Теорема Байеса является основой байесовской статистики - целого направления статистического мышления. Она лежит в основе спам-фильтров электронной почты, инструментов медицинской диагностики, рекомендательных систем и алгоритмов машинного обучения.

Теорема также раскрывает важное понимание: точности теста недостаточно для интерпретации результатов. Необходимо также учитывать, насколько распространено состояние (базовую частоту). Игнорирование базовых частот - одна из самых распространенных ошибок мышления.

Ключевой вывод

Теорема Байеса показывает, как обновлять вероятности с новыми данными. Всегда учитывайте базовую частоту - "высокоточный" тест может давать преимущественно ложноположительные результаты для редких состояний.

← Back to Glossary