Визначення
Теорема Баєса - це математична формула, яка описує, як оновити ймовiрнiсть гiпотези, коли зʼявляються новi докази. Вона поєднує попереднi знання зi спостережуваними даними для отримання переглянутої ймовiрностi.
Як це працює
Ви починаєте з початкового переконання (апрiорна ймовiрнiсть), спостерiгаєте новi докази, а потiм обчислюєте оновлене переконання (апостерiорна ймовiрнiсть).
Хвороба вражає 1% населення. Тест на хворобу має точнiсть 90% (вiн правильно визначає 90% хворих та 90% здорових людей).
Ваш тест позитивний. Яка ймовiрнiсть, що ви дiйсно хворi?
За теоремою Баєса: P(хворий|позитивний) = (0,90 x 0,01) / ((0,90 x 0,01) + (0,10 x 0,99)) = 0,009 / 0,108 = приблизно 8,3%
Незважаючи на "90% точний" тест, iснує лише 8,3% шанс, що ви дiйсно хворi. Низька базова частота (1%) означає, що бiльшiсть позитивних результатiв є хибнопозитивними.
Чому це важливо
Теорема Баєса є основою баєсiвської статистики - цiлого напрямку статистичного мислення. Вона забезпечує роботу спам-фiльтрiв електронної пошти, медичних дiагностичних iнструментiв, рекомендацiйних систем та алгоритмiв машинного навчання.
Теорема також виявляє критично важливий висновок: точностi тесту недостатньо для iнтерпретацiї результатiв. Потрiбно також враховувати, наскiльки поширеним є стан (базова частота). Iгнорування базових частот є однiєю з найпоширенiших помилок мiркування.
Теорема Баєса показує, як оновлювати ймовiрностi з новими доказами. Завжди враховуйте базову частоту - "високоточний" тест може все одно давати переважно хибнопозитивнi результати для рiдкiсних станiв.