Байес теоремасы

Катлаулылык: Уртача Уку вакыты: 15 минут

Байес теоремасы нәрсә ул?

Байес теоремасы - яңа мәгълүмат алганда фикерләрне яңарту ысулы. Сезнең башта берәр нәрсә турында фикерегез бар (алдангы ихтималлык), яңа мәгълүмат ала һәм фикерне яңартасыз (арттан ихтималлык). Бу - логик фикерләүнең формулага салынганы.

0.01 +Авыру 0.99 -Авыру 0.95 +Тест 0.05 -Тест 0.05 +Тест 0.95 -Тест

Формула

P(A | Б) = P(Б | A) × P(A) ÷ P(Б)

  • P(A) - алдангы ихтималлык: яңа мәгълүмат алганчы А турындагы ышанычыгыз
  • P(Б | A) - А дөрес булса, Б күзәтелү ихтималлыгы
  • P(Б) - Б ның гомуми ихтималлыгы
  • P(A | Б) - арттан ихтималлык: Б күзәтелгәннән соң А ихтималлыгы

Гади мисал: медицина тесты

Мисал

Казанда сирәк авыру өчен тест ясыйлар. Авыру 1 000 кешенең 5-ендә генә очрый (P(авыру) = 0.005). Тест 95% точнослы: авыру кеше тикшерелсә, тест 95% очракта уңай нәтиҗә бирә (P(уңай | авыру) = 0.95). Сау кешедә ялган уңай ихтималлыгы 3% (P(уңай | сау) = 0.03).

Тест уңай чыкты. Чыннан да авыру булу ихтималлыгы ничәгә тигез?

Байес белән исәпләү:

P(уңай) = P(уңай | авыру) × P(авыру) + P(уңай | сау) × P(сау)

P(уңай) = 0.95 × 0.005 + 0.03 × 0.995 = 0.00475 + 0.02985 = 0.0346

P(авыру | уңай) = 0.95 × 0.005 ÷ 0.0346 = 0.00475 ÷ 0.0346 ≈ 0.137 = 13.7%

Тест уңай булса да, чыннан да авыру булу ихтималлыгы бары 13.7%! Бу күпләрне гаҗәпләндерә. Авыру бик сирәк очрый, шуңа ялган уңайлар күп.

Ни өчен нәтиҗә шулай гаҗәп?

Ачкыч - алдангы ихтималлыкта (base rate). Авыру бик сирәк (0.5%), шуңа хәтта яхшы тест та күп ялган уңай бирәчәк. Бу «алдангы ихтималлык ялгышлыгы» (base rate fallacy) дип атала - кешеләр еш кына алдангы ихтималлыкны игнорь итәләр.

Саннар белән күрсәтик

Мисал

10 000 кеше тикшерелә:

1 Элек 16 Соң
  • 50 кеше авыру. Алардан 47.5 (≈48) тестта уңай (чын уңай).
  • 9 950 кеше сау. Алардан 298.5 (≈299) тестта уңай (ялган уңай).

Барлыгы уңай тест: 48 + 299 = 347

Чын авыру: 48 / 347 ≈ 13.8%

Уңай тест алган кешеләрнең 86% ы чынлыкта сау!

Көндәлек тормышта Байес

Байес фикерләве медицинадан тыш да кулланыла:

Мисал

Сез Рубин уенына бара торгансыз. Алдангы фикерегез: Рубин 60% ихтималлык белән җиңәчәк. Ләкин уенга 15 минут калгач, хәбәр килә: Рубинның иң яхшы нападающийсе сакатланган. Хәзер ихтималлыкны яңартасыз - бәлки 40% ка. Бу - Байес фикерләве: яңа мәгълүмат алганда ышанычыңны яңарту.

Спам фильтры - Байес кулланылышы

Электрон почтадагы спам фильтрлары Байес теоремасын куллана. Фильтр хат эчендәге сүзләргә карый: «акча», «бүләк», «бушлай» дигән сүзләр бар - спам ихтималлыгы арта. Ләкин контекст мөһим: «бушлай дәресләр» дигән сүз Stats24 дан килгән икән - спам түгел дип бәяли.

Байес фикерләвенең файдасы

  1. Яңа мәгълүмат белән фикерне яңартыгыз. Башта фикерегез бар - ләкин яңа фактлар алгач, аны үзгәртү нормаль.
  2. Алдангы ихтималлыкны игнорь итмәгез. Авыру сирәк булса - хәтта яхшы тест та ялган уңай бирәчәк.
  3. Бер дәлилгә генә таянмагыз. Берничә чыганактан мәгълүмат җыегыз, һәрберсе белән ихтималлыкны яңартыгыз.
Төп нәтиҗә

Байес теоремасы - яңа мәгълүмат алганда ихтималлыкларны яңарту формуласы. P(A | Б) = P(Б | A) × P(A) ÷ P(Б). Иң мөһим сабак: алдангы ихтималлыкны (base rate) игнорь итмәгез. Авыру сирәк булса, хәтта яхшы тест та күп ялган уңай бирәчәк. Байес фикерләве - медицинадан спам фильтрларына кадәр һәр җирдә кулланыла.