Байес теоремасы нәрсә ул?
Байес теоремасы - яңа мәгълүмат алганда фикерләрне яңарту ысулы. Сезнең башта берәр нәрсә турында фикерегез бар (алдангы ихтималлык), яңа мәгълүмат ала һәм фикерне яңартасыз (арттан ихтималлык). Бу - логик фикерләүнең формулага салынганы.
Формула
P(A | Б) = P(Б | A) × P(A) ÷ P(Б)
- P(A) - алдангы ихтималлык: яңа мәгълүмат алганчы А турындагы ышанычыгыз
- P(Б | A) - А дөрес булса, Б күзәтелү ихтималлыгы
- P(Б) - Б ның гомуми ихтималлыгы
- P(A | Б) - арттан ихтималлык: Б күзәтелгәннән соң А ихтималлыгы
Гади мисал: медицина тесты
Казанда сирәк авыру өчен тест ясыйлар. Авыру 1 000 кешенең 5-ендә генә очрый (P(авыру) = 0.005). Тест 95% точнослы: авыру кеше тикшерелсә, тест 95% очракта уңай нәтиҗә бирә (P(уңай | авыру) = 0.95). Сау кешедә ялган уңай ихтималлыгы 3% (P(уңай | сау) = 0.03).
Тест уңай чыкты. Чыннан да авыру булу ихтималлыгы ничәгә тигез?
Байес белән исәпләү:
P(уңай) = P(уңай | авыру) × P(авыру) + P(уңай | сау) × P(сау)
P(уңай) = 0.95 × 0.005 + 0.03 × 0.995 = 0.00475 + 0.02985 = 0.0346
P(авыру | уңай) = 0.95 × 0.005 ÷ 0.0346 = 0.00475 ÷ 0.0346 ≈ 0.137 = 13.7%
Тест уңай булса да, чыннан да авыру булу ихтималлыгы бары 13.7%! Бу күпләрне гаҗәпләндерә. Авыру бик сирәк очрый, шуңа ялган уңайлар күп.
Ни өчен нәтиҗә шулай гаҗәп?
Ачкыч - алдангы ихтималлыкта (base rate). Авыру бик сирәк (0.5%), шуңа хәтта яхшы тест та күп ялган уңай бирәчәк. Бу «алдангы ихтималлык ялгышлыгы» (base rate fallacy) дип атала - кешеләр еш кына алдангы ихтималлыкны игнорь итәләр.
Саннар белән күрсәтик
10 000 кеше тикшерелә:
- 50 кеше авыру. Алардан 47.5 (≈48) тестта уңай (чын уңай).
- 9 950 кеше сау. Алардан 298.5 (≈299) тестта уңай (ялган уңай).
Барлыгы уңай тест: 48 + 299 = 347
Чын авыру: 48 / 347 ≈ 13.8%
Уңай тест алган кешеләрнең 86% ы чынлыкта сау!
Көндәлек тормышта Байес
Байес фикерләве медицинадан тыш да кулланыла:
Сез Рубин уенына бара торгансыз. Алдангы фикерегез: Рубин 60% ихтималлык белән җиңәчәк. Ләкин уенга 15 минут калгач, хәбәр килә: Рубинның иң яхшы нападающийсе сакатланган. Хәзер ихтималлыкны яңартасыз - бәлки 40% ка. Бу - Байес фикерләве: яңа мәгълүмат алганда ышанычыңны яңарту.
Спам фильтры - Байес кулланылышы
Электрон почтадагы спам фильтрлары Байес теоремасын куллана. Фильтр хат эчендәге сүзләргә карый: «акча», «бүләк», «бушлай» дигән сүзләр бар - спам ихтималлыгы арта. Ләкин контекст мөһим: «бушлай дәресләр» дигән сүз Stats24 дан килгән икән - спам түгел дип бәяли.
Байес фикерләвенең файдасы
- Яңа мәгълүмат белән фикерне яңартыгыз. Башта фикерегез бар - ләкин яңа фактлар алгач, аны үзгәртү нормаль.
- Алдангы ихтималлыкны игнорь итмәгез. Авыру сирәк булса - хәтта яхшы тест та ялган уңай бирәчәк.
- Бер дәлилгә генә таянмагыз. Берничә чыганактан мәгълүмат җыегыз, һәрберсе белән ихтималлыкны яңартыгыз.
Байес теоремасы - яңа мәгълүмат алганда ихтималлыкларны яңарту формуласы. P(A | Б) = P(Б | A) × P(A) ÷ P(Б). Иң мөһим сабак: алдангы ихтималлыкны (base rate) игнорь итмәгез. Авыру сирәк булса, хәтта яхшы тест та күп ялган уңай бирәчәк. Байес фикерләве - медицинадан спам фильтрларына кадәр һәр җирдә кулланыла.