Aktualizowanie przekonań
W poprzedniej lekcji widzieliśmy, że prawdopodobieństwo warunkowe pozwala nam uwzględniać nowe informacje. Twierdzenie Bayesa idzie o krok dalej - daje precyzyjny wzór na to, jak aktualizować nasze przekonania, gdy pojawiają się nowe dowody.
To jedno z najważniejszych twierdzeń w całej statystyce. Rewolucjonizuje sposób, w jaki myśli się o diagnostyce medycznej, filtrowaniu spamu, a nawet codziennym podejmowaniu decyzji.
Wzór
P(A|B) = P(B|A) × P(A) / P(B)
Gdzie:
- P(A|B) - prawdopodobieństwo A po zaobserwowaniu B (posteriori)
- P(B|A) - prawdopodobieństwo zaobserwowania B, jeśli A jest prawdziwe
- P(A) - początkowe prawdopodobieństwo A (priori)
- P(B) - całkowite prawdopodobieństwo zaobserwowania B
Wróćmy do przykładu medycznego. Choroba dotyczy 1 na 1000 osób. Test ma czułość 95% i swoistość 90%. Dostajesz pozytywny wynik. Jakie jest prawdopodobieństwo, że jesteś chory?
P(chory) = 0,001. P(pozytywny|chory) = 0,95. P(pozytywny|zdrowy) = 0,10. P(pozytywny) = P(pozytywny|chory) × P(chory) + P(pozytywny|zdrowy) × P(zdrowy) = 0,95 × 0,001 + 0,10 × 0,999 = 0,00095 + 0,0999 = 0,10085.
P(chory|pozytywny) = 0,95 × 0,001 / 0,10085 ≈ 0,0094 ≈ 0,94%.
Niecały procent! Nawet z pozytywnym wynikiem testu o czułości 95%, prawdopodobieństwo choroby jest poniżej 1%, bo choroba jest tak rzadka.
Dlaczego to działa tak nieintuicyjnie?
Kluczem jest prawdopodobieństwo bazowe (priori). Jeśli choroba jest bardzo rzadka, to nawet dokładny test generuje więcej fałszywych alarmów niż prawdziwych trafień - po prostu dlatego, że zdrowych osób jest tak dużo więcej.
To dlatego lekarze często zlecają powtórny test po pozytywnym wyniku. Jeśli drugi test też jest pozytywny, prawdopodobieństwo choroby drastycznie rośnie - bo teraz priori to już nie 0,1%, ale około 1% (wynik pierwszego testu).
Bayes w codziennym życiu
Twój sąsiad nigdy nie kłamał (na ile wiesz). Mówi ci, że widział wilka w parku w centrum Warszawy. Twoje początkowe przekonanie, że w centrum Warszawy jest wilk, jest bardzo niskie (P ≈ 0,001). Ale wiarygodność sąsiada jest wysoka. Twierdzenie Bayesa mówi, że powinieneś zaktualizować swoje przekonanie w górę, ale niekoniecznie do 100% - może sąsiad pomylił wilka z dużym psem.
Bayes a filtrowanie spamu
Filtry spamu w poczcie elektronicznej to jedno z najsłynniejszych zastosowań twierdzenia Bayesa. System uczy się, że pewne słowa (np. "wygrana", "nagroda", "kliknij tutaj") częściej pojawiają się w spamie. Kiedy przychodzi nowy e-mail, filtr oblicza: jakie jest prawdopodobieństwo, że to spam, biorąc pod uwagę słowa w wiadomości?
Bayesowskie myślenie w praktyce
Nie musisz za każdym razem wykonywać formalnych obliczeń. Kluczowa lekcja z twierdzenia Bayesa jest taka:
- Zacznij od początkowego przekonania (priori) - co wiesz przed zobaczeniem nowych dowodów?
- Oceń siłę dowodu - jak bardzo ten dowód zmienia obraz?
- Zaktualizuj przekonanie - nowe przekonanie powinno uwzględniać zarówno priori, jak i nowy dowód.
Słyszysz w wiadomościach, że nowy suplement diety "cudownie" leczy przeziębienie. Twoje priori: większość takich doniesień się nie potwierdza (powiedzmy 5% szans, że to prawda). Dowód: jedno małe badanie z 30 uczestnikami. Siła dowodu jest słaba. Zaktualizowane przekonanie: może 8-10%, ale daleko do pewności. Gdyby dowód pochodził z dużego badania z 10 000 uczestnikami opublikowanego w prestiżowym czasopiśmie, siła dowodu byłaby znacznie większa.
Częsty błąd: ignorowanie priori
Ludzie często ignorują prawdopodobieństwo bazowe i koncentrują się wyłącznie na nowych dowodach. To tzw. "błąd bazowy" (base rate neglect). Widząc pozytywny wynik testu, myśląc: "test jest 95% dokładny, więc na 95% jestem chory" - ignorując fakt, że choroba dotyczy 1 na 1000 osób.
Twierdzenie Bayesa pozwala formalnie aktualizować przekonania w świetle nowych dowodów. Kluczowa lekcja: prawdopodobieństwo bazowe (priori) ma ogromne znaczenie. Nawet silny dowód nie może całkowicie przesłonić bardzo niskiego lub bardzo wysokiego priori. Myślenie bayesowskie - uwzględnianie zarówno tego, co już wiemy, jak i nowych informacji - to jedno z najpotężniejszych narzędzi krytycznego myślenia.