Twierdzenie Bayesa

Poziom trudności: Średniozaawansowany Czas czytania: 15 minut

Aktualizowanie przekonań

W poprzedniej lekcji widzieliśmy, że prawdopodobieństwo warunkowe pozwala nam uwzględniać nowe informacje. Twierdzenie Bayesa idzie o krok dalej - daje precyzyjny wzór na to, jak aktualizować nasze przekonania, gdy pojawiają się nowe dowody.

0.01 +Choroba 0.99 -Choroba 0.95 +Pozyt. 0.05 -Negat. 0.05 +Pozyt. 0.95 -Negat.

To jedno z najważniejszych twierdzeń w całej statystyce. Rewolucjonizuje sposób, w jaki myśli się o diagnostyce medycznej, filtrowaniu spamu, a nawet codziennym podejmowaniu decyzji.

Wzór

P(A|B) = P(B|A) × P(A) / P(B)

Gdzie:

  • P(A|B) - prawdopodobieństwo A po zaobserwowaniu B (posteriori)
  • P(B|A) - prawdopodobieństwo zaobserwowania B, jeśli A jest prawdziwe
  • P(A) - początkowe prawdopodobieństwo A (priori)
  • P(B) - całkowite prawdopodobieństwo zaobserwowania B
Przykład

Wróćmy do przykładu medycznego. Choroba dotyczy 1 na 1000 osób. Test ma czułość 95% i swoistość 90%. Dostajesz pozytywny wynik. Jakie jest prawdopodobieństwo, że jesteś chory?

P(chory) = 0,001. P(pozytywny|chory) = 0,95. P(pozytywny|zdrowy) = 0,10. P(pozytywny) = P(pozytywny|chory) × P(chory) + P(pozytywny|zdrowy) × P(zdrowy) = 0,95 × 0,001 + 0,10 × 0,999 = 0,00095 + 0,0999 = 0,10085.

P(chory|pozytywny) = 0,95 × 0,001 / 0,10085 ≈ 0,0094 ≈ 0,94%.

Niecały procent! Nawet z pozytywnym wynikiem testu o czułości 95%, prawdopodobieństwo choroby jest poniżej 1%, bo choroba jest tak rzadka.

Dlaczego to działa tak nieintuicyjnie?

Kluczem jest prawdopodobieństwo bazowe (priori). Jeśli choroba jest bardzo rzadka, to nawet dokładny test generuje więcej fałszywych alarmów niż prawdziwych trafień - po prostu dlatego, że zdrowych osób jest tak dużo więcej.

To dlatego lekarze często zlecają powtórny test po pozytywnym wyniku. Jeśli drugi test też jest pozytywny, prawdopodobieństwo choroby drastycznie rośnie - bo teraz priori to już nie 0,1%, ale około 1% (wynik pierwszego testu).

Bayes w codziennym życiu

Przykład

Twój sąsiad nigdy nie kłamał (na ile wiesz). Mówi ci, że widział wilka w parku w centrum Warszawy. Twoje początkowe przekonanie, że w centrum Warszawy jest wilk, jest bardzo niskie (P ≈ 0,001). Ale wiarygodność sąsiada jest wysoka. Twierdzenie Bayesa mówi, że powinieneś zaktualizować swoje przekonanie w górę, ale niekoniecznie do 100% - może sąsiad pomylił wilka z dużym psem.

Bayes a filtrowanie spamu

Filtry spamu w poczcie elektronicznej to jedno z najsłynniejszych zastosowań twierdzenia Bayesa. System uczy się, że pewne słowa (np. "wygrana", "nagroda", "kliknij tutaj") częściej pojawiają się w spamie. Kiedy przychodzi nowy e-mail, filtr oblicza: jakie jest prawdopodobieństwo, że to spam, biorąc pod uwagę słowa w wiadomości?

1 Przed 16 Po

Bayesowskie myślenie w praktyce

Nie musisz za każdym razem wykonywać formalnych obliczeń. Kluczowa lekcja z twierdzenia Bayesa jest taka:

  1. Zacznij od początkowego przekonania (priori) - co wiesz przed zobaczeniem nowych dowodów?
  2. Oceń siłę dowodu - jak bardzo ten dowód zmienia obraz?
  3. Zaktualizuj przekonanie - nowe przekonanie powinno uwzględniać zarówno priori, jak i nowy dowód.
Przykład

Słyszysz w wiadomościach, że nowy suplement diety "cudownie" leczy przeziębienie. Twoje priori: większość takich doniesień się nie potwierdza (powiedzmy 5% szans, że to prawda). Dowód: jedno małe badanie z 30 uczestnikami. Siła dowodu jest słaba. Zaktualizowane przekonanie: może 8-10%, ale daleko do pewności. Gdyby dowód pochodził z dużego badania z 10 000 uczestnikami opublikowanego w prestiżowym czasopiśmie, siła dowodu byłaby znacznie większa.

Częsty błąd: ignorowanie priori

Ludzie często ignorują prawdopodobieństwo bazowe i koncentrują się wyłącznie na nowych dowodach. To tzw. "błąd bazowy" (base rate neglect). Widząc pozytywny wynik testu, myśląc: "test jest 95% dokładny, więc na 95% jestem chory" - ignorując fakt, że choroba dotyczy 1 na 1000 osób.

Kluczowy wniosek

Twierdzenie Bayesa pozwala formalnie aktualizować przekonania w świetle nowych dowodów. Kluczowa lekcja: prawdopodobieństwo bazowe (priori) ma ogromne znaczenie. Nawet silny dowód nie może całkowicie przesłonić bardzo niskiego lub bardzo wysokiego priori. Myślenie bayesowskie - uwzględnianie zarówno tego, co już wiemy, jak i nowych informacji - to jedno z najpotężniejszych narzędzi krytycznego myślenia.