Definicja
Twierdzenie Bayesa to wzór matematyczny opisujący, jak zaktualizować prawdopodobieństwo hipotezy, gdy pojawiają się nowe dowody. Łączy wiedzę wcześniejszą z zaobserwowanymi danymi, aby uzyskać zmienione prawdopodobieństwo.
Jak to działa
Zaczynasz od początkowego przekonania (prawdopodobieństwo a priori), obserwujesz nowy dowód, a następnie obliczasz zaktualizowane przekonanie (prawdopodobieństwo a posteriori).
Choroba dotyka 1% populacji. Test na tę chorobę ma 90% dokładności (prawidłowo identyfikuje 90% chorych i 90% zdrowych osób).
Twój wynik jest pozytywny. Jakie jest prawdopodobieństwo, że naprawdę jesteś chory?
Używając twierdzenia Bayesa: P(chory|pozytywny) = (0,90 x 0,01) / ((0,90 x 0,01) + (0,10 x 0,99)) = 0,009 / 0,108 = około 8,3%
Pomimo "90% dokładności" testu, prawdopodobieństwo rzeczywistej choroby wynosi tylko 8,3%. Niski wskaźnik bazowy (1%) oznacza, że większość wyników pozytywnych to wyniki fałszywie pozytywne.
Dlaczego to ważne
Twierdzenie Bayesa stanowi fundament statystyki bayesowskiej - całej gałęzi myślenia statystycznego. Napędza filtry antyspamowe, narzędzia diagnostyki medycznej, systemy rekomendacji i algorytmy uczenia maszynowego.
Twierdzenie ujawnia też kluczowy wniosek: dokładność testu nie wystarczy do interpretacji wyników. Należy również uwzględnić, jak częsta jest dana choroba (wskaźnik bazowy). Ignorowanie wskaźników bazowych to jeden z najczęstszych błędów rozumowania.
Twierdzenie Bayesa mówi, jak aktualizować prawdopodobieństwa na podstawie nowych dowodów. Zawsze uwzględniaj wskaźnik bazowy - "bardzo dokładny" test może nadal dawać głównie fałszywe wyniki pozytywne w przypadku rzadkich schorzeń.