İnandıklarınızı Güncellemek
Önceki derste yeni bilginin olasılığı nasıl değiştirdiğini gördük. Koşullu olasılık "bir şey olduğu koşulunda, yeni şanslar nedir?" sorusunu cevapladar. Bayes Teoremi bunu bir adım ileri götürür ve yeni kanıt geldiğinde inançlarınızı güncellemenin sistematik bir yolunu sunar.
18. yüzyıl din adamı ve matematikçi Rahip Thomas Bayes'in adını taşıyan bu teorem, tüm istatistiklerdeki en güçlü fikirlerden biridir. Ve ününe rağmen, temel fikri şaşırtıcı derecede açıktır.
Büyük Fikir Sade Dille
İşte Bayes Teoremi günlük terimlerle:
Güncellenmiş inancınız = Orijinal inancınız x Kanıtın ne kadar uygun düştüğü / Kanıtın genel olarak ne kadar yaygın olduğu
Veya daha kesin olarak:
- Önceki inancınızla başlayın ("öncül" olasılık).
- Yeni kanıta bakın ve sorun: "İnancım doğru olsaydı, bu kanıt ne kadar muhtemel olurdu?"
- Ayrıca düşünün: "Bu kanıt genel olarak ne kadar muhtemel - inancım doğru olsa da olmasa da?"
- Bunları birleştirerek güncellenmiş inancınızı (son olasılığı) elde edin.
Formül
Formülleri sevenler için, işte:
P(A | B) = P(B | A) x P(A) / P(B)
Burada:
- P(A | B) = B kanıtını gördükten sonra A'nın olasılığı (bulmak istediğiniz)
- P(B | A) = A doğruysa B kanıtını görme olasılığı
- P(A) = Yeni kanıttan önceki A olasılığı (öncül inancınız)
- P(B) = B kanıtını görme genel olasılığı
Formül şu an soyut geliyorsa endişelenmeyin. Aşağıdaki örnekler somutlaştıracak.
Örnek: Hastalık Testi Tekrar
Bu klasik Bayes Teoremi örneğidir ve tam olarak koşullu olasılık dersimizin kaldığı yerden devam eder.
Bir hastalık 200 kişiden 1'ini etkiliyor (%0,5). Kan testi, hastalığı olan birinde %95 oranında tespit ediyor (buna "duyarlılık" denir). Ama sağlıklı insanların %3'ü de yanlış pozitif sonuç alıyor.
Testiniz pozitif çıkıyor. Gerçekten hastalığınız olma olasılığı nedir?
Adım 1: Bildiklerinizi yazın.
- P(hastalık) = 0,005 (öncülünüz - 200'de 1)
- P(pozitif | hastalık) = 0,95 (test hastaların %95'ini yakalar)
- P(pozitif | hastalık yok) = 0,03 (%3 yanlış pozitif oranı)
Adım 2: P(pozitif) bulun - pozitif çıkmanın genel şansı.
P(pozitif) = P(pozitif | hastalık) x P(hastalık) + P(pozitif | hastalık yok) x P(hastalık yok)
= (0,95 x 0,005) + (0,03 x 0,995)
= 0,00475 + 0,02985 = 0,03460
Adım 3: Bayes Teoremini uygulayın.
P(hastalık | pozitif) = P(pozitif | hastalık) x P(hastalık) / P(pozitif)
= (0,95 x 0,005) / 0,03460
= 0,00475 / 0,03460 = 0,137, yani yaklaşık %13,7.
%95 doğrulukta bir testle bile, pozitif sonuç sadece yaklaşık %14 gerçek hastalık şansı demek. Düşük baz oranı (sadece %0,5 insanın hasta olması) çoğu pozitif sonucun yanlış alarm olduğu anlamına gelir.
Bu yüzden doktorlar genellikle pozitif sonuçtan sonra ikinci bir test ister. İkinci test de pozitifse, olasılık dramatik olarak yükselir - çünkü artık "öncülünüz" %0,5 yerine %13,7'dir.
Kişiler Açısından Düşünmek (Doğal Frekans Yaklaşımı)
Birçoğu Bayes Teoremini olasılıklar yerine gerçek kişi sayıları kullanarak daha kolay anlar. Yukarıdaki örneği 10.000 kişiyle tekrar yapalım:
10.000 kişiden:
- 50'sinde hastalık var (10.000'in %0,5'i).
- 9.950'sinde hastalık YOK.
50 hasta kişiyi test edin: %95'i pozitif çıkar → 47,5 (yaklaşık 48) pozitif sonuç.
9.950 sağlıklı kişiyi test edin: %3'ü pozitif çıkar → 298,5 (yaklaşık 299) yanlış pozitif.
Toplam pozitif sonuç: 48 + 299 = 347.
Bu 347 pozitif sonuçtan sadece 48'inde gerçekten hastalık var.
48 / 347 = 0,138, yani yaklaşık %13,8. (13,7%'den küçük fark sadece yuvarlama.)
Bu yaklaşım - gerçek kişi saymak - genellikle bir formüle sayı sokmaktan daha sezgisel hissettirir.
Örnek: O E-posta Spam mi?
E-posta spam filtreleri, Bayes Teoreminin en yaygın gerçek dünya uygulamalarından biridir.
Aldığınız e-postaların %40'ının spam olduğunu varsayalım. "BEDAVA" kelimesi spam e-postaların %80'inde görünüyor ama meşru e-postaların sadece %5'inde. "BEDAVA" kelimesini içeren bir e-posta geliyor. Spam olma olasılığı nedir?
Bildiklerimiz:
- P(spam) = 0,40
- P("BEDAVA" | spam) = 0,80
- P("BEDAVA" | spam değil) = 0,05
P("BEDAVA") genel olarak:
= (0,80 x 0,40) + (0,05 x 0,60) = 0,32 + 0,03 = 0,35
Bayes Teoremini uygula:
P(spam | "BEDAVA") = (0,80 x 0,40) / 0,35 = 0,32 / 0,35 = 0,914, yani yaklaşık %91,4.
"BEDAVA" içeren bir e-postanın spam olma olasılığı yaklaşık %91. Gerçek spam filtreleri tam olarak bu mantığı kullanır, ama sadece bir kelime yerine binlerce kelime ve özellikle.
Örnek: Yemek Pişirirken Duman Alarmı
Duman alarminiz çalıyor. Deneyimlerinizden biliyorsunuz:
- Evinizde yaklaşık 10 yılda bir gerçek yangın oluyor, yani herhangi bir günde yaklaşık %0,03 olasılık.
- Gerçek yangın VARSA, alarm %99 oranında çalıyor.
- Yangın YOKSA, alarm yine de yaklaşık %2 oranında çalıyor (yanan tost, duştan buhar vb.).
Alarm az önce çaldı. Yangın mı var?
P(yangın | alarm) = (0,99 x 0,0003) / [(0,99 x 0,0003) + (0,02 x 0,9997)]
= 0,000297 / (0,000297 + 0,019994) = 0,000297 / 0,020291 = 0,0146, yani yaklaşık %1,5.
Gerçek yangın olasılığı yaklaşık %1,5. Düşük - ama sıfır değil. Yine de kontrol etmelisiniz! Mesele şu ki, gerçek yangınlar yanan toste kıyasla çok nadir olduğu için çoğu alarm yanlış alarmdır.
Baz Oranı Neden Bu Kadar Önemli?
Tüm bu örneklerde sürekli bir tema beliriyor: baz oranı - herhangi bir kanıttan önce bir şeyin ne kadar yaygın olduğu - nihai cevap üzerinde muazzam bir etkiye sahiptir.
Test ettiğiniz şey nadir olduğunda (nüfusun %0,5'ini etkileyen bir hastalık veya on yılda bir olan yangın), çok doğruluklu testler bile çoğunlukla yanlış pozitifler üretir. Bu testin başarısızlığı değildir; temel matematiktir.
Tersine, bir şey yaygın olduğunda (e-postaların %40'ını oluşturan spam), orta düzey kanıt bile olasılığı çok yükseğe taşıyabilir.
Pratik ders: herhangi bir test sonucunu, uyarıyı veya göstergeyi yorumlamadan önce her zaman "bu ilk başta ne kadar yaygın?" diye sorun.
Düşünme Biçimi Olarak Bayes Teoremi
Matematiğin ötesinde, Bayes Teoremi dünya hakkında düşünmenin değerli bir yolunu sunar:
- Bildiklerinizle başlayın. Yeni kanıt almadan önce en iyi tahmininiz nedir? Bu öncülünüzdür.
- Yeni kanıtı dikkatlice tartın. Bu kanıt bir yönü ne kadar güçlü işaret ediyor?
- Orantısal olarak güncelleyin. Güçlü kanıt inançlarınızı çok kaydırmalıdır. Zayıf kanıt az kaydırmalıdır.
- Tekrar güncellemeye istekli olun. Her yeni kanıt parçası, inançlarınızı daha da rafine etme fırsatıdır.
Bu yaklaşım - bir inançla başlayıp kanıt toplayıp güncelleme - bilimsel düşüncenin, tıbbi tanılamanın, cezai soruşturmanın ve genel olarak iyi karar vermenin omurgasıdır.
Yaygın Tuzaklar
- Öncülü görmezden gelmek. "%99 doğrulukta" bir test etkileyici geliyor ama durum milyonda birse, çoğu pozitif yine yanlıştır.
- P(B | A) ile P(A | B)'yi karıştırmak. Hastaysanız testin pozitif çıkma olasılığı, pozitif çıktıysa hasta olma olasılığıyla AYNI DEĞİLDİR.
- Yeterince güncellemek - veya çok fazla güncellemek. Tek bir zayıf kanıt parçası güçlü bir öncülü tamamen devirmemelidir. Ama çok güçlü kanıt, başlangıç inancınızla çelişse bile büyük bir güncellemeye neden olmalıdır.
Bayes Teoremi, yeni kanıt geldiğinde inançlarınızı güncellemenin mantıksal bir yolunu sağlar. P(A | B) = P(B | A) x P(A) / P(B) formülü, öncül inancınızı kanıtın gücü ile birleştirerek güncellenmiş bir olasılık üretir. Baz oranı - bir şeyin baştan ne kadar yaygın olduğu - çok önemlidir ve sıklıkla göz ardı edilir. Tıbbi test sonuçlarını yorumlarken, spam filtrelerken veya günlük kararlar alırken, Bayes gibi düşünmek bildiklerinizle başlamak, kanıtı tartmak ve inançlarınızı adım adım güncellemek demektir.