Định Lý Bayes Đơn Giản

Do Kho: Trung cấp Thoi Gian Doc: 15 phut

Cập nhật niềm tin

Trong cuộc sống, chúng ta liên tục cập nhật đánh giá của mình khi nhận được thông tin mới. Bạn nghĩ 20% khả năng trời mưa, nhưng rồi bạn thấy mây đen kéo đến - bạn tăng ước tính lên 70%. Định lý Bayes cho bạn công thức chính xác để thực hiện việc cập nhật này một cách logic.

0.01 +Bệnh 0.99 -Bệnh 0.95 +XN 0.05 -XN 0.05 +XN 0.95 -XN

Công thức Bayes

P(A|B) = P(B|A) × P(A) / P(B)

Trong đó:

  • P(A|B): Xác suất A xảy ra khi đã biết B - đây là thứ bạn muốn tìm (xác suất hậu nghiệm)
  • P(B|A): Xác suất B xảy ra khi A đúng (likelihood)
  • P(A): Xác suất A trước khi biết B (xác suất tiên nghiệm)
  • P(B): Xác suất B xảy ra nói chung

Ví dụ kinh điển: xét nghiệm y tế

Đây là ứng dụng nổi tiếng nhất của định lý Bayes, và nó quan trọng vì nhiều người (kể cả bác sĩ) thường hiểu sai kết quả xét nghiệm.

Ví dụ

Một bệnh hiếm ảnh hưởng 1 trong 1.000 người Việt Nam (tỷ lệ mắc 0,1%). Xét nghiệm có:

  • Độ nhạy 99%: nếu bạn mắc bệnh, 99% xét nghiệm cho kết quả dương tính
  • Độ đặc hiệu 95%: nếu bạn không mắc bệnh, 95% xét nghiệm cho kết quả âm tính (5% dương tính giả)

Bạn xét nghiệm dương tính. Xác suất bạn thực sự mắc bệnh là bao nhiêu?

Bước 1: P(bệnh) = 0,001; P(không bệnh) = 0,999

Bước 2: P(dương tính | bệnh) = 0,99; P(dương tính | không bệnh) = 0,05

Bước 3: P(dương tính) = 0,99 × 0,001 + 0,05 × 0,999 = 0,00099 + 0,04995 = 0,05094

Bước 4: P(bệnh | dương tính) = 0,00099 / 0,05094 ≈ 1,94%

Kết quả đáng ngạc nhiên: dù xét nghiệm "chính xác 99%," xác suất bạn thực sự mắc bệnh chỉ khoảng 2%! Lý do: bệnh quá hiếm nên số dương tính giả áp đảo số dương tính thật.

Hiểu bằng con số tự nhiên

Nếu công thức khó nhớ, hãy dùng cách đếm trực tiếp - cách này dễ hiểu hơn nhiều.

Ví dụ

Tưởng tượng 100.000 người Việt Nam được xét nghiệm:

  • 100 người thực sự mắc bệnh (0,1%). Trong đó, 99 người xét nghiệm dương tính (độ nhạy 99%)
  • 99.900 người không mắc bệnh. Trong đó, 4.995 người xét nghiệm dương tính giả (5% dương tính giả)

Tổng số dương tính: 99 + 4.995 = 5.094 người

Trong 5.094 người dương tính, chỉ 99 thực sự mắc bệnh = 99/5.094 ≈ 1,94%

Cùng kết quả, nhưng dễ hình dung hơn nhiều!

Tại sao Bayes quan trọng?

Định lý Bayes giúp bạn tránh những kết luận vội vàng. Khi nghe "xét nghiệm dương tính," phản ứng tự nhiên là hoảng sợ. Nhưng Bayes cho bạn thấy cần xem xét tỷ lệ nền (base rate) - bệnh phổ biến đến mức nào - trước khi kết luận.

1 Trước 16 Sau

Ứng dụng ngoài y tế

Lọc email rác

Bộ lọc spam trong email dùng Bayes. Nếu email chứa từ "trúng thưởng" và "chuyển khoản ngay," xác suất nó là spam rất cao. P(spam | chứa "trúng thưởng") được tính dựa trên dữ liệu hàng triệu email trước đó.

Kinh doanh

Ví dụ

Một cửa hàng cà phê ở Đà Nẵng muốn biết: "Nếu trời mưa, xác suất doanh thu giảm trên 20% là bao nhiêu?"

  • P(doanh thu giảm > 20%) = 10% (nói chung)
  • P(mưa | doanh thu giảm) = 80% (những ngày doanh thu giảm thường là ngày mưa)
  • P(mưa) = 30% (30% ngày trong tháng có mưa)

P(doanh thu giảm | mưa) = 0,80 × 0,10 / 0,30 = 0,08/0,30 ≈ 26,7%

Khi trời mưa, xác suất doanh thu giảm mạnh tăng từ 10% lên gần 27%.

Pháp luật

Trong điều tra, bằng chứng mới cập nhật xác suất nghi phạm có tội. Dấu vân tay trùng khớp (bằng chứng mới) tăng xác suất, nhưng cần xem xét có bao nhiêu người có vân tay tương tự (tỷ lệ nền). Bỏ qua tỷ lệ nền có thể dẫn đến kết án oan.

Sai lầm thường gặp

Bỏ qua tỷ lệ nền (Base Rate Neglect): Đây là lỗi phổ biến nhất. Mọi người tập trung vào thông tin mới (xét nghiệm dương tính) mà quên xem xét tỷ lệ cơ bản (bệnh hiếm hay phổ biến). Định lý Bayes nhắc nhở bạn luôn bắt đầu từ tỷ lệ nền.

Nhầm P(A|B) với P(B|A): P(dương tính | bệnh) = 99% hoàn toàn khác P(bệnh | dương tính) = 2%. Nhầm hai giá trị này gọi là "ngụy biện tỷ lệ nền" và nó xảy ra thường xuyên trong y tế và pháp luật.

Điểm chính

Định lý Bayes là công cụ cập nhật xác suất khi có thông tin mới: P(A|B) = P(B|A) × P(A) / P(B). Điểm quan trọng nhất: luôn xem xét tỷ lệ nền trước khi kết luận. Một xét nghiệm "chính xác 99%" vẫn có thể cho kết quả sai nếu bệnh hiếm gặp. Bayes được dùng trong y tế, lọc spam, kinh doanh, pháp luật, và bất kỳ nơi nào cần cập nhật niềm tin dựa trên bằng chứng mới.