Định nghĩa
Định lý Bayes là một công thức toán học mô tả cách cập nhật xác suất của một giả thuyết khi có bằng chứng mới. Nó kết nối kiến thức trước đó với dữ liệu quan sát được để tạo ra xác suất đã được điều chỉnh.
Cách hoạt động
Bạn bắt đầu với một niềm tin ban đầu (xác suất tiên nghiệm), quan sát bằng chứng mới, và sau đó tính toán niềm tin cập nhật (xác suất hậu nghiệm).
Một bệnh ảnh hưởng đến 1% dân số. Một xét nghiệm cho bệnh này có độ chính xác 90% (nó xác định đúng 90% người bệnh và 90% người khỏe mạnh).
Bạn xét nghiệm dương tính. Xác suất bạn thực sự mắc bệnh là bao nhiêu?
Sử dụng định lý Bayes: P(bệnh|dương tính) = (0,90 x 0,01) / ((0,90 x 0,01) + (0,10 x 0,99)) = 0,009 / 0,108 = khoảng 8,3%
Mặc dù xét nghiệm "chính xác 90%", chỉ có 8,3% cơ hội bạn thực sự bị bệnh. Tỷ lệ cơ sở thấp (1%) có nghĩa là hầu hết các kết quả dương tính là dương tính giả.
Tại sao điều này quan trọng
Định lý Bayes là nền tảng của thống kê Bayes, một ngành tư duy thống kê hoàn chỉnh. Nó cung cấp năng lượng cho bộ lọc thư rác email, công cụ chẩn đoán y tế, hệ thống gợi ý và thuật toán học máy.
Định lý cũng tiết lộ một thông tin quan trọng: độ chính xác của xét nghiệm không đủ để diễn giải kết quả. Bạn cũng phải xem xét mức độ phổ biến của tình trạng (tỷ lệ cơ sở). Bỏ qua tỷ lệ cơ sở là một trong những lỗi suy luận phổ biến nhất mà mọi người mắc phải.
Định lý Bayes cho bạn biết cách cập nhật xác suất với bằng chứng mới. Luôn xem xét tỷ lệ cơ sở - một xét nghiệm "độ chính xác cao" vẫn có thể cho kết quả dương tính giả chủ yếu đối với các tình trạng hiếm gặp.