What is hypothesis testing in statistics?

Hypothesis testing is a method to decide whether sample data provides enough evidence to reject a claim about a population.

What is the difference between null and alternative hypothesis?

The null hypothesis assumes no effect or difference, while the alternative hypothesis claims there is a significant effect or difference.

What are the steps of hypothesis testing?

State hypotheses, choose a significance level, collect data, calculate a test statistic, find the p-value, and decide to reject or not.

What is a Type I error in hypothesis testing?

A Type I error is rejecting the null hypothesis when it is actually true - a false positive. The probability equals your significance level.

What is a Type II error in hypothesis testing?

A Type II error is failing to reject the null hypothesis when it is actually false - a false negative. It means missing a real effect.

Kiểm Định Giả Thuyết

Đặt câu hỏi đúng cách

Trong cuộc sống, chúng ta thường muốn kiểm tra một khẳng định: "Thuốc mới này có hiệu quả hơn thuốc cũ không?" "Chương trình đào tạo có thực sự cải thiện năng suất không?" "Quảng cáo trên TikTok có tăng doanh số không?" Kiểm định giả thuyết là phương pháp thống kê giúp trả lời những câu hỏi này một cách có hệ thống.

Hai giả thuyết

Mỗi kiểm định bắt đầu bằng hai giả thuyết đối lập:

Giả thuyết không (H₀): "Không có sự khác biệt" hoặc "Không có hiệu quả." Đây là giả định mặc định - trạng thái hiện tại.
Giả thuyết đối (H₁): "Có sự khác biệt" hoặc "Có hiệu quả." Đây là điều bạn muốn chứng minh.

Ví dụ

Một công ty dược phẩm Việt Nam thử nghiệm thuốc hạ sốt mới:

H₀: Thuốc mới KHÔNG hiệu quả hơn thuốc cũ (không có sự khác biệt)
H₁: Thuốc mới hiệu quả HƠN thuốc cũ

Chúng ta bắt đầu bằng giả định H₀ đúng (thuốc không hiệu quả hơn), rồi xem dữ liệu có đủ bằng chứng để bác bỏ giả định đó không.

Quy trình kiểm định

Đặt giả thuyết: Xác định H₀ và H₁
Chọn mức ý nghĩa (α): Thường α = 0,05 (5%) - ngưỡng bạn chấp nhận bác bỏ H₀ sai
Thu thập dữ liệu: Lấy mẫu và tính thống kê cần thiết
Tính giá trị p: Xác suất nhận được kết quả như vậy (hoặc cực đoan hơn) nếu H₀ đúng
Quyết định: Nếu p ≤ α → bác bỏ H₀. Nếu p > α → không bác bỏ H₀

Ví dụ

Trường THPT Chu Văn An thử phương pháp dạy Toán mới. Giả thuyết:

H₀: Điểm trung bình không thay đổi (μ = 6,5 như trước)
H₁: Điểm trung bình tăng (μ > 6,5)

Sau 1 học kỳ, 40 học sinh có điểm trung bình 7,2. Giá trị p = 0,01.

Vì 0,01 < 0,05 → Bác bỏ H₀. Có bằng chứng thống kê rằng phương pháp mới cải thiện điểm số.

Hiểu giá trị p bằng phép loại suy

Hãy nghĩ về kiểm định giả thuyết như phiên tòa ở Việt Nam:

H₀ = "Bị cáo vô tội" (giả định ban đầu)
H₁ = "Bị cáo có tội"
Bằng chứng = Dữ liệu
Giá trị p = Khả năng bằng chứng xuất hiện nếu bị cáo thực sự vô tội

Nếu bằng chứng quá khó giải thích khi giả định vô tội (p rất nhỏ), ta kết luận "có tội" (bác bỏ H₀). Nếu bằng chứng có thể giải thích dễ dàng ngay cả khi vô tội (p lớn), ta không đủ cơ sở kết luận.

Hai loại sai lầm

Như phiên tòa có thể sai, kiểm định thống kê cũng vậy:

Sai lầm loại I (dương tính giả): Bác bỏ H₀ khi H₀ đúng - kết luận có hiệu quả khi thực ra không có. Xác suất: α (mức ý nghĩa).
Sai lầm loại II (âm tính giả): Không bác bỏ H₀ khi H₁ đúng - bỏ lỡ hiệu quả thực sự. Xác suất: β.

Ví dụ

Xét nghiệm sàng lọc ung thư tại bệnh viện K:

Sai lầm loại I: Nói bệnh nhân có ung thư khi thực tế không có → gây lo lắng, xét nghiệm thêm không cần thiết
Sai lầm loại II: Nói bệnh nhân không có ung thư khi thực tế có → bỏ lỡ điều trị sớm, nguy hiểm hơn

Trong y tế, sai lầm loại II thường nghiêm trọng hơn, nên ngưỡng sàng lọc được đặt để giảm thiểu nó.

"Không bác bỏ" không phải "chứng minh đúng"

Điểm quan trọng: khi p > α, chúng ta nói "không bác bỏ H₀" - KHÔNG phải "H₀ đúng." Không đủ bằng chứng để bác bỏ khác với chứng minh không có hiệu quả. Có thể mẫu quá nhỏ, hoặc hiệu quả có nhưng quá nhỏ để phát hiện.

Ứng dụng thực tế

Y tế: Thử nghiệm lâm sàng vaccine tại Việt Nam kiểm định H₀: vaccine không hiệu quả
Kinh doanh: A/B testing trên Shopee: giao diện mới có tăng tỷ lệ mua hàng không?
Nông nghiệp: Giống lúa mới có năng suất cao hơn giống cũ không?
Giáo dục: Phương pháp giảng dạy mới có cải thiện điểm thi không?

Điểm chính

Kiểm định giả thuyết bắt đầu bằng giả định "không có hiệu quả" (H₀), rồi dùng dữ liệu để xem có đủ bằng chứng bác bỏ giả định đó không. Giá trị p cho biết khả năng dữ liệu xuất hiện nếu H₀ đúng - p nhỏ = bằng chứng mạnh chống H₀. Luôn nhớ: "không bác bỏ" không có nghĩa "chứng minh đúng," và có hai loại sai lầm cần cân nhắc.

Kiểm Định Giả Thuyết

Đặt câu hỏi đúng cách

Hai giả thuyết

Quy trình kiểm định

Hiểu giá trị p bằng phép loại suy

Hai loại sai lầm

"Không bác bỏ" không phải "chứng minh đúng"

Ứng dụng thực tế

Bài học liên quan