What does a p-value tell you?

A p-value is the probability of seeing results as extreme as yours if the null hypothesis were true. Lower p-values mean stronger evidence against it.

Is a p-value of 0.05 significant?

By convention, p < 0.05 is considered statistically significant, but this threshold is arbitrary and should be interpreted in context.

What does p-value less than 0.001 mean?

It means there is less than a 0.1% chance the observed result happened by random chance alone, suggesting very strong evidence.

Can a p-value be exactly zero?

In theory no. A very small p-value may display as 0.000 due to rounding, but there is always some nonzero probability however tiny.

What is the difference between one-tailed and two-tailed p-values?

A one-tailed test checks for an effect in one direction only. A two-tailed test checks both directions and is more conservative.

Giá Trị P | Stats24

Q: Is a p-value of 0.05 significant?

By convention, p < 0.05 is considered statistically significant, but this threshold is arbitrary and should be interpreted in context.

Q: What does p-value less than 0.001 mean?

It means there is less than a 0.1% chance the observed result happened by random chance alone, suggesting very strong evidence.

Q: Can a p-value be exactly zero?

In theory no. A very small p-value may display as 0.000 due to rounding, but there is always some nonzero probability however tiny.

Q: What is the difference between one-tailed and two-tailed p-values?

A one-tailed test checks for an effect in one direction only. A two-tailed test checks both directions and is more conservative.

Giá trị p: khái niệm bị hiểu lầm nhiều nhất

Giá trị p (p-value) có lẽ là khái niệm bị hiểu sai nhiều nhất trong thống kê. Nó xuất hiện trong mọi nghiên cứu khoa học, từ y học đến kinh tế, nhưng ngay cả nhiều nhà nghiên cứu cũng diễn giải sai. Hãy tìm hiểu nó thực sự có nghĩa gì.

Định nghĩa chính xác

Giá trị p là xác suất nhận được kết quả bằng hoặc cực đoan hơn kết quả quan sát, giả sử rằng giả thuyết không (H₀) đúng.

Nói cách khác: nếu thực sự không có hiệu quả (H₀ đúng), giá trị p cho biết khả năng dữ liệu tạo ra kết quả ấn tượng như bạn đã thấy chỉ do ngẫu nhiên.

Ví dụ

Một công ty cà phê Trung Nguyên thử nghiệm công thức pha mới. Họ cho 100 người nếm thử cả hai công thức. 62 người thích công thức mới hơn.

H₀: Không có sự khác biệt (tỷ lệ thích = 50%)

Giá trị p = 0,02

Nghĩa là: Nếu hai công thức thực sự không khác nhau, xác suất 62/100 người chọn cùng một phía chỉ do may mắn là 2%. Con số 2% rất nhỏ → khó tin đây chỉ là ngẫu nhiên → bác bỏ H₀.

P nhỏ hay p lớn?

P nhỏ (ví dụ 0,01): Kết quả khó xảy ra nếu H₀ đúng → bằng chứng mạnh chống H₀ → bác bỏ H₀
P lớn (ví dụ 0,45): Kết quả dễ dàng xảy ra ngay cả khi H₀ đúng → không đủ bằng chứng → không bác bỏ H₀

Ngưỡng thông dụng

Ngưỡng phổ biến nhất là α = 0,05 (5%):

p < 0,05: "Có ý nghĩa thống kê" - bác bỏ H₀
p < 0,01: "Rất có ý nghĩa" - bằng chứng mạnh hơn
p < 0,001: "Cực kỳ có ý nghĩa" - bằng chứng rất mạnh
p ≥ 0,05: "Không có ý nghĩa thống kê" - không bác bỏ H₀

Giá trị p KHÔNG phải gì

Đây là phần quan trọng nhất. Giá trị p bị hiểu sai theo nhiều cách:

Sai: "P = 0,03 nghĩa là 3% khả năng H₀ đúng"

KHÔNG. Giá trị p không cho biết xác suất giả thuyết đúng hay sai. Nó chỉ nói về dữ liệu, không nói về giả thuyết. Để biết xác suất H₀ đúng, bạn cần định lý Bayes.

Sai: "P = 0,03 nghĩa là 97% chắc chắn có hiệu quả"

KHÔNG. 1 − p không phải xác suất có hiệu quả.

Sai: "P < 0,05 nghĩa là kết quả quan trọng"

Ý nghĩa thống kê ≠ ý nghĩa thực tế. Với mẫu đủ lớn, ngay cả sự khác biệt nhỏ xíu cũng có p < 0,05.

Ví dụ

Nghiên cứu trên 100.000 học sinh Việt Nam thấy: học sinh dùng bút xanh có điểm trung bình cao hơn 0,02 điểm so với dùng bút đen, p = 0,04.

"Có ý nghĩa thống kê" - đúng. Nhưng 0,02 điểm có ý nghĩa thực tế không? Hoàn toàn không. Không ai nên đổi bút vì khác biệt 0,02 điểm. Mẫu quá lớn khiến ngay cả sự khác biệt vô nghĩa cũng "có ý nghĩa thống kê."

Ý nghĩa thống kê vs. ý nghĩa thực tế

Luôn hỏi hai câu hỏi:

Có ý nghĩa thống kê không? (p < α?) - Liệu kết quả có phải do ngẫu nhiên?
Có ý nghĩa thực tế không? - Sự khác biệt có đủ lớn để quan trọng?

Cả hai đều cần trả lời "có" để kết quả thực sự đáng chú ý.

Vấn đề với ngưỡng 0,05

Ngưỡng 0,05 là quy ước, không phải luật tự nhiên. Giá trị p = 0,049 không khác biệt có ý nghĩa so với p = 0,051 - nhưng theo quy tắc cứng nhắc, cái đầu "có ý nghĩa" còn cái sau "không có ý nghĩa." Đây là điểm yếu của cách tiếp cận nhị phân.

Trong thực tế, nhiều nhà nghiên cứu khuyên nên báo cáo giá trị p chính xác thay vì chỉ nói "có ý nghĩa" hay "không," và luôn kèm theo kích thước hiệu ứng (effect size) và khoảng tin cậy.

P-hacking: thao túng giá trị p

P-hacking là việc thử nhiều phân tích khác nhau cho đến khi tìm được p < 0,05. Ví dụ: chia nhóm theo nhiều cách, loại bỏ dữ liệu không thuận lợi, thử nhiều biến phụ thuộc - cho đến khi một phép thử cho kết quả "có ý nghĩa." Đây là hành vi thiếu trung thực trong nghiên cứu.

Ví dụ

Một nhà nghiên cứu kiểm tra ảnh hưởng của trà xanh lên 20 chỉ số sức khỏe khác nhau. Với α = 0,05, trung bình 1 trong 20 phép thử sẽ cho p < 0,05 chỉ do ngẫu nhiên. Nếu họ chỉ báo cáo kết quả "có ý nghĩa" và bỏ qua 19 kết quả không có ý nghĩa - đó là p-hacking.

Điểm chính

Giá trị p là xác suất dữ liệu xuất hiện nếu H₀ đúng - không phải xác suất H₀ đúng. P nhỏ = bằng chứng mạnh chống H₀. Nhưng "có ý nghĩa thống kê" không đồng nghĩa "quan trọng trong thực tế." Luôn xem xét kích thước hiệu ứng bên cạnh giá trị p, và cảnh giác với p-hacking.

Giá Trị P

Giá trị p: khái niệm bị hiểu lầm nhiều nhất

Định nghĩa chính xác

P nhỏ hay p lớn?

Ngưỡng thông dụng

Giá trị p KHÔNG phải gì

Sai: "P = 0,03 nghĩa là 3% khả năng H₀ đúng"

Sai: "P = 0,03 nghĩa là 97% chắc chắn có hiệu quả"

Sai: "P < 0,05 nghĩa là kết quả quan trọng"

Ý nghĩa thống kê vs. ý nghĩa thực tế

Vấn đề với ngưỡng 0,05

P-hacking: thao túng giá trị p

Bài học liên quan