Định nghĩa
Phương sai là một thước đo thống kê lượng hóa mức độ phân tán của một tập giá trị từ trung bình. Nó được tính bằng cách tính trung bình bình phương các độ lệch giữa mỗi giá trị và trung bình. Phương sai càng lớn, dữ liệu càng phân tán.
Cách tính phương sai
Tìm trung bình, trừ trung bình từ mỗi giá trị, bình phương mỗi kết quả, rồi tính trung bình các bình phương độ lệch đó.
Nhiệt độ hàng ngày trong một tuần (độ C): 20, 22, 19, 21, 23
Trung bình: (20 + 22 + 19 + 21 + 23) / 5 = 21
Bình phương độ lệch: (20-21)^2 + (22-21)^2 + (19-21)^2 + (21-21)^2 + (23-21)^2 = 1 + 1 + 4 + 0 + 4 = 10
Phương sai: 10 / 5 = 2
Tại sao điều này quan trọng
Phương sai là khối xây dựng cho nhiều phương pháp thống kê. Nó là trung tâm của ANOVA (phân tích phương sai), hồi quy và lý thuyết danh mục đầu tư trong tài chính. Hiểu phương sai giúp bạn lượng hóa rủi ro, đánh giá tính nhất quán và so sánh độ tin cậy của các quy trình khác nhau.
Trong thực tế, bạn sẽ thường thấy độ lệch chuẩn được sử dụng để báo cáo vì nó dễ diễn giải hơn. Nhưng đằng sau, phương sai đang thực hiện công việc toán học nặng nề. Nhiều công thức trong thống kê nâng cao làm việc trực tiếp với phương sai vì các giá trị bình phương có các tính chất toán học thuận tiện.
Phương sai đo độ phân tán dữ liệu bằng đơn vị bình phương. Để diễn giải hàng ngày, hãy lấy căn bậc hai của nó để có độ lệch chuẩn.