Độ Lệch Chuẩn

Do Kho: Cơ bản Thoi Gian Doc: 12 phut

Từ phương sai đến độ lệch chuẩn

Ở bài trước, bạn đã học phương sai - trung bình bình phương các độ lệch. Phương sai hữu ích, nhưng có một vấn đề thực tế: đơn vị đo bị bình phương. Nếu bạn đo chiều cao bằng cm, phương sai có đơn vị cm² - khó hiểu. Nếu bạn đo lương bằng đồng, phương sai có đơn vị đồng² - vô nghĩa.

55 70 85 100 115 130 145

Độ lệch chuẩn giải quyết vấn đề này bằng cách lấy căn bậc hai của phương sai, đưa đơn vị trở về giống dữ liệu gốc.

Độ lệch chuẩn = √Phương sai

Ví dụ

Điểm thi Toán THPT quốc gia của 5 học sinh: 6, 7, 7, 8, 7

Trung bình = 35/5 = 7,0

Phương sai = [(6−7)² + (7−7)² + (7−7)² + (8−7)² + (7−7)²] / 5 = [1+0+0+1+0]/5 = 0,4

Độ lệch chuẩn = √0,4 ≈ 0,63 điểm

Bây giờ bạn có thể nói: "Điểm trung bình 7,0 với độ lệch chuẩn 0,63 điểm" - cùng đơn vị, dễ hiểu.

Độ lệch chuẩn cho bạn biết gì?

Độ lệch chuẩn cho biết trung bình mỗi giá trị cách xa trung bình bao nhiêu. Độ lệch chuẩn nhỏ = dữ liệu tập trung gần trung bình. Độ lệch chuẩn lớn = dữ liệu trải rộng.

Ví dụ

So sánh giá phở ở hai khu vực:

Phố cổ Hà Nội: Trung bình 45.000đ, độ lệch chuẩn 15.000đ → giá dao động mạnh (quán du lịch đắt, quán dân đắt)

Khu dân cư quận Cầu Giấy: Trung bình 40.000đ, độ lệch chuẩn 3.000đ → giá rất ổn định

Dù trung bình gần nhau, trải nghiệm giá cả rất khác: ở phố cổ bạn có thể gặp tô 25k hoặc 80k, còn ở Cầu Giấy hầu như luôn quanh 37-43k.

Quy tắc 68-95-99,7

Khi dữ liệu tuân theo phân phối chuẩn (hình chuông), có quy tắc cực kỳ hữu ích:

68 70 72 74 76 78 80 73.1
  • 68% dữ liệu nằm trong khoảng trung bình ± 1 độ lệch chuẩn
  • 95% dữ liệu nằm trong khoảng trung bình ± 2 độ lệch chuẩn
  • 99,7% dữ liệu nằm trong khoảng trung bình ± 3 độ lệch chuẩn
Ví dụ

Cân nặng trẻ sơ sinh Việt Nam có trung bình khoảng 3,1 kg với độ lệch chuẩn 0,4 kg.

Theo quy tắc 68-95-99,7:

  • 68% trẻ nặng từ 2,7 đến 3,5 kg
  • 95% trẻ nặng từ 2,3 đến 3,9 kg
  • 99,7% trẻ nặng từ 1,9 đến 4,3 kg

Một trẻ nặng 2,0 kg nằm ngoài 2 độ lệch chuẩn - điều này cần chú ý y tế đặc biệt vì chỉ khoảng 2,5% trẻ nhẹ như vậy.

So sánh bằng độ lệch chuẩn

Độ lệch chuẩn cho phép bạn so sánh vị trí tương đối của một giá trị. Bạn có thể hỏi: "Giá trị này cách trung bình bao nhiêu độ lệch chuẩn?"

Ví dụ

Điểm thi Toán THPT: trung bình 6,5, độ lệch chuẩn 1,5. Điểm thi Anh: trung bình 5,0, độ lệch chuẩn 2,0.

Một thí sinh đạt Toán 8,0 và Anh 7,0. Môn nào "nổi bật" hơn?

  • Toán: (8,0 − 6,5) / 1,5 = 1,0 độ lệch chuẩn trên trung bình
  • Anh: (7,0 − 5,0) / 2,0 = 1,0 độ lệch chuẩn trên trung bình

Cả hai đều nổi bật như nhau - đều hơn trung bình 1 độ lệch chuẩn, dù điểm số tuyệt đối khác nhau.

Ứng dụng thực tế

Kiểm soát chất lượng

Nhà máy đóng gói cà phê robusta ở Đắk Lắk đặt tiêu chuẩn: mỗi gói phải nặng 500g ± 5g. Nếu độ lệch chuẩn trọng lượng là 2g, quy trình sản xuất tốt. Nếu độ lệch chuẩn tăng lên 10g, máy cần hiệu chỉnh.

0 9 18 27 36 45 60 65 70 75 80 85 90 95 100

Đầu tư tài chính

Trên sàn chứng khoán HOSE, cổ phiếu có độ lệch chuẩn lợi nhuận hàng ngày cao là cổ phiếu biến động mạnh - tiềm năng lời lớn nhưng cũng rủi ro lỗ lớn. Nhà đầu tư dùng độ lệch chuẩn để đo rủi ro.

Dự báo thời tiết

"Nhiệt độ ngày mai 30°C ± 2°C" ngầm hiểu rằng độ lệch chuẩn khoảng 2°C - bạn có thể dự đoán nhiệt độ sẽ quanh 28-32°C.

Độ lệch chuẩn mẫu vs. tổng thể

Giống phương sai, khi tính từ mẫu ta chia cho (n−1) thay vì n trước khi lấy căn. Ký hiệu: σ (sigma) cho tổng thể, s cho mẫu. Trong thực tế, hầu hết phần mềm (Excel, Google Sheets) mặc định tính phương sai mẫu.

Điểm chính

Độ lệch chuẩn = căn bậc hai phương sai - nó đo mức phân tán bằng cùng đơn vị với dữ liệu gốc. Độ lệch chuẩn nhỏ = dữ liệu tập trung, lớn = dữ liệu trải rộng. Quy tắc 68-95-99,7 cho phép bạn nhanh chóng ước tính phạm vi dữ liệu. Đây là thước đo phân tán được dùng phổ biến nhất trong thống kê, tài chính, y tế, và kiểm soát chất lượng.