Cấp Độ Đo Lường

Do Kho: Cơ bản Thoi Gian Doc: 10 phut

Tại sao cấp độ đo lường quan trọng?

Khi bạn thu thập dữ liệu, không phải mọi con số hay nhãn đều có cùng "sức mạnh." Một số cho phép bạn so sánh, một số cho phép tính toán, và một số chỉ là nhãn phân loại. Cấp độ đo lường cho bạn biết bạn có thể làm gì với dữ liệu - và quan trọng không kém, điều gì bạn không nên làm.

Danh nghĩa Thứ tự Khoảng Tỷ lệ

Có bốn cấp độ đo lường, từ đơn giản nhất đến chi tiết nhất: danh nghĩa, thứ bậc, khoảng, và tỷ lệ.

Cấp độ 1: Danh nghĩa (Nominal)

Đây là cấp đo lường cơ bản nhất. Dữ liệu danh nghĩa chỉ là nhãn hoặc tên gọi - không có thứ tự, không có khoảng cách, không có điểm gốc.

Ví dụ

Trong cuộc điều tra dân số Việt Nam, dân tộc được ghi nhận: Kinh, Tày, Thái, Mường, Khmer... Đây là dữ liệu danh nghĩa. Không dân tộc nào "cao hơn" hay "lớn hơn" dân tộc nào. Bạn chỉ có thể đếm số người thuộc mỗi nhóm và tính phần trăm.

Phép toán duy nhất có ý nghĩa với dữ liệu danh nghĩa là đếm tần suất và tìm yếu vị (mode - giá trị xuất hiện nhiều nhất).

Cấp độ 2: Thứ bậc (Ordinal)

Dữ liệu thứ bậc có thứ tự rõ ràng, nhưng khoảng cách giữa các bậc không nhất thiết bằng nhau. Bạn biết cái nào lớn hơn, nhưng không biết lớn hơn bao nhiêu.

Ví dụ

Xếp loại học lực ở trường Việt Nam: Giỏi, Khá, Trung bình, Yếu. Bạn biết "Giỏi" tốt hơn "Khá" và "Khá" tốt hơn "Trung bình." Nhưng khoảng cách từ Giỏi đến Khá có giống khoảng cách từ Khá đến Trung bình không? Không nhất thiết.

Với dữ liệu thứ bậc, bạn có thể tìm trung vị (median) và yếu vị, nhưng tính trung bình (mean) thì gây tranh cãi vì khoảng cách giữa các bậc không đều.

Cấp độ 3: Khoảng (Interval)

Dữ liệu khoảng có thứ tự và khoảng cách đều nhau giữa các giá trị. Tuy nhiên, nó không có điểm gốc thực sự (số 0 không có nghĩa "không có gì").

Ví dụ

Nhiệt độ đo bằng độ C ở Hà Nội: 15°C, 25°C, 35°C. Khoảng cách giữa 15°C và 25°C bằng khoảng cách giữa 25°C và 35°C (đều là 10 độ). Nhưng 0°C không có nghĩa "không có nhiệt độ" - nó chỉ là một điểm trên thang đo. Vì vậy, bạn không thể nói 30°C "nóng gấp đôi" 15°C.

Một ví dụ khác là năm dương lịch. Năm 2024 trừ năm 2000 cho bạn biết 24 năm đã trôi qua (khoảng cách có ý nghĩa), nhưng năm 0 không phải là "khởi đầu thời gian."

Cấp độ 4: Tỷ lệ (Ratio)

Đây là cấp đo lường mạnh nhất. Nó có tất cả đặc điểm của khoảng, cộng thêm một điểm gốc thực sự (số 0 có nghĩa "không có gì").

Ví dụ

Thu nhập hàng tháng: 0 đồng thực sự có nghĩa không có thu nhập. Nếu một công nhân ở Bình Dương kiếm 8.000.000đ/tháng và một lập trình viên ở TP.HCM kiếm 24.000.000đ/tháng, bạn có thể nói thu nhập của lập trình viên gấp 3 lần - phép chia và nhân có ý nghĩa.

Các ví dụ khác về dữ liệu tỷ lệ: cân nặng (0 kg = không có khối lượng), chiều cao, khoảng cách từ Hà Nội đến TP.HCM (1.726 km), sản lượng gạo xuất khẩu (tấn), và giá cổ phiếu trên sàn HOSE.

So sánh bốn cấp độ

Hãy dùng một ví dụ từ kỳ thi THPT quốc gia để thấy rõ sự khác biệt:

  • Danh nghĩa: Môn thi (Toán, Văn, Anh, Lý, Hóa) - chỉ là nhãn
  • Thứ bậc: Xếp loại kết quả (Giỏi, Khá, Trung bình) - có thứ tự nhưng khoảng cách không đều
  • Khoảng: Điểm IQ của thí sinh - có khoảng cách đều nhưng 0 không phải "không trí tuệ"
  • Tỷ lệ: Điểm thi thực tế (0-10) - 0 điểm nghĩa là không trả lời đúng câu nào, 8 điểm gấp đôi 4 điểm

Phép tính nào được phép ở mỗi cấp?

Khi cấp độ đo lường tăng lên, bạn có thể thực hiện nhiều phép tính hơn:

  • Danh nghĩa: Đếm, yếu vị, phần trăm
  • Thứ bậc: Tất cả trên + so sánh lớn hơn/nhỏ hơn, trung vị
  • Khoảng: Tất cả trên + cộng trừ, trung bình, độ lệch chuẩn
  • Tỷ lệ: Tất cả trên + nhân chia, tỷ lệ phần trăm thay đổi

Sai lầm phổ biến

Một sai lầm thường gặp là đối xử với dữ liệu thứ bậc như thể nó là khoảng. Ví dụ, nhiều người tính điểm trung bình đánh giá sao trên Shopee (4,3 sao) như thể khoảng cách giữa 1 sao và 2 sao bằng khoảng cách giữa 4 sao và 5 sao. Trong thực tế, cảm nhận giữa "rất tệ" (1 sao) và "tệ" (2 sao) rất khác với cảm nhận giữa "tốt" (4 sao) và "tuyệt vời" (5 sao).

Tuy nhiên, trong thực hành, nhiều nhà nghiên cứu vẫn tính trung bình cho thang đo thứ bậc khi nó có đủ nhiều bậc (ví dụ thang Likert 1-7). Đây là một sự đánh đổi giữa lý thuyết thuần túy và tính thực tiễn.

Điểm chính

Bốn cấp độ đo lường - danh nghĩa, thứ bậc, khoảng, và tỷ lệ - cho bạn biết dữ liệu mạnh đến đâu và bạn có thể làm gì với nó. Danh nghĩa chỉ là nhãn, thứ bậc có thứ tự, khoảng có khoảng cách đều, và tỷ lệ có điểm gốc thực sự. Chọn đúng phương pháp phân tích phụ thuộc vào việc hiểu đúng cấp độ đo lường của dữ liệu bạn có.