Tại sao cần biểu đồ?
Con người xử lý hình ảnh nhanh hơn nhiều so với bảng số. Một biểu đồ tốt có thể truyền tải trong vài giây điều mà một bảng dữ liệu mất vài phút để hiểu. Nhưng chọn sai loại biểu đồ có thể gây hiểu lầm hoặc che giấu thông tin quan trọng.
Biểu đồ cột (Bar Chart)
Dùng để so sánh giá trị giữa các nhóm khác nhau. Mỗi cột đại diện cho một nhóm, chiều cao cột thể hiện giá trị.
Sản lượng cà phê xuất khẩu theo vùng (nghìn tấn/năm):
- Đắk Lắk: 450
- Lâm Đồng: 280
- Gia Lai: 200
- Đắk Nông: 180
Biểu đồ cột cho thấy ngay lập tức Đắk Lắk dẫn đầu và khoảng cách với các tỉnh khác.
Khi nào dùng: So sánh giá trị giữa các danh mục (tỉnh, sản phẩm, năm). Phù hợp nhất cho dữ liệu định tính hoặc rời rạc.
Biểu đồ tròn (Pie Chart)
Thể hiện tỷ lệ phần trăm của từng phần trong tổng thể. Mỗi "lát" tỷ lệ với phần trăm nó đại diện.
Thị phần thương mại điện tử Việt Nam 2025:
- Shopee: 45%
- TikTok Shop: 25%
- Lazada: 15%
- Tiki: 8%
- Khác: 7%
Biểu đồ tròn cho thấy Shopee chiếm gần nửa thị trường - điều dễ nhận ra bằng mắt.
Cảnh báo: Biểu đồ tròn chỉ hiệu quả khi có ít danh mục (5-6 trở xuống). Nhiều lát nhỏ khiến biểu đồ khó đọc. Nhiều nhà thống kê khuyên tránh dùng biểu đồ tròn vì con người không giỏi so sánh góc.
Biểu đồ đường (Line Chart)
Thể hiện xu hướng theo thời gian. Trục ngang là thời gian, trục đứng là giá trị.
GDP Việt Nam qua các năm (tỷ USD): 2019: 262 → 2020: 271 → 2021: 366 → 2022: 409 → 2023: 430 → 2024: 465
Biểu đồ đường cho thấy xu hướng tăng rõ ràng, với tốc độ tăng nhanh hơn từ 2021.
Khi nào dùng: Dữ liệu thay đổi theo thời gian (doanh thu hàng tháng, nhiệt độ hàng ngày, giá cổ phiếu). Tuyệt đối không dùng cho dữ liệu không có thứ tự thời gian.
Biểu đồ tần suất - Histogram
Histogram cho thấy phân phối của dữ liệu liên tục. Nó chia dữ liệu thành các khoảng (bin) và đếm số giá trị rơi vào mỗi khoảng.
Điểm thi THPT quốc gia môn Toán của 1.000 thí sinh:
- 0-2 điểm: 30 thí sinh
- 2-4 điểm: 120 thí sinh
- 4-6 điểm: 350 thí sinh
- 6-8 điểm: 380 thí sinh
- 8-10 điểm: 120 thí sinh
Histogram cho thấy phân phối hình chuông lệch nhẹ sang phải, đa số thí sinh đạt 4-8 điểm.
Phân biệt: Histogram khác biểu đồ cột. Histogram dùng cho dữ liệu liên tục (các cột sát nhau, không khoảng cách). Biểu đồ cột dùng cho danh mục (các cột có khoảng cách).
Biểu đồ phân tán (Scatter Plot)
Thể hiện mối quan hệ giữa hai biến số. Mỗi điểm đại diện cho một quan sát.
Khảo sát 50 sinh viên: trục X = số giờ ôn thi mỗi ngày, trục Y = điểm thi THPT. Nếu các điểm tạo thành xu hướng tăng từ trái qua phải, có mối tương quan dương: ôn nhiều hơn thường đi kèm điểm cao hơn.
Biểu đồ hộp (Box Plot)
Tóm tắt phân phối dữ liệu qua 5 số: giá trị nhỏ nhất, tứ phân vị 1, trung vị, tứ phân vị 3, giá trị lớn nhất. Rất hữu ích để phát hiện giá trị ngoại lai và so sánh phân phối.
So sánh lương nhân viên IT ở Hà Nội và TP.HCM bằng biểu đồ hộp: bạn có thể thấy ngay TP.HCM có lương trung vị cao hơn và khoảng biến thiên rộng hơn.
Biểu đồ gây hiểu lầm
Biểu đồ có thể bị thao túng. Cẩn thận với:
- Trục Y không bắt đầu từ 0: Làm sự khác biệt nhỏ trông rất lớn
- Tỷ lệ trục không đều: Bóp méo xu hướng thực tế
- Biểu đồ 3D: Trông đẹp nhưng khó đọc chính xác
- Chọn khoảng thời gian có chủ đích: Chỉ hiển thị giai đoạn có lợi
Chọn đúng biểu đồ phụ thuộc vào loại dữ liệu và câu hỏi bạn muốn trả lời. Biểu đồ cột so sánh danh mục, biểu đồ đường theo dõi xu hướng, histogram thể hiện phân phối, biểu đồ phân tán cho thấy mối quan hệ hai biến. Luôn kiểm tra trục, tỷ lệ, và gốc 0 để tránh bị đánh lừa bởi biểu đồ gây hiểu lầm.