Định nghĩa
Tương quan là một thước đo thống kê định lượng cường độ và hướng của mối quan hệ tuyến tính giữa hai biến. Thước đo phổ biến nhất là hệ số tương quan Pearson (r), nằm trong khoảng từ -1 đến +1.
Cách diễn giải tương quan
Dấu cho biết hướng. Độ lớn cho biết cường độ.
Một trường học theo dõi giờ học và điểm thi cho 200 học sinh.
r = 0,82 - tương quan dương mạnh.
Khi giờ học tăng, điểm thi cũng có xu hướng tăng. Nhưng tương quan không chứng minh rằng việc học đã gây ra điểm cao hơn - học sinh có động lực có thể vừa học nhiều hơn vừa học tốt hơn vì những lý do khác.
Tại sao điều này quan trọng
Tương quan giúp bạn xác định các mối quan hệ trong dữ liệu. Doanh nghiệp sử dụng nó để tìm kênh tiếp thị nào liên quan đến doanh số. Bác sĩ sử dụng nó để xác định các yếu tố nguy cơ bệnh tật. Nhà khoa học sử dụng nó như bước đầu tiên trước phân tích sâu hơn như hồi quy.
Quy tắc quan trọng nhất: tương quan không ngầm định nhân quả. Hai biến có thể di chuyển cùng nhau mà không có biến nào gây ra biến kia. Luôn tìm kiếm các biến gây nhiễu và xem xét liệu mối quan hệ có hợp lý không.
Tương quan đo lường cách hai biến di chuyển cùng nhau. Luôn nhớ rằng: tương quan mạnh không chứng minh rằng một biến gây ra thay đổi trong biến kia.