Apakah Dua Hal Bergerak Bersama?
Dalam kehidupan sehari-hari, kita terus-menerus melihat pola. Orang yang lebih tinggi cenderung lebih berat. Siswa yang belajar lebih banyak jam cenderung mendapat nilai lebih baik. Kota dengan lebih banyak polisi cenderung memiliki lebih banyak kejahatan. (Tunggu - apakah yang terakhir berarti polisi menyebabkan kejahatan?)
Korelasi adalah cara statistikawan mengukur dan mendeskripsikan hubungan-hubungan ini. Korelasi memberitahu Anda apakah dua hal cenderung bergerak bersama, dan seberapa kuat. Tapi seperti yang ditunjukkan contoh ketiga, korelasi tidak memberitahu Anda mengapa.
Apa Itu Korelasi?
Korelasi mengukur kekuatan dan arah dari hubungan linier antara dua variabel. Ketika satu variabel naik, apakah yang lain cenderung naik juga? Turun? Atau tidak ada pola yang konsisten?
Ukuran yang paling umum adalah koefisien korelasi, biasanya ditulis sebagai r. Ini adalah satu angka antara -1 dan +1.
Membaca Koefisien Korelasi
- r = +1: Korelasi positif sempurna. Ketika satu variabel meningkat, yang lain meningkat dengan jumlah yang dapat diprediksi dengan sempurna. Setiap titik jatuh tepat pada garis naik.
- r = -1: Korelasi negatif sempurna. Ketika satu naik, yang lain turun dengan cara yang dapat diprediksi dengan sempurna.
- r = 0: Tidak ada hubungan linier sama sekali. Mengetahui satu variabel tidak memberitahu apa-apa tentang yang lain.
Dalam praktiknya, Anda hampir tidak pernah melihat tepat +1, -1, atau 0. Data nyata itu berantakan. Berikut panduan kasar:
- 0,7 sampai 1,0 (atau -0,7 sampai -1,0): Hubungan kuat
- 0,4 sampai 0,7 (atau -0,4 sampai -0,7): Hubungan sedang
- 0,1 sampai 0,4 (atau -0,1 sampai -0,4): Hubungan lemah
- 0,0 sampai 0,1 (atau 0,0 sampai -0,1): Pada dasarnya tidak ada hubungan
Tinggi badan dan berat badan - Di antara orang dewasa Indonesia, tinggi dan berat badan memiliki korelasi positif sekitar r = 0,5 sampai 0,7. Orang yang lebih tinggi cenderung lebih berat, tapi ada banyak variasi. Seseorang dengan tinggi 160 cm mungkin lebih berat daripada seseorang dengan tinggi 175 cm.
Korelasinya positif (keduanya naik bersama) dan sedang sampai kuat (polanya terlihat tapi tidak sempurna).
Korelasi Positif vs. Negatif
Korelasi positif berarti kedua variabel bergerak ke arah yang sama. Ketika satu naik, yang lain cenderung naik. Ketika satu turun, yang lain cenderung turun.
- Jam belajar dan nilai ujian (lebih banyak belajar, nilai lebih tinggi)
- Suhu dan penjualan es krim (hari lebih panas, lebih banyak es krim terjual)
- Pengalaman kerja dan gaji (lebih banyak tahun bekerja, gaji lebih tinggi - umumnya)
Korelasi negatif berarti keduanya bergerak ke arah berlawanan. Ketika satu naik, yang lain cenderung turun.
- Olahraga dan detak jantung istirahat (lebih banyak olahraga, detak jantung lebih rendah)
- Harga dan permintaan (harga lebih tinggi, lebih sedikit orang membeli)
- Ketidakhadiran dan nilai (lebih banyak bolos kelas, nilai lebih rendah)
Korelasi Bukan Berarti Sebab-Akibat
Ini adalah aturan terpenting dalam statistik, dan muncul terus-menerus berkaitan dengan korelasi. Hanya karena dua hal berkorelasi bukan berarti satu menyebabkan yang lain.
Penjualan es krim dan kasus demam berdarah berkorelasi positif di Indonesia. Ketika penjualan es krim naik, kasus demam berdarah juga naik. Apakah es krim menyebabkan demam berdarah?
Tentu saja tidak. Keduanya disebabkan oleh variabel ketiga: musim hujan yang panas. Ketika cuaca panas dan lembap, lebih banyak orang membeli es krim DAN lebih banyak nyamuk berkembang biak (menyebabkan lebih banyak kasus demam berdarah). Es krim dan demam berdarah memang berhubungan, tapi keduanya tidak saling menyebabkan.
Ini disebut variabel perancu - faktor tersembunyi yang mempengaruhi kedua hal yang Anda ukur.
Ada beberapa alasan mengapa dua hal bisa berkorelasi tanpa satu menyebabkan yang lain:
- Variabel ketiga menyebabkan keduanya. (Cuaca panas menyebabkan penjualan es krim dan perkembangbiakan nyamuk.)
- Sebab-akibat terbalik. Mungkin A tidak menyebabkan B - sebaliknya, B menyebabkan A. Kota dengan lebih banyak kejahatan mungkin merekrut lebih banyak polisi, bukan sebaliknya.
- Kebetulan murni. Dengan cukup banyak data, Anda akan menemukan korelasi acak. Jumlah film yang dibintangi Nicolas Cage berkorelasi dengan jumlah orang tenggelam di kolam renang - jelas itu tidak bermakna.
Apa yang Korelasi Lewatkan
Koefisien korelasi hanya mengukur hubungan linier (garis lurus). Jika hubungan antara dua variabel berbentuk lengkung, koefisien korelasi bisa menyesatkan.
Misalnya, stres dan kinerja memiliki hubungan lengkung: sedikit stres meningkatkan kinerja, tetapi terlalu banyak stres justru menurunkannya. Koefisien korelasi mungkin menunjukkan r = 0, menunjukkan tidak ada hubungan, padahal jelas ada - hanya saja bukan garis lurus.
Inilah mengapa selalu baik untuk membuat grafik data Anda sebelum bergantung pada satu angka.
Korelasi dalam Kehidupan Sehari-hari
Anda menemui korelasi sepanjang waktu, sering tanpa menyadarinya:
- Dokter Anda mungkin mencatat bahwa kadar kolesterol berkorelasi dengan risiko penyakit jantung.
- Sebuah bisnis mungkin menemukan bahwa skor kepuasan pelanggan berkorelasi dengan pembelian berulang di Tokopedia.
- Sebuah sekolah mungkin menemukan bahwa tingkat kehadiran berkorelasi dengan tingkat kelulusan.
Dalam setiap kasus, korelasi adalah informasi yang berguna - tetapi Anda perlu menyelidiki lebih lanjut sebelum menyimpulkan satu hal menyebabkan yang lain.
Korelasi mengukur apakah dua hal cenderung bergerak bersama (korelasi positif) atau ke arah berlawanan (korelasi negatif), pada skala dari -1 sampai +1. Ini adalah alat yang kuat untuk menemukan pola, tetapi memiliki batasan krusial: korelasi tidak membuktikan sebab-akibat. Dua hal bisa berkorelasi karena faktor ketiga yang tersembunyi, sebab-akibat terbalik, atau kebetulan murni. Selalu tanyakan "mengapa" sebelum melompat ke kesimpulan tentang apa yang menyebabkan apa.