Ketika Data Anda Bukan Angka
Tidak semua data berupa pengukuran seperti tinggi badan, berat, atau nilai ujian. Kadang data Anda berupa kategori - hal seperti ya atau tidak, preferensi merek, warna yang dipilih, atau jenis makanan yang dipesan. Ketika Anda ingin tahu apakah dua kategori berhubungan, Anda membutuhkan alat yang berbeda. Alat itu adalah uji chi-kuadrat (dibaca "kai-kuadrat").
Pertanyaan Intinya
Uji chi-kuadrat menjawab pertanyaan sederhana: apakah dua variabel kategorikal berhubungan, atau mereka independen?
Misalnya: apakah kelompok usia seseorang mempengaruhi layanan streaming mana yang mereka pilih? Apakah pria dan wanita memilih jurusan kuliah yang berbeda dengan tingkat yang berbeda? Apakah ada hubungan antara provinsi tempat tinggal seseorang dan cara mereka memilih dalam pemilu?
Pertanyaan-pertanyaan ini semua melibatkan penghitungan berapa banyak orang yang masuk ke berbagai kombinasi kategori - dan kemudian memeriksa apakah pola yang Anda lihat bisa terjadi karena kebetulan.
Teramati vs. yang Diharapkan
Uji chi-kuadrat bekerja dengan membandingkan dua hal:
- Jumlah teramati: Apa yang benar-benar Anda temukan dalam data.
- Jumlah yang diharapkan: Apa yang Anda harapkan jika kedua kategori sama sekali tidak berhubungan.
Jika jumlah teramati sangat berbeda dari jumlah yang diharapkan, itu bukti bahwa kategori-kategorinya berhubungan. Jika mendekati, kategori-kategorinya mungkin independen.
Sebuah toko ponsel di Jakarta mensurvei 400 pelanggan dan mencatat jenis kelamin serta preferensi merek ponsel mereka:
| Samsung | iPhone | Lainnya | Total | |
|---|---|---|---|---|
| Wanita | 90 | 80 | 30 | 200 |
| Pria | 120 | 55 | 25 | 200 |
| Total | 210 | 135 | 55 | 400 |
Jika jenis kelamin dan preferensi merek sama sekali independen, Anda akan mengharapkan setiap jenis kelamin memilih merek dengan tingkat yang sama. Karena 210 dari 400 total pelanggan memilih Samsung (52,5%), Anda akan mengharapkan sekitar 52,5% wanita (105) dan 52,5% pria (105) memilih Samsung.
Tetapi angka sebenarnya adalah 90 wanita dan 120 pria. Itu jelas berbeda dari yang diharapkan 105 masing-masing. Uji chi-kuadrat mengukur apakah perbedaan seperti ini cukup besar untuk bermakna atau bisa terjadi karena kebetulan.
Bagaimana Cara Kerjanya (Tanpa Rumus)
Uji chi-kuadrat mengikuti langkah-langkah ini:
- Hitung apa yang Anda amati. Jumlahkan berapa banyak orang atau benda yang masuk ke setiap kombinasi kategori.
- Hitung apa yang diharapkan. Tentukan berapa jumlahnya jika kedua kategori sama sekali tidak berhubungan.
- Bandingkan teramati dengan yang diharapkan. Untuk setiap sel dalam tabel Anda, ukur seberapa jauh jumlah teramati dari jumlah yang diharapkan.
- Gabungkan perbedaannya. Jumlahkan semua perbedaan (setelah dikuadratkan dan disesuaikan dengan jumlah yang diharapkan) untuk mendapatkan satu angka - statistik chi-kuadrat.
- Dapatkan nilai-p. Gunakan statistik chi-kuadrat untuk menentukan seberapa besar kemungkinan Anda melihat perbedaan sebesar ini karena kebetulan murni.
Statistik chi-kuadrat yang besar (dan nilai-p yang kecil) berarti kategori-kategorinya kemungkinan berhubungan. Statistik chi-kuadrat yang kecil berarti mereka mungkin independen.
Kegunaan Umum Lainnya: Uji Kecocokan
Ada jenis kedua dari uji chi-kuadrat yang disebut uji kecocokan (goodness-of-fit test). Alih-alih bertanya apakah dua kategori berhubungan, uji ini bertanya apakah data Anda cocok dengan distribusi tertentu yang Anda harapkan.
Sebuah perusahaan permen mengklaim kantong mereka berisi proporsi yang sama dari lima rasa: mangga, durian, stroberi, jeruk, dan anggur (masing-masing 20%). Anda membeli satu kantong dan menghitung 100 permen:
- Mangga: 28, Durian: 15, Stroberi: 22, Jeruk: 18, Anggur: 17
Jika klaim perusahaan benar, Anda akan mengharapkan sekitar 20 dari setiap rasa. Kantong Anda punya mangga jauh lebih banyak dan durian lebih sedikit. Uji kecocokan chi-kuadrat memeriksa apakah perbedaan-perbedaan ini cukup besar untuk meragukan klaim perusahaan, atau apakah masih dalam rentang variasi acak yang normal.
Kapan Menggunakan Uji Chi-Kuadrat
Uji chi-kuadrat adalah pilihan yang tepat ketika:
- Data Anda berupa jumlah atau frekuensi dalam kategori (bukan pengukuran seperti tinggi atau nilai).
- Setiap pengamatan masuk ke tepat satu kategori per variabel.
- Anda memiliki sampel yang cukup besar - umumnya, setiap jumlah sel yang diharapkan minimal 5.
- Pengamatan bersifat independen - setiap orang atau objek dihitung hanya sekali.
Keterbatasan
Uji chi-kuadrat memberitahu Anda apakah ada hubungan antara kategori, tetapi bukan seberapa kuat hubungannya. Sampel yang sangat besar bisa menghasilkan hasil signifikan bahkan untuk hubungan yang sangat sepele. Untuk mengukur kekuatan asosiasi, statistikawan menggunakan ukuran tambahan seperti V Cramer bersama uji chi-kuadrat.
Selain itu, seperti semua uji statistik, menemukan hubungan tidak membuktikan sebab-akibat. Jika pria dan wanita memilih merek ponsel yang berbeda, uji ini tidak memberitahu mengapa - bisa jadi pemasaran, pengaruh teman, preferensi fitur, atau banyak faktor lainnya.
Uji chi-kuadrat digunakan ketika data Anda melibatkan kategori, bukan angka. Uji ini membandingkan apa yang benar-benar Anda amati dengan apa yang Anda harapkan jika dua kategori tidak berhubungan. Perbedaan besar antara jumlah teramati dan yang diharapkan (menghasilkan nilai-p kecil) menunjukkan kategori-kategorinya terhubung. Uji ini banyak digunakan dalam survei, riset pasar, dan ilmu sosial - setiap kali Anda bertanya apakah keanggotaan kelompok mempengaruhi pilihan yang dibuat orang.