Tabel Frekuensi & Tabulasi Silang

Tingkat Kesulitan: Pemula Waktu Baca: 10 menit

Dari data mentah ke hitungan terorganisir

Ketika mengumpulkan data, sering dimulai sebagai daftar berantakan. Bayangkan menyurvei 200 pelanggan tentang metode pembayaran pilihan dan mendapat kolom panjang respons: kartu kredit, tunai, pembayaran mobile, kartu kredit, kartu kredit, tunai, dan seterusnya. Tabel frekuensi mengubah kekacauan ini menjadi ringkasan rapi dengan menghitung berapa kali setiap nilai muncul.

Tabel frekuensi dasar memiliki dua kolom: kategori dan hitungan (juga disebut frekuensi). Untuk contoh pembayaran, Anda mungkin mendapat kartu kredit: 95, tunai: 52, pembayaran mobile: 38, kartu debit: 15. Sekarang Anda bisa langsung melihat metode pembayaran mana yang mendominasi dan mana yang jarang. Tindakan penghitungan sederhana ini adalah fondasi statistik deskriptif.

95 Kartu Kredit 52 Tunai 38 Pembayaran Mobile 15 Kartu Debit

Frekuensi relatif dan kumulatif

Hitungan mentah berguna, tapi bisa sulit dibandingkan antar kumpulan data berukuran berbeda. Jika satu toko menyurvei 200 orang dan yang lain 1.000, membandingkan hitungan mentah menyesatkan. Frekuensi relatif memecahkan ini dengan mengekspresikan setiap hitungan sebagai proporsi atau persentase dari total. Kartu kredit 95 dari 200 adalah frekuensi relatif 47.5%.

Frekuensi kumulatif melangkah lebih jauh. Ini menunjukkan total berjalan saat Anda bergerak melalui kategori. Untuk data terurut seperti rentang skor ujian, frekuensi kumulatif menjawab pertanyaan seperti "berapa persen siswa yang mendapat skor 70 atau di bawah?" Anda cukup menambahkan frekuensi semua kategori hingga titik itu. Ini sangat berguna untuk menemukan median atau persentil dari data yang dikelompokkan.

Bersama-sama, ketiga pandangan data yang sama ini (frekuensi mentah, frekuensi relatif, dan frekuensi kumulatif) memberi gambaran lengkap. Hitungan mentah menunjukkan angka aktual, frekuensi relatif memungkinkan perbandingan antar kumpulan data, dan frekuensi kumulatif membantu memahami distribusi nilai.

Tabel frekuensi untuk data numerik

Ketika data Anda numerik dan kontinu, seperti usia, pendapatan, atau skor ujian, Anda tidak bisa mendaftar setiap nilai unik karena mungkin ada ratusan. Sebaliknya, Anda mengelompokkan nilai ke interval yang disebut bin atau kelas. Misalnya, usia mungkin dikelompokkan sebagai 18-25, 26-35, 36-45, dan seterusnya.

0 2 4 6 7 20-30 31-40 41-50 51-60 61-70 71-80

Memilih jumlah bin yang tepat penting. Terlalu sedikit bin dan Anda kehilangan detail. Terlalu banyak bin dan tabel menjadi sekacau data mentah. Aturan umum adalah menggunakan 5 hingga 15 bin untuk sebagian besar kumpulan data. Histogram di atas menunjukkan bagaimana data usia terlihat ketika dikelompokkan dalam enam bin, membuat bentuk distribusi jelas sekilas.

Contoh

Seorang guru mencatat skor ujian 30 siswa: mulai dari 45 hingga 98. Dia membuat tabel frekuensi dengan bin 10 poin masing-masing (40-49, 50-59, 60-69, 70-79, 80-89, 90-99). Ini mengungkapkan bahwa sebagian besar siswa mendapat skor antara 70 dan 89, dengan hanya dua siswa di bawah 50. Tabel frekuensi langsung menyoroti di mana kelas mengelompok dan di mana outlier berada, yang sulit dilihat dalam daftar mentah 30 angka.

Tabulasi silang: dua variabel sekaligus

Tabel frekuensi menangani satu variabel. Tapi bagaimana jika Anda ingin mengeksplorasi hubungan antara dua variabel kategoris? Di sinilah tabulasi silang (juga disebut tabel kontingensi atau tabel dua arah) berperan. Ini membuat grid di mana satu variabel mendefinisikan baris dan yang lain mendefinisikan kolom, dengan hitungan di setiap sel.

Misalnya, Anda menyurvei karyawan tentang kepuasan kerja (puas, netral, tidak puas) dan juga mencatat departemen mereka (penjualan, teknik, dukungan). Tabulasi silang menunjukkan berapa banyak karyawan di setiap departemen jatuh ke setiap kategori kepuasan. Sekarang Anda bisa melihat sekilas apakah teknik memiliki lebih banyak karyawan tidak puas daripada penjualan, atau apakah dukungan sangat bahagia.

35 Penjualan - Puas 15 Penjualan - Netral 10 Penjualan - Tidak Puas 20 Teknik - Puas 25 Teknik - Netral 18 Teknik - Tidak Puas 28 Dukungan - Puas 12 Dukungan - Netral 7 Dukungan - Tidak Puas

Tabulasi silang adalah titik awal untuk banyak uji statistik, termasuk uji chi-kuadrat. Mereka memungkinkan Anda memeriksa secara visual apakah dua variabel tampak terkait sebelum menjalankan analisis formal. Saat membaca penelitian, Anda sering akan melihat tabel tabulasi silang disajikan dengan persentase baris atau kolom untuk memudahkan perbandingan.

Membaca tabel seperti profesional

Tabel frekuensi dan tabulasi silang muncul di mana-mana: di artikel berita, laporan medis, dasbor bisnis, dan makalah akademis. Berikut tips praktis untuk membacanya dengan baik. Pertama, selalu periksa total. Jika tabel menunjukkan persentase tapi bukan hitungan dasar, ukuran sampel mungkin terlalu kecil untuk persentase yang bermakna (mengatakan "50% memilih opsi A" terdengar mengesankan sampai Anda tahu hanya 4 orang yang disurvei).

Kedua, perhatikan bagaimana kategori didefinisikan. Bin dengan lebar tidak sama dalam tabel frekuensi bisa mendistorsi kesan Anda tentang data. Bin berlabel "0-10" dan yang lain berlabel "11-50" secara alami akan memiliki lebih banyak hitungan di bin yang lebih lebar, bahkan jika tingkat dasar sama.

Ketiga, dalam tabulasi silang, putuskan apakah persentase baris atau kolom lebih tepat untuk pertanyaan Anda. Jika ingin tahu berapa fraksi setiap departemen yang puas, gunakan persentase baris. Jika ingin tahu berapa fraksi karyawan puas dari setiap departemen, gunakan persentase kolom. Memilih arah yang salah bisa mengarah ke kesimpulan yang salah.

Poin penting

Tabel frekuensi mengubah data mentah menjadi ringkasan terorganisir dengan menghitung seberapa sering setiap nilai atau kategori muncul. Frekuensi relatif mengekspresikan hitungan sebagai proporsi untuk perbandingan mudah, dan frekuensi kumulatif melacak total berjalan. Tabulasi silang memperluas ini ke dua variabel sekaligus, mengungkapkan pola dalam hubungan antar kategori. Alat sederhana ini adalah langkah pertama dalam hampir setiap analisis data dan salah satu keterampilan paling praktis untuk membaca statistik dalam kehidupan sehari-hari.