Jenis-Jenis Data

Tingkat Kesulitan: Pemula Waktu Baca: 10 menit

Tidak Semua Data Itu Sama

Sebelum Anda bisa menganalisis apa pun, Anda perlu memahami jenis data apa yang sedang Anda kerjakan. Sama seperti Anda tidak akan menggunakan palu untuk mengencangkan sekrup, jenis data yang berbeda membutuhkan alat dan pendekatan yang berbeda. Salah memilih akan menghasilkan kesalahan. Memilih dengan benar membuat semua langkah selanjutnya jauh lebih mudah.

25 A 40 B 15 C 30 D 10 F

Dalam pelajaran ini, kita akan menguraikan jenis-jenis data utama yang akan Anda temui. Jangan khawatir harus menghafal setiap detail sekarang. Tujuannya adalah mulai mengenali jenis-jenis ini ketika Anda melihatnya dalam kehidupan sehari-hari.

Data Kualitatif (Data Kategorikal)

Data kualitatif mendeskripsikan kualitas atau karakteristik. Data ini menjawab pertanyaan seperti "jenis apa?" atau "kategori mana?" Anda tidak bisa melakukan aritmatika yang bermakna dengan data kualitatif.

Bayangkan data kualitatif sebagai label. Label memberitahu sesuatu tentang seseorang, tempat, atau benda, tapi Anda tidak bisa menjumlahkan atau merata-ratakannya dengan cara yang masuk akal.

Contoh
  • Merek mi instan favorit: Indomie, Mie Sedaap, Sarimi. Anda bisa menghitung berapa orang memilih setiap merek, tapi "Indomie + Sarimi" tidak menghasilkan sesuatu yang bermakna.
  • Provinsi tempat tinggal: Jawa Barat, Sumatera Utara, Sulawesi Selatan. Ini adalah kategori, bukan angka.
  • Ulasan pelanggan di Tokopedia: "Barang sesuai deskripsi," "pengiriman lama," "penjual ramah." Ini adalah deskripsi, bukan pengukuran.
  • Agama: Islam, Kristen, Hindu, Buddha, Konghucu. Hanya label tanpa urutan numerik.

Dengan data kualitatif, hal paling umum yang Anda lakukan adalah menghitung seberapa sering setiap kategori muncul. Misalnya, dalam survei 30 mahasiswa, 18 memilih Indomie, 8 memilih Mie Sedaap, dan 4 memilih Sarimi. Hitungan itu berguna, tapi kategorinya sendiri bukan angka yang bisa Anda rata-ratakan.

Data Kuantitatif (Data Numerik)

Data kuantitatif terdiri dari angka yang mewakili jumlah atau pengukuran. Data ini menjawab pertanyaan seperti "berapa banyak?" atau "berapa?" Anda bisa menjumlahkan, mengurangkan, dan merata-ratakan data kuantitatif.

Contoh
  • Tinggi badan: 165 cm, 170 cm. Ini adalah pengukuran yang bisa Anda bandingkan dan rata-ratakan.
  • Suhu udara: 28 derajat Celsius, 33 derajat Celsius. Ini adalah pengukuran pada skala tertentu.
  • Jumlah saudara: 0, 1, 2, 3. Anda bisa menghitung rata-rata mahasiswa dalam kelas memiliki 1,5 saudara.
  • Pengeluaran belanja mingguan: Rp350.000, Rp500.000, Rp275.000. Ini adalah jumlah yang bisa Anda totalkan dan rata-ratakan.

Data kuantitatif dibagi lagi menjadi dua subjenis penting: diskret dan kontinu.

Data Diskret

Data diskret hanya bisa mengambil nilai tertentu yang terpisah. Biasanya ini adalah bilangan bulat yang Anda dapatkan dengan menghitung. Anda tidak bisa memiliki setengah orang atau 2,7 anak.

Tes sederhana: jika Anda bisa menghitungnya satu per satu, kemungkinan besar itu diskret.

Contoh
  • Jumlah siswa di kelas: 25, 26, 27, tapi tidak pernah 25,5.
  • Gol dalam pertandingan Liga 1: 0, 1, 2, 3. Persija tidak bisa mencetak 1,3 gol.
  • Jumlah aplikasi di HP Anda: 42, 43, 44. Bilangan bulat saja.
  • Jumlah bungkus Indomie yang Anda beli: 0 sampai 40. Anda menghitungnya satu per satu.

Data Kontinu

Data kontinu bisa mengambil nilai apa pun dalam suatu rentang, termasuk pecahan dan desimal. Anda mendapatkan data kontinu dengan mengukur, bukan menghitung.

Tes sederhana: jika Anda selalu bisa membayangkan ada nilai di antara dua nilai, itu kontinu. Antara 5,1 dan 5,2, ada 5,15. Antara 5,15 dan 5,16, ada 5,155. Dan seterusnya tanpa batas.

Contoh
  • Berat badan: Anda mungkin memiliki berat 65,3 kg atau 65,37 kg. Ketelitiannya tergantung timbangannya.
  • Waktu lari 100 meter: 12,456 detik. Waktu bisa diukur dengan presisi sangat tinggi.
  • Suhu tubuh: 36,4 derajat, 36,41 derajat, 36,413 derajat. Termometer yang membatasi.
  • Volume air dalam gelas: 250,5 ml, 250,55 ml. Air mengalir, tidak datang dalam potongan tetap.

Mengapa Perbedaan Diskret vs. Kontinu Penting?

Karena jenis data menentukan grafik dan perhitungan mana yang tepat. Diagram batang cocok untuk data diskret (Anda bisa menampilkan batang terpisah untuk setiap nilai). Histogram dan grafik garis lebih cocok untuk data kontinu (di mana nilai mengalir di sepanjang rentang). Menggunakan grafik atau metode yang salah bisa membuat hasil Anda menyesatkan atau bahkan salah total.

Contoh

Bayangkan Anda melacak kebiasaan belanja di Shopee. Jumlah barang yang Anda beli setiap kali belanja adalah diskret: 3 barang, 7 barang, 12 barang. Total yang Anda belanjakan adalah kontinu: Rp47.300, Rp183.900, Rp512.050. Kategori toko yang Anda kunjungi adalah kualitatif: Fashion, Elektronik, Makanan. Ketiga informasi ini mendeskripsikan transaksi belanja yang sama, tapi masing-masing adalah jenis data berbeda yang akan Anda analisis dengan cara berbeda.

Data Terstruktur vs. Tidak Terstruktur

Ada satu perbedaan penting lagi, terutama di dunia sekarang di mana data datang dari begitu banyak sumber.

Data Terstruktur

Data terstruktur diorganisir dengan rapi, biasanya dalam baris dan kolom seperti spreadsheet. Setiap informasi punya tempat yang jelas. Kebanyakan statistik tradisional bekerja dengan data terstruktur.

  • Spreadsheet berisi nama karyawan, usia, dan gaji
  • Tabel pembacaan tekanan darah pasien dari waktu ke waktu
  • Database harga produk dan jumlah stok di Tokopedia

Data Tidak Terstruktur

Data tidak terstruktur tidak masuk dengan rapi ke dalam baris dan kolom. Datanya berantakan, beragam, dan sering membutuhkan alat khusus untuk dianalisis.

  • Ulasan pelanggan dalam teks bebas ("Nasi gorengnya enak tapi pelayanan lambat")
  • Foto yang diposting di Instagram
  • Rekaman suara dari call center
  • Cuitan Twitter, komentar YouTube, dan postingan blog

Jumlah data dunia yang tidak terstruktur sangat besar. Menganalisisnya sering membutuhkan konversi ke bentuk terstruktur terlebih dahulu. Misalnya, Anda bisa membaca 500 ulasan pelanggan di Shopee dan mengkategorikan masing-masing sebagai "positif," "negatif," atau "netral." Sekarang Anda telah mengubah teks tidak terstruktur menjadi kategori terstruktur yang bisa dihitung dan dibandingkan.

Contoh

Sebuah warung makan di Jakarta menerima 200 ulasan Google. Teks mentah setiap ulasan adalah data tidak terstruktur. Tapi jika seseorang membaca setiap ulasan dan mencatat rating bintang (1 sampai 5), apakah penulis menyebut kualitas makanan (ya atau tidak), dan tanggal ulasan, detail yang dicatat itu adalah data terstruktur. Sumber informasi yang sama menghasilkan kedua jenis data tergantung cara Anda menangkapnya.

Menyatukan Semuanya

Mari kita telusuri skenario yang realistis. Bayangkan Anda mengelola sebuah gym kecil di Surabaya dan ingin memahami anggota Anda lebih baik. Anda mengumpulkan informasi berikut:

  • Jenis keanggotaan (Basic, Premium, VIP) — data kualitatif
  • Usia (34, 56, 22) — kuantitatif, diskret (tahun bulat)
  • Berat badan (65,4 kg, 72,8 kg) — kuantitatif, kontinu
  • Jumlah kunjungan per bulan (8, 12, 4) — kuantitatif, diskret
  • Komentar kepuasan ("Suka kelas pagi!") — data tidak terstruktur
  • Rating kepuasan (1 sampai 10) — kuantitatif, diskret

Sebelum melakukan analisis apa pun, mengidentifikasi setiap jenis data membantu Anda memilih alat yang tepat. Anda akan menggunakan diagram lingkaran atau batang untuk jenis keanggotaan. Anda akan menghitung rata-rata untuk kunjungan per bulan. Anda perlu membaca dan mengkategorikan komentar kepuasan sebelum bisa mengkuantifikasikannya.

Panduan Cepat

Berikut cara sederhana untuk mengklasifikasi setiap data yang Anda temui:

  1. Apakah itu angka atau label? Label adalah kualitatif. Angka adalah kuantitatif.
  2. Jika angka, bisakah nilainya apa saja, atau hanya nilai tertentu? Nilai bulat tertentu adalah diskret. Nilai apa saja dalam rentang adalah kontinu.
  3. Apakah terorganisir dalam tabel, atau bentuk bebas? Tabel adalah terstruktur. Teks bebas, gambar, dan audio adalah tidak terstruktur.
Poin Penting

Data datang dalam berbagai jenis, dan mengenali jenis-jenis tersebut adalah langkah pertama dalam setiap analisis. Data kualitatif mendeskripsikan kategori dan label. Data kuantitatif mewakili angka dan pengukuran, dan bisa diskret (bisa dihitung, nilai terpisah) atau kontinu (bisa diukur, nilai apa saja dalam rentang). Data terstruktur masuk dengan rapi dalam tabel; data tidak terstruktur adalah bentuk bebas. Mengetahui jenis data yang Anda miliki memberitahu Anda alat dan metode mana yang harus digunakan selanjutnya.