What is the difference between a population and a sample?

A population includes every member of a group you want to study, while a sample is a smaller subset selected to represent that population.

Why do we use samples instead of populations?

Studying an entire population is usually too expensive or impractical, so we draw representative samples and use statistics to generalize.

What is a representative sample?

A representative sample accurately reflects the characteristics of the population it was drawn from, minimizing bias in the results.

How big should a sample size be?

It depends on population variability and desired precision. Common minimums are 30 for basic analyses, but larger samples give more reliable results.

What is sampling error?

Sampling error is the natural difference between a sample statistic and the true population value, caused by studying only part of the population.

Populasi dan Sampel

Anda Tidak Bisa Mengukur Segalanya

Bayangkan Anda ingin mengetahui rata-rata tinggi badan setiap orang dewasa di Indonesia. Untuk mendapat jawaban sempurna, Anda perlu mengukur setiap orang dewasa. Itu bisa ratusan juta orang. Anda butuh pasukan pembantu, bertahun-tahun waktu, dan biaya yang sangat besar. Saat Anda selesai, orang sudah bertambah tinggi, menyusut, atau meninggal. Data Anda sudah kadaluarsa.

Inilah mengapa kita menggunakan sampel. Alih-alih mengukur semua orang, kita mengukur kelompok yang lebih kecil dan menggunakan hasilnya untuk menarik kesimpulan tentang kelompok yang lebih besar. Ide ini adalah salah satu konsep paling kuat dalam statistik.

Populasi vs. Sampel

Populasi adalah seluruh kelompok yang ingin Anda pelajari. Sampel adalah bagian lebih kecil dari populasi itu yang benar-benar Anda kumpulkan datanya.

Contoh

Anda sedang membuat panci besar soto. Untuk mengecek apakah bumbunya sudah pas, Anda aduk dulu lalu mencicipi satu sendok. Seluruh panci adalah populasi. Satu sendok itu adalah sampel. Anda tidak perlu menghabiskan seluruh panci untuk tahu apakah perlu tambah garam. Satu sendok yang representatif memberitahu Anda apa yang perlu diketahui — tapi hanya jika Anda mengaduk pancinya terlebih dahulu. Jika semua garam mengendap di dasar, sendokan dari atas akan menyesatkan.

Populasi tidak selalu berarti "semua orang di Indonesia." Populasi berarti kelompok lengkap apa pun yang sedang Anda pelajari:

Jika Anda ingin tahu pendapat mahasiswa di kampus tentang kantin, populasinya adalah semua mahasiswa di kampus.
Jika pabrik Indomie ingin menguji kualitas produknya, populasinya adalah setiap bungkus Indomie yang diproduksi.
Jika dokter mempelajari efek obat pada orang dewasa dengan diabetes, populasinya adalah semua orang dewasa dengan diabetes.

Mengapa Kita Mengambil Sampel

Ada beberapa alasan praktis mengapa mempelajari seluruh populasi sering kali mustahil atau tidak praktis:

Biaya: Mensurvei ratusan juta orang itu mahal. Sampel 2.000 orang yang dirancang dengan baik bisa memberi hasil yang sangat akurat dengan biaya jauh lebih kecil.
Waktu: Mengumpulkan data dari semua orang memakan waktu terlalu lama. Saat Anda selesai, informasinya mungkin sudah tidak relevan.
Mustahil: Beberapa pengujian merusak benda yang diuji. Pabrik baterai tidak bisa menguji setiap baterai sampai habis dan masih punya produk untuk dijual.
Aksesibilitas: Anda tidak bisa menjangkau setiap anggota dari beberapa populasi. BPS tidak bisa mewawancarai setiap nelayan di seluruh kepulauan Indonesia untuk mempelajari hasil tangkapan mereka.

Contoh

Sebuah pabrik memproduksi 100.000 baterai per bulan. Untuk mengecek kualitas, mereka secara acak memilih 500 baterai dan mengujinya. Jika 98% baterai yang diuji memenuhi standar kualitas, perusahaan bisa cukup yakin bahwa sekitar 98% dari semua 100.000 baterai juga bagus. Mereka tidak bisa menguji setiap baterai karena proses pengujian menghabiskan baterai sepenuhnya.

Apa yang Membuat Sampel Baik?

Tidak semua sampel diciptakan sama. Sampel yang buruk memberi hasil yang menyesatkan, tidak peduli seberapa besar sampelnya. Kualitas utama sampel yang baik adalah representatif — artinya mencerminkan karakteristik populasi secara keseluruhan.

Sampel Representatif

Sampel yang representatif terlihat seperti versi mini dari populasi. Jika 50% populasi adalah perempuan, kira-kira 50% sampel Anda juga harus perempuan. Jika populasinya mencakup orang dari semua usia, sampel Anda juga harus demikian.

Contoh

Lembaga survei ingin memprediksi hasil Pemilu. Jika mereka hanya mensurvei orang di perumahan mewah Jakarta Selatan, hasilnya akan miring. Orang-orang itu mungkin punya pandangan politik yang sangat berbeda dari orang di pedesaan Jawa Timur atau pemukiman nelayan di Sulawesi. Survei Pemilu yang baik memastikan sampelnya mencakup orang dari berbagai daerah, tingkat pendapatan, kelompok usia, dan latar belakang, mencerminkan populasi pemilih yang sesungguhnya.

Bias dalam Pengambilan Sampel

Bias terjadi ketika sampel Anda secara sistematis berbeda dari populasi. Berikut cara umum hal ini terjadi:

Sampling kemudahan: Anda mensurvei siapa pun yang paling mudah dijangkau. Bertanya hanya kepada teman-teman tentang sebuah produk tidak mewakili semua pelanggan.
Respons sukarela: Anda memasang survei online dan menunggu orang merespons. Orang dengan opini kuat (sangat senang atau sangat marah) lebih mungkin merespons, sehingga hasilnya miring.
Undercoverage: Sebagian populasi tidak punya kesempatan untuk dipilih. Jika Anda mensurvei lewat telepon rumah, Anda akan melewatkan semua orang yang hanya punya HP, yang cenderung lebih muda.

Sampling Acak

Cara terbaik mendapatkan sampel yang representatif adalah melalui sampling acak. Dalam sampel yang benar-benar acak, setiap anggota populasi punya kesempatan yang sama untuk dipilih. Ini bukan berarti asal-asalan. Ini berarti sengaja menggunakan proses yang menghilangkan bias manusia dari pemilihan.

Bayangkan seperti undian. Jika setiap tiket punya kesempatan yang sama untuk ditarik, nomor pemenang tidak dipengaruhi oleh preferensi atau kebiasaan siapa pun.

Jenis Sampling Acak

Sampling acak sederhana: Setiap individu punya peluang yang sama untuk dipilih. Seperti mengambil nama dari topi yang berisi semua orang.
Sampling berlapis (stratified): Anda membagi populasi ke dalam kelompok (strata) berdasarkan karakteristik kunci (seperti usia atau pendapatan), lalu mengambil sampel acak dari setiap kelompok. Ini memastikan setiap kelompok terwakili.
Sampling sistematis: Anda memilih setiap orang ke-n dari daftar. Misalnya, setiap pelanggan ke-10 yang masuk toko.
Sampling klaster: Anda membagi populasi ke dalam klaster (seperti kelurahan atau sekolah), secara acak memilih beberapa klaster, lalu mensurvei semua orang di klaster yang terpilih.

Contoh

Sebuah SMA ingin mengetahui apakah siswa puas dengan menu kantin. Menggunakan sampling acak sederhana, mereka memberi nomor kepada setiap 800 siswa dan menggunakan generator angka acak untuk memilih 80 siswa. Menggunakan sampling berlapis, mereka memastikan untuk memasukkan siswa dari setiap angkatan secara proporsional. Menggunakan sampling klaster, mereka mungkin secara acak memilih 4 kelas dari 30 kelas dan mensurvei semua siswa di kelas-kelas itu.

Ukuran Sampel: Berapa Besar yang Cukup?

Pertanyaan umum adalah "berapa orang yang perlu saya survei?" Jawabannya tergantung beberapa faktor, tapi berikut dasarnya:

Lebih besar umumnya lebih baik. Sampel yang lebih besar cenderung menghasilkan hasil yang lebih akurat karena fluktuasi acak saling menyeimbangkan.
Tapi ada diminishing returns. Naik dari 100 ke 1.000 orang meningkatkan akurasi secara dramatis. Naik dari 10.000 ke 11.000 hampir tidak ada bedanya.
Ukuran populasi kurang penting dari yang Anda kira. Sampel 2.000 orang yang dipilih dengan baik bisa secara akurat mewakili kota 500.000 orang atau negara 270 juta orang. Yang penting adalah bagaimana sampel dipilih, bukan ukurannya relatif terhadap populasi.

Ini mungkin tampak bertentangan dengan logika. Bagaimana bisa 2.000 orang mewakili jutaan? Pikirkan kembali contoh soto. Baik panci kecil atau kuali raksasa, satu sendok yang sudah diaduk rata memberitahu Anda tentang bumbu. Kuncinya bukan berapa banyak soto yang Anda cicipi; tapi apakah sotonya sudah diaduk dengan benar.

Contoh

Lembaga survei nasional besar di Indonesia sering mensurvei sekitar 1.200 hingga 2.000 orang untuk memprediksi perilaku lebih dari 190 juta pemilih. Ketika dilakukan dengan baik menggunakan sampling acak yang tepat, survei ini biasanya akurat dalam margin 2 hingga 4 poin persentase. Rahasianya bukan jumlah orang yang disurvei; tapi metode yang digunakan untuk memilih mereka.

Parameter vs. Statistik

Berikut catatan kosakata singkat yang akan membantu di pelajaran selanjutnya. Angka yang mendeskripsikan populasi disebut parameter. Angka yang mendeskripsikan sampel disebut statistik.

Misalnya, rata-rata pendapatan sesungguhnya dari semua orang di sebuah kota adalah parameter (Anda butuh data dari setiap orang). Rata-rata pendapatan yang dihitung dari survei 500 penduduk adalah statistik (dihitung dari sampel). Kita menggunakan statistik untuk memperkirakan parameter.

Poin Penting

Populasi adalah kelompok lengkap yang ingin Anda pelajari. Sampel adalah bagian yang bisa dikelola dari kelompok itu. Kita menggunakan sampel karena mempelajari seluruh populasi biasanya terlalu mahal, memakan waktu, atau mustahil. Kualitas terpenting dari sampel adalah bahwa ia representatif terhadap populasi, dan sampling acak adalah cara terbaik untuk mencapainya. Ukuran sampel penting, tapi bagaimana Anda memilih sampel bahkan lebih penting. Sampel kecil yang dipilih dengan baik mengalahkan sampel besar yang bias setiap saat.

Populasi dan Sampel

Anda Tidak Bisa Mengukur Segalanya

Populasi vs. Sampel

Mengapa Kita Mengambil Sampel

Apa yang Membuat Sampel Baik?

Sampel Representatif

Bias dalam Pengambilan Sampel

Sampling Acak

Jenis Sampling Acak

Ukuran Sampel: Berapa Besar yang Cukup?

Parameter vs. Statistik

Pelajaran Terkait