Distribusi Probabilitas

Tingkat Kesulitan: Menengah Waktu Baca: 15 menit

Pola dalam Keacakan

Lempar koin sekali, dan hasilnya terasa sepenuhnya acak. Lempar 1.000 kali, dan pola muncul: kira-kira separuh akan gambar. Lempar dadu sekali, dan apa saja bisa terjadi. Lempar 10.000 kali, dan setiap angka muncul kira-kira sama rata.

0 9 18 27 36 45 1 2 3 4 5 6 7 8 9

Distribusi probabilitas mendeskripsikan pola-pola ini. Distribusi memberitahu Anda semua hasil yang mungkin dari kejadian acak dan seberapa mungkin masing-masing. Bayangkan sebagai peta lengkap peluang — alih-alih bertanya tentang satu hasil spesifik, Anda bisa melihat seluruh gambaran sekaligus.

Apa Itu Distribusi Probabilitas?

Distribusi probabilitas menjawab pertanyaan: "Jika saya mengulangi kejadian acak ini berkali-kali, seperti apa hasilnya?"

Distribusi bisa ditampilkan sebagai tabel, rumus, atau — paling umum — grafik. Grafik menunjukkan hasil yang mungkin di sepanjang bagian bawah dan probabilitasnya di sisi atas.

Contoh

Lempar dua dadu dan jumlahkan angkanya. Total yang mungkin berkisar dari 2 sampai 12. Tapi mereka TIDAK semuanya sama mungkin:

  • Total 2 hanya bisa terjadi satu cara: 1+1. Probabilitas: 1/36.
  • Total 7 bisa terjadi enam cara: 1+6, 2+5, 3+4, 4+3, 5+2, 6+1. Probabilitas: 6/36.
  • Total 12 hanya bisa terjadi satu cara: 6+6. Probabilitas: 1/36.

Jika Anda membuat grafiknya, Anda akan melihat bentuk segitiga — rendah di pinggiran (2 dan 12), tertinggi di tengah (7). Grafik itu ADALAH distribusi probabilitas untuk jumlah dua dadu.

Dua Jenis Distribusi

Distribusi datang dalam dua rasa, tergantung jenis datanya:

140 150 160 170 180 190 200

Distribusi Diskret

Ini berurusan dengan hasil yang bisa dihitung. Berapa kali gambar dalam 10 lemparan koin? Berapa pelanggan mengunjungi warung hari ini? Berapa produk cacat dalam pengiriman? Hasilnya adalah angka spesifik (0, 1, 2, 3...) dengan celah di antaranya.

Distribusi Kontinu

Ini berurusan dengan hasil yang bisa diukur yang bisa mengambil nilai apa pun dalam rentang. Tinggi badan seseorang bisa 170,0 cm, 170,1 cm, 170,15 cm — nilai apa pun dimungkinkan. Suhu, waktu, dan berat semuanya kontinu. Alih-alih bertanya "berapa probabilitas tingginya tepat 170,0 cm?" (yang pada dasarnya nol untuk data kontinu), kita bertanya tentang rentang: "Berapa probabilitas tingginya antara 165 dan 175 cm?"

Distribusi Normal: Kurva Lonceng yang Terkenal

Dari semua distribusi probabilitas, distribusi normal — juga disebut kurva lonceng — sejauh ini yang paling penting. Ketika Anda membuat grafiknya, ia membentuk bentuk yang halus dan simetris yang terlihat seperti lonceng: tinggi di tengah dan meruncing sama rata di kedua sisi.

Kurva lonceng didefinisikan oleh hanya dua angka:

  • Mean (rata-rata): Ini adalah pusat lonceng — puncaknya. Ini memberitahu di mana kebanyakan nilai berkumpul.
  • Deviasi standar: Ini mengukur seberapa tersebar nilainya. Deviasi standar kecil berarti lonceng tinggi dan sempit (nilai rapat). Deviasi standar besar berarti lonceng pendek dan lebar (nilai lebih tersebar).
Contoh

Menurut data BPS, tinggi badan pria dewasa Indonesia rata-rata sekitar 164 cm, dengan deviasi standar sekitar 6 cm. Ini berarti:

  • Kebanyakan pria (sekitar 68%) berada dalam satu deviasi standar dari mean: antara 158 dan 170 cm.
  • Hampir semua pria (sekitar 95%) berada dalam dua deviasi standar: antara 152 dan 176 cm.
  • Lebih pendek dari 146 cm atau lebih tinggi dari 182 cm sangat jarang — kurang dari 0,3% populasi.

Inilah mengapa toko pakaian menyimpan stok paling banyak untuk ukuran M dan L dan lebih sedikit untuk ukuran ekstrem. Kurva lonceng memberitahu mereka di mana kebanyakan pelanggan berada.

Aturan 68-95-99,7

Salah satu fakta paling berguna tentang distribusi normal adalah aturan 68-95-99,7 (kadang disebut "aturan empiris"). Untuk kurva lonceng mana pun:

17 1 16 2 17 3 16 4 17 5 17 6
  • 68% nilai berada dalam 1 deviasi standar dari mean.
  • 95% nilai berada dalam 2 deviasi standar dari mean.
  • 99,7% nilai berada dalam 3 deviasi standar dari mean.

Aturan ini memberi Anda cara cepat menilai apakah suatu nilai tipikal atau tidak biasa. Jika sesuatu jatuh lebih dari 2 deviasi standar dari mean, ia berada di 5% terluar — cukup langka. Lebih dari 3 deviasi standar? Sangat langka.

Contoh

Ujian Nasional punya mean skor 500 dan deviasi standar 100. Menggunakan aturan 68-95-99,7:

  • Sekitar 68% peserta ujian mendapat skor antara 400 dan 600.
  • Sekitar 95% mendapat skor antara 300 dan 700.
  • Sekitar 99,7% mendapat skor antara 200 dan 800.

Jika seseorang mendapat skor 750, mereka lebih dari 2 deviasi standar di atas mean — menempatkan mereka di 2-3% teratas peserta ujian. Satu angka itu memberitahu Anda banyak, berkat kurva lonceng.

Mengapa Kurva Lonceng Ada di Mana-Mana?

Inilah hal yang luar biasa: kurva lonceng muncul di jumlah situasi dunia nyata yang menakjubkan. Tinggi badan, tekanan darah, nilai ujian, kesalahan pengukuran, suhu harian, berat buah durian dari kebun — semuanya cenderung mengikuti kurva lonceng. Mengapa?

Jawabannya berasal dari hasil matematika yang mendalam yang disebut Teorema Limit Pusat. Dalam istilah sederhana, ia mengatakan:

Ketika Anda menjumlahkan banyak efek acak yang kecil dan independen, totalnya cenderung membentuk kurva lonceng — tidak peduli seperti apa efek individualnya.

Tinggi badan seseorang, misalnya, dipengaruhi oleh ratusan faktor genetik dan lingkungan, masing-masing berkontribusi sedikit. Jumlahkan semuanya, dan Anda mendapat kurva lonceng. Nilai ujian tergantung pada pengetahuan, persiapan, fokus, kesulitan soal, dan keberuntungan — banyak faktor kecil yang bergabung menjadi distribusi berbentuk lonceng.

Contoh

Pabrik Indomie membuat mie yang seharusnya tepat 85 gram per bungkus. Kenyataannya, setiap bungkus sedikit berbeda karena variasi kecil dalam mesin, bahan, suhu, dan faktor lain. Jika pabrik menimbang 10.000 bungkus, beratnya akan membentuk kurva lonceng yang berpusat di sekitar 85 gram, dengan kebanyakan bungkus sangat dekat target dan sedikit outlier di kedua sisi.

Tim kontrol kualitas menggunakan ini: jika sebuah bungkus lebih dari 3 deviasi standar dari mean, sesuatu mungkin salah dengan mesinnya.

Distribusi Penting Lainnya

Kurva lonceng yang paling terkenal, tapi bukan satu-satunya distribusi. Berikut beberapa lainnya yang mungkin Anda temui:

Distribusi Seragam

Setiap hasil sama mungkin. Dadu yang adil punya distribusi seragam: setiap sisi punya peluang 1/6. Jika Anda membuat grafiknya, Anda mendapat garis datar — tidak ada puncak, tidak ada lembah.

Distribusi Miring

Tidak semuanya simetris. Distribusi pendapatan, misalnya, miring ke kanan: kebanyakan orang berpenghasilan moderat, tapi sejumlah kecil berpenghasilan sangat besar. "Ekor" memanjang jauh ke kanan. Inilah mengapa median pendapatan sering menjadi ukuran yang lebih baik daripada mean — yang berpenghasilan sangat tinggi menarik rata-rata ke atas.

Distribusi Binomial

Ini mendeskripsikan jumlah keberhasilan dalam jumlah tetap percobaan ya/tidak. Berapa kali gambar dalam 20 lemparan koin? Berapa dari 100 pelanggan yang akan membeli sesuatu? Distribusi binomial memberi probabilitas untuk setiap jumlah yang mungkin. Menariknya, ketika jumlah percobaan cukup besar, distribusi binomial mulai terlihat seperti kurva lonceng.

Apa yang Distribusi Ceritakan dalam Praktik

Memahami distribusi bukan sekadar akademis. Mereka punya nilai praktis langsung:

  • Mendeteksi kejadian tidak biasa. Jika pengukuran jatuh jauh di luar distribusi yang diharapkan, sesuatu yang perlu diperhatikan mungkin sedang terjadi. Bungkus Indomie yang terlalu berat, skor siswa yang jauh dari mean, harga saham yang bergerak jauh lebih dari yang diharapkan — distribusi membantu Anda mendeteksi ini.
  • Membuat prediksi. Jika Anda tahu distribusi, Anda bisa memperkirakan probabilitas hasil di masa depan. Perusahaan asuransi menggunakan distribusi untuk menetapkan premi. BMKG menggunakannya untuk memprediksi cuaca.
  • Menetapkan standar. Rentang "normal" untuk tekanan darah, gula darah, dan ukuran kesehatan lainnya didasarkan pada distribusi nilai dalam populasi sehat. Jika pengukuran Anda jatuh di luar rentang "normal," artinya Anda berada di ekor distribusi.
Contoh

Dokter anak memberitahu orang tua bahwa anak mereka berada di "persentil ke-75" untuk tinggi badan. Artinya anak itu lebih tinggi dari 75% anak seusianya. Dokter tahu ini karena mereka punya distribusi tinggi badan untuk anak-anak — kurva lonceng — dan bisa melihat tepat di mana setiap anak berada di dalamnya.

Distribusi dan Keputusan Sehari-hari

Anda berinteraksi dengan distribusi probabilitas lebih sering dari yang Anda kira:

  • Ketika JNE bilang "pengiriman 2-4 hari kerja," mereka mendeskripsikan bagian tengah distribusi. Kebanyakan paket tiba dalam jangka waktu itu, tapi ada yang lebih cepat dan ada yang lebih lambat.
  • Ketika resep bilang "masak selama 25-30 menit," waktu sebenarnya tergantung kompor, panci, dan faktor lain. Rentang itu mencerminkan distribusi waktu masak yang mungkin.
  • Ketika perjalanan dari rumah ke kantor "biasanya 45 menit," itu puncak distribusi. Kadang 30 menit, kadang 90 menit saat macet parah, dan distribusi menunjukkan seberapa mungkin setiap waktu tempuh.
Poin Penting

Distribusi probabilitas memetakan semua hasil yang mungkin dan kemungkinannya. Distribusi normal (kurva lonceng) adalah yang paling umum, didefinisikan oleh mean dan deviasi standarnya. Berkat aturan 68-95-99,7, Anda bisa dengan cepat menilai apakah suatu nilai tipikal atau tidak biasa. Kurva lonceng muncul di mana-mana karena banyak hasil dunia nyata merupakan hasil kombinasi banyak faktor acak yang kecil. Memahami distribusi memberi Anda lensa yang kuat untuk menginterpretasikan data, mendeteksi pencilan, dan membuat prediksi yang terinformasi dalam kehidupan sehari-hari.