Nilai-P Dijelaskan

Tingkat Kesulitan: Menengah Waktu Baca: 12 menit

Angka Paling Disalahpahami dalam Statistik

Jika Anda pernah membaca artikel ilmiah, Anda mungkin pernah melihat frasa seperti "p < 0,05" atau "hasilnya signifikan secara statistik." Di balik frasa-frasa itu ada satu angka yang disebut nilai-p. Ini adalah salah satu konsep yang paling banyak digunakan - dan paling banyak disalahpahami - dalam seluruh statistika.

-3 -2 -1 0 1 2 3

Mari kita luruskan semuanya dengan bahasa sederhana dan eksperimen yang mudah dipahami.

Mulai dengan Sebuah Pertanyaan

Bayangkan teman Anda mengklaim bisa menebak lemparan koin. Anda skeptis. Jadi Anda merancang sebuah ujian: lempar koin 20 kali dan biarkan dia menebak setiap lemparan. Jika dia hanya menebak asal, dia seharusnya benar sekitar 10 dari 20 - kira-kira 50%.

Ternyata dia benar 14 dari 20. Apakah itu mengesankan, atau bisa terjadi karena keberuntungan?

Itulah jenis pertanyaan yang dijawab oleh nilai-p.

Apa Sebenarnya Nilai-P Itu

Nilai-p menjawab pertanyaan spesifik ini: Jika sebenarnya tidak ada yang istimewa terjadi, seberapa besar kemungkinan kita akan melihat hasil setidaknya seekstrem ini?

45 p<0.01 30 p<0.05 15 p<0.10 10 p>0.10

Dalam contoh lemparan koin: jika teman Anda tidak punya kemampuan nyata (hipotesis nol), berapa probabilitas menebak benar 14 atau lebih dari 20 hanya karena keberuntungan?

Jawabannya ternyata sekitar 0,058 - kira-kira peluang 6%. Itulah nilai-p-nya.

Contoh

Teman Anda menebak benar 14 dari 20 lemparan koin.

Hipotesis nol: Dia hanya menebak asal (peluang 50% setiap kali).

Nilai-p: Sekitar 0,058 - artinya ada kira-kira 6% peluang menebak benar 14 atau lebih hanya karena keberuntungan murni.

Apakah 6% cukup rendah untuk meyakinkan Anda bahwa dia punya kemampuan nyata? Itu tergantung pada ambang batas Anda. Dengan batas umum 5%, Anda akan berkata "belum cukup bukti." Jika dia menebak benar 15 (p = 0,02), Anda mungkin lebih yakin.

Ambang Batas 0,05

Di sebagian besar bidang penelitian, nilai-p di bawah 0,05 (5%) dianggap "signifikan secara statistik." Ini berarti hasilnya akan terjadi kurang dari 5% dari waktu hanya karena kebetulan, yang dianggap cukup tidak mungkin untuk dianggap serius.

Mengapa 0,05? Sejujurnya, ini agak sewenang-wenang. Statistikawan Ronald Fisher menyarankannya pada tahun 1920-an sebagai patokan yang mudah digunakan. Angka ini bertahan dan sekarang digunakan hampir di mana-mana. Beberapa bidang menggunakan ambang batas yang lebih ketat - fisika partikel menggunakan 0,0000003 (sekitar 1 dari 3,5 juta) untuk mengklaim sebuah penemuan.

Ide kuncinya: nilai-p yang lebih kecil berarti bukti yang lebih kuat terhadap hipotesis nol. Nilai-p 0,001 jauh lebih meyakinkan daripada 0,04.

Apa yang BUKAN Arti Nilai-P

Di sinilah kebanyakan kebingungan berada. Berikut kesalahan-kesalahan paling umum:

-3 -2 -1 0 1 2 3

Kesalahan 1: "Nilai-p adalah probabilitas hipotesis nol benar."

Bukan. Nilai-p 0,03 TIDAK berarti ada 3% kemungkinan tidak ada yang terjadi. Nilai-p mengasumsikan hipotesis nol benar dan bertanya seberapa mengejutkan data tersebut. Nilai-p tidak memberitahu Anda probabilitas suatu hipotesis benar atau salah.

Kesalahan 2: "Nilai-p kecil berarti efeknya besar atau penting."

Bukan. Anda bisa mendapatkan nilai-p sangat kecil untuk efek yang sangat kecil dan secara praktis tidak berarti - terutama dengan ukuran sampel yang besar. Jika Anda mensurvei satu juta orang, bahkan perbedaan sepele antara dua kelompok bisa menghasilkan nilai-p 0,0001. Efeknya mungkin nyata tapi terlalu kecil untuk diperhatikan.

Kesalahan 3: "Nilai-p di atas 0,05 berarti tidak ada efek."

Bukan. Itu berarti Anda tidak menemukan bukti yang cukup kuat adanya efek. Itu berbeda dari membuktikan tidak ada efek. Mungkin Anda tidak punya cukup data. Mungkin efeknya nyata tapi kecil. Ketiadaan bukti bukanlah bukti ketiadaan.

Dalam Istilah Sehari-hari

Bayangkan nilai-p sebagai "pengukur kejutan." Anda mulai dengan mengasumsikan penjelasan biasa itu benar (tidak ada yang istimewa terjadi). Lalu Anda melihat data dan bertanya: seberapa terkejut seharusnya saya?

  • Nilai-p mendekati 1,0: Sama sekali tidak terkejut. Data Anda sepenuhnya konsisten dengan penjelasan biasa.
  • Nilai-p sekitar 0,5: Data Anda biasa saja. Bisa dengan mudah terjadi karena kebetulan.
  • Nilai-p sekitar 0,05: Mulai menarik. Ini hanya akan terjadi sekitar 1 dari 20 kali karena kebetulan.
  • Nilai-p sekitar 0,001: Sangat mengejutkan. Hanya sekitar 1 dari 1.000 kali karena kebetulan. Bukti kuat ada sesuatu yang nyata terjadi.

Mengapa Batas 0,05 Menimbulkan Masalah

Memperlakukan 0,05 sebagai garis keras menciptakan situasi yang aneh. Penelitian dengan p = 0,049 dipublikasikan sebagai "temuan signifikan." Penelitian dengan p = 0,051 diperlakukan seolah tidak ada yang ditemukan. Padahal kedua hasil itu praktis identik - perbedaan kecil bisa disebabkan oleh satu orang tambahan dalam penelitian.

Banyak statistikawan sekarang berpendapat kita harus berhenti memperlakukan 0,05 sebagai ambang batas ajaib. Sebaliknya, mereka menyarankan untuk melaporkan nilai-p yang sebenarnya dan membiarkan pembaca menilai sendiri kekuatan buktinya.

Contoh

Dua peneliti di universitas Indonesia mempelajari apakah olahraga rutin menurunkan tekanan darah.

Peneliti A menemukan p = 0,048 dan menulis: "Olahraga secara signifikan menurunkan tekanan darah."

Peneliti B menemukan p = 0,052 dan menulis: "Olahraga tidak memiliki efek signifikan pada tekanan darah."

Hasil mereka hampir identik! Tetapi karena satu melewati garis 0,05 dan yang lain tidak, kesimpulannya terdengar benar-benar berbeda. Inilah mengapa melihat angka sebenarnya - bukan hanya "signifikan atau tidak" - sangat penting.

Nilai-P di Dunia Nyata

Nilai-p muncul dalam studi medis, eksperimen bisnis, penelitian ilmu sosial, dan judul berita. Ketika Anda melihatnya, tanyakan pada diri sendiri:

  • Seberapa kecil nilai-p-nya? (Lebih kecil = bukti lebih kuat)
  • Seberapa besar efek sebenarnya? (Efek nyata tapi kecil mungkin tidak penting)
  • Seberapa besar sampelnya? (Sampel besar bisa membuat efek kecil menjadi "signifikan")
  • Apakah penelitiannya dirancang dengan baik? (Nilai-p dari penelitian yang dirancang buruk tidak banyak artinya)
Poin Penting

Nilai-p memberitahu Anda seberapa mengejutkan data Anda jika sebenarnya tidak ada yang istimewa terjadi. Nilai-p yang kecil (biasanya di bawah 0,05) menunjukkan bahwa data tersebut tidak mungkin terjadi hanya karena kebetulan. Tetapi nilai-p BUKAN probabilitas bahwa suatu hipotesis benar, dan hasil "signifikan" tidak otomatis berarti temuan tersebut penting atau besar. Selalu perhatikan besarnya efek dan kualitas penelitian bersamaan dengan nilai-p.