Apa Itu Pencilan dalam Statistika?

Definisi

Pencilan adalah titik data yang berbeda secara signifikan dari pengamatan lain dalam kumpulan data. Letaknya pada jarak abnormal dari nilai lain, baik jauh lebih tinggi atau lebih rendah dari sebagian besar data.

Cara Mengidentifikasi Pencilan

Metode paling umum menggunakan rentang interkuartil (IQR). Nilai apa pun di bawah Q1 - 1.5 x IQR atau di atas Q3 + 1.5 x IQR ditandai sebagai pencilan.

Contoh

Pengeluaran bulanan 8 karyawan: $200, $250, $230, $210, $240, $220, $260, $1.500

Nilai $1.500 adalah pencilan. Jauh di atas nilai lain, yang berkumpul antara $200 dan $260.

Rata-rata dengan pencilan adalah $389. Tanpanya, rata-rata adalah $230. Satu nilai ekstrem menaikkan rata-rata hampir 70%.

Mengapa Ini Penting

Pencilan dapat secara dramatis mempengaruhi perhitungan statistik. Mereka menarik rata-rata menjauh dari pusat, menaikkan simpangan baku, dan dapat mendistorsi garis regresi. Gagal memperhitungkan pencilan dapat mengarah pada kesimpulan yang salah.

Namun, pencilan tidak selalu buruk. Mereka dapat mengungkap penipuan (transaksi yang luar biasa besar), kesalahan (desimal yang salah tempat), atau fenomena yang benar-benar penting (pengukuran ilmiah terobosan). Kuncinya adalah menyelidiki setiap pencilan daripada menghapusnya secara otomatis.

Poin Utama

Selalu selidiki pencilan sebelum memutuskan untuk menyimpan atau menghapusnya. Mereka bisa berupa kesalahan yang mendistorsi analisis atau titik data nyata yang mengandung informasi berharga.

← Back to Glossary