Definisi
Pencilan adalah titik data yang berbeda secara signifikan dari pengamatan lain dalam kumpulan data. Letaknya pada jarak abnormal dari nilai lain, baik jauh lebih tinggi atau lebih rendah dari sebagian besar data.
Cara Mengidentifikasi Pencilan
Metode paling umum menggunakan rentang interkuartil (IQR). Nilai apa pun di bawah Q1 - 1.5 x IQR atau di atas Q3 + 1.5 x IQR ditandai sebagai pencilan.
Pengeluaran bulanan 8 karyawan: $200, $250, $230, $210, $240, $220, $260, $1.500
Nilai $1.500 adalah pencilan. Jauh di atas nilai lain, yang berkumpul antara $200 dan $260.
Rata-rata dengan pencilan adalah $389. Tanpanya, rata-rata adalah $230. Satu nilai ekstrem menaikkan rata-rata hampir 70%.
Mengapa Ini Penting
Pencilan dapat secara dramatis mempengaruhi perhitungan statistik. Mereka menarik rata-rata menjauh dari pusat, menaikkan simpangan baku, dan dapat mendistorsi garis regresi. Gagal memperhitungkan pencilan dapat mengarah pada kesimpulan yang salah.
Namun, pencilan tidak selalu buruk. Mereka dapat mengungkap penipuan (transaksi yang luar biasa besar), kesalahan (desimal yang salah tempat), atau fenomena yang benar-benar penting (pengukuran ilmiah terobosan). Kuncinya adalah menyelidiki setiap pencilan daripada menghapusnya secara otomatis.
Selalu selidiki pencilan sebelum memutuskan untuk menyimpan atau menghapusnya. Mereka bisa berupa kesalahan yang mendistorsi analisis atau titik data nyata yang mengandung informasi berharga.