Güven Aralıkları

Zorluk: Orta Okuma Süresi: 12 dakika

Tek Bir Sayı Neden Yeterli Değil?

Bir haber raporunun "Türk vatandaşları yılda ortalama 3.200 TL dış yemek harcaması yapıyor" dediğini hayal edin. Kulağa kesin geliyor ama bu bilgi sadece 500 kişilik bir anketten geldi. Bu sayı 85 milyon Türk içindeki gerçeğe ne kadar yakın?

%95 GA 48 52 56 50

Tek bir sayı (buna "nokta tahmini" denir) size en iyi tahmini verir ama bu tahminin ne kadar güvenilir olduğu hakkında hiçbir şey söylemez. İşte güven aralıkları burada devreye girer. Size gerçek cevabı içermesi muhtemel bir aralık sunar.

Güven Aralığı Nedir?

Güven aralığı, örneklem verilerimize dayanarak gerçek popülasyon değerini içerdiğine inandığımız bir değer aralığıdır. "Ortalama 3.200 TL" demek yerine "gerçek ortalamanın 2.950 TL ile 3.450 TL arasında olduğuna %95 güvenle inanıyoruz" dersiniz.

Bu aralık - 2.950 TL ile 3.450 TL - güven aralığıdır. "Yukarı ve aşağı 250 TL" ise hata payıdır.

Seçim Anketi Örneği

Örnek

Bir seçim öncesi, araştırma şirketi 1.200 muhtemel seçmene anket yapar. Adayların %52'sinin A Adayını desteklediğini bulurlar.

Ama sadece "%52" raporlamazlar. Şöyle raporlarlar: "%52 ± %3, %95 güvenle."

Bu şu anlama gelir: bu örnekleme dayanarak, TÜM seçmenler arasında A Adayına gerçek destek oranının %49 ile %55 arasında olduğuna %95 güvenle inanıyoruz.

%49'un %50'nin altında olduğuna dikkat edin. Anket A Adayını "önde" gösterse de, güven aralığı yarıştaki baskın tarafın değişebileceğini söylüyor. Tek başına "%52" sayısının ortaya koymadığı son derece faydalı bir bilgi.

"%95 Güvenle" Gerçekte Ne Anlama Gelir?

Bu, istatistikte en yaygın yanlış anlaşılan ifadelerden biridir. Ne anlama geldiği ve gelmediği:

Şu anlama GELMEZ: "Gerçek değerin bu belirli aralıkta olma olasılığı %95'tir." Aralık hesaplandıktan sonra gerçek değer ya içindedir ya değildir - bunda olasılık yoktur.

Şu anlama GELİR: "Bu çalışmanın tamamı defalarca tekrarlansaydı - her seferinde yeni bir örneklem alınıp yeni bir aralık hesaplansaydı - bu aralıkların yaklaşık %95'i gerçek değeri içerirdi."

Bunu bir balık ağı gibi düşünün. Aynı türdeki ağı 100 kez atarsanız, balıkçı yaklaşık 95 kez balığı yakalamayı bekler. Herhangi bir atışta kaçırılabilir ama yöntem uzun vadede güvenilirdir.

Hata Payı

Hata payı, güven aralığının "artı veya eksi" kısmıdır. Tahminizin ne kadar sapabileceğini söyler. Daha küçük hata payı daha kesin bir tahmin anlamına gelir.

%99 GA 44 52 60 50

Üç şey hata payını etkiler:

  • Örneklem boyutu: Daha büyük örneklemler daha küçük hata payları üretir. 2.000 kişiyle anket yapmak, 200 kişiyle anket yapmaktan daha dar bir aralık verir.
  • Verideki değişkenlik: Popülasyondaki herkes birbirine çok benziyorsa, ortalamayı tahmin etmek için daha az veri noktası yeter. İnsanlar birbirinden çok farklıysa daha fazla gerekir.
  • Güven düzeyi: %99'luk güven aralığı, %95'likten daha geniştir. Daha fazla kesinlik istemek, daha geniş bir aralığı kabul etmek demektir.
Örnek

Bir okul, öğrencilerin her gece ödevlere ne kadar vakit harcadığını bilmek istiyor.

50 öğrenciyle anket yapıp ortalama 1,8 saat ve %95 güven aralığı olarak 1,5 ile 2,1 saat buluyorlar.

200 öğrenciyle anket yapsalar, aralık 1,65 ile 1,95 saat'e daralabilirdi - daha fazla veriden daha kesin bir tahmin.

Sadece 15 öğrenciyle anket yapsalar, aralık 1,2 ile 2,4 saat'e genişleyebilirdi - aralık çok geniş olduğu için çok daha az kullanışlı.

Örneklem Boyutu Genişliği Nasıl Etkiler?

Bu, istatistiğin en pratik içgörülerinden biridir. Örneklem boyutu ile kesinlik arasındaki ilişki doğrusal değildir - "karekök" kuralını izler.

Hata payınızı yarıya indirmek için örneklem boyutunuzu dört katına çıkarmanız gerekir. 100'den 400 kişiye çıkmak hata payını yarılara indirir. 400'den 1.600'e çıkmak tekrar yarılara indirir.

Bu, ulusal anketlerin çoğunun neden 1.000-1.500 kişiyle yapıldığını açıklar. Bunun ötesinde, kesinlikte elde edilen iyileşme ekstra maliyete değmez. 1.000 yerine 10.000 kişiyle anket yapmak aralığı sadece yaklaşık üç kat daraltır - genellikle on kat artan çabaya değmez.

Farklı Güven Düzeyleri

İhtiyaçlarınıza göre farklı güven düzeyleri seçebilirsiniz:

  • %90 güven: Daha dar aralık ama gerçek değeri kaçırma şansı daha yüksek.
  • %95 güven: En yaygın tercih. Kesinlik ve güvenilirlik arasında iyi bir denge.
  • %99 güven: Daha geniş aralık ama gerçek değerin dahil olduğuna neredeyse emin olursunuz.

Daha yüksek güven, daha geniş ağ demektir. Gerçeği yakalama olasılığınız artar ama tahminiz daha az kesindir. Kabul edeceğiniz risk düzeyine göre seçim yaptığınız bir dengeleme.

Haberlerde Güven Aralıklarını Okumak

Güven aralıkları raporlandığını gördüğünüzde, bazı pratik ipuçları:

  • İki güven aralığı birbiriyle örtüşmüyorsa, gruplar muhtemelen gerçekten farklıdır.
  • Bir fark için güven aralığı sıfırı içeriyorsa, fark gerçek olmayabilir.
  • Çok geniş bir aralık, tahminin güvenilir olmadığını gösterir - muhtemelen küçük bir örneklemden veya yüksek değişkenlikten kaynaklanıyor.
  • Her zaman güven düzeyini kontrol edin. Aynı veriden elde edilen %90'lık aralık, %99'luk aralıktan daha dar görünür ama daha az güvenilirdir.
Önemli Nokta

Güven aralığı, tek bir tahmin yerine bir popülasyon ölçüsü için makul değerler aralığı sunar. Hata payı, bu aralığın ne kadar geniş olduğunu söyler. Daha büyük örneklemler daha dar, daha kesin aralıklar üretir. "%95 güven" gördüğünüzde, yöntemin birçok tekrarda %95 oranında işleyeceği anlamına gelir - bu belirli aralığın doğru olma olasılığının %95 olduğu değil. Güven aralıkları, herhangi bir tahmini ne kadar güvenileceğini anlamak için vazgeçilmezdir.