Her Şeyi Ölçemezsiniz
Türkiye'deki her yetişkinin ortalama boyunu bilmek istediğinizi düşünün. Kusursuz bir cevap için her yetişkini ölçmeniz gerekir. Bu, 60 milyondan fazla insan demek. Bir ordu yardımcı, yıllarca zaman ve bir dağ kadar para gerekir. Bitirdiğinizde insanlar büyümüş, küçülmüş veya hayatını kaybetmiş olur. Veriniz çoktan eski olur.
Bu yüzden örneklem kullanırız. Herkesi ölçmek yerine, daha küçük bir grubu ölçer ve sonuçları daha büyük grup hakkında sonuçlar çıkarmak için kullanırız. Bu fikir, istatistikteki en güçlü kavramlardan biridir.
Popülasyon ve Örneklem
Popülasyon, incelemek istediğiniz grubun tamamıdır. Örneklem, o popülasyonun gerçekten veri topladığınız daha küçük bir alt kümesidir.
Büyük bir tencere çorba yapıyorsunuz. Tuzunun iyi olup olmadığını kontrol etmek için iyice karıştırıp bir kaşık tadına bakıyorsunuz. Tüm tencere popülasyondur. Kaşık örneklemdir. Yeterince tuz olup olmadığını bilmek için tüm tencereyi içmeniz gerekmez. Temsili bir kaşık size gerekeni söyler - ama ancak tencereyi önce karıştırdıysanız. Eğer tüm tuz dibe çökmüşse, üstten aldığınız kaşık yanıltıcı olur.
Popülasyon her zaman "bir ülkedeki tüm insanlar" anlamına gelmez. İncelediğiniz tam grup ne ise odur:
- Okulunuzdaki öğrencilerin yemekhane hakkında ne düşündüğünü bilmek istiyorsanız, popülasyon okulunuzdaki tüm öğrencilerdir.
- Bir fabrika ampullerinin dayanıklılığını test etmek istiyorsa, popülasyon üretilen her ampuldür.
- Bir doktor yüksek tansiyonlu yetişkinlerde bir ilacın etkisini inceliyorsa, popülasyon tüm yüksek tansiyonlu yetişkinlerdir.
Neden Örneklem Alırız?
Tüm popülasyonu incelemenin genellikle imkânsız veya pratik olmadığı birkaç pratik neden vardır:
- Maliyet: Milyonlarca kişiye anket yapmak pahalıdır. İyi tasarlanmış 1.000 kişilik bir örneklem, maliyetin çok küçük bir kısmıyla kayda değer ölçüde doğru sonuçlar verebilir.
- Zaman: Herkesten veri toplamak çok uzun sürer. Bitirdiğinizde bilgi artık geçerli olmayabilir.
- İmkânsızlık: Bazı testler test edilen nesneyi yok eder. Bir ampul fabrikası her ampulü yanana kadar test edip sonra satacak ürün bulamaz.
- Erişilebilirlik: Bazı popülasyonların her üyesine ulaşmanız mümkün değildir. Beslenme alışkanlıklarını incelemek için Türkiye'deki her balığa mülakat yapamazsınız.
Bir fabrika ayda 100.000 pil üretiyor. Kaliteyi kontrol etmek için rastgele 500 pil seçip test ediyorlar. Test edilen pillerin %98'i kalite standartlarını karşılıyorsa, şirket tüm 100.000 pilin de yaklaşık %98'inin iyi olduğuna makul ölçüde güvenebilir. Her birini test edemezler çünkü test süreci pilleri tamamen boşaltır.
İyi Bir Örneklem Neyi Gerektirir?
Tüm örneklemler eşit değildir. Kötü bir örneklem, ne kadar büyük olursa olsun, yanıltıcı sonuçlar verir. İyi bir örneklemin temel kalitesi, temsil edici olması, yani popülasyonun genel özelliklerini yansıtmasıdır.
Temsil Edici Örneklemler
Temsil edici bir örneklem, popülasyonun minyatür bir versiyonu gibi görünür. Popülasyonun %60'ı kadınsa, örnekleminizin de yaklaşık %60'ı kadın olmalıdır. Popülasyon her yaştan insan içeriyorsa, örnekleminiz de içermelidir.
Türkiye'de seçim anketi yapan bir şirket düşünün. Sadece İstanbul Beşiktaş'taki insanlara anket yapsalar, sonuçları çarpık olur. O insanların siyasi görüşleri kırsal bölgedeki veya düşük gelirli mahallelerdeki insanlardan çok farklı olabilir. İyi bir seçim anketi, örneklemin farklı bölge, gelir düzeyi, yaş grubu ve arka planlardan insanları içermesini sağlar - gerçek seçmen popülasyonunu yansıtır.
Örneklemede Yanlılık
Yanlılık, örnekleminiz popülasyondan sistematik olarak farklı olduğunda oluşur. Bu yaşanmanın yaygın yolları şunlardır:
- Kolaylık örneklemesi: Ulaşmanın en kolay olduğu kişiler anket yapılır. Bir ürün hakkında sadece arkadaşlarınıza sormak, tüm müşterileri temsil etmez.
- Gönüllü katılım: Anket yayınlayıp insanların cevap vermesini bekliyorsunuz. Güçlü görüşlere sahip insanlar (çok mutlu veya çok kızgın) cevap verme olasılığı daha yüksektir, bu da sonuçları çarpıtır.
- Yetersiz kapsam: Popülasyonun bir kısmı seçilme şansına sahip değildir. Sadece sabit hatlardan arama yaparak anket yaparsanız, sadece cep telefonu kullanan herkesi kaçırırsınız - ki bunlar genellikle genç insanlardır.
Rastgele Örnekleme
Temsil edici bir örneklem almanın en iyi yolu rastgele örneklemedir. Gerçekten rastgele bir örneklemde, popülasyonun her üyesinin seçilme şansı eşittir. Bu, gelişigüzel veya dikkatsiz anlamına gelmez. İnsan yanlılığını seçimden çıkartan bir süreci kasıtlı olarak kullanmak demektir.
Bunu piyango gibi düşünün. Her biletin çekilme şansı eşitse, kazanan numaralar kimsenin tercihleri veya alışkanlıklarından etkilenmez.
Rastgele Örnekleme Türleri
- Basit rastgele örnekleme: Her bireyin seçilme şansı aynıdır. Herkesi içeren bir şapkadan isim çekmek gibi.
- Tabakalandırılmış örnekleme: Popülasyonu temel bir özelliğe göre gruplara (tabakalara) ayırırsınız (yaş veya gelir gibi), sonra her gruptan rastgele örneklem alırsınız. Bu her grubun temsil edilmesini sağlar.
- Sistematik örnekleme: Bir listeden her n'inci kişiyi seçersiniz. Örneğin, bir markete giren her 10. müşteri.
- Küme örneklemesi: Popülasyonu kümelere ayırırsınız (mahalleler veya okullar gibi), rastgele bazı kümeleri seçersiniz ve sonra o seçilen kümelerdeki herkese anket yaparsınız.
Bir üniversite, öğrencilerin yemekhane hizmetinden memnun olup olmadığını bilmek istiyor. Basit rastgele örnekleme kullanarak, 5.000 öğrenciden her birine numara atar ve rastgele sayı üreticiyle 500 öğrenci seçer. Tabakalandırılmış örnekleme kullanarak, her fakülteden orantılı öğrenci dahil ederler. Küme örneklemesi kullanarak, 40 sınıftan rastgele 5 tanesini seçip o sınıflardaki herkese anket yapabilirler.
Örneklem Büyüklüğü: Ne Kadar Büyük Yeterli?
Yaygın bir soru "kaç kişiye anket yapmam gerekiyor?" sorusudur. Cevap birkaç faktöre bağlıdır, ama işte temel bilgiler:
- Büyük genellikle daha iyidir. Daha büyük örneklemler genellikle daha doğru sonuçlar üretir çünkü rastgele dalgalanmalar dengelenir.
- Ama azalan getiriler var. 100'den 1.000 kişiye çıkmak doğruluğu önemli ölçüde artırır. 10.000'den 11.000'e çıkmak neredeyse hiç fark yaratmaz.
- Popülasyon büyüklüğü sandığınızdan az önemli. İyi seçilmiş 1.000 kişilik bir örneklem, 500.000 nüfuslu bir şehri veya 85 milyonluk bir ülkeyi doğru temsil edebilir. Önemli olan örneklemin nasıl seçildiği, sadece popülasyona göre büyüklüğü değil.
Bu sezgiye aykırı görünebilir. 1.000 kişi milyonları nasıl temsil edebilir? Çorba örneğine dönün. Küçük bir tencere veya dev bir kazan olsun, iyi karıştırılmış bir kaşık size lezzet hakkında bilgi verir. Önemli olan ne kadar çorba tattığınız değil; çorbanın düzgün karıştırılıp karıştırılmamasıdır.
Türkiye'de büyük seçim anketleri genellikle 60 milyonun üzerindeki seçmenin davranışını tahmin etmek için yaklaşık 2.000 ila 3.000 kişiye anket yapar. Düzgün rastgele örnekleme ile yapıldığında, bu anketler genellikle 2 ila 3 yüzdelik puan hata payıyla doğrudur. Sır, anket yapılan kişi sayısı değil; onları seçmek için kullanılan yöntemdir.
Parametre ve İstatistik
Gelecek derslerde işine yarayacak hızlı bir kelime notu. Bir popülasyonu tanımlayan sayıya parametre denir. Bir örneklemi tanımlayan sayıya istatistik denir.
Örneğin, bir şehirdeki herkesin gerçek ortalama geliri bir parametredir (her kişiden veri gerekir). 500 sakin üzerinden hesaplanan ortalama gelir bir istatistiktir (örneklemden hesaplanmıştır). Parametreyi tahmin etmek için istatistiği kullanırız.
Popülasyon, incelemek istediğiniz tam gruptur. Örneklem, o grubun yönetilebilir bir alt kümesidir. Tüm popülasyonu incelemek genellikle çok pahalı, zaman alıcı veya imkânsız olduğu için örneklemler kullanırız. Bir örneklemin en önemli kalitesi, popülasyonu temsil etmesidir ve rastgele örnekleme bunu başarmanın en iyi yoludur. Örneklem büyüklüğü önemlidir, ama örneklemi nasıl seçtiğiniz daha da önemlidir. Küçük, iyi seçilmiş bir örneklem, her zaman büyük, yanlı bir örneklemi yener.