Merkezi Limit Teoremi

Zorluk: Orta Okuma Süresi: 15 dakika

Ortalamalardaki Şaşırtıcı Desen

Küçük bir simit fırını işleten birini düşünün. Her gün farklı sayıda simit satılıyor - bir gün 200, bazı günler 600, bazı günler 350. Günlük satışlar hiçbir düzene uymuyor. Tamamen dağınık görünüyor.

0 9 18 27 36 42 46 47 48 49 50 51 52 53 54

Ama işte şaşırtıcı olan kısım: her haftanın ortalama satışını yazıp hafta hafta takip ettiğinde, bu haftalık ortalamalar tanıdık bir çan eğrisi şeklinde kümeleniyor. Günlük sayılar karışık ve tahmin edilemez olsa da ortalamalar düzenli hale geliyor.

Bu, Merkezi Limit Teoremi'nin uygulamada görünmesidir - istatistiğin en önemli fikirlerinden biri.

Merkezi Limit Teoremi Ne Der?

Merkezi Limit Teoremi (MLT), bize şunu söyler: herhangi bir topluluktan çok sayıda rastgele örneklem alıp her birinin ortalamasını hesapladığınızda, bu ortalamalar bir çan eğrisi (normal dağılım) oluşturur - orijinal verinin şekli ne olursa olsun.

Orijinal veriler çarpık, düz, dalgalı veya tamamen asimetrik olabilir. Örneklemleriniz yeterince büyük olduğu sürece, ortalamalar o pürüzsüz, simetrik çan şeklini alacaktır.

Bu, bir tür matematiksel dengeleme işlemidir. Herhangi bir örneklemde, olağandışı yüksek değerler ve olağandışı düşük değerler birbirini götürme eğilimindedir. Her örneklemdeki veri noktası sayısı arttıkça bu dengeleme daha fazla gerçekleşir ve ortalama gerçek merkeze yaklaşır.

Zar Deneyi

Bunu somut hale getirelim. Evde deneyebileceğiniz bir örnek ile başlayalım.

44 46 48 50 52 54 56
Örnek

Tek bir zarı 100 kez atın ve her sonucu yazın. 1, 2, 3, 4, 5 ve 6 sayılarının kabaca eşit oranlarda çıktığını göreceksiniz. Dağılım düzdür - kesinlikle bir çan eğrisi değil.

Şimdi iki zarı 100 kez atıp her çiftin ortalamasını yazın. Sonuçların 3,5 civarında yoğunlaştığını ve 1 ile 6'ya yakın değerlerin azaldığını göreceksiniz. Hafif bir tepe şekli beliriyor.

Beş zarı 100 kez atıp her grubun ortalamasını alın. Şimdi sonuçlar 3,5 etrafında çok daha sıkıca kümeleniyor ve belirgin bir çan eğrisi oluşturuyor. Aşırı uçlar (hepsi bir veya hepsi altı) çok nadir hale geliyor.

Düz bir dağılımdan (tek zar) başladınız, ama ortalamalar bir çan eğrisi oluşturdu. İşte bu Merkezi Limit Teoremi'dir.

Bu Neden Önemli?

MLT, istatistiğin büyük bölümünün neden işlevsel olduğunu açıklar. Günlük hayat için neden önemli olduğuna bakalım:

  • Anketler ve kamuoyu yoklamaları - Bir araştırma şirketi seçim öncesi 1.000 kişiyle anket yaptığında, milyonlarca seçmenden bir örneklem alıyor. MLT, örneklemlerindeki ortalama görüşün gerçek ortalamaya yakın olacağını ve bu yakınlığın hesaplanabileceğini söyler.
  • Kalite kontrolu - Bir fabrika her bir ampulü test edemez. Partiler halinde test yapar. MLT, bir partideki ortalama ömrün tüm ampuller için güvenilir bir tahmin olduğunu garanti eder.
  • Tıbbi araştırma - Doktorlar yeni bir tedaviyi 200 hasta üzerinde test ettiğinde, çalışmanın ortalama sonucunun herkes için geçerli olacağını MLT sayesinde bilirler.

Örneklem Ne Kadar Büyük Olmalı?

Yaygın bir soru: MLT'nin devreye girmesi için her örneklemde kaç veri noktası gerekir?

40 1 25 2 15 3 10 4 6 5 4 6

Standart kural 30 veya daha fazladır. 30 ve üzerindeki örneklemlerde, orijinal dağılım ne olursa olsun ortalamalar genellikle bir çan eğrisi oluşturur.

Ancak, orijinal verileriniz zaten çan eğrisine yakınsa, 10-15 örneklem bile işe yarayabilir. Eğer verileriniz aşırı çarpıksa (örneğin gelir verileri gibi, birkaç milyarderin ortalamayı yukarı çektiği durumlar), 50 veya daha fazla örnekleme ihtiyaç duyabilirsiniz.

Gerçek Hayattan Bir Örnek: Çay Tüketimi

Örnek

Türkiye'de yetişkinlerin günlük ortalama çay tüketimini öğrenmek istediğinizi düşünün. Herkesi ölçemezsiniz, bu yüzden rastgele örneklemler alırsınız.

50 farklı yere gidiyorsunuz - bir çay bahçesine, bir iş merkezine, bir otobüs durağına - ve her yerde 40 rastgele kişiye günlük çay tüketimini soruyorsunuz. Sonra her 40 kişilik grubun ortalamasını hesaplıyorsunuz.

Bireysel tüketim çok farklılık gösterse de (günlük 1 bardaktan 15 bardağa kadar), 50 örneklem ortalaması gerçek şehir ortalamasının etrafında sıkıca kümelenir ve bir çan eğrisi oluşturur. Örneklem ortalamalarınızın çoğu gerçek cevaba çok yakın olacaktır. Birkaçı biraz yüksek veya düşük olabilir, ama hiçbiri tamamen yanlış olmayacaktır.

Üç Temel Özellik

MLT, örneklem ortalamaları dağılımı hakkında üç belirli şey söyler:

  1. Merkez: Tüm örneklem ortalamalarının ortalaması, gerçek popülasyon ortalamasına eşittir. Çan eğrisi doğru yerde merkezlenir.
  2. Yayılım: Ortalamaların çan eğrisi, orijinal veriden daha dardır. Daha büyük örneklemler daha da dar eğriler üretir; bu da daha kesin tahminler anlamına gelir.
  3. Şekil: Orijinal verinin şekli ne olursa olsun, örneklem büyüklüğü arttıkça ortalamaların dağılımı bir çan eğrisine yaklaşır.

Yaygın Bir Yanlış Anlama

Birçok kişi MLT'nin "yeterince veri toplarsanız, verileriniz çan eğrisi gibi görünür" dediğini düşünür. Oysa teorem bunu söylemez.

Orijinal veriler herhangi bir şekle sahip olabilir. MLT, verinin kendisiyle değil, tekrarlanan örneklemlerin ortalamalarıyla ilgilidir. Hane halkı gelirleri sağa çarpıksa (birkaç çok zengin kişi kuyruğu uzatır), daha fazla gelir verisi toplamak bu çarpıklığı değiştirmez. Ama birçok örneklem alıp her birinin ortalama gelirini hesaplarsanız, bu ortalamalar bir çan eğrisi oluşturacaktır.

Neden "Teorem" Deniyor?

Matematikte teorem, sadece gözlemlenmiş değil, mantıkla kesin olarak kanıtlanmış bir şeydir. Merkezi Limit Teoremi sadece işe yarıyor gibi görünen bir desen değil. Matematikçiler, çok geniş koşullar altında bunun işlemesi gerektiğini kanıtlamıştır. Bu, istatistikçilere bunun üzerine birçok araç inşa etme güvenini veren şeydir.

Önemli Nokta

Merkezi Limit Teoremi, tekrarlanan rastgele örneklemler alıp ortalamalarını hesapladığınızda bu ortalamaların bir çan eğrisi oluşturduğunu söyler - orijinal veriler ne şekilde olursa olsun. İstatistikçilerin örneklemlerden güvenilir tahminler yapabilmesinin nedeni budur. Anketleri, deneyleri ve kalite testlerini güvenilir kılan temel ilkedir.