Aralık ve Varyans

Zorluk: Başlangıç Okuma Süresi: 10 dakika

Ortalama Tek Başına Yetmez

İki şehrin ortalama günlük sıcaklığının 20 derece olduğunu düşünün. Benzer havaya sahipmiş gibi görünüyor, değil mi? Ama ya Antalya yıl boyunca 18 ile 22 derece arasında kalıyorsa, Erzurum ise kışın eksi 15, yazın 35 dereceye ulaşıyorsa? Ortalama aynı, ama orada yaşama deneyimi tamamen farklı.

10 12 14 16 18 20 15.0

Bu yüzden yayılımı - bir veri setindeki değerlerin birbirinden ne kadar farklı olduğunu - ölçmemiz gerekiyor. Yayılımı ölçmek için en önemli iki araç aralık ve varyanstır.

Aralık: En Basit Yayılım Ölçüsü

Aralık, anlaması en kolay yayılım ölçüsüdür. En büyük değeri alın, en küçük değeri çıkarın, aralığınız budur.

Aralık = En yüksek değer − En düşük değer

Örnek

Süper Lig'de bir futbolcu 5 maçta şu golleri atıyor: 0, 1, 2, 3, 1

En yüksek: 3. En düşük: 0.

Aralık = 3 − 0 = 3 gol

Bu bize oyuncunun gol performansının en kötü ile en iyi maçı arasında 3 gol değiştiğini söyler.

Aralık hızlı bir bakış sağlar, ama büyük bir sınırlaması vardır: sadece iki en aşırı değere bakar ve aradaki her şeyi görmezden gelir.

Örnek

İki öğrencinin 5 sınav notu:

Öğrenci A: 60, 80, 82, 83, 100 → Aralık = 40

Öğrenci B: 60, 61, 62, 63, 100 → Aralık = 40

İkisinin de aralığı 40 ama Öğrenci A'nın notları ortada kümelenmiş, Öğrenci B'ninki ise düşük uçta toplanmış ve tek bir yüksek aykırı değeri var. Aralık bunu size söyleyemez.

Aralık Ne Zaman Faydalıdır?

Sınırlamalarına rağmen aralık hızlı kontroller için kullanışlıdır. Bir doktor hastanın bir haftalık tansiyonunu kontrol ederken önce aralığı not edebilir: "Sistolik tansiyonunuz 118 ile 142 arasında değişmiş." Bu hem doktor hem de hasta için hemen faydalı bir bilgidir.

Varyansa Giriş: Daha Akıllı Bir Yayılım Ölçüsü

Varyans, verinizdeki her değere bakar ve sorar: her biri ortalamadan ne kadar uzak? Sonra tüm bu mesafeleri tek bir sayıda birleştirir. Düşük varyans, değerlerin ortalamaya yakın kümelendiğini anlamına gelir. Yüksek varyans, birbirinden uzak yayıldığını gösterir.

Varyansı Adım Adım Hesaplamak

Basit bir örnekle inceleyelim ki fikir netleşsin.

Örnek

Küçük bir dükkândaki 4 çalışanın aylık maaşları: 10.000 TL, 12.000 TL, 14.000 TL, 12.000 TL

Adım 1 - Ortalamayı bulun:
(10.000 + 12.000 + 14.000 + 12.000) / 4 = 12.000 TL

Adım 2 - Her değerin ortalamadan uzaklığını bulun:

  • 10.000 − 12.000 = −2.000
  • 12.000 − 12.000 = 0
  • 14.000 − 12.000 = +2.000
  • 12.000 − 12.000 = 0

Adım 3 - Her mesafenin karesini alın (negatif işaretleri kaldırmak ve büyük farkları vurgulamak için):

  • (−2.000)² = 4.000.000
  • (0)² = 0
  • (2.000)² = 4.000.000
  • (0)² = 0

Adım 4 - Kare mesafelerin ortalamasını bulun:
(4.000.000 + 0 + 4.000.000 + 0) / 4 = 2.000.000

Varyans 2.000.000'dir ("kare TL" cinsinden, biraz tuhaf - bunu sonraki standart sapma dersinde ele alacağız).

Mesafelerin Karesini Neden Alıyoruz?

Bu, pek çok yeni başlayanın sorduğu ve harika bir sorudur. Ham mesafeleri kare almadan toplasanız, pozitifler ve negatifler birbirini götürür ve her seferinde sıfır elde edersiniz. Kare almak tüm değerleri pozitif yapar ve ortalamadan uzak olan değerlere ekstra ağırlık verir.

Popülasyon Varyansı ve Örneklem Varyansı

Varyans için biraz farklı iki formül görebilirsiniz. Fark küçük ama bilmeye değer.

Veriniz ilgilendiğiniz grubun tamamını içeriyorsa (örneğin, bir sınıftaki her öğrenci), toplam sayıya bölersiniz. Buna popülasyon varyansı denir.

Veriniz bir örneklem ise - daha büyük bir grubu temsil etmek için seçilmiş daha küçük bir grup (örneğin binlercesi arasında anket yapılan 100 müşteri) - sayının bir eksiğine bölersiniz. Buna örneklem varyansı denir ve bu küçük ayarlama tahmini daha doğru yapar.

Örnek

5 kişiye günde kaç bardak çay içtiğini soruyorsunuz: 2, 3, 4, 3, 3. Ortalama 3.

Ortalamadan kare mesafeler: 1, 0, 1, 0, 0

Popülasyon varyansı (bu 5 kişi tüm ilgilenilmiş olunan kişiler ise): (1+0+1+0+0) / 5 = 0,4

Örneklem varyansı (bu 5 kişi daha büyük bir grubu temsil ediyorsa): (1+0+1+0+0) / 4 = 0,5

Fark burada küçüktür ve örneklem büyüklüğü arttıkça daha da küçülür.

Yayılım Gerçek Hayatta Neden Önemli?

Hava Durumu ve Seyahat Planlama

Bir tatile gidiyorsunuz ve hedefteki ortalama sıcaklık 22 derece. Sadece yaz kıyafetleri hazırlayabilirsiniz. Ama varyans yüksekse, sıcaklıklar gece 10 dereceye, gündüz 34 dereceye gidip gelebilir. Katmanlı giysiler istersiniz. Ortalama tek başına sizi hazırlamaz.

Maaş Müzakereleri

Bir iş ilanı pozisyon için ortalama maaşın 25.000 TL olduğunu söylüyor. Ama yayılım ne? Aralık 22.000 TL ile 28.000 TL arasındaysa, maaşlar sıkı paketlenmiş ve kabaca ne bekleyeceğinizi biliyorsunuz. Aralık 15.000 TL ile 60.000 TL arasındaysa, gerçek maaş deneyim, konum ve müzakereye bağlı. Yayılım, konuşmayı nasıl yapacağınızı değiştirir.

Sporda Tutarlılık

Süper Lig'de iki futbolcu sezon boyunca maç başına ortalama 1 gol atıyor. Oyuncu A çoğu maçta 0 veya 1 gol atıyor - çok tutarlı. Oyuncu B birçok maçta 0 gol atıyor ama ara sıra 3 veya 4 gol atıyor - yüksek varyans. Aralarında karar veren teknik direktör, güvenilirlik için Oyuncu A'yı veya büyük performansın fark yaratabildiği yüksek riskli bir maç için Oyuncu B'yi tercih edebilir.

Aralık ve Varyans Karşılaştırması

Aralık hızlı ve kolay ama sadece iki veri noktasını dikkate alır. Varyans her veri noktasını kullanır ve yayılımın daha kapsamlı bir resmini verir. Aralığı sabah ve akşam termometreye bir kez bakmak, varyansı ise her saat kontrol edip sıcaklığın gün boyunca ne kadar dalgalandığını hesaplamak olarak düşünün.

Önemli Nokta

Aralık, en yüksek ve en düşük değerler arasındaki farkı söyler - hızlı ve basit ama detayları kaçırır. Varyans, tüm değerlerin ortalama etrafında ne kadar yayıldığını söyler - her veri noktasını kullanır ve çok daha zengin bir resim verir. Ortalama ile birlikte bu ölçüler, sadece tipik olanın ne olduğunu değil, şeylerin ne kadar değiştiğini de anlamanıza yardımcı olur. Ve gerçek hayatta, değişim çoğu zaman ortalamadan daha önemlidir.