Varyansdan Standart Sapmaya
Önceki derste varyansı - değerlerin ne kadar yaygın olduğunu ölçen bir ölçüyü - öğrendik. Varyans güçlüdür ama pratik bir sorunu var: kare birimlerle ölçülür. Puan cinsinden ölçülen sınav notlarına bakıyorsanız, varyans "puan kare" olarak çıkar. Bunu yorumlamak zor.
Standart sapma bunu varyansın karekökünu alarak çözer. Bu, ölçüyü orijinal birimlere geri getirir - puan, TL, derece, kilogram veya başlanılan her ne ise.
Standart sapma = √varyans
Önceki dersteki maaş örneğimizden varyans 2.000.000 idi (kare TL cinsinden).
Standart sapma = √2.000.000 ≈ 1.414 TL
Şimdi söyleyebiliriz: ortalama olarak her çalışanın maaşı ortalamadan yaklaşık 1.414 TL farklıdır. Bu gerçekten anlayabileceğimiz ve kullanabileceğimiz bir sayı.
Standart Sapma Gerçekte Ne Anlama Gelir?
Standart sapmayı ortalamadan ortalama uzaklık olarak düşünün. Teknik olarak tam bir mesafe ortalaması değildir (matematik kare alma ve karekök alma içerir), ama bu sezgi çok yakın ve son derece faydalıdır.
Küçük standart sapma, veri noktalarının ortalamaya yakın kümelendiğini gösterir. Büyük standart sapma, uzağa yayıldığını gösterir.
İki kahveci, müşterilerin siparişlerini kaç dakikada aldığını 5 ziyaret boyunca takip ediyor:
Kahveci A: 3, 4, 4, 5, 4 → Ortalama = 4 dakika, Std Sapma ≈ 0,6 dakika
Kahveci B: 1, 2, 4, 6, 7 → Ortalama = 4 dakika, Std Sapma ≈ 2,3 dakika
Her iki kahvecinin ortalama bekleme süresi aynı ama Kahveci A çok daha tutarlı. Öngörülemeyen beklemelerden hoşlanmıyorsanız, Kahveci A sizin yeriniz.
Standart Sapmayı Adım Adım Hesaplamak
Tam bir hesaplama üzerinden gidelim ki nasıl çalıştığını tam olarak görün. Formülü ezberleme konusunda endişelenmeyin - fikri anlamak önemli olan.
Bir öğrencinin 6 haftalık quiz notları: 70, 80, 75, 85, 90, 80
Adım 1 - Ortalamayı bulun:
(70 + 80 + 75 + 85 + 90 + 80) / 6 = 480 / 6 = 80
Adım 2 - Her notun ortalamadan uzaklığını bulun:
- 70 − 80 = −10
- 80 − 80 = 0
- 75 − 80 = −5
- 85 − 80 = +5
- 90 − 80 = +10
- 80 − 80 = 0
Adım 3 - Her mesafenin karesini alın: 100, 0, 25, 25, 100, 0
Adım 4 - Kare mesafelerin ortalamasını bulun (varyans):
(100 + 0 + 25 + 25 + 100 + 0) / 6 = 250 / 6 ≈ 41,7
Adım 5 - Karekök alın: √41,7 ≈ 6,5
Standart sapma yaklaşık 6,5 puan. Bu, öğrencinin notlarının tipik olarak 80 ortalamasından yaklaşık 6-7 puan uzağa düştüğü anlamına gelir.
68-95-99,7 Kuralı
Veri çan şeklinde bir kalıp izlediğinde (ki pek çok gerçek dünya ölçümü izler - boylar, tansiyon, sınav puanları), verinin ortalama etrafında nasıl dağıldığı konusunda dikkat çekici derecede tutarlı bir kalıp vardır. Buna 68-95-99,7 kuralı, bazen ampirik kural denir.
- Yaklaşık %68 değer ortalamanın 1 standart sapması içinde kalır
- Yaklaşık %95 değer ortalamanın 2 standart sapması içinde kalır
- Yaklaşık %99,7 değer ortalamanın 3 standart sapması içinde kalır
Gerçek bir örnekle bunun nasıl göründüğüne bakalım.
Büyük bir sınıfta sınav notlarının ortalaması 75 ve standart sapması 10 olsun.
Öğrencilerin %68'i 65 ile 85 arasında puan aldı (75 ± 10)
Öğrencilerin %95'i 55 ile 95 arasında puan aldı (75 ± 20)
Öğrencilerin %99,7'si 45 ile 105 arasında puan aldı (75 ± 30)
Birisi 50 aldıysa, ortalamanın 2 standart sapmasından fazla altında - öğrencilerin sadece yaklaşık %2,5'i daha düşük aldı. Bu sınıfa göre çok düşük bir puan.
Bu kural inanılmaz güçlüdür çünkü karmaşık hesaplamalar yapmadan belirli bir değerin sıradan mı yoksa olağan dışı mı olduğunu hızlıca değerlendirmenizi sağlar.
Standart Sapmayı Gerçek Hayatta Yorumlamak
Sağlık: Tansiyon Okumaları
Doktorunuz normal sistolik tansiyonun yaklaşık 120 mmHg ortalamaya ve 15 standart sapmaya sahip olduğunu söylüyor. 68-95-99,7 kuralını kullanarak, çoğu insanın 105 ile 135 arasında olduğunu bilirsiniz. 160 okuması ortalamadan neredeyse 3 standart sapma yukarıda - bu olağan dışı ve araştırılmaya değer.
Üretim: Kalite Kontrol
Bir fabrika tam 10,0 cm uzunluğunda civatalar üretiyor. Üretim sürecinin standart sapması 0,02 cm. Bu, civatların %95'inin 9,96 cm ile 10,04 cm arasında olduğu anlamına gelir. 10,1 cm ölçen bir civata - hedeften 5 standart sapma uzakta - makinede bir şeyler ters gitti demektir.
Finans: Borsa Dalgalanması
Finans analistleri "dalgalanma"dan bahsettiklerinde, genellikle standart sapmadan bahsediyorlar. BIST 100'de günlük getirisi %1 standart sapmaya sahip bir hisse nispeten istikrarlı. %5 standart sapmaya sahip bir hisse ise yaşanması zor bir yolculuk. Bu, yatırımcıların yatırımlarını kaldırabilecekleri risk miktarıyla eşleştirmelerine yardımcı olur.
İki yatırım fonu son on yılda yıllık ortalama %12 getiri sağladı.
Fon A: Standart sapma %3 → Çoğu yıl getiriler %9 ile %15 arasındaydı.
Fon B: Standart sapma %15 → Bazı yıllar getiriler %27, bazılarında −%3'tü.
İstikrarlı gelire ihtiyaç duyan emekli bir kişi muhtemelen Fon A'yı tercih eder. Önünde onlarca yıl olan genç bir yatırımcı, ara sıra yüksek getiri şansı için Fon B'nin inişlerini ve çıkışlarını kabul edebilir.
Yaygın Yanlış Anlamalar
"Büyük standart sapma verinin kötü olduğu anlamına gelir"
Zorunlu değildir. Bazı şeyler doğal olarak çok değişir. İç Anadolu'da günlük sıcaklıklar büyük standart sapmaya sahiptir çünkü mevsimler arasında gerçekten büyük farklar vardır. Veri "kötü" değildir - gerçekliği doğru yansıtmaktadır.
"Standart sapma sadece çan şeklindeki veriler için çalışır"
68-95-99,7 kuralı özellikle çan şeklindeki (normal) dağılımlara uygulanır. Ama standart sapmanın kendisi herhangi bir veri seti için hesaplanabilir. Her zaman faydalı bir yayılım ölçüsüdür, ampirik kuraldan gelen tam yüzdeler mükemmel uygulanmasa bile.
"Formülü ezberlemeniz gerekiyor"
Pratikte hesap makineleri, elektronik tablolar ve yazılımlar standart sapmayı anında hesaplar. Önemli olan sayının ne anlama geldiğini ve nasıl kullanılacağını anlamaktır. Birisi standart sapmanın 5 olduğunu söylerse, çoğu değerin ortalamadan yaklaşık 5 birim içinde olduğunu bilmeniz gerekir - bu temel içgörüdür.
Bir Bakışta Standart Sapma
Ortalamaya göre farklı büyüklükteki standart sapmalar hakkında hızlı bir düşünme yolu:
- Küçük (ortalamaya göre): Veri sıkıca paketlenmiş. Yüksek tutarlılık. Hassas bir termometre veya güvenilir bir otobüs tarifesi düşünün.
- Orta: Normal miktarda değişkenlik. Çoğu gerçek dünya verisi buraya düşer.
- Büyük (ortalamaya göre): Veri geniş yayılmış. Yüksek değişkenlik. Girişim gelirleri veya 500 ile 15.000 arasında gidip gelen günlük adım sayılarını düşünün.
Standart sapma, değerlerin ortalamadan tipik olarak ne kadar uzakta olduğunu sade birimlerle söyler. Küçük standart sapma tutarlılık, büyüğü geniş değişkenlik anlamına gelir. 68-95-99,7 kuralı belirli bir değerin normal mi yoksa olağan dışı mı olduğunu hızlıca değerlendirmenin bir yolunu verir: değerlerin yaklaşık üçte ikisi ortalamanın bir standart sapması içinde, neredeyse tamamı üç standart sapma içinde kalır. Bu tek sayı, tüm istatistikteki en faydalı araçlardan biridir.