Korelasyon

Zorluk: Orta Okuma Süresi: 12 dakika

İki Şey Birlikte mi Hareket Ediyor?

Günlük hayatta sürekli desenler fark ederiz. Uzun insanlar daha ağır olma eğilimindedir. Daha çok çalışan öğrenciler daha iyi notlar alma eğilimindedir. Daha fazla polisi olan şehirlerde daha fazla suç olma eğilimindedir. (Bir dakika - bu son örnek polisin suça neden olduğu mu demek?)

2 4 6 8 10 2 4 6 8 10 12

Korelasyon, istatistikçilerin bu ilişkileri ölçtüğü ve tanımladığı yöntemdir. İki şeyin birlikte hareket edip etmediğini ve ne kadar güçlü olduğunu söyler. Ama üçüncü örnekte de ima edildiği gibi, neden olduğunu söylemez.

Korelasyon Nedir?

Korelasyon, iki değişken arasındaki doğrusal ilişkinin gücünü ve yönünü ölçer. Bir değişken yükseldiğinde, diğeri de yükselme eğiliminde mi? Düşer mi? Yoksa tutarlı bir desen yok mu?

En yaygın ölçü korelasyon katsayısıdır, genellikle r olarak yazılır. -1 ile +1 arasında tek bir sayıdır.

Korelasyon Katsayısını Okumak

  • r = +1: Mükemmel pozitif korelasyon. Bir değişken arttıkça, diğeri tamamen tahmin edilebilir bir miktarda artar. Her nokta tam bir yukarı doğru çizginin üzerindedir.
  • r = -1: Mükemmel negatif korelasyon. Biri yükselirken diğeri tamamen tahmin edilebilir şekilde düşer.
  • r = 0: Hiçbir doğrusal ilişki yok. Bir değişkeni bilmek diğeri hakkında hiçbir şey söylemez.

Pratikte neredeyse hiç tam +1, -1 veya 0 göremezsiniz. Gerçek veriler karışıktır. İşte kaba bir kılavuz:

2 4 6 8 10 5 10
  • 0,7 ile 1,0 (veya -0,7 ile -1,0): Güçlü ilişki
  • 0,4 ile 0,7 (veya -0,4 ile -0,7): Orta düzey ilişki
  • 0,1 ile 0,4 (veya -0,1 ile -0,4): Zayıf ilişki
  • 0,0 ile 0,1 (veya 0,0 ile -0,1): Esas olarak ilişki yok
Örnek

Boy ve kilo - Yetişkinler arasında boy ve kilonun pozitif korelasyonu yaklaşık r = 0,5 ile 0,7 arasındadır. Daha uzun insanlar daha ağır olma eğilimindedir ama bolca farklılık vardır. 1,68 m boyunda biri 1,83 m boyunda birinden daha ağır olabilir.

Korelasyon pozitiftir (ikisi birlikte yükselir) ve orta ila güçlü düzeydedir (desen fark edilir ama mükemmel değil).

Pozitif ve Negatif Korelasyon

Pozitif korelasyon, her iki değişkenin aynı yönde hareket ettiği anlamına gelir. Biri yükseldiğinde diğeri de yükselme eğilimindedir. Biri düştüğünde diğeri de düşme eğilimindedir.

  • Çalışma saatleri ve sınav notları (daha fazla çalışma, daha yüksek not)
  • Sıcaklık ve dondurma satışları (daha sıcak günler, daha fazla dondurma satışı)
  • Deneyim ve maaş (daha fazla çalışma yılı, daha yüksek maaş - genel olarak)

Negatif korelasyon, ters yönlerde hareket ettikleri anlamına gelir. Biri yükseldiğinde diğeri düşme eğilimindedir.

  • Egzersiz ve dinlenme kalp hızı (daha fazla egzersiz, daha düşük kalp hızı)
  • Fiyat ve talep (daha yüksek fiyat, daha az kişi satın alır)
  • Devamsızlık ve notlar (daha fazla kaçırılan ders, daha düşük not)

Korelasyon Nedensellik Anlamına Gelmez

Bu, istatistiğin en önemli kuralıdır ve korelasyonla sürekli karşımıza çıkar. İki şeyin korelasyonlu olması, birinin diğerine neden olduğu anlamına gelmez.

2 4 6 8 10 2 4 6 8 10
Örnek

Dondurma satışları ve boğulma olayları pozitif korelasyon gösterir. Dondurma satışları arttığında boğulma olayları da artar. Dondurma boğulmaya mı neden oluyor?

Tabii ki hayır. Her ikisi de üçüncü bir değişken tarafından tetiklenir: sıcak hava. Hava sıcak olduğunda insanlar hem daha fazla dondurma alır HEM DE daha fazla denize girer (bu da daha fazla boğulma olayına yol açar). Dondurma ve boğulma ilişkilidir ama biri diğerine neden olmaz.

Buna karıştırıcı değişken denir - ölçtüğünüz iki şeyi de etkileyen gizli bir faktör.

İki şeyin biri diğerine neden olmadan korelasyonlu olmasının birkaç nedeni vardır:

  • Üçüncü bir değişken her ikisine de neden olur. (Sıcak hava hem dondurma satışına hem de yüzmeye neden olur.)
  • Ters nedensellik. Belki A, B'ye neden olmuyordur - bunun yerine B, A'ya neden oluyordur. Daha fazla suçu olan şehirler daha fazla polis alabilir, tersi değil.
  • Saf tesadüf. Yeterli veriyle rastgele korelasyonlar bulursunuz. Nicolas Cage'in oynadığı film sayısı havuz boğulmalarıyla korelasyon gösteriyor - açıkça anlamsız.

Korelasyonun Kaçırdıkları

Korelasyon katsayısı yalnızca doğrusal (düz çizgi) ilişkileri ölçer. İki değişken arasındaki ilişki eğriyse, korelasyon katsayısı yanıltıcı olabilir.

Örneğin, stres ve performans arasında eğrisel bir ilişki vardır: biraz stres performansı artırır ama aşırı stres zarar verir. Korelasyon katsayısı r = 0 gösterip ilişki yokmuş gibi görünebilir, oysa açıkça bir ilişki vardır - sadece düz bir çizgi değildir.

Bu yüzden tek bir sayıya güvenmeden önce her zaman verilerinizi grafikleştirmek iyi bir fikirdir.

Günlük Hayatta Korelasyon

Korelasyonlarla sürekli karşılaşırsınız, çoğu zaman farkında olmadan:

  • Doktorunuz kolesterol düzeyinizin kalp hastalığı riski ile korele olduğunu belirtebilir.
  • Bir işletme, müşteri memnuniyeti puanlarının tekrar satın almalarla korele olduğunu bulabilir.
  • Bir okul, devamın mezuniyet oranlarıyla korele olduğunu keşfedebilir.

Her durumda korelasyon faydalı bir bilgidir - ama bir şeyin diğerine neden olduğu sonucuna varmadan önce daha fazla araştırma yapmanız gerekir.

Önemli Nokta

Korelasyon, iki şeyin birlikte mi (pozitif korelasyon) yoksa ters yönlerde mi (negatif korelasyon) hareket etme eğiliminde olduğunu -1'den +1'e bir ölçekte ölçer. Desenleri tespit etmek için güçlü bir araçtır, ama kritik bir sınırlaması vardır: korelasyon nedensellik kanıtlamaz. İki şey gizli bir üçüncü faktör, ters nedensellik veya saf tesadüf yüzünden korelasyonlu olabilir. Neyin neye neden olduğu konusunda sonuca atlamadan önce her zaman "neden" diye sorun.