t-Testi Temelleri

Zorluk: Orta Okuma Süresi: 15 dakika

İki Grubu Karşılaştırmak

Günlük hayattaki en yaygın soruların bazıları iki şeyi karşılaştırmayı içerir. Bu öğretim yöntemi ötekinden daha mı iyi? Kadın ve erkek çalışanlar bu şirkette farklı maaş mı alıyor? Uygulamamızın yeni sürümü kullanıcıları eskisinden daha uzun mu meşgul ediyor?

Fark 2.1 5.2 8.3 0

t-testi, bu tür soruları yanıtlamak için en basit ve en yaygın kullanılan araçlardan biridir. İki grup arasındaki farkın gerçek mi olduğunu - yoksa sadece bir tesadüf mü olabildiğini - belirlemenize yardımcı olur.

Temel Fikir

Bir okuldaki iki sınıfın farklı öğretim yöntemleri kullandığını varsayın. Yıl sonunda A Sınıfının ortalama sınav notu 78, B Sınıfının ise 82. Bu 4 puanlık fark anlamlı mı?

Belki. Ama belki de değil. Her iki sınıfta da notlar çok dağınıksa - bazı öğrenciler 50, bazıları 100 alıyorsa - 4 puanlık fark şansla kolayca oluşabilir. Ama her iki sınıftaki notlar daha sıkıca kümelenmişse (çoğu 75 ile 85 arasında), 4 puanlık farkı görmezden gelmek daha zordur.

t-testi, farkın gerçek olup olmadığını belirlemek için hem gruplar arasındaki farkın büyüklüğünü hem de her grup içindeki değişkenlik miktarını dikkate alır.

t-Testi Ne Zaman Kullanılır?

t-testi şu durumlarda uygundur:

  • Ortalamaları karşılaştırıyorsunuz (sayıları veya kategorileri değil).
  • Verileriniz sayısaldır - sınav notları, ağırlıklar, süreler veya fiyatlar gibi şeyler.
  • Makul ölçüde küçük bir örnekleminiz var (t-testi binlerce veri noktanız olmadığı durumlar için tasarlanmıştır).
  • Her gruptaki veriler kabaca çan eğrisi şeklinde veya grup başına en az 30 gözleminiz var.

Tek Örneklem t-Testi

Bazen bir grubu başka bir grupla değil, bilinen bir standartla karşılaştırmak istersiniz. Bu tek örneklem t-testidir.

Örnek

Bir kahve zinciri büyük bardaklarının 300 ml içerdiğini iddia ediyor. Bir müşteri az geldiğinden şüpheleniyor. Farklı günlerde 25 büyük kahve alıp her birini ölçüyor. Ortalama 285 ml çıkıyor.

Tek örneklem t-testi, örneklem ortalamasını (285 ml) iddia edilen değerle (300 ml) karşılaştırır. 25 bardaktaki değişkenlik göz önüne alındığında, 285 ile 300 arasındaki farkın dükkanın gerçekten az koyduğu sonucuna varmaya yetip yetmeyeceğini sorar. Yoksa fark sadece normal dalgalanma olabilir mi?

İki Örneklem t-Testi

Daha sıklıkla, iki farklı grubu karşılaştırmak istersiniz. Bu iki örneklem t-testidir (bağımsız örneklem t-testi olarak da adlandırılır).

-3 -2 -1 0 1 2 3
Örnek

Bir il millî eğitim müdürlüğü yeni bir öğretim yönteminin matematik notlarını iyileştirip iyileştirmediğini bilmek istiyor. Rastgele 30 öğrenciyi yeni yönteme (Grup A) ve 30 öğrenciyi geleneksel yönteme (Grup B) atıyorlar.

Bir dönem sonra:

  • Grup A ortalaması: 84 puan
  • Grup B ortalaması: 79 puan

İki örneklem t-testi, 5 puanlık farka bakar ve sorar: her gruptaki not dağılımı göz önüne alındığında, bu fark gerçek olacak kadar büyük mü, yoksa her iki yöntem eşit derecede etkili olsa bile rastgele şans eseri oluşabilir mi?

t-testi küçük bir p-değeri üretirse (örneğin 0,02), şansla bu büyüklükte bir fark görmenin sadece %2 olasılığı var demektir. Bu, yeni yöntemin gerçekten daha iyi çalıştığına dair güçlü bir kanıttır.

Eşleştirilmiş t-Testi

Üçüncü bir varyasyon vardır: eşleştirilmiş t-testi. Bu, aynı kişiler veya nesneler iki kez ölçüldüğünde kullanılır - bir şeyden önce ve sonra.

Eşleştirilmiş durum örnekleri:

  • Hastaların ilaç almadan önce ve sonraki tansiyonlarını ölçmek.
  • Öğrencileri bir özel ders programının başında ve sonunda test etmek.
  • Aynı çalışanların iş yeri değişikliğinden önce ve sonraki verimliliğini karşılaştırmak.

Eşleştirilmiş t-testi, bu durumlarda iki örneklem versiyonundan daha güçlüdür çünkü bireysel farklılıkları kontrol eder. Her kişi kendi kendisiyle karşılaştırılır.

t-Testi Nasıl Çalışır (Matematik Olmadan)

t-testi, t-istatistiği adında bir sayı hesaplar. Bunu bir sinyal-gürültü oranı olarak düşünün:

  • Sinyal: Grup ortalamaları arasındaki fark. Daha büyük fark daha fazla sinyal demektir.
  • Gürültü: Her grup içindeki değişkenlik, örneklem boyutuna göre ayarlanmış. Daha fazla değişkenlik veya daha küçük örneklemler daha fazla gürültü demektir.

Büyük bir t-istatistiği (gürültüye göre çok sinyal), farkın muhtemelen gerçek olduğu anlamına gelir. Küçük bir t-istatistiği, farkın kolayca gürültü olabileceği anlamına gelir.

t-istatistiği bir p-değerine dönüştürülür. Bu size gruplar arasında gerçekten hiç fark olmasaydı bu sonucun ne kadar şaşırtıcı olacağını söyler.

Örneklem Boyutu Önemlidir

t-testi özellikle küçük örneklemler için tasarlanmıştır ("t" harfi, Guinness birasında çalışırken "Student" takma adıyla yayınlayan William Sealy Gosset'ten gelir). Büyük örneklemlerle - yüzlerce veya binlerce gözlemle - küçük ve önemsiz farklar bile "istatistiksel olarak anlamlı" hale gelebilir. Her zaman sadece testin anlamlı deyip demediğine değil, farkın büyüklüğüne de bakın.

Akılda Tutulması Gereken Varsayımlar

t-testi verileriniz hakkında bazı varsayımlar yapar:

  • Bağımsızlık: Her gözlem diğerini etkilememelidir. Aynı kişiyi iki kez ölçmek (eşleştirilmiş versiyon kullanmadan) bunu ihlal eder.
  • Yaklaşık normal dağılım: Her gruptaki veriler yaklaşık olarak çan eğrisi şeklinde olmalıdır. Grup başına 30 ve üzerinde gözlemle, Merkezi Limit Teoremi sayesinde bu daha az kritik hale gelir.
  • Benzer değişkenlik: İki grubun yaklaşık benzer yayılımları olmalıdır. Eşit olmayan değişkenliği ele alan değiştirilmiş bir versiyon (Welch t-testi) vardır.
Önemli Nokta

t-testi, iki grup arasındaki (veya bir grubun bir standartla) ortalamalarını karşılaştırmak için anlaşılır bir araçtır. Gruplar arasındaki farkı, gruplar içindeki doğal değişkenliğe karşı tartar. Bilinen bir değerle karşılaştırmak için tek örneklem, iki bağımsız grubu karşılaştırmak için iki örneklem ve aynı denekler iki kez ölçüldüğünde eşleştirilmiş versiyonu kullanın. İstatistiksel anlamlılığı her zaman pratik anlamlılıkla birlikte değerlendirin - "gerçek" bir fark her zaman anlamlı bir fark değildir.