Ki-Kare Testi

Zorluk: Orta Okuma Süresi: 12 dakika

Verileriniz Sayı Değil, Kategori Olduğunda

Tüm veriler boy, kilo veya sınav notu gibi ölçümleri içermez. Bazen verileriniz kategoriler hakkındadır - evet veya hayır, marka tercihleri, seçilen renkler veya sipariş edilen yemek türleri gibi. İki kategorinin ilişkili olup olmadığını bilmek istiyorsanız farklı bir araca ihtiyacınız var. Bu araç ki-kare testidir (okunuşu: "ki-kare").

30 A 25 B 28 C 17 D

Temel Soru

Ki-kare testi basit bir soruyu yanıtlar: iki kategorik değişken ilişkili mi, yoksa birbirinden bağımsız mı?

Örneğin: kişinin yaş grubu tercih ettiği dizi platformunu etkiliyor mu? Kadın ve erkekler farklı bölüm tercihlerini farklı oranlarda mı yapıyor? Yaşanılan bölge ile oy kullanma tercihi arasında bir ilişki var mı?

Bu soruların tümünde, insanların farklı kategori kombinasyonlarına nasıl dağıldığı sayılır - ve sonra gördüğünüz desenin şansla oluşup oluşmadığına bakılır.

Gözlenen ve Beklenen Değerler

Ki-kare testi iki şeyi karşılaştırır:

  • Gözlenen sayılar: Verilerinizde gerçekte bulduğunuz değerler.
  • Beklenen sayılar: İki kategorinin kesinlikle hiçbir ilişkisi olmasaydı bulmayı beklediğiniz değerler.

Gözlenen sayılar beklenen sayılardan çok farklıysa, bu kategorilerin ilişkili olduğuna dair kanıttır. Birbirine yakınlarsa, kategoriler muhtemelen bağımsızdır.

Örnek

Bir telefon perakendecisi 400 müşteriye anket yapar ve cinsiyetlerini ve telefon markası tercihlerini kaydeder:

AppleSamsungDiğerToplam
Kadın1205525200
Erkek908030200
Toplam21013555400

Cinsiyet ve marka tercihi tamamen bağımsız olsaydı, her cinsiyetin markaları aynı oranlarda tercih etmesini beklerdiniz. Toplam 400 müşteriden 210'u Apple tercih ettiğinden (%52,5), kadınların yaklaşık %52,5'inin (105) ve erkeklerin %52,5'inin (105) Apple tercih etmesini beklerdiniz.

Ama gerçek sayılar 120 kadın ve 90 erkek. Bu, beklenen 105'ten belirgin ölçüde farklı. Ki-kare testi, bu tür farklılıkların anlamlı olacak kadar büyük mü yoksa şansla olabilecek kadar küçük mü olduğunu ölçer.

Nasıl Çalışır (Matematik Olmadan)

Ki-kare testi şu adımları izler:

  1. Gözlediğinizi sayın. Kaç kişi veya nesnenin her bir kategori kombinasyonuna düştüğünü hesaplayın.
  2. Beklenileni hesaplayın. İki kategori tamamen ilişkisiz olsaydı sayıların nasıl görüneceğini belirleyin.
  3. Gözleneni beklenenle karşılaştırın. Tablonuzdaki her hücre için gözlenen sayının beklenen sayıdan ne kadar uzak olduğunu ölçün.
  4. Farkları birleştirin. Tüm bu farkları (karesini alıp beklenen sayılara bölerek) toplayarak tek bir sayı - ki-kare istatistiği - elde edin.
  5. Bir p-değeri elde edin. Ki-kare istatistiğini kullanarak, saf şansla bu büyüklükte farklar görme olasılığının ne olduğunu belirleyin.

Büyük bir ki-kare istatistiği (ve küçük p-değeri), kategorilerin muhtemelen ilişkili olduğu anlamına gelir. Küçük bir ki-kare istatistiği, muhtemelen bağımsız oldukları anlamına gelir.

Diğer Yaygın Kullanım: Uyum İyiliği Testi

Ki-kare testinin ikinci bir türü vardır: uyum iyiliği testi. İki kategorinin ilişkili olup olmadığını sormak yerine, verilerinizin beklediğiniz belirli bir dağılımıyla eşleşip eşleşmediğini sorar.

30 Gzl A 25 Bkl A 15 Gzl B 25 Bkl B 35 Gzl C 25 Bkl C 20 Gzl D 25 Bkl D
Örnek

Bir lokum üreticisi kutularının beş çeşidi eşit oranda içerdiğini iddia ediyor: gül, fıstık, sade, portakal ve nane (%20'şer). Bir kutu alıp 100 lokum sayıyorsunuz:

  • Gül: 28, Fıstık: 15, Sade: 22, Portakal: 18, Nane: 17

Şirketin iddiası doğruysa, her çeşitten yaklaşık 20 beklerdiniz. Kutunuzda belirgin ölçüde daha fazla gül ve daha az fıstık var. Ki-kare uyum iyiliği testi, bu farklılıkların şirketin iddiasını sorgulamaya yetecek kadar büyük mü, yoksa normal rastgele değişkenlik kapsamında mı olduğunu kontrol eder.

Ki-Kare Testi Ne Zaman Kullanılır?

Ki-kare testi şu durumlarda doğru seçimdir:

  • Verileriniz kategorilerdeki sayımlar veya frekanslardan oluşuyor (boy veya not gibi ölçümlerden değil).
  • Her gözlem, değişken başına tam olarak bir kategoriye düşüyor.
  • Yeterince büyük bir örnekleminiz var - genel olarak, beklenen her hücre değeri en az 5 olmalı.
  • Gözlemler bağımsız - her kişi veya nesne yalnızca bir kez sayılıyor.

Sınırlılıklar

Ki-kare testi, kategoriler arasında bir ilişkinin var olup olmadığını söyler ama ne kadar güçlü olduğunu söylemez. Çok büyük bir örneklem, önemsiz derecede küçük bir ilişki için bile anlamlı bir sonuç üretebilir. İlişki gücünü ölçmek için istatistikçiler ki-kare testiyle birlikte Cramer V gibi ek ölçüler kullanırlar.

Ayrıca, tüm istatistiksel testlerde olduğu gibi, bir ilişki bulmak nedensellik kanıtlamaz. Kadın ve erkekler farklı telefon markalarını tercih ediyorsa, test size nedenini söylemez - pazarlama, çevresel etki, özellik tercihleri veya başka birçok faktör olabilir.

Önemli Nokta

Ki-kare testi, verileriniz sayılar değil kategoriler içerdiğinde kullanılır. Gerçekte gözlediğinizi, iki kategorinin ilişkisiz olması durumundaki beklentinizle karşılaştırır. Gözlenen ve beklenen sayılar arasındaki büyük bir fark (küçük bir p-değerine karşılık gelen), kategorilerin bağlantılı olduğunu gösterir. Anketlerde, pazar araştırmalarında ve sosyal bilimlerde - grup üyeliğinin insanların yaptığı tercihleri etkileyip etkilemediğini her sorduğunuzda - yaygın olarak kullanılır.