Frekans Tabloları ve Çapraz Tablolama

Zorluk: Başlangıç Okuma Süresi: 10 dakika

Ham Veriden Düzenli Sayımlara

Veri topladığınızda, genellikle düzensiz bir liste olarak başlar. 200 müşteriye tercih ettikleri ödeme yöntemini sorduğunuzu ve uzun bir yanıt sütunu aldığınızı düşünün: kredi kartı, nakit, mobil ödeme, kredi kartı, kredi kartı, nakit vb. Bir frekans tablosu bu kaosu, her değerin kaç kez göründüğünü sayarak temiz bir özete dönüştürür.

Temel bir frekans tablosunun iki sütunu vardır: kategori ve sayım (frekans olarak da adlandırılır). Ödeme örneği için şöyle bir sonuç elde edebilirsiniz: kredi kartı: 95, nakit: 52, mobil ödeme: 38, banka kartı: 15. Artık hangi ödeme yönteminin baskın olduğunu ve hangisinin nadir olduğunu anında görebilirsiniz. Bu basit sayım işlemi, betimleyici istatistiğin temelidir.

95 Kredi Kartı 52 Nakit 38 Mobil Ödeme 15 Banka Kartı

Göreli ve Kümülatif Frekans

Ham sayımlar yararlıdır, ancak farklı büyüklükteki veri setleri arasında karşılaştırma yapmak zor olabilir. Bir mağaza 200, diğeri 1.000 kişiye anket yaptıysa, ham sayımları karşılaştırmak yanıltıcıdır. Göreli frekans, her sayımı toplamın bir oranı veya yüzdesi olarak ifade ederek bu sorunu çözer. 200'den 95 kredi kartı, %47,5'lik bir göreli frekanstır.

Kümülatif frekans bir adım daha ileri gider. Kategoriler arasında ilerledikçe kümülatif bir toplam gösterir. Sınav puan aralıkları gibi sıralı veriler için kümülatif frekans, "öğrencilerin yüzde kaçı 70 veya altında puan aldı?" gibi soruları yanıtlar. O noktaya kadar tüm kategorilerin frekanslarını toplarsınız. Bu, gruplandırılmış verilerden medyan veya yüzdelik bulmanız gerektiğinde özellikle yararlıdır.

Bu üç veri görünümü birlikte (ham frekans, göreli frekans ve kümülatif frekans) eksiksiz bir resim sunar. Ham sayımlar gerçek rakamları gösterir, göreli frekanslar veri setleri arasında karşılaştırma yapmanıza olanak tanır ve kümülatif frekanslar değerlerin dağılımını anlamanıza yardımcı olur.

Sayısal Veriler İçin Frekans Tabloları

Verileriniz sayısal ve sürekli olduğunda -- yaşlar, gelirler veya test puanları gibi -- her benzersiz değeri listeleyemezsiniz çünkü yüzlercesi olabilir. Bunun yerine değerleri aralıklar (sınıflar veya çubuklar) halinde gruplandırırsınız. Örneğin, yaşlar 18-25, 26-35, 36-45 vb. olarak gruplandırılabilir.

0 2 4 6 7 20-30 31-40 41-50 51-60 61-70 71-80

Doğru sayıda aralık seçmek önemlidir. Çok az aralık ve ayrıntıyı kaybedersiniz. Çok fazla aralık ve tablo ham veri kadar kaotik olur. Genel kural, çoğu veri seti için 5 ile 15 arasında aralık kullanmaktır. Yukarıdaki histogram, yaş verilerinin altı aralığa gruplandırıldığında nasıl göründüğünü gösterir ve dağılım şeklini bir bakışta netleştirir.

Örnek

Bir öğretmen 30 öğrencinin sınav puanlarını kaydeder: 45 ile 98 arasında. Her biri 10 puanlık aralıklarla (40-49, 50-59, 60-69, 70-79, 80-89, 90-99) bir frekans tablosu oluşturur. Bu, çoğu öğrencinin 70 ile 89 arasında puan aldığını ve yalnızca iki öğrencinin 50'nin altında olduğunu ortaya koyar. Frekans tablosu, 30 ham sayı listesinde görülmesi zor olacak sınıfın nerede kümelendiğini ve aykırı değerlerin nerede olduğunu anında vurgular.

Çapraz Tablolama: İki Değişken Aynı Anda

Bir frekans tablosu tek bir değişkeni ele alır. Peki ya iki kategorik değişken arasındaki ilişkiyi keşfetmek istiyorsanız? İşte burada çapraz tablolama (olasılık tablosu veya iki yönlü tablo olarak da adlandırılır) devreye girer. Bir değişkenin satırları, diğerinin sütunları tanımladığı bir ızgara oluşturur ve her hücrede sayımlar bulunur.

Örneğin, çalışanlara iş memnuniyeti (memnun, kararsız, memnuniyetsiz) hakkında anket yaptığınızı ve bölümlerini (satış, mühendislik, destek) de kaydettiğinizi varsayalım. Bir çapraz tablo, her bölümdeki kaç çalışanın her memnuniyet kategorisine düştüğünü gösterir. Artık mühendisliğin satıştan daha fazla memnuniyetsiz çalışana sahip olup olmadığını veya desteğin özellikle mutlu olup olmadığını bir bakışta görebilirsiniz.

35 Satış - Memnun 15 Satış - Kararsız 10 Satış - Memnuniyetsiz 20 Müh. - Memnun 25 Müh. - Kararsız 18 Müh. - Memnuniyetsiz 28 Destek - Memnun 12 Destek - Kararsız 7 Destek - Memnuniyetsiz

Çapraz tablolar, ki-kare testi dahil birçok istatistiksel testin başlangıç noktasıdır. Herhangi bir resmi analiz çalıştırmadan önce iki değişkenin ilişkili görünüp görünmediğini görsel olarak incelemenize olanak tanırlar. Araştırma okurken, karşılaştırmaları kolaylaştırmak için satır yüzdeleri veya sütun yüzdeleri ile sunulan çapraz tablolama tablolarını sıklıkla göreceksiniz.

Tabloları Profesyonel Gibi Okuma

Frekans tabloları ve çapraz tablolar her yerde karşımıza çıkar: haber makalelerinde, tıbbi raporlarda, iş panolarında ve akademik makalelerde. Bunları iyi okumak için pratik ipuçları şunlardır. Birincisi, her zaman toplamları kontrol edin. Bir tablo yüzdeleri gösterip altta yatan sayımları göstermiyorsa, örneklem büyüklüğü yüzdelerin anlamlı olması için çok küçük olabilir ("%50 A seçeneğini tercih etti" yalnızca 4 kişiye anket yapıldığını öğrenene kadar etkileyici görünür).

İkincisi, kategorilerin nasıl tanımlandığına dikkat edin. Eşit olmayan genişlikteki aralıklar bir frekans tablosundaki veri izleniminizi çarpıtabilir. "0-10" etiketli bir aralık ve "11-50" etiketli bir diğer aralık, altta yatan oran aynı olsa bile doğal olarak daha geniş aralıkta daha fazla sayıma sahip olacaktır.

Üçüncüsü, çapraz tablolarda sorunuz için satır yüzdelerinin mi yoksa sütun yüzdelerinin mi daha uygun olduğuna karar verin. Her bölümün hangi oranının memnun olduğunu bilmek istiyorsanız, satır yüzdelerini kullanın. Memnun çalışanların hangi oranının her bölümden geldiğini bilmek istiyorsanız, sütun yüzdelerini kullanın. Yanlış yönü seçmek yanlış sonuçlara yol açabilir.

Temel Çıkarım

Frekans tabloları, her değerin veya kategorinin ne sıklıkla göründüğünü sayarak ham verileri düzenli özetlere dönüştürür. Göreli frekans, kolay karşılaştırma için sayımları oranlar olarak ifade eder ve kümülatif frekans kümülatif toplamları takip eder. Çapraz tablolama bunu aynı anda iki değişkene genişleterek kategorilerin nasıl ilişkili olduğuna dair örüntüleri ortaya çıkarır. Bu basit araçlar, neredeyse her veri analizinin ilk adımı ve günlük hayatta istatistik okumak için en pratik becerilerden biridir.