Ölçüm Düzeyleri Neden Önemli?
Önceki derste verilerin nitel (kategorik) veya nicel (sayısal) olabildiğini öğrendik. Ama daha derin bir katman var. Tüm kategoriler eşit değildir ve tüm sayılar aynı şekilde çalışmaz. Ölçüm düzeyi, verinizle ne yapabilip ne yapamayacağınızı söyler.
Bunu doğru yapmak önemlidir çünkü yanlış veri türüne yanlış matematik uygulamak saçma sonuçlar verir. Örneğin, Süper Lig takımlarına numara atarsanız (Galatasaray = 1, Fenerbahçe = 2, Beşiktaş = 3), "ortalama takım" olarak 2 hesaplamak Fenerbahçe anlamına gelmez. Bu hesaplama anlamsızdır.
Dört ölçüm düzeyi vardır ve her biri bir öncekinin üzerine inşa eder. En basitinden en bilgi vericiye doğru inceleyelim.
Düzey 1: Sınıflamasal (Nominal)
Sınıflamasal veri en basit düzeydir. Doğal bir sırası olmayan isimler, etiketler veya kategorilerden oluşur. "Sınıflamasal" Latince "isim" kelimesinden gelir ve bu düzey tam olarak bunu yapar: şeyleri isimlendirir.
- Kan grubu: A, B, AB, 0. A'nın B'den "daha fazla" olduğu bir durum yoktur.
- Yaşanılan şehir: İstanbul, Ankara, İzmir, Bursa. Sıralama yok.
- Göz rengi: Kahverengi, mavi, yeşil, ela. Sadece etiketler.
- Plaka kodları: Sayılara benzeseler de, 34 (İstanbul) 06'dan (Ankara) herhangi anlamlı bir şekilde "büyük" değildir. Bunlar konumlar için etiketlerdir.
Sınıflamasal veriyle ne yapabilirsiniz: Her kategoriye kaç öğeyi düştüğünü sayın (frekans). En yaygın kategoriyi bulun (mod). Hepsi bu kadar. Sınıflamasal verinin ortalamasını hesaplamak anlamsızdır.
Düzey 2: Sırasal (Ordinal)
Sırasal veri, doğal bir sıra veya sıralama izleyen kategorilere sahiptir. Bir değerin diğerinden yüksek veya düşük olduğunu söyleyebilirsiniz. Ancak değerler arasındaki mesafeler zorunlu olarak eşit değildir.
- Tişört bedenleri: S, M, L, XL. Küçükten büyüğe doğru net bir sıra var, ama S ile M arasındaki kumaş farkı, L ile XL arasındakiyle aynı olmak zorunda değil.
- Müşteri memnuniyeti: Çok Memnun Değil, Memnun Değil, Nötr, Memnun, Çok Memnun. Memnun, Nötr'den daha iyi ama aralarındaki fark, Memnun Değil ile Nötr arasındakiyle aynı mı? Emin olamayız.
- Eğitim düzeyi: İlkokul, Ortaokul, Lise, Lisans, Yüksek Lisans, Doktora. Net bir ilerleme var ama her adım arasındaki "mesafe" değişir.
- Yarış sıralaması: 1. sıralama, 2. sıralama, 3. sıralama. Birinci ikinciden iyi ama zaman farkı saniyelerin kesri veya dakikalar olabilir.
Sırasal veriyle ne yapabilirsiniz: Nominal ile yapabildiğiniz her şey (sayma, mod bulma) artı sıralama yapabilir ve ortanca değeri (medyan) bulabilirsiniz. Ama gerçek bir ortalama hesaplamak sorunludur çünkü kategoriler arasındaki boşluklar eşit olmak zorunda değildir.
Bir restoranı Google'da 4 yıldız ile puanladınız. Arkadaşınız 2 yıldız veriyor. Sizin deneyiminiz tam olarak "iki kat daha iyi" mi? Muhtemelen hayır. Yıldız derecelendirmelerinin bir sırası var (5, 4'ten daha iyi), ama 1 yıldız ile 2 yıldız arasındaki psikolojik mesafe, 4 yıldız ile 5 yıldız arasındakinden çok farklı hissedebilir. Bu, sırasal verinin belirgin özelliği: sıra var ama eşit aralık yok.
Düzey 3: Aralıksal (Interval)
Aralıksal veri, sıraya ve değerler arasında eşit aralığa sahiptir. 10 ile 20 arasındaki fark, 40 ile 50 arasındaki farkla aynıdır. Ancak aralıksal verinin gerçek bir sıfır noktası yoktur, bu da oranların çalışmadığı anlamına gelir.
- Celsius cinsinden sıcaklık: 30 ile 40 derece arasındaki fark, 70 ile 80 derece arasındakiyle aynıdır. Ama 0 derece "sıcaklık yok" anlamına gelmez. Ve 80 derece, 40 derecenin "iki katı sıcak" değildir.
- Takvim yılları: 1990 ile 2000 arasındaki fark, 2010 ile 2020 arasındakiyle aynıdır (10 yıl). Ama yıl 0, zamanın gerçek yokluğu değil, keyfi bir referans noktasıdır.
- IQ puanları: 100 ile 110 arasındaki fark, 120 ile 130 arasındakiyle aynı olması amaçlanmıştır. Ama IQ 0 "zeka yok" anlamına gelmez ve 140 puanı 70'in "iki katı zeki" değildir.
Aralıksal veriyle ne yapabilirsiniz: Önceki düzeylerden her şey, artı anlamlı ortalamalar hesaplayabilir ve değerler arasındaki tam farkları ölçebilirsiniz. Ama gerçek bir sıfır olmadığı için "iki katı" gibi oran ifadeleri yapamazsınız.
"Gerçek Sıfır Yok" Fikri
Bu, çoğu insanı şaşırtan kısımdır, o yüzden bir dakika üzerinde duralım. "Gerçek sıfır" ölçülen şeyin tamamen yokluğu demektir. Sıfır derece Celsius ısının olmadığı anlamına gelmez. Sadece suyun donma noktasıdır, bu da keyfi bir seçimdir. Sıfır yok çünkü sıfır yapay, "40 derece 20 derecenin iki katı sıcak" demek geçerli değildir.
Düzey 4: Oransal (Ratio)
Oransal veri, aralıksal verinin sahip olduğu her şeye sahiptir - sıra, eşit aralık - artı gerçek bir sıfır noktası. Sıfır "hiçbiri yok" anlamına geldiğinde oransal veriniz vardır. Bu en bilgi verici ölçüm düzeyidir.
- Kilo: 0 kg ağırlık yok demektir. 100 kg gerçekten 50 kg'ın iki katı ağırdır.
- Boy: 0 cm boy yok demektir. 180 cm boyundaki bir kişi 90 cm boyundaki bir çocuktan iki kat uzundur.
- Banka hesabındaki para: 0 TL paranız yok demektir. 2.000 TL tam olarak 1.000 TL'nin iki katıdır.
- Yemek tarifleri: 0 su bardağı un, hiç un yok demektir. 2 su bardağı un gerektiren bir tarif, 1 su bardağı gerektirenin tam iki katı kullanır.
- Kelvin cinsinden sıcaklık: 0 Kelvin mutlak sıfırdır, termal enerjinin tamamen yokluğu. Bu, Kelvin'i oransal ölçek yapar; Fahrenheit ve Celsius aralıksal olmasına rağmen.
Oransal veriyle ne yapabilirsiniz: Her şey. Sayma, sıralama, ortalama alma, farkları karşılaştırma ve anlamlı oran ifadeleri yapma ("A, B'den üç kat ağır"). Bu en esnek düzeydir.
Bir kurabiye tarifi 200 gram un ve 100 gram şeker gerektiriyor. Şekerin iki katı kadar un gerektiğini söyleyebilirsiniz çünkü gram ölçümlerinin gerçek bir sıfırı var (0 gram = malzeme yok). Bu bir oran karşılaştırmasıdır. Şimdi kurabiyeleri 180 derece Celsius'ta pişirdiğinizi düşünün. 180 derecenin 90 derecenin "iki katı sıcak" olduğunu söyleyemezsiniz çünkü Celsius'un gerçek bir sıfırı yoktur. Aynı mutfak, aynı kurabiye, ama farklı ölçüm düzeyleri.
Dört Düzeyi Nasıl Hatırlarsınız?
Düzeyleri her biri yeni bir yetenek ekleyen yapı taşları olarak düşünün:
- Sınıflamasal (Nominal): Sadece isimler. Gruplayabilir ve sayabilirsiniz.
- Sırasal (Ordinal): İsimler + sıra. Sıralayabilirsiniz.
- Aralıksal (Interval): İsimler + sıra + eşit aralık. Tam farkları ölçebilirsiniz.
- Oransal (Ratio): İsimler + sıra + eşit aralık + gerçek sıfır. Oranları karşılaştırabilirsiniz.
Faydalı bir hafıza hilesi: "NOIR" (Fransızca "siyah" kelimesi) ifadesini düşünün. Nominal, Ordinal, Interval, Ratio. Her harf, en az bilgi vericiden en çok bilgi vericiye doğru bir düzeyi temsil eder.
Pratikte Neden Önemli?
Ölçüm düzeyiniz için yanlış analiz seçmek yanıltıcı sonuçlara yol açar. İşte bazı yaygın hatalar:
- Plaka kodlarının ortalamasını almak. 34 (İstanbul) ve 06 (Ankara) plaka kodlarının ortalaması 20'dir. Bu rakam anlamsızdır çünkü plaka kodları sınıflamasaldır.
- Yıldız derecelendirmelerinin dikkatsizce ortalamasını almak. "Ortalama 3,7 yıldız" puan alan bir restoran yaygın bir uygulamadır, ama teknik olarak sorunludur çünkü yıldız derecelendirmeleri sırasaldır ve yıldızlar arasındaki boşluklar eşit olmayabilir.
- "İki kat sıcak" demek. 40 derece Celsius'un 20 derecenin "iki katı sıcak" olduğunu raporlamak yanlıştır çünkü Celsius aralıksal bir ölçektir.
Dört ölçüm düzeyi - sınıflamasal, sırasal, aralıksal ve oransal - veriniz için hangi karşılaştırmaların ve hesaplamaların geçerli olduğunu söyler. Sınıflamasal veri sadece etiketlerdir. Sırasal veri sıra ekler. Aralıksal veri eşit aralık ekler. Oransal veri gerçek bir sıfır ekleyerek en geniş analiz yelpazesine izin verir. Herhangi bir veriyi analiz etmeden önce, ölçüm düzeyini belirleyin. Bu sizi yanlış sonuçlar çıkarımaktan kurtaracaktır.