Dlaczego sposób mierzenia ma znaczenie
W poprzedniej lekcji mówiliśmy o typach danych. Teraz pogłębmy ten temat. W statystyce istnieją cztery poziomy pomiaru, a każdy z nich mówi coś innego o tym, co możesz robić z danymi. Pomyśl o nich jak o szczeblach drabiny - każdy kolejny poziom daje więcej możliwości analizy.
Poziom nominalny - nazywanie i grupowanie
Na tym poziomie po prostu nadajesz nazwy kategoriom. Nie ma żadnej kolejności ani rankingu. Możesz jedynie policzyć, ile razy każda kategoria się pojawia.
- Płeć: mężczyzna, kobieta, inna
- Województwo: mazowieckie, śląskie, wielkopolskie
- Typ pojazdu: samochód, rower, autobus
- Ulubiona sieć sklepów: Biedronka, Lidl, Żabka
Ankieta pyta: "Jaki jest Twój ulubiony sklep spożywczy?" Odpowiedzi: Biedronka (45%), Lidl (30%), Żabka (15%), inne (10%). Możesz policzyć częstości i stworzyć wykres kołowy, ale nie możesz powiedzieć, że Biedronka jest "dwa razy lepsza" niż Żabka - to są po prostu nazwy kategorii.
Poziom porządkowy - kolejność bez równych odległości
Tutaj kategorie mają naturalny porządek, ale odległości między nimi nie są równe ani mierzalne. Wiesz, co jest "wyżej" a co "niżej", ale nie wiesz dokładnie o ile.
- Oceny szkolne: celujący, bardzo dobry, dobry, dostateczny, dopuszczający, niedostateczny
- Poziom wykształcenia: podstawowe, średnie, wyższe
- Satysfakcja klienta: bardzo zadowolony, zadowolony, neutralny, niezadowolony
Na maturze z języka polskiego uczeń może uzyskać ocenę procentową, ale wyniki są często raportowane w kategoriach: poniżej progu (0-29%), podstawowy (30-49%), dobry (50-69%), bardzo dobry (70-89%), celujący (90-100%). Te kategorie mają jasną kolejność, ale "skok" z poniżej progu do podstawowego nie jest tym samym co skok z dobrego do bardzo dobrego pod względem trudności.
Poziom przedziałowy - równe odległości, ale brak prawdziwego zera
Na tym poziomie odległości między wartościami są równe i znaczące, ale punkt zerowy jest umowny - nie oznacza "braku" mierzonej cechy.
Najlepszy przykład to temperatura w stopniach Celsjusza. Różnica między 10°C a 20°C jest taka sama jak między 20°C a 30°C. Ale 0°C nie oznacza "braku temperatury" - to po prostu punkt zamarzania wody. Nie możesz powiedzieć, że 30°C jest "dwa razy cieplej" niż 15°C.
W Warszawie jest 20°C, w Krakowie 10°C. Możesz powiedzieć, że w Warszawie jest o 10 stopni cieplej (różnica ma sens). Ale nie możesz powiedzieć, że w Warszawie jest "dwa razy cieplej" - bo 0°C nie oznacza braku temperatury. Gdyby tak było, w dniu gdy jest 0°C nie byłoby w ogóle temperatury, co nie ma sensu.
Poziom stosunkowy - wszystko plus prawdziwe zero
To najwyższy poziom pomiaru. Ma wszystko co przedziałowy, plus prawdziwe zero, które oznacza całkowity brak mierzonej cechy. Dzięki temu możesz mówić o proporcjach i ilorazach.
- Waga: 0 kg oznacza brak wagi
- Dochód: 0 zł oznacza brak dochodu
- Odległość: 0 km oznacza brak odległości
- Czas: 0 sekund oznacza brak czasu
Zarobki dwóch pracowników: jeden zarabia 4000 zł, drugi 8000 zł. Możesz powiedzieć, że drugi zarabia dwa razy więcej - bo 0 zł to prawdziwe zero (brak zarobków). Możesz też powiedzieć, że różnica wynosi 4000 zł. Na poziomie stosunkowym dozwolone są wszystkie operacje matematyczne.
Podsumowanie poziomów
Oto co możesz robić na każdym poziomie:
- Nominalny: liczenie częstości, dominanta (moda)
- Porządkowy: to co wyżej + mediana, porównywanie kolejności
- Przedziałowy: to co wyżej + średnia, odchylenie standardowe, dodawanie i odejmowanie
- Stosunkowy: to co wyżej + proporcje, mnożenie i dzielenie
Każdy następny poziom "dziedziczy" możliwości poprzedniego i dodaje nowe. Dlatego dane stosunkowe są najbardziej elastyczne - możesz na nich wykonać najwięcej analiz.
Częsty błąd
Jednym z najczęstszych błędów jest traktowanie danych porządkowych jak przedziałowych. Na przykład, w ankietach często spotykamy skalę 1-5 (od "zdecydowanie się nie zgadzam" do "zdecydowanie się zgadzam"). Wiele osób oblicza średnią z takich odpowiedzi (np. "średnia satysfakcja wynosi 3,7"), ale to zakłada, że odległości między wartościami są równe - czego nie możemy być pewni.
W praktyce ten błąd jest często akceptowany, ale dobrze być tego świadomym.
Istnieją cztery poziomy pomiaru: nominalny (kategorie bez kolejności), porządkowy (kategorie z kolejnością), przedziałowy (równe odległości, umowne zero) i stosunkowy (równe odległości, prawdziwe zero). Im wyższy poziom, tym więcej narzędzi statystycznych możesz zastosować. Zanim zaczniesz analizę, upewnij się, że wiesz, z jakim poziomem pomiaru masz do czynienia.