Рівні вимірювання

Складність: Початковий Час читання: 10 хвилин

Навіщо знати рівні вимірювання?

Рівень вимірювання визначає, що саме ви можете робити з даними. Це як поверхи будинку: кожен наступний рівень дає більше можливостей, і все, що можна на нижчому рівні, доступно й на вищому. Існує чотири рівні, і кожен статистик повинен їх знати.

Номінальна Порядкова Інтервальна Відношення

1. Номінальний рівень: просто імена

На номінальному рівні дані -- це просто мітки. Категорії не мають порядку, і єдине, що можна робити -- рахувати частоту кожної категорії.

Приклад

Опитування: "За яку команду УПЛ ви вболіваєте?" Відповіді: Шахтар, Динамо, Дніпро-1, Зоря, інша. Ви можете сказати: "35% обрали Динамо, 30% -- Шахтар". Але не можете сказати, що Динамо "більше" за Шахтар у числовому сенсі. Це просто категорії.

Інші приклади: група крові (A, B, AB, O), область проживання, тип житла (квартира, будинок, гуртожиток). Можна знайти моду (найчастішу категорію), але обчислення середнього безглузде.

2. Порядковий рівень: категорії з рангом

На порядковому рівні категорії мають природний порядок, але відстань між ними невідома або нерівномірна.

Приклад

Рівні складності НМТ: початковий, середній, достатній, високий. Ви знаєте, що "високий" краще за "середній", але не можете сказати, що різниця між "початковим" і "середнім" така сама, як між "достатнім" і "високим". Рейтинг ресторану на Google Maps (1-5 зірок) -- теж порядковий: 5 зірок краще за 3, але "наскільки краще" -- невідомо.

На порядковому рівні можна порівнювати (більше/менше) та знаходити медіану, але обчислення середнього -- спірне питання серед статистиків.

3. Інтервальний рівень: рівні проміжки, але немає нуля

На інтервальному рівні різниця між значеннями має сенс і є рівномірною, але нуль -- умовний, а не справжній. Не можна сказати, що одне значення "вдвічі більше" за інше.

Приклад

Температура у Львові сьогодні +20 °C, а вчора була +10 °C. Різниця 10 градусів має чітке значення. Але чи означає це, що сьогодні "вдвічі тепліше"? Ні! Бо 0 °C -- не означає відсутність температури. У шкалі Фаренгейта ті самі дні мали б інше співвідношення. Рік народження -- ще один приклад: різниця між 1990 і 2000 роками -- 10 років, але "рік 0" не означає "початок часу".

На інтервальному рівні можна обчислювати середнє та стандартне відхилення, але не можна говорити про пропорції ("вдвічі більше").

4. Пропорційний рівень: повна свобода

Пропорційний (або абсолютний) рівень має справжній нуль, який означає повну відсутність вимірюваної величини. Це дає найбільше можливостей для аналізу.

Приклад

Зарплата в гривнях: 0 грн означає "немає доходу". Якщо Олена заробляє 30 000 грн, а Тарас -- 15 000 грн, ми можемо сказати, що Олена заробляє вдвічі більше. Площа земельної ділянки: 0 га означає "немає землі", і ділянка в 10 га справді вдвічі більша за ділянку в 5 га. Вага врожаю соняшника -- те саме: 0 тонн означає "урожаю немає".

На пропорційному рівні можна все: середнє, медіана, стандартне відхилення, пропорції, відсотки. Це найвищий і найбагатший рівень вимірювання.

Порівняння рівнів

Ось коротке порівняння того, що можна робити на кожному рівні:

  • Номінальний: рахувати частоту, знаходити моду.
  • Порядковий: все вище + порівнювати (більше/менше), знаходити медіану.
  • Інтервальний: все вище + обчислювати середнє, різницю, стандартне відхилення.
  • Пропорційний: все вище + обчислювати пропорції та відсотки.

Як визначити рівень?

Задайте собі три запитання по порядку:

  1. Чи є природний порядок? Ні -- номінальний. Так -- рухаємося далі.
  2. Чи рівні проміжки між значеннями? Ні -- порядковий. Так -- рухаємося далі.
  3. Чи є справжній нуль? Ні -- інтервальний. Так -- пропорційний.
Приклад

Бал НМТ з математики (від 100 до 200). Є порядок? Так, 180 краще за 140. Рівні проміжки? Так, різниця між 140 і 150 така сама, як між 180 і 190. Справжній нуль? Ні -- бал 100 (мінімальний) не означає "нуль знань". Отже, це інтервальний рівень.

Поширені пастки

Номер маршрутки (27, 55, 118) -- номінальний, хоча записаний числами. Позиція у турнірній таблиці УПЛ (1-ше, 2-ге, 3-тє місце) -- порядковий, бо різниця в очках між 1-м і 2-м місцем може бути зовсім іншою, ніж між 2-м і 3-м. Температура в градусах Цельсія -- інтервальний, а температура в Кельвінах -- пропорційний (бо 0 К -- абсолютний нуль).

Ключовий висновок

Чотири рівні вимірювання -- номінальний, порядковий, інтервальний та пропорційний -- утворюють ієрархію. Кожен наступний дає більше можливостей для аналізу. Перед тим як рахувати середнє чи будувати графік, завжди визначте рівень вимірювання ваших даних, бо використання невідповідного методу призведе до хибних висновків.