Перевірка гіпотез

Складність: Середній Час читання: 15 хвилин

Наукове мислення у дії

Перевірка гіпотез -- це формальний процес прийняття рішення на основі даних. Замість "я думаю, що це так" статистика каже: "дані достатньо переконливі, щоб відхилити альтернативу, чи ні?"

-3 -2 -1 0 1 2 3

Це як суд: підсудний вважається невинним, доки не доведено інакше. У статистиці "невинність" -- це нульова гіпотеза, а "вина" -- те, що ви намагаєтеся довести.

Нульова та альтернативна гіпотези

Нульова гіпотеза (H₀) -- це твердження "нічого особливого не відбувається". Різниці немає, ефекту немає, зв'язку немає. Це статус-кво.

Альтернативна гіпотеза (H₁) -- це те, що ви хочете довести. Різниця є, ефект існує, зв'язок реальний.

Приклад

Фармацевтична компанія створила новий препарат від головного болю. H₀: "Новий препарат діє не краще за плацебо" (ефекту немає). H₁: "Новий препарат ефективніший за плацебо" (ефект є). Дослідники збирають дані і перевіряють, чи є достатньо доказів, щоб відхилити H₀.

Процес перевірки

  1. Сформулюйте гіпотези: H₀ і H₁.
  2. Оберіть рівень значущості (α): зазвичай 0,05 (5%). Це максимальна ймовірність помилково відхилити правдиву H₀.
  3. Зберіть дані та обчисліть тестову статистику.
  4. Обчисліть p-значення: ймовірність отримати такі або більш екстремальні результати, якщо H₀ правдива.
  5. Прийміть рішення: якщо p < α, відхиліть H₀. Якщо p ≥ α -- не відхиляйте.
Приклад

Директор школи у Харкові вважає, що нова методика підготовки до НМТ підвищує бали. H₀: середній бал з новою методикою = середній бал без неї. H₁: середній бал з новою методикою вищий. Після тестування 60 студентів з новою методикою середній бал -- 158, а загальний середній -- 150. p-значення = 0,02. Оскільки 0,02 < 0,05, директор відхиляє H₀ і робить висновок, що методика, ймовірно, ефективна.

Результат 0.5 2.3 4.1 0

Помилки першого та другого роду

Будь-яке рішення може бути помилковим:

Помилка першого роду (Type I): Ви відхилили H₀, хоча вона правдива. Це "хибна тривога". Ймовірність = α.

Приклад

Ви вирішили, що нова реклама на Rozetka підвищує продажі, хоча насправді збільшення було випадковим. Компанія витрачає гроші на масштабування цієї реклами -- даремно.

Помилка другого роду (Type II): Ви не відхилили H₀, хоча вона хибна. Це "пропущений сигнал". Ймовірність = β.

Приклад

Новий препарат справді працює, але ваше дослідження з 20 пацієнтів не виявило достатньої різниці (p = 0,08). Ви не відхиляєте H₀ і робите висновок "ефекту немає", хоча він є. Вибірка була занадто малою.

Рівень значущості: чому 0,05?

Поріг 0,05 (5%) -- це конвенція, а не закон природи. Він означає: ми готові помилитися (хибно відхилити H₀) з ймовірністю 5%. У медицині часто використовують 0,01 (1%), бо ціна помилки вища. У попередніх дослідженнях може використовуватися 0,10 (10%).

-3 -2 -1 0 1 2 3

Одностороння та двостороння перевірка

Двостороння: Чи є різниця в будь-якому напрямку? H₁: "середній бал відрізняється від 150" (може бути вищий або нижчий).

Одностороння: Різниця тільки в одному напрямку? H₁: "середній бал вищий за 150".

Одностороння перевірка потужніша (легше виявити ефект), але вимагає обґрунтування напрямку до початку збору даних.

Поширені помилки

  • "p < 0,05 означає, що H₀ хибна з ймовірністю 95%." Неправда. p-значення -- це ймовірність даних за умови H₀, а не ймовірність H₀ за умови даних.
  • "Не відхилили H₀ = довели H₀." Ні. Ви просто не знайшли достатньо доказів проти неї. Як у суді: "не доведено винним" не означає "доведено невинним".
  • Статистична значущість = практична значущість. Різниця в 0,3 бали НМТ може бути статистично значущою при великій вибірці, але практично безглуздою.
Ключовий висновок

Перевірка гіпотез -- формальний процес прийняття рішення на основі даних. Нульова гіпотеза (H₀) передбачає відсутність ефекту; альтернативна (H₁) -- його наявність. Якщо p-значення менше за поріг α (зазвичай 0,05), H₀ відхиляється. Помилка першого роду -- хибне відхилення; другого -- пропущений ефект. Статистична значущість не завжди означає практичну важливість.