Наукове мислення у дії
Перевірка гіпотез -- це формальний процес прийняття рішення на основі даних. Замість "я думаю, що це так" статистика каже: "дані достатньо переконливі, щоб відхилити альтернативу, чи ні?"
Це як суд: підсудний вважається невинним, доки не доведено інакше. У статистиці "невинність" -- це нульова гіпотеза, а "вина" -- те, що ви намагаєтеся довести.
Нульова та альтернативна гіпотези
Нульова гіпотеза (H₀) -- це твердження "нічого особливого не відбувається". Різниці немає, ефекту немає, зв'язку немає. Це статус-кво.
Альтернативна гіпотеза (H₁) -- це те, що ви хочете довести. Різниця є, ефект існує, зв'язок реальний.
Фармацевтична компанія створила новий препарат від головного болю. H₀: "Новий препарат діє не краще за плацебо" (ефекту немає). H₁: "Новий препарат ефективніший за плацебо" (ефект є). Дослідники збирають дані і перевіряють, чи є достатньо доказів, щоб відхилити H₀.
Процес перевірки
- Сформулюйте гіпотези: H₀ і H₁.
- Оберіть рівень значущості (α): зазвичай 0,05 (5%). Це максимальна ймовірність помилково відхилити правдиву H₀.
- Зберіть дані та обчисліть тестову статистику.
- Обчисліть p-значення: ймовірність отримати такі або більш екстремальні результати, якщо H₀ правдива.
- Прийміть рішення: якщо p < α, відхиліть H₀. Якщо p ≥ α -- не відхиляйте.
Директор школи у Харкові вважає, що нова методика підготовки до НМТ підвищує бали. H₀: середній бал з новою методикою = середній бал без неї. H₁: середній бал з новою методикою вищий. Після тестування 60 студентів з новою методикою середній бал -- 158, а загальний середній -- 150. p-значення = 0,02. Оскільки 0,02 < 0,05, директор відхиляє H₀ і робить висновок, що методика, ймовірно, ефективна.
Помилки першого та другого роду
Будь-яке рішення може бути помилковим:
Помилка першого роду (Type I): Ви відхилили H₀, хоча вона правдива. Це "хибна тривога". Ймовірність = α.
Ви вирішили, що нова реклама на Rozetka підвищує продажі, хоча насправді збільшення було випадковим. Компанія витрачає гроші на масштабування цієї реклами -- даремно.
Помилка другого роду (Type II): Ви не відхилили H₀, хоча вона хибна. Це "пропущений сигнал". Ймовірність = β.
Новий препарат справді працює, але ваше дослідження з 20 пацієнтів не виявило достатньої різниці (p = 0,08). Ви не відхиляєте H₀ і робите висновок "ефекту немає", хоча він є. Вибірка була занадто малою.
Рівень значущості: чому 0,05?
Поріг 0,05 (5%) -- це конвенція, а не закон природи. Він означає: ми готові помилитися (хибно відхилити H₀) з ймовірністю 5%. У медицині часто використовують 0,01 (1%), бо ціна помилки вища. У попередніх дослідженнях може використовуватися 0,10 (10%).
Одностороння та двостороння перевірка
Двостороння: Чи є різниця в будь-якому напрямку? H₁: "середній бал відрізняється від 150" (може бути вищий або нижчий).
Одностороння: Різниця тільки в одному напрямку? H₁: "середній бал вищий за 150".
Одностороння перевірка потужніша (легше виявити ефект), але вимагає обґрунтування напрямку до початку збору даних.
Поширені помилки
- "p < 0,05 означає, що H₀ хибна з ймовірністю 95%." Неправда. p-значення -- це ймовірність даних за умови H₀, а не ймовірність H₀ за умови даних.
- "Не відхилили H₀ = довели H₀." Ні. Ви просто не знайшли достатньо доказів проти неї. Як у суді: "не доведено винним" не означає "доведено невинним".
- Статистична значущість = практична значущість. Різниця в 0,3 бали НМТ може бути статистично значущою при великій вибірці, але практично безглуздою.
Перевірка гіпотез -- формальний процес прийняття рішення на основі даних. Нульова гіпотеза (H₀) передбачає відсутність ефекту; альтернативна (H₁) -- його наявність. Якщо p-значення менше за поріг α (зазвичай 0,05), H₀ відхиляється. Помилка першого роду -- хибне відхилення; другого -- пропущений ефект. Статистична значущість не завжди означає практичну важливість.