What is hypothesis testing in statistics?

Hypothesis testing is a method to decide whether sample data provides enough evidence to reject a claim about a population.

What is the difference between null and alternative hypothesis?

The null hypothesis assumes no effect or difference, while the alternative hypothesis claims there is a significant effect or difference.

What are the steps of hypothesis testing?

State hypotheses, choose a significance level, collect data, calculate a test statistic, find the p-value, and decide to reject or not.

What is a Type I error in hypothesis testing?

A Type I error is rejecting the null hypothesis when it is actually true - a false positive. The probability equals your significance level.

What is a Type II error in hypothesis testing?

A Type II error is failing to reject the null hypothesis when it is actually false - a false negative. It means missing a real effect.

Перевірка гіпотез

Наукове мислення у дії

Перевірка гіпотез -- це формальний процес прийняття рішення на основі даних. Замість "я думаю, що це так" статистика каже: "дані достатньо переконливі, щоб відхилити альтернативу, чи ні?"

Це як суд: підсудний вважається невинним, доки не доведено інакше. У статистиці "невинність" -- це нульова гіпотеза, а "вина" -- те, що ви намагаєтеся довести.

Нульова та альтернативна гіпотези

Нульова гіпотеза (H₀) -- це твердження "нічого особливого не відбувається". Різниці немає, ефекту немає, зв'язку немає. Це статус-кво.

Альтернативна гіпотеза (H₁) -- це те, що ви хочете довести. Різниця є, ефект існує, зв'язок реальний.

Приклад

Фармацевтична компанія створила новий препарат від головного болю. H₀: "Новий препарат діє не краще за плацебо" (ефекту немає). H₁: "Новий препарат ефективніший за плацебо" (ефект є). Дослідники збирають дані і перевіряють, чи є достатньо доказів, щоб відхилити H₀.

Процес перевірки

Сформулюйте гіпотези: H₀ і H₁.
Оберіть рівень значущості (α): зазвичай 0,05 (5%). Це максимальна ймовірність помилково відхилити правдиву H₀.
Зберіть дані та обчисліть тестову статистику.
Обчисліть p-значення: ймовірність отримати такі або більш екстремальні результати, якщо H₀ правдива.
Прийміть рішення: якщо p < α, відхиліть H₀. Якщо p ≥ α -- не відхиляйте.

Приклад

Директор школи у Харкові вважає, що нова методика підготовки до НМТ підвищує бали. H₀: середній бал з новою методикою = середній бал без неї. H₁: середній бал з новою методикою вищий. Після тестування 60 студентів з новою методикою середній бал -- 158, а загальний середній -- 150. p-значення = 0,02. Оскільки 0,02 < 0,05, директор відхиляє H₀ і робить висновок, що методика, ймовірно, ефективна.

Помилки першого та другого роду

Будь-яке рішення може бути помилковим:

Помилка першого роду (Type I): Ви відхилили H₀, хоча вона правдива. Це "хибна тривога". Ймовірність = α.

Приклад

Ви вирішили, що нова реклама на Rozetka підвищує продажі, хоча насправді збільшення було випадковим. Компанія витрачає гроші на масштабування цієї реклами -- даремно.

Помилка другого роду (Type II): Ви не відхилили H₀, хоча вона хибна. Це "пропущений сигнал". Ймовірність = β.

Приклад

Новий препарат справді працює, але ваше дослідження з 20 пацієнтів не виявило достатньої різниці (p = 0,08). Ви не відхиляєте H₀ і робите висновок "ефекту немає", хоча він є. Вибірка була занадто малою.

Рівень значущості: чому 0,05?

Поріг 0,05 (5%) -- це конвенція, а не закон природи. Він означає: ми готові помилитися (хибно відхилити H₀) з ймовірністю 5%. У медицині часто використовують 0,01 (1%), бо ціна помилки вища. У попередніх дослідженнях може використовуватися 0,10 (10%).

Одностороння та двостороння перевірка

Двостороння: Чи є різниця в будь-якому напрямку? H₁: "середній бал відрізняється від 150" (може бути вищий або нижчий).

Одностороння: Різниця тільки в одному напрямку? H₁: "середній бал вищий за 150".

Одностороння перевірка потужніша (легше виявити ефект), але вимагає обґрунтування напрямку до початку збору даних.

Поширені помилки

"p < 0,05 означає, що H₀ хибна з ймовірністю 95%." Неправда. p-значення -- це ймовірність даних за умови H₀, а не ймовірність H₀ за умови даних.
"Не відхилили H₀ = довели H₀." Ні. Ви просто не знайшли достатньо доказів проти неї. Як у суді: "не доведено винним" не означає "доведено невинним".
Статистична значущість = практична значущість. Різниця в 0,3 бали НМТ може бути статистично значущою при великій вибірці, але практично безглуздою.

Ключовий висновок

Перевірка гіпотез -- формальний процес прийняття рішення на основі даних. Нульова гіпотеза (H₀) передбачає відсутність ефекту; альтернативна (H₁) -- його наявність. Якщо p-значення менше за поріг α (зазвичай 0,05), H₀ відхиляється. Помилка першого роду -- хибне відхилення; другого -- пропущений ефект. Статистична значущість не завжди означає практичну важливість.

Перевірка гіпотез

Наукове мислення у дії

Нульова та альтернативна гіпотези

Процес перевірки

Помилки першого та другого роду

Рівень значущості: чому 0,05?

Одностороння та двостороння перевірка

Поширені помилки

Схожі уроки