Основи t-тесту

Складність: Середній Час читання: 15 хвилин

Коли потрібно порівняти дві групи

Одне з найчастіших запитань у статистиці: "Чи ці дві групи реально відрізняються, чи різниця випадкова?" t-тест -- класичний інструмент для відповіді. Він порівнює середні значення двох груп і визначає, чи різниця статистично значуща.

Різниця 2.1 5.2 8.3 0
Приклад

Мережа кав'ярень у Львові тестує два рецепти лате. Група А (50 клієнтів) оцінила класичний рецепт у середньому на 7,8 з 10. Група Б (50 клієнтів) -- новий рецепт на 8,3. Різниця 0,5 бали -- це реальна перевага нового рецепту чи просто випадкові коливання? t-тест дає відповідь.

Одновибірковий t-тест

Порівнює середнє однієї групи з відомим значенням (теоретичним або еталонним).

Приклад

Завод у Дніпрі виробляє болти довжиною 50 мм (стандарт). Ви берете вибірку з 30 болтів, їх середня довжина -- 50,3 мм. Чи це допустиме відхилення, чи обладнання потребує калібрування? Одновибірковий t-тест порівнює 50,3 з еталонним 50,0.

Формула

t = (вибіркове середнє - еталонне значення) / (стандартне відхилення / √n)

Чим більше t, тим менша ймовірність, що різниця випадкова.

Двовибірковий t-тест (незалежні вибірки)

Порівнює середні двох незалежних груп. "Незалежні" означає: різні люди, не пов'язані між собою.

Приклад

Дослідження порівнює бали НМТ з математики студентів, які готувалися самостійно (група А, n=40, середнє 152) та з репетитором (група Б, n=45, середнє 163). Двовибірковий t-тест перевіряє: чи різниця в 11 балів значуща?

Результат: t = 3,2, p = 0,002. Оскільки p < 0,05, різниця значуща. Підготовка з репетитором, ймовірно, дає кращі результати.

Парний t-тест (залежні вибірки)

Використовується, коли ті самі люди вимірюються двічі: до і після, або при двох різних умовах.

Приклад

20 працівників IT-компанії в Києві пройшли тренінг з тайм-менеджменту. Їх продуктивність виміряли до тренінгу (середнє: 65 балів) і після (середнє: 72 бали). Парний t-тест порівнює ці два виміри для кожного працівника. Результат: t = 2,8, p = 0,01. Тренінг, ймовірно, підвищив продуктивність.

Умови застосування t-тесту

t-тест надійний, коли:

-3 -2 -1 0 1 2 3
  • Дані приблизно нормально розподілені або вибірка достатньо велика (n > 30, завдяки ЦГТ).
  • Дисперсії приблизно рівні в обох групах (для двовибіркового тесту). Якщо ні -- використовуйте t-тест Велча.
  • Спостереження незалежні (для двовибіркового) або правильно спарені (для парного).

Читання результатів

Типовий результат t-тесту включає:

  • t-статистика: чим далі від 0, тим більша різниця.
  • Ступені свободи (df): пов'язані з розміром вибірки.
  • p-значення: менше 0,05 = різниця значуща.
  • Довірчий інтервал для різниці: показує правдоподібний діапазон.
Приклад

Порівняння середньої ціни однокімнатної квартири у Львові та Одесі. Львів: n=50, середнє 1 200 000 грн. Одеса: n=45, середнє 1 050 000 грн. t-тест дає: t = 2,4, df = 89, p = 0,019. 95% ДІ для різниці: від 25 000 до 275 000 грн. Різниця значуща: квартири у Львові дорожчі.

Коли НЕ використовувати t-тест

  • Більше двох груп -- використовуйте ANOVA.
  • Дані категоріальні -- використовуйте хі-квадрат.
  • Дуже малі вибірки з ненормальним розподілом -- використовуйте непараметричні тести.
Ключовий висновок

t-тест -- основний інструмент для порівняння середніх. Одновибірковий порівнює групу з еталоном, двовибірковий -- дві незалежні групи, парний -- ті самі об'єкти до і після. Результат включає t-статистику, p-значення та довірчий інтервал. t-тест вимагає приблизно нормального розподілу або достатньо великої вибірки.