Коли потрібно порівняти дві групи
Одне з найчастіших запитань у статистиці: "Чи ці дві групи реально відрізняються, чи різниця випадкова?" t-тест -- класичний інструмент для відповіді. Він порівнює середні значення двох груп і визначає, чи різниця статистично значуща.
Мережа кав'ярень у Львові тестує два рецепти лате. Група А (50 клієнтів) оцінила класичний рецепт у середньому на 7,8 з 10. Група Б (50 клієнтів) -- новий рецепт на 8,3. Різниця 0,5 бали -- це реальна перевага нового рецепту чи просто випадкові коливання? t-тест дає відповідь.
Одновибірковий t-тест
Порівнює середнє однієї групи з відомим значенням (теоретичним або еталонним).
Завод у Дніпрі виробляє болти довжиною 50 мм (стандарт). Ви берете вибірку з 30 болтів, їх середня довжина -- 50,3 мм. Чи це допустиме відхилення, чи обладнання потребує калібрування? Одновибірковий t-тест порівнює 50,3 з еталонним 50,0.
Формула
t = (вибіркове середнє - еталонне значення) / (стандартне відхилення / √n)
Чим більше t, тим менша ймовірність, що різниця випадкова.
Двовибірковий t-тест (незалежні вибірки)
Порівнює середні двох незалежних груп. "Незалежні" означає: різні люди, не пов'язані між собою.
Дослідження порівнює бали НМТ з математики студентів, які готувалися самостійно (група А, n=40, середнє 152) та з репетитором (група Б, n=45, середнє 163). Двовибірковий t-тест перевіряє: чи різниця в 11 балів значуща?
Результат: t = 3,2, p = 0,002. Оскільки p < 0,05, різниця значуща. Підготовка з репетитором, ймовірно, дає кращі результати.
Парний t-тест (залежні вибірки)
Використовується, коли ті самі люди вимірюються двічі: до і після, або при двох різних умовах.
20 працівників IT-компанії в Києві пройшли тренінг з тайм-менеджменту. Їх продуктивність виміряли до тренінгу (середнє: 65 балів) і після (середнє: 72 бали). Парний t-тест порівнює ці два виміри для кожного працівника. Результат: t = 2,8, p = 0,01. Тренінг, ймовірно, підвищив продуктивність.
Умови застосування t-тесту
t-тест надійний, коли:
- Дані приблизно нормально розподілені або вибірка достатньо велика (n > 30, завдяки ЦГТ).
- Дисперсії приблизно рівні в обох групах (для двовибіркового тесту). Якщо ні -- використовуйте t-тест Велча.
- Спостереження незалежні (для двовибіркового) або правильно спарені (для парного).
Читання результатів
Типовий результат t-тесту включає:
- t-статистика: чим далі від 0, тим більша різниця.
- Ступені свободи (df): пов'язані з розміром вибірки.
- p-значення: менше 0,05 = різниця значуща.
- Довірчий інтервал для різниці: показує правдоподібний діапазон.
Порівняння середньої ціни однокімнатної квартири у Львові та Одесі. Львів: n=50, середнє 1 200 000 грн. Одеса: n=45, середнє 1 050 000 грн. t-тест дає: t = 2,4, df = 89, p = 0,019. 95% ДІ для різниці: від 25 000 до 275 000 грн. Різниця значуща: квартири у Львові дорожчі.
Коли НЕ використовувати t-тест
- Більше двох груп -- використовуйте ANOVA.
- Дані категоріальні -- використовуйте хі-квадрат.
- Дуже малі вибірки з ненормальним розподілом -- використовуйте непараметричні тести.
t-тест -- основний інструмент для порівняння середніх. Одновибірковий порівнює групу з еталоном, двовибірковий -- дві незалежні групи, парний -- ті самі об'єкти до і після. Результат включає t-статистику, p-значення та довірчий інтервал. t-тест вимагає приблизно нормального розподілу або достатньо великої вибірки.