Что такое тест хи-квадрат?

Определение

Тест хи-квадрат - это статистический тест, используемый для определения наличия значимой связи между двумя категориальными переменными. Он сравнивает частоты, которые вы фактически наблюдаете в данных, с частотами, которые вы ожидали бы при отсутствии связи.

Как это работает

Вы организуете данные в таблицу наблюдаемых значений, рассчитываете ожидаемые значения (что вы увидели бы, если переменные не были бы связаны) и измеряете, насколько наблюдаемые значения отклоняются от ожидаемых.

Пример

Школа опрашивает 200 учеников об их предпочтительном предмете и поле.

Если бы предпочтение предмета не зависело от пола, вы ожидали бы примерно равные пропорции. Тест хи-квадрат вычисляет, достаточно ли фактическая картина отличается от этого ожидания.

Результат: хи-квадрат = 8.4, p-значение = 0.015. Поскольку p < 0.05, существует статистически значимая связь между полом и предпочтением предмета в этой выборке.

Почему это важно

Тест хи-квадрат - один из наиболее часто используемых тестов для категориальных данных. Маркетологи используют его для проверки различий в предпочтениях продуктов по демографическим группам. Медицинские исследователи используют его для проверки связи результатов лечения с характеристиками пациентов.

В отличие от тестов для числовых данных (таких как t-тест), тест хи-квадрат работает со счетчиками и категориями. Это делает его незаменимым, когда ваши данные включают группы, метки или результаты да/нет, а не непрерывные измерения.

Ключевой вывод

Используйте тест хи-квадрат, когда нужно проверить, связаны ли две категориальные переменные. Это основной тест для данных счетчиков, организованных в таблицы.

← Back to Glossary