Что такое корреляция в статистике?

Определение

Корреляция - это статистическая мера, которая количественно оценивает силу и направление линейной связи между двумя переменными. Наиболее распространенная мера - коэффициент корреляции Пирсона (r), который варьируется от -1 до +1.

Как интерпретировать корреляцию

Знак показывает направление. Величина показывает силу.

Пример

Школа отслеживает часы учебы и результаты тестов для 200 учеников.

r = 0.82 - сильная положительная корреляция.

По мере увеличения часов учебы результаты тестов также имеют тенденцию к росту. Но корреляция не доказывает, что учеба вызвала более высокие оценки - мотивированные ученики могут и больше учиться, и лучше выступать по другим причинам.

Почему это важно

Корреляция помогает выявлять связи в данных. Бизнес использует ее для определения маркетинговых каналов, связанных с продажами. Врачи используют ее для выявления факторов риска заболеваний. Ученые используют ее как первый шаг перед более глубоким анализом, таким как регрессия.

Самое важное правило: корреляция не означает причинность. Две переменные могут изменяться вместе без причинно-следственной связи. Всегда ищите смешивающие переменные и оценивайте, имеет ли связь логический смысл.

Ключевой вывод

Корреляция измеряет, как две переменные изменяются вместе. Всегда помните: сильная корреляция не доказывает, что одна переменная вызывает изменения в другой.

← Back to Glossary