Czym jest korelacja w statystyce?

Definicja

Korelacja to miara statystyczna, która określa siłę i kierunek liniowego związku między dwiema zmiennymi. Najpowszechniejszą miarą jest współczynnik korelacji Pearsona (r), który waha się od -1 do +1.

Jak interpretować korelację

Znak mówi o kierunku. Wartość bezwzględna mówi o sile.

Przykład

Szkoła śledzi godziny nauki i wyniki testów 200 uczniów.

r = 0,82 - silna korelacja dodatnia.

Gdy godziny nauki rosną, wyniki testów również mają tendencję wzrostową. Ale korelacja nie dowodzi, że nauka spowodowała wyższe wyniki - zmotywowani uczniowie mogą zarówno więcej się uczyć, jak i lepiej wypadać z innych powodów.

Dlaczego to ważne

Korelacja pomaga identyfikować związki w danych. Firmy używają jej do znajdowania, które kanały marketingowe są powiązane ze sprzedażą. Lekarze używają jej do identyfikacji czynników ryzyka chorób. Naukowcy używają jej jako pierwszego kroku przed głębszą analizą, taką jak regresja.

Najważniejsza zasada: korelacja nie oznacza przyczynowości. Dwie zmienne mogą zmieniać się razem bez powodowania zmian przez jedną z nich. Zawsze szukaj zmiennych zakłócających i rozważaj, czy związek ma logiczny sens.

Kluczowy wniosek

Korelacja mierzy, jak dwie zmienne zmieniają się razem. Zawsze pamiętaj: silna korelacja nie dowodzi, że jedna zmienna powoduje zmiany w drugiej.

← Back to Glossary