Definicja
Regresja to technika statystyczna modelująca związek między zmienną zależną (wynikiem, który chcesz przewidzieć) a jedną lub wieloma zmiennymi niezależnymi (czynnikami, które według ciebie wpływają na wynik). Najprostsza forma, regresja liniowa, dopasowuje prostą do punktów danych, aby opisać i przewidzieć związek.
Jak to działa
Regresja liniowa znajduje linię, która minimalizuje całkowity kwadrat odległości między punktami danych a samą linią.
Analityk nieruchomości chce przewidzieć ceny domów na podstawie metrażu.
Po analizie 500 domów równanie regresji brzmi: Cena = 50 000 $ + 150 $ za metr kwadratowy.
Dla domu o powierzchni 200 m2: 50 000 $ + (150 $ x 200) = 80 000 $ przewidywana cena.
Dlaczego to ważne
Regresja jest jednym z najszerzej stosowanych narzędzi w statystyce. Firmy używają jej do prognozowania sprzedaży, ekonomiści do modelowania wzrostu, a naukowcy do zrozumienia, jak zmienne na siebie oddziałują. Wykracza poza korelację, dając równanie predykcyjne.
Regresja wieloraka rozszerza koncepcję, włączając kilka zmiennych predykcyjnych jednocześnie. Na przykład przewidywanie cen domów z wykorzystaniem metrażu, liczby sypialni i lokalizacji razem. To czyni regresję elastycznym i potężnym narzędziem do analizy w świecie rzeczywistym.
Regresja modeluje związki między zmiennymi i umożliwia prognozy. Jest fundamentem analityki predykcyjnej i jednym z najbardziej praktycznych narzędzi statystycznych.