modele regresji liniowej służą do pokazywania lub przewidywania zależności między dwiema zmiennymi lub czynnikami. Czynnik, który jest przewidywany (czynnik, który rozwiązuje równanie) nazywa się zmienną zależną. Czynniki, które są używane do przewidywania wartości zmiennej zależnej nazywane są zmiennymi niezależnymi.
w regresji liniowej każda obserwacja składa się z dwóch wartości. Jedna wartość jest dla zmiennej zależnej i jedna wartość jest dla zmiennej niezależnej. W tym prostym modelu linia prosta przybliża zależność między zmienną zależną a zmienną niezależną.
gdy w analizie regresji wykorzystywane są dwie lub więcej zmiennych niezależnych, model nie jest już prostym modelem liniowym. Jest to znane jako regresji wielokrotnej.
wzór na prosty model regresji liniowej
dwa czynniki, które są zaangażowane w prostą analizę regresji liniowej są oznaczone x i y. Równanie, które opisuje, jak Y jest związane z x, jest znane jako model regresji.
prosty model regresji liniowej jest reprezentowany przez:
y = β0 +ß1x+ε
model regresji liniowej zawiera termin błędu, który jest reprezentowany przez ε. Termin błędu jest używany do uwzględnienia zmienności y, której nie można wyjaśnić liniową relacją między x I y. gdyby ε nie było obecne, oznaczałoby to, że znajomość x dostarczyłaby wystarczających informacji do określenia wartości y.
istnieją również parametry, które reprezentują badaną populację. Te parametry modelu są reprezentowane przez β0 i β1.
proste równanie regresji liniowej jest narysowane jako linia prosta, gdzie:
- β0 jest punktem przecięcia linii regresji z osią y.
- β1 to nachylenie.
- Ε(y) jest średnią lub oczekiwaną wartością y dla danej wartości X.
linia regresji może wykazywać dodatnią zależność liniową, ujemną zależność liniową lub brak zależności.
- brak zależności: wykreślona linia w prostej regresji liniowej jest płaska (nie nachylona). Nie ma związku między tymi dwoma zmiennymi.
- dodatnia zależność: linia regresji nachylona jest w górę wraz z dolnym końcem linii w punkcie przecięcia y (osi) wykresu i górnym końcem linii rozciągającej się w górę do pola wykresu, z dala od punktu przecięcia x (osi). Istnieje dodatnia zależność liniowa między dwiema zmiennymi: gdy wartość jednej wzrasta, wartość drugiej również wzrasta.
- negatywny związek: Linia regresji pochyla się w dół z górnym końcem linii na osi Y (oś) wykresu i dolnym końcem linii rozciągającej się w dół do pola wykresu, w kierunku osi X (oś). Istnieje ujemna zależność liniowa między dwiema zmiennymi: gdy wartość jednej wzrasta, wartość drugiej maleje.
szacowane równanie regresji liniowej
jeśli parametry populacji były znane, proste równanie regresji liniowej (pokazane poniżej) może być użyte do obliczenia średniej wartości y dla znanej wartości x.
Ε(y) = β0 +ß1x+ε
w praktyce jednak wartości parametrów na ogół nie są znane, więc należy je oszacować na podstawie danych z próby populacji. Parametry populacji są szacowane za pomocą statystyk próbnych. Statystyki próby są reprezentowane przez β0 i β1. Gdy statystyki próbki są zastępowane parametrami populacji, tworzy się szacunkowe równanie regresji.
szacowane równanie regresji to:
(ŷ) = β0 +ß1x+ε
Uwaga: (ŷ) jest zaimkiem.
Wykres szacowanego prostego równania regresji nazywa się szacowaną linią regresji.
- β0 jest punktem przecięcia linii regresji.
- β1 to nachylenie.
- (ŷ) to szacunkowa wartość y dla danej wartości X.
granice prostej regresji liniowej
nawet najlepsze dane nie opowiadają pełnej historii.
Analiza regresji jest powszechnie stosowana w badaniach w celu ustalenia, że istnieje korelacja między zmiennymi. Ale korelacja nie jest taka sama jak związek przyczynowy: związek między dwiema zmiennymi nie oznacza, że jedna powoduje drugą. Nawet linia w prostej regresji liniowej, która dobrze pasuje do punktów danych, nie może zagwarantować związku przyczynowo-skutkowego.
Korzystanie z modelu regresji liniowej pozwoli Ci odkryć, czy związek między zmiennymi w ogóle istnieje. Aby dokładnie zrozumieć, czym jest ten związek i czy jedna zmienna powoduje drugą, będziesz potrzebował dodatkowych badań i analizy statystycznej.