Lineære regresjonsmodeller brukes til å vise eller forutsi forholdet mellom to variabler eller faktorer. Faktoren som blir spådd (faktoren som ligningen løser for) kalles den avhengige variabelen. Faktorene som brukes til å forutsi verdien av den avhengige variabelen kalles de uavhengige variablene.
i lineær regresjon består hver observasjon av to verdier. En verdi er for den avhengige variabelen og en verdi er for den uavhengige variabelen. I denne enkle modellen tilnærmer en rett linje forholdet mellom den avhengige variabelen og den uavhengige variabelen.
når to eller flere uavhengige variabler brukes i regresjonsanalyse, er modellen ikke lenger en enkel lineær. Dette kalles multippel regresjon.
Formel for En Enkel Lineær Regresjonsmodell
de to faktorene som er involvert i enkel lineær regresjonsanalyse er betegnet x og y. Ligningen som beskriver hvordan y er relatert til x er kjent som regresjonsmodellen.
den enkle lineære regresjonsmodellen er representert ved:
y = β0 +ß1x+ε
den lineære regresjonsmodellen inneholder en feilbegrep som er representert av ε. Feilbegrepet brukes til å redegjøre for variabiliteten i y som ikke kan forklares av det lineære forholdet mellom x og y. Hvis det ikke var tilstede, ville det bety at å vite x ville gi nok informasjon til å bestemme verdien av y.
Det er også parametere som representerer populasjonen som studeres. Disse parameterne i modellen er representert av β0 og β1.
den enkle lineære regresjonsligningen er grafert som en rett linje, hvor:
- β0 er y-avskjæringen av regresjonslinjen.
- β1 er skråningen.
- Ε (y) er gjennomsnittlig eller forventet verdi av y for en gitt verdi av x.
en regresjonslinje kan vise et positivt lineært forhold, et negativt lineært forhold eller ingen forhold.
- Ingen sammenheng: den grafede linjen i en enkel lineær regresjon er flat(ikke skrå). Det er ingen sammenheng mellom de to variablene.
- Positivt forhold: regresjonslinjen skråner oppover med den nedre enden av linjen ved y-avskjæringen (akse) av grafen og den øvre enden av linjen som strekker seg oppover i graffeltet, vekk fra x-avskjæringen (akse). Det er et positivt lineært forhold mellom de to variablene: når verdien av en øker, øker verdien av den andre også.
- Negativt forhold: Regresjonslinjen skråner nedover med den øvre enden av linjen ved y-avskjæringen (akse) av grafen og den nedre enden av linjen som strekker seg nedover i graffeltet, mot x-avskjæringen (akse). Det er et negativt lineært forhold mellom de to variablene: når verdien av en øker, reduseres verdien av den andre.
Den Estimerte Lineære Regresjonsligningen
Hvis parametrene for populasjonen var kjent, kunne den enkle lineære regresjonsligningen (vist nedenfor) brukes til å beregne middelverdien av y for en kjent verdi av x.
Ε (y) = β0 +ß 1x + ε
i praksis er parameterverdier generelt ikke kjent, så de må estimeres ved å bruke data fra et utvalg av befolkningen. Populasjonsparametrene estimeres ved hjelp av utvalgsstatistikk. Prøvestatistikkene er representert av β0 og β1. Når utvalgsstatistikken er erstattet av populasjonsparametrene, dannes den estimerte regresjonsligningen.
den estimerte regresjonsligningen er:
(ŷ) = β0 +ß1x+ε
Merk: (ŷ) er pronouncedy hatt.
grafen for den estimerte enkle regresjonsligningen kalles den estimerte regresjonslinjen.
- β0 er y-avskjæringen av regresjonslinjen.
- β1 er skråningen.
- (ŷ) er den estimerte verdien av y for en gitt verdi av x.
Grenser For Enkel Lineær Regresjon
Selv de beste dataene forteller ikke en komplett historie. Regresjonsanalyse Brukes ofte i forskning for å fastslå at en korrelasjon eksisterer mellom variabler. Men korrelasjon er ikke det samme som årsakssammenheng: et forhold mellom to variabler betyr ikke at en forårsaker den andre til å skje. Selv en linje i en enkel lineær regresjon som passer til datapunktene godt, kan ikke garantere et årsakssammenheng.
ved å Bruke en lineær regresjonsmodell kan du oppdage om et forhold mellom variabler eksisterer i det hele tatt. For å forstå nøyaktig hva dette forholdet er, og om en variabel forårsaker en annen, trenger du ytterligere forskning og statistisk analyse.