lineaarisia regressiomalleja käytetään osoittamaan tai ennustamaan kahden muuttujan tai tekijän välistä suhdetta. Tekijä, joka on ennustettu (tekijä, että yhtälö ratkaisee) kutsutaan riippuvainen muuttuja. Riippuvan muuttujan arvon ennustamiseen käytettäviä tekijöitä kutsutaan itsenäisiksi muuttujiksi.
lineaarisessa regressiossa jokainen havainto koostuu kahdesta arvosta. Yksi arvo on riippuvainen muuttuja ja yksi arvo on riippumaton muuttuja. Tässä yksinkertaisessa mallissa suora approksimoi riippuvan muuttujan ja itsenäisen muuttujan suhdetta.
kun regressioanalyysissä käytetään kahta tai useampaa toisistaan riippumatonta muuttujaa, malli ei ole enää yksinkertainen lineaarinen. Tätä kutsutaan moninkertaiseksi regressioksi.
yksinkertaisen lineaarisen regressiomallin kaava
yksinkertaiseen lineaariseen regressioanalyysiin osallistuvat kaksi tekijää nimetään x: ksi ja y: ksi. Yhtälö, joka kuvaa miten y liittyy x: ään, tunnetaan regressiomallina.
yksinkertaista lineaarista regressiomallia edustaa:
y = β0 +ß1x+ε
lineaarinen regressiomalli sisältää virhetermin, jota edustaa ε. Virhetermiä käytetään selittämään Y: n vaihtelua, jota ei voida selittää X: n ja y: n lineaarisella suhteella. jos ε: ta ei olisi, se tarkoittaisi, että X: n tietäminen antaisi riittävästi tietoa Y: n arvon määrittämiseksi.
on myös muuttujia, jotka edustavat tutkittavaa perusjoukkoa. Näitä mallin parametreja edustavat β0 ja β1.
yksinkertainen lineaarinen regressioyhtälö on graafisesti suora, jossa:
- β0 on regressiolinjan y-leikkaus.
- β1 on rinne.
- Ε(y) on Y: n keskiarvo tai odotusarvo annetulle X: n arvolle.
regressiolinja voi osoittaa positiivisen lineaarisen suhteen, negatiivisen lineaarisen suhteen tai ei suhdetta.
- ei suhdetta: yksinkertaisessa lineaarisessa regressiossa graafinen linja on tasainen (ei kalteva). Näiden kahden muuttujan välillä ei ole yhteyttä.
- positiivinen suhde: regressiolinja on ylöspäin viivan alapään ollessa kuvaajan y-leikkauspisteessä (akselilla) ja viivan yläpään ulottuessa ylöspäin graafikenttään, poispäin x-leikkauspisteestä (akselilla). Näiden kahden muuttujan välillä on positiivinen lineaarinen suhde: kun toisen arvo kasvaa, kasvaa myös toisen arvo.
- negatiivinen suhde: Regressiolinja laskee viivan yläpään ollessa kuvaajan y-leikkauspisteessä (akselilla) ja viivan alapään ulottuessa alaspäin kuvaajakenttään kohti x-leikkauspistettä (akselilla). Kahden muuttujan välillä on negatiivinen lineaarinen suhde: kun toisen arvo kasvaa, toisen arvo pienenee.
arvioitu Lineaarinen regressioyhtälö
Jos populaation parametrit olivat tiedossa, yksinkertaisen lineaarisen regressioyhtälön (esitetty alla) avulla voitiin laskea Y: n keskiarvo tunnetulle X: n arvolle.
Ε(y) = β0 +ß1x+ε
käytännössä parametriarvoja ei kuitenkaan yleensä tunneta, joten ne on estimoitava populaation otoksesta saatujen tietojen perusteella. Väestöparametrit arvioidaan otostilastojen avulla. Otostilastoja edustavat β0 ja β1. Kun otostilastot korvataan populaatioparametreilla, muodostetaan estimoitu regressioyhtälö.
estimoitu regressioyhtälö on:
(ŷ) = β0 +ß1x+ε
Huom: (ŷ) on proncedy hat.
estimoidun yksinkertaisen regressioyhtälön kuvaajaa kutsutaan estimoiduksi regressiolinjaksi.
- β0 on regressiolinjan y-leikkaus.
- β1 on rinne.
- (ŷ) on Y: n estimoitu arvo annetulle X: n arvolle.
yksinkertaisen lineaarisen Regression rajat
paraskaan tieto ei kerro täydellistä tarinaa.
regressioanalyysia käytetään yleisesti tutkimuksessa osoittamaan, että muuttujien välillä on korrelaatio. Mutta korrelaatio ei ole sama kuin syy-yhteys: kahden muuttujan suhde ei tarkoita, että toinen aiheuttaa toisen. Edes viiva yksinkertaisessa lineaarisessa regressiossa, joka sopii datapisteisiin hyvin, ei välttämättä takaa syy-seuraussuhdetta.
käyttämällä lineaarista regressiomallia voidaan selvittää, onko muuttujien välistä suhdetta ylipäätään olemassa. Jotta ymmärtäisit tarkalleen, mikä tämä suhde on ja aiheuttaako yksi muuttuja toisen, tarvitset lisätutkimusta ja tilastollista analyysia.