Cos’è un modello di regressione lineare semplice e come funziona

I modelli di regressione lineare vengono utilizzati per mostrare o prevedere la relazione tra due variabili o fattori. Il fattore che viene previsto (il fattore per cui l’equazione risolve) è chiamato variabile dipendente. I fattori che vengono utilizzati per prevedere il valore della variabile dipendente sono chiamati variabili indipendenti.

Nella regressione lineare, ogni osservazione consiste di due valori. Un valore è per la variabile dipendente e un valore è per la variabile indipendente. In questo semplice modello, una linea retta approssima la relazione tra la variabile dipendente e la variabile indipendente.

Quando nell’analisi di regressione vengono utilizzate due o più variabili indipendenti, il modello non è più lineare. Questo è noto come regressione multipla.

Formula per un modello di regressione lineare semplice

I due fattori coinvolti nell’analisi di regressione lineare semplice sono designati x e y. L’equazione che descrive come y è correlata a x è nota come modello di regressione.

Il modello di regressione lineare semplice è rappresentato da:

y = β0 +ß1x+ε

Il modello di regressione lineare contiene un termine di errore rappresentato da ε. Il termine di errore è usato per spiegare la variabilità in y che non può essere spiegata dalla relazione lineare tra x e y. Se ε non fosse presente, ciò significherebbe che conoscere x fornirebbe informazioni sufficienti per determinare il valore di y.

Ci sono anche parametri che rappresentano la popolazione studiata. Questi parametri del modello sono rappresentati da β0 e β1.

La semplice equazione di regressione lineare è graficamente come una linea retta, dove:

  1. β0 è l’intercetta y della linea di regressione.
  2. β1 è la pendenza.
  3. Ε(y) è il valore medio o atteso di y per un dato valore di x.

Una linea di regressione può mostrare una relazione lineare positiva, una relazione lineare negativa o nessuna relazione.

  1. Nessuna relazione: la linea grafica in una regressione lineare semplice è piatta (non inclinata). Non esiste alcuna relazione tra le due variabili.
  2. Relazione positiva: la linea di regressione si inclina verso l’alto con l’estremità inferiore della linea all’intercetta y (asse) del grafico e l’estremità superiore della linea che si estende verso l’alto nel campo del grafico, lontano dall’intercetta x (asse). Esiste una relazione lineare positiva tra le due variabili: all’aumentare del valore di una, aumenta anche il valore dell’altra.
  3. Relazione negativa: La linea di regressione si inclina verso il basso con l’estremità superiore della linea all’intercetta y (asse) del grafico e l’estremità inferiore della linea che si estende verso il basso nel campo del grafico, verso l’intercetta x (asse). Esiste una relazione lineare negativa tra le due variabili: man mano che il valore di uno aumenta, il valore dell’altro diminuisce.

L’equazione di regressione lineare stimata

Se i parametri della popolazione erano noti, la semplice equazione di regressione lineare (mostrata sotto) potrebbe essere utilizzata per calcolare il valore medio di y per un valore noto di x.

Ε(y) = β0 +ß1x+ε

In pratica, tuttavia, i valori dei parametri generalmente non sono noti, quindi devono essere stimati utilizzando i dati di un campione della popolazione. I parametri di popolazione sono stimati utilizzando statistiche di esempio. Le statistiche del campione sono rappresentate da β0 e β1. Quando le statistiche del campione vengono sostituite per i parametri di popolazione, viene formata l’equazione di regressione stimata.

L’equazione di regressione stimata è:

(β) = β0 +ß1x+ε

Nota: (hat) è pronunciato hat.

Il grafico dell’equazione di regressione semplice stimata è chiamato linea di regressione stimata.

  1. β0 è l’intercetta y della linea di regressione.
  2. β1 è la pendenza.
  3. (ŷ) è il valore stimato di y per un dato valore di x.

Limiti di regressione lineare semplice

Anche i dati migliori non raccontano una storia completa.

L’analisi di regressione è comunemente usata nella ricerca per stabilire che esiste una correlazione tra le variabili. Ma la correlazione non è la stessa della causalità: una relazione tra due variabili non significa che una causa l’altra. Anche una linea in una semplice regressione lineare che si adatta bene ai punti dati potrebbe non garantire una relazione causa-effetto.

L’utilizzo di un modello di regressione lineare ti consentirà di scoprire se esiste una relazione tra variabili. Per capire esattamente cosa sia quella relazione e se una variabile ne causi un’altra, avrai bisogno di ulteriori ricerche e analisi statistiche.

Related Posts

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *