Una correlazione è una misura o grado di relazione tra due variabili. Un insieme di dati può essere correlato positivamente, correlato negativamente o non correlato affatto. Come un insieme di valori aumenta l’altro insieme tende ad aumentare allora è chiamato una correlazione positiva.
Come un insieme di valori aumenta l’altro insieme tende a diminuire allora è chiamato una correlazione negativa.
Se la modifica dei valori di un set non influisce sui valori dell’altro, si dice che le variabili abbiano “nessuna correlazione” o “correlazione zero.”
Esiste una relazione causale tra due eventi se il verificarsi del primo causa l’altro. Il primo evento è chiamato la causa e il secondo evento è chiamato l’effetto. Una correlazione tra due variabili non implica causalità. D’altra parte, se esiste una relazione causale tra due variabili, devono essere correlate.
Esempio:
Uno studio mostra che esiste una correlazione negativa tra l’ansia di uno studente prima di un test e il punteggio dello studente sul test. Ma non possiamo dire che l’ansia provoca un punteggio più basso sul test; ci potrebbero essere altri motivi—lo studente potrebbe non aver studiato bene, per esempio. Quindi la correlazione qui non implica causalità.
Tuttavia, considera la correlazione positiva tra il numero di ore che trascorri a studiare per un test e il voto che ottieni nel test. Qui, c’è anche la causalità; se si spende più tempo a studiare, si traduce in un grado superiore.
Una delle misure di correlazione più comunemente utilizzate è la correlazione del momento del prodotto di Pearson o il coefficiente di correlazione di Pearson. Essa è misurata utilizzando la formula,
r x y = n ∑ x y − ∑ x ∑ y ( n ∑ x 2 − ( ∑ x ) 2 ) ( n ∑ y 2 − ( ∑ y ) 2 )
Il valore del coefficiente di correlazione di Pearson variare da − 1 a + 1, dove 1 indica una forte correlazione negativa e + 1 indica una forte correlazione positiva.