o corelație este o măsură sau un grad de relație între două variabile. Un set de date poate fi corelat pozitiv, corelat negativ sau deloc corelat. Pe măsură ce un set de valori crește, celălalt set tinde să crească, atunci se numește o corelație pozitivă.
pe măsură ce un set de valori crește, celălalt set tinde să scadă, atunci se numește corelație negativă.
Dacă modificarea valorilor unui set nu afectează valorile celuilalt, atunci se spune că variabilele nu au „nicio corelație” sau „corelație zero.”
există o relație cauzală între două evenimente dacă apariția primului provoacă celălalt. Primul eveniment se numește cauză, iar al doilea eveniment se numește efect. O corelație între două variabile nu implică cauzalitate. Pe de altă parte, dacă există o relație cauzală între două variabile, acestea trebuie corelate.
exemplu:
un studiu arată că există o corelație negativă între anxietatea unui student înainte de un test și scorul elevului la test. Dar nu putem spune că anxietatea provoacă un scor mai mic la test; ar putea exista și alte motive—este posibil ca elevul să nu fi studiat bine, de exemplu. Deci corelația de aici nu implică cauzalitate. cu toate acestea, luați în considerare corelația pozitivă dintre numărul de ore pe care le petreceți studiind pentru un test și nota pe care o obțineți la test. Aici, există și cauzalitate; dacă petreceți mai mult timp studiind, rezultă o notă mai mare.
una dintre cele mai frecvent utilizate măsuri de corelație este corelația momentului produsului Pearson sau coeficientul de corelație al lui Pearson. Aceasta este măsurată cu ajutorul formulei,
r x y = n ∑ x y − ∑ x ∑ y ( n ∑ x 2 − ( ∑ x ) 2 ) ( n ∑ y 2 − ( ∑ y ) 2 )
valoarea de corelație Pearson coeficientul de varia de la − 1 la + 1, unde -1 indică o corelație negativă puternică și de + 1 indică o corelație pozitivă puternică.