korelacja jest miarą lub stopniem zależności między dwiema zmiennymi . Zestaw danych może być pozytywnie skorelowany, negatywnie skorelowany lub w ogóle nie skorelowany. Ponieważ jeden zbiór wartości zwiększa drugi zbiór ma tendencję do wzrostu, nazywa się to korelacją dodatnią.
ponieważ jeden zbiór wartości zwiększa drugi zbiór ma tendencję do zmniejszania się, wtedy nazywa się to korelacją ujemną.
Jeśli zmiana wartości jednego zestawu nie wpływa na wartości drugiego, wtedy mówi się, że zmienne mają „brak korelacji” lub „Zero korelacji.”
związek przyczynowy między dwoma zdarzeniami istnieje, jeśli wystąpienie pierwszego powoduje drugie. Pierwsze zdarzenie nazywa się przyczyną, a drugie-skutkiem. Korelacja między dwiema zmiennymi nie oznacza związku przyczynowego. Z drugiej strony, jeśli istnieje związek przyczynowy między dwiema zmiennymi, muszą one być skorelowane.
przykład:
badanie pokazuje, że istnieje negatywna korelacja między lękiem ucznia przed testem a wynikiem ucznia na teście. Ale nie możemy powiedzieć, że lęk powoduje niższy wynik na teście; mogą być inne powody-uczeń może nie studiował dobrze, na przykład. Korelacja tutaj nie oznacza związku przyczynowego.
należy jednak wziąć pod uwagę pozytywną korelację między liczbą godzin spędzonych na nauce do testu a oceną, którą uzyskasz na teście. Tutaj również istnieje związek przyczynowy; jeśli spędzasz więcej czasu na nauce, skutkuje to wyższą oceną.
jedną z najczęściej stosowanych miar korelacji jest korelacja momentu Pearsona lub współczynnik korelacji Pearsona. Mierzona jest za pomocą wzoru,
p x R = N ∑ x i y − ∑ x ∑ u ( n ∑ X2 − ( ∑ x ) 2 ) ( n ∑ d 2 − ( ∑ Y ) i 2 )
wartość Pearsona współczynnik korelacji wahają się od − 1 do + 1, gdzie -1 mówi o silnej ujemnej korelacji i + 1 świadczy o silnej pozytywnej korelacji.