korelace je míra nebo stupeň vztahu mezi dvěma proměnnými. Soubor dat může být pozitivně korelován, negativně korelován nebo vůbec nekorelován. Jak se jedna sada hodnot zvyšuje, druhá sada má tendenci se zvyšovat, pak se nazývá pozitivní korelace.
protože jedna sada hodnot zvyšuje, druhá sada má tendenci klesat, pak se nazývá negativní korelace.
pokud změna hodnot jedné sady neovlivní hodnoty druhé, pak proměnné mají „žádnou korelaci“ nebo “ nulovou korelaci.“
kauzální vztah mezi dvěma událostmi existuje, pokud výskyt první způsobí druhou. První událost se nazývá příčina a druhá událost se nazývá efekt. Korelace mezi dvěma proměnnými neznamená příčinnou souvislost. Na druhou stranu, pokud existuje kauzální vztah mezi dvěma proměnnými, musí být korelovány.
příklad:
studie ukazuje, že existuje negativní korelace mezi úzkostí studenta před testem a skóre studenta v testu. Nemůžeme však říci,že úzkost způsobuje nižší skóre testu; mohou existovat i jiné důvody-například student nemusí dobře studovat. Korelace zde tedy neznamená příčinnou souvislost.
zvažte však pozitivní korelaci mezi počtem hodin, které strávíte studiem testu, a známkou, kterou získáte v testu. Tady, existuje také příčinná souvislost; pokud budete trávit více času studiem, to má za následek vyšší stupeň.
Jedním z nejčastěji používaných opatření korelace Pearson Product Moment Correlation nebo Pearsonův korelační koeficient. Měří se pomocí vzorce,
r x y = n ∑ xy − ∑ x ∑ y ( n ∑ x 2 − ( ∑ x ) 2 ) ( n ∑ y 2 − ( ∑ y ) 2 )
hodnota Pearsonův korelační koeficient se liší od − 1 do + 1, kde -1 značí silnou negativní korelaci a + 1 značí silnou pozitivní korelaci.