en korrelation er et mål eller en grad af forhold mellem to variabler. Et sæt data kan være positivt korreleret, negativt korreleret eller slet ikke korreleret. Når et sæt værdier øges, har det andet sæt en tendens til at stige, så kaldes det en positiv korrelation.
da et sæt værdier stiger, har det andet sæt tendens til at falde, så kaldes det en negativ korrelation.
hvis ændringen i værdier for det ene sæt ikke påvirker værdierne for det andet, siges variablerne at have “ingen korrelation” eller “nul korrelation.”
en årsagssammenhæng mellem to begivenheder eksisterer, hvis forekomsten af den første forårsager den anden. Den første begivenhed kaldes årsagen, og den anden begivenhed kaldes effekten. En sammenhæng mellem to variabler indebærer ikke årsagssammenhæng. På den anden side, hvis der er et årsagsforhold mellem to variabler, skal de korreleres.
eksempel:
en undersøgelse viser, at der er en negativ sammenhæng mellem en studerendes angst før en test og den studerendes score på testen. Men vi kan ikke sige, at angsten forårsager en lavere score på testen; der kan være andre grunde—den studerende har måske ikke studeret godt, for eksempel. Så korrelationen her indebærer ikke årsagssammenhæng.
overvej dog den positive sammenhæng mellem antallet af timer, du bruger på at studere til en test, og den karakter, du får på testen. Her er der også årsagssammenhæng; hvis du bruger mere tid på at studere, resulterer det i en højere karakter.
et af de mest almindeligt anvendte målinger af korrelation er Pearson Produktmomentkorrelation eller Pearsons korrelationskoefficient. Det er målt ved hjælp af følgende formel,
f x y = n ∑ x y − ∑ x ∑ y ( n ∑ x 2 − ( ∑ x ) 2 ) ( n ∑ y 2 − ( ∑ y ) 2 )
værdien af Pearson ‘ s korrelationskoefficient variere fra − 1 til + 1, hvor -1 indikerer en stærk negativ korrelation og + 1 indikerer en stærk positiv korrelation.