a correlação é uma medida ou grau de relação entre duas variáveis. Um conjunto de dados pode ser positivamente correlacionado, negativamente correlacionado ou não correlacionado em tudo. Como um conjunto de valores aumenta o outro conjunto tende a aumentar, então é chamado de correlação positiva.
como um conjunto de valores aumenta o outro conjunto tende a diminuir, então é chamado de correlação negativa.
Se a alteração nos valores de um conjunto não afeta os valores do outro, então as variáveis são ditas ter “nenhuma correlação” ou “correlação zero”.”
Existe uma relação causal entre dois eventos se a ocorrência da primeira causa a outra. O primeiro evento é chamado de causa e o segundo evento é chamado de efeito. Uma correlação entre duas variáveis não implica causalidade. Por outro lado, se houver uma relação causal entre duas variáveis, elas devem ser correlacionadas.
exemplo:
Um estudo mostra que existe uma correlação negativa entre a ansiedade de um estudante antes de um teste e a pontuação do estudante no teste. Mas não podemos dizer que a ansiedade causa uma pontuação mais baixa no teste; pode haver outras razões—o estudante pode não ter estudado bem, por exemplo. Portanto, a correlação aqui não implica causalidade.
no entanto, considere a correlação positiva entre o número de horas que você passa estudando para um teste e a nota que você obtém no teste. Aqui, há também a causa.; se você passar mais tempo estudando, isso resulta em uma nota mais alta.
uma das medidas de correlação mais utilizadas é a correlação de momento do produto Pearson ou o coeficiente de correlação de Pearson. Ele é medido usando-se a fórmula,
r x y = n ∑ xy − ∑ x ∑ y ( n ∑ x 2 − ( ∑ x ) 2 ) ( n ∑ y 2 − ( ∑ y ) 2 )
O valor de Pearson o coeficiente de correlação varia de − 1 a + 1, onde 1 indica uma forte correlação negativa e + 1 indica uma forte correlação positiva.