modelos de regressão Linear são usados para mostrar ou prever a relação entre duas variáveis ou fatores. O fator que está sendo previsto (o fator para o qual a equação resolve) é chamado de variável dependente. Os fatores que são usados para prever o valor da variável dependente são chamados de variáveis independentes.
em regressão linear, cada observação consiste em dois valores. Um valor é para a variável dependente e um valor é para a variável independente. Neste modelo simples, uma linha reta aproxima a relação entre a variável dependente e a variável independente.
Quando duas ou mais variáveis independentes são usadas na análise de regressão, o modelo não é mais um simples linear. Isto é conhecido como regressão múltipla.
fórmula para um modelo de regressão Linear simples
os dois fatores envolvidos na análise de regressão linear simples são designados x e Y. A equação que descreve como y está relacionado com x é conhecida como o modelo de regressão.
O simples modelo de regressão linear é representado por:
y = β0 +ß1x+ε
O modelo de regressão linear contém um termo de erro que é representado por ε. O termo erro é usado para contabilizar a variabilidade em y que não pode ser explicada pela relação linear entre x e y. Se ε Não estivesse presente, isso significaria que conhecer x forneceria informação suficiente para determinar o valor de Y.
também existem parâmetros que representam a população em estudo. Estes parâmetros do modelo são representados por β0 e β1.
a equação de regressão linear simples é apresentada como uma linha recta, onde:
- β0 é a ordenada na origem em y da linha de regressão.
- β1 é o declive.
- Ε(y) é o valor médio ou esperado de y para um dado valor de X.
Uma linha de regressão pode mostrar uma relação linear positiva, uma relação linear negativa, ou nenhuma relação.
- no relationship: the graphed line in a simple linear regression is flat (not sloped). Não há relação entre as duas variáveis.
- relação Positiva: A linha de regressão pistas para cima, com a extremidade inferior da linha de intercepção de y (eixo) do gráfico e a extremidade superior da linha que se estende para cima no gráfico campo, longe da intersecção de x (eixo). Há uma relação linear positiva entre as duas variáveis: à medida que o valor de uma aumenta, o valor da outra também aumenta.relação negativa: A linha de regressão pistas para baixo, com a extremidade superior da linha de intercepção de y (eixo) do gráfico e a extremidade inferior da linha estendendo-se para baixo para o gráfico do campo, em direção a intersecção de x (eixo). Há uma relação linear negativa entre as duas variáveis: à medida que o valor de uma aumenta, o valor das outras diminui.
A Equação de regressão Linear estimada
Se os parâmetros da população fossem conhecidos, a equação de regressão linear simples (mostrada abaixo) poderia ser utilizada para calcular o valor médio de y para um valor conhecido de X.
Ε (y) = β0 +ß1x+ε
na prática, contudo, os valores dos parâmetros geralmente não são conhecidos, pelo que devem ser estimados utilizando dados de uma amostra da população. Os parâmetros populacionais são estimados utilizando estatísticas por amostragem. As Estatísticas da amostra são representadas por β0 e β1. Quando as Estatísticas da amostra são substituídas pelos parâmetros da população, forma-se a equação de regressão estimada.
A estimativa da equação de regressão é:
(ŷ) = β0 +ß1x+ε
Nota: (ŷ) é pronouncedy chapéu.
o gráfico da equação de regressão simples estimada é chamado de reta de regressão estimada.
- β0 é a ordenada na origem em y da linha de regressão.
- β1 é o declive.
- (ŷ) é o valor estimado de y para um dado valor de x.
Limites de Regressão Linear Simples
Mesmo os melhores dados não contar uma história completa.
a análise de regressão é comumente usada em pesquisas para estabelecer que existe uma correlação entre variáveis. Mas a correlação não é a mesma que o nexo de causalidade.: uma relação entre duas variáveis não significa que uma causa a outra para acontecer. Mesmo uma linha em uma regressão linear simples que se encaixa os pontos de dados bem pode não garantir uma relação de causa e efeito.
usando um modelo de regressão linear irá permitir-lhe descobrir se existe alguma relação entre as variáveis. Para entender exatamente qual é essa relação, e se uma variável causa outra, você precisará de pesquisa adicional e análise estatística.