Você está na página 1de 2

Regressão Linear Simples

A regressão linear simples estuda a relação de uma variável independente sobre uma variável
dependente. A variável dependente vai ser explicada pela regressão, enquanto a variável
independente explica a variação na variável dependente. É amplamente utilizada para prever
cenários ou comportamentos com base na associação entre as variáveis.
Importante lembrar que, ao analisar uma regressão simples, é importante ter em mente qual é
a variável dependente e independente, caso contrário, a análise não fará sentido. Por exemplo:
a autonomia de um certo modelo de carro depende do consumo, porém o consumo não
depende da autonomia.
“Algebricamente” falando, uma regressão linear simples é uma equação matemática de duas
variáveis e apresenta a relação entre as variáveis, por meio de uma linha reta, crescente ou
decrescente (linha de tendência). Sendo:

ou
y = variável dependente x = variável independente/preditora ε = erro
Beta0 / alpha = termo constante Beta1 = inclinação da reta

Sendo assim, para calcular Beta1/Beta e


Beta0/alpha, usamos as seguintes fórmulas.
Sendo N o tamanho da amostra. A partir
desses resultados, é possível montar a
equação da regressão e, a partir desta,
começar a fazer as análises.

Interpretações: a partir da equação pronta, podemos tirar conclusões e fazer previsões com
base nela. Uma interpretação generalista é que: para cada 1 unidade de acréscimo/decréscimo
de Y, é esperado um acréscimo/decréscimo de B1 unidades em Y.

Avaliando o Modelo

● Anova: consiste na análise da variância da regressão, levando em consideração a


soma dos quadrados do total, do modelo e do resíduo. Sendo SQT = SQE + SQR. A
partir disso é calculado o Quadrado Médio (QM) de ambos e, por fim, o teste F, que
consiste na razão entre QME e QMR.
● Coeficiente de determinação: explica a proporção de variabilidade de J explicada
pela variabilidade K, ou seja, tomando base o conceito de regressão linear, é o quanto
da variabilidade pode ser explicada pelo modelo. Seu resultado deve estar entre 0 e 1,
sendo que quanto mais próximo de 1 melhor.
● Coeficiente de relação linear: mede a relação entre as variáveis. É um número entre
-1 e 1, sendo que um coef. de correlação muito próximo ou igual a zero indica que as
não possuem correlação, sendo considerado fraco. Quanto mais próximo de 1 (relação
linear positiva) ou de -1 (correlação linear negativa), o coeficiente é considerado forte.
● Teste de Significância dos Parâmetros: é o teste de hipótese que avalia a
significância do Beta0 e Beta1 de acordo com a razão entre Beta e seu erro padrão
respectivo. Caso Beta seja 0, não é significante, caso Beta seja diferente de 0, é
significante.
A relação entre crescimento econômico e taxa de desemprego pode ser demonstrada pela Lei
de Okun, que demonstra empiricamente o comportamento inverso entre as variações nas
taxas de desemprego (em pontos percentuais) e a variação do Produto Interno Bruto (PIB).
Faça um modelo regressão seguindo a lei de Okun e faça análises com os seguintes dados:

Equação de regressão estimada: Y = 0,1481 - 0,1241.X Teste T: 0,1615 e 0,1352


R quadrado: 0,2691 Coef. de Correlação: -0,5188 valor-p = 0,1877

Interpretação: nota-se que o acréscimo de 1 ponto percentual no PIB faz com que a taxa de
desemprego diminua 0,1241 pontos percentuais. A partir disso, com o auxílio do coef. de
correlação, sendo este considerado forte, pois é mais próximo de 1 do que de 0, podemos
comprovar a tese dada inicialmente de que o comportamento entre PIB e taxa de desemprego
possui correlação linear negativa na economia.

Um ponto importante a se notar é que o coeficiente de determinação do modelo é considerado


muito baixo, logo, auferindo um pouco poder de explicação, sendo que 26,91% da variação
total da taxa de desemprego é explicada pela variação do PIB, porém, deve ser levado em
consideração que para avaliar a qualidade do modelo a autocorrelação dos resíduos, assim
sendo necessário o Teste de Durbin-Watson para averiguar o poder de explicação real do
modelo.

De acordo com o teste de significância de parâmetros, os betas encontrados são significativos


para a regressão. Além disso, o valor-p também indica que a regressão é validada. A região
de Validade dos dados está entre -10,7 e 1,4.

Você também pode gostar