Escolar Documentos
Profissional Documentos
Cultura Documentos
(aula 2)
Regressão Stepwise
Regressão Forward
Regressão Stepwise
------------------------------------------------------------------------------
tempo | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
idade | .6503912 .1279417 5.08 0.000 .3804578 .9203247
acuidade | -.4538341 .0928187 -4.89 0.000 -.6496644 -.2580038
_cons | 126.5642 10.09118 12.54 0.000 105.2736 147.8547
------------------------------------------------------------------------------
Regressão Forward
A linearidade é facilmente
examinada utilizando:
Gráficos de Dispersão
Gráfico de resíduos
O gráfico de resíduos é
facilmente construído no
Não linearidade
STATA:
rvfplot, yline(0)
Se uma relação não-linear é encontrada, a abordagem mais direta é
transformar uma ou as duas variáveis de modo a ter linearidade.
Linear Y = a + bx Y = a + bx x y
Exponencial Y = a.ebx ln y = ln a + bx x ln Y
Logarítmica Y = a + b.ln x Y = a + b.ln x ln x y
hettest
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of tempo
chi2(1) = 0.14
Prob > chi2 = 0.7089
Se ocorrer heteroscedasticidade, duas ações corretivas
são possíveis:
Transformações para estabilização da variância;
Se for possível atribuir a violação a uma única
variável dependente, usar o métodos dos mínimos
quadrados ponderados poderá ser empregado.
10
predict res, resid
qnorm res
5
Residuals
0-5
-10
-10 -5 0 5 10
Inverse N ormal
Realizando o teste Shapiro Wilk, obtemos o seguinte resultado:
swilk res
------------------------------------------------------------------------------
tempo | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
idade | .0951472 .5941671 0.16 0.875 -1.158436 1.34873
sexo | -9.944194 8.144006 -1.22 0.239 -27.12654 7.238157
acuidade | -.2873334 .4653876 -0.62 0.545 -1.269215 .6945486
_cons | 147.2193 47.56397 3.10 0.007 46.8681 247.5705
------------------------------------------------------------------------------
Vamos identificar a existência de informações influentes.
180
160
140
tempo
120
100
20 25 30 35 40
idade