Escolar Documentos
Profissional Documentos
Cultura Documentos
MODELOS DE REGRESIN
APLICADOS
CAPITULO I: MODELOS DE
REGRESIN MLTIPLE
Ideas bsicas
El modelo y los supuestos.
Estimacin de los coeficientes.
Valores ajustados y residuales.
Inferencias.
Coeficientes de determinacin
Prueba de hiptesis.
Predictores cualitativos
Ideas bsicas
Objetivos
Un estudio .....................
Unidad:
Variable respuesta:
Predictores :
..........................
..........................
..
..
...........................
Construccin de un modelo de regresin
Seleccin de predictores.
Forma funcional de la relacin en la regresin.
Alcance del modelo.
Seleccin de predictores
Observacionales:
No es posible controlar las variables explicativas.
No da informacin adecuada acerca de las relaciones de causa
y efecto.
Debe investigarse si otras variables explicativas pueden
explicar ms directamente estas relaciones.
Experimentales:
Los niveles de los predictores son controlados y las
observaciones pueden ser asignadas aleatoriamente a cada
nivel.
Los resultados pueden dar informacin ms fuerte sobre las
relaciones de causa y efecto ya que la aleatorizacin tiende a
balancear los efectos de cualquier otra variable que pueda
afectar la respuesta.
El modelo y los supuestos
Objetivos
yi E Y | xi i Y | xi i
La media condicional se puede modelar. La forma ms simple es
expresar esta media en funcin del predictor de una forma lineal:
Y | x 0 1 xi
i
Y | x 0 1 xi yi
i
Modelo de regresin general
Distribucn
de Y para X1
Ecuacin de
regresin
Medias en crecimiento lineal
Representar grficamente:
Y | x E[Y | X x4 ] y 4
4
1. Las medias decrecen a un ritmo de 3
unidades al aumentar la X en 2 unidades.
2. La varianza crece al aumentar el valor de X.
Necesidad de ms de un predictor
yi EY | X i i
Se modela la media condicional como un hiperplano:
E[Y | X i ] 0 1 xi1 2 xi 2 ... p 1 xi , p 1
i yi E (Y | X i )
ri yi Y | X i yi y i
Supuestos sobre las variables
~ N (0, I ) 2
Normalidad y homoscedasticidad
Estimacin de los
coeficientes
Objetivos
Elegir de tal forma que los valores estimados (yi)
estn tan cerca como sea posible de las observaciones
reales ( yi ).
Una forma es minimizar la suma de cuadrados de los
residuos:
Q yi y i ri 2
2
Suma de cuadrados residual
Q ri 2 yi y i
2
Q yi ( 0 1 xi1 2 xi 2 ... p 1 xi , p 1 )
2
Q (Y X )T (Y X )
Q Y T Y T X T Y Y T X T X T X
Q Y T Y 2 T X T Y T X T X
Minimizacin de la suma de cuadrados residual
r T r Y T Y 2 T X T Y T X T X
(r T r )
2 X T Y 2 X T X 0
Las soluciones en para esta ecuacin son las
estimaciones de mnimos cuadrados de los coeficientes de
regresin.
X X X T Y
1
T
Estimacin de mxima verosimilitud
i ~ N(0, 2)
1 2
f i i ri
1
exp 2 ri
2
2 1/ 2
2
n
1 1 2 1 1 2
L( , )
2
i 1 2 2 1/ 2
exp 2 ri
2 2
2 n/2
exp 2
2
i
r
Estimacin de mxima verosimilitud
r 2
2
i
2 2
n/2 2
1 68,5 16.7
1 1 21.0 360.0
45.2 16.8
1 ... 1302.4
X ' X 68.5 45.2 52.3 1302.4 87707.9 22609.2
1
...
... ... ...
16.7 16.8 16.0 360.0 22609.2 6190.3
52.3 16.0
...
1
174.4
29.7289 .0722 1.9926 1 1 ... 1 3820
.0722 .00037 .0056 X 'Y 68.5 45.2 52.3 249643
164 .4
X ' X 1 ...
...
1.9926 .0056 .1363 16.7 16.8 ... 16.0 66073
166 . 5
Ejemplo (continuacin)
El vector de coeficientes estimados
y i 0 1 xi1 2 xi 2 ... p 1 xi , p 1
Ejemplo (continuacin)
Y X
s rXX
1
rYX
s s p 1
i Y i 0 y i xi
sX
i i 1
Ejemplo (continuacin)
Coeficientes estandarizados
Y 181.9
p 1
0 y i xi 181.9 1.45 62.02 9.37 17.14 68.6
X 1 62.02 0
i 1
X 2 17.14
SC Re s r' r
2
n p n p
Ejemplo (continuacin)
SCE 2180.93
2
121.1626
n p 21 3
Inferencias sobre los coeficientes
Estimacin puntual:
X X X T Y
1
T
E.E.( i ) 2 X T X
1
ii
Ejemplo (continuacin)
i t / 2,n p E.E.(i )
Var(Yh ) X h Var( ) X h
T
185.3 Yh 196.9
Ejemplo (continuacin)
167.3 Yh 214.9
Coeficientes de
determinacin
Objetivos
yi y ( yi yi ) ( yi y )
Observado Ajustado
respecto al respecto
ajustado a la
media
Particin de la suma de cuadrados
iy y 2
i i i
( y
y )
2
(
y y )
2
SCE
R 1
2
SCTot
Porcin no
explicada
Efecto de agregar predictores
1/8
1/4
3/4 5/8
SC Re g ( X 2 X1 ) SCE( X1 ) SCE( X1 , X 2 )
3 / 4 5 / 8 1/ 8
Coeficientes de determinacin parcial
SCR( X 2 X 1 )
r 2
Y 2 ,1
SCE ( X 1 )
Similarmente, el coeficiente de determinacin parcial entre Y y
X3, dado que X1 y X2 estn en el modelo se denota como
.rY23,12 y se define como:
SCR( X 3 X 1 , X 2 )
r 2
Y 3,12
SCE ( X 1 , X 2 )
Prueba de hiptesis
Objetivos
H0 :w
HA :W
( SCEw SCEW ) /( q p ) q : dim( W)
F ~ Fq p ,n q
SCEW /( n q) p : dim( w )
Prueba de todos los predictores
H0: y
H 0 : 1 2 ... p 1 0
HA : y X
( SCT SCEW ) /( p 1)
F ~ Fp 1,n p
SCEW /( n p)
Ejemplo: Ahorros
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 28.5660865 7.3545161 3.884 0.000334 ***
pop15 -0.4611931 0.1446422 -3.189 0.002603 **
pop75 -1.6914977 1.0835989 -1.561 0.125530
dpi -0.0003369 0.0009311 -0.362 0.719173
ddpi 0.4096949 0.1961971 2.088 0.042471 *
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
n-p=50-5
p-1=5-1
Prueba de un predictor
H 0 : y 1 X 1 2 X 2 ... i 1 X i 1 i 1 X i 1 ... p X p
H 0 : i 0
HA : y 1 X 1 2 X 2 ... i X i ... p X p
t n2 p F1,n p
Ejemplo (continuacin)
Coefficients:
Estimate Std. Error t value Pr(>|t|) 0.46
t 3.19
0.14
(Intercept) 28.5660865 7.3545161 3.884 0.000334 ***
pop15 -0.4611931 0.1446422 -3.189 0.002603 **
(797.72 650.71)
F 10.2
650.71 / 45
(3.19) 2 10.2
0.46
t 3.19
0.14
Efectos combinados
H 0 : y 1 X 1 2 X 2 ... jk ( X j X k ) ... p X p
H0 : j k
H A : y 1 X 1 2 X 2 ... i X i ... p X p
Ejemplo (continuacin)
(673.63 650.71) / 1
F 1.58
650.71 / 45
Prueba de un coeficiente
igual a una constante
H 0 : y 1 X 1 2 X 2 ... X j ... p X p
H0 : j
H A : y 1 X 1 2 X 2 ... j X j ... p X p
j
t ~ tn p
E.E.( j )
Ejemplo (continuacin)
0.41 0.5
t 0.46
0.196
(0.46) 2 0.21
Ejemplo (continuacin)
yi 0 1 xi1 2 xi 2 i
Si la firma es tipo stock (X2=1), el modelo se reduce a:
yi 0 1 xi1 2 i (0 2 ) 1 xi1 i
Si la firma es tipo mutual (X2=0), el modelo se reduce a:
yi 0 1 xi1 i
Modelo
Stock:
y i( s ) (33.87 8.065) 0.102 xi1 41.935 0.102 xi1
Mutual:
yi 0 1 xi1 2 xi 2 3 xi1 xi 2 i
Si la firma es tipo stock (X2=1), el modelo se reduce a:
yi( m ) 0 1 xi1 i
Reduccin del modelo
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 33.84 2.44 13.864 2.47e-10 ***
Tamano -0.10 0.01 -7.779 7.97e-07 ***
Tipo1Stock 8.13 3.65 2.225 0.0408 *
Tamano:Tipo1Stock -0.0004 0.02 -0.023 0.9821
Ejemplo con Tiempo2
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 33.84 2.44 13.86 2.47e-10 ***
Tamano -0.05 0.01 -3.95 0.00115 **
Tipo1Stock 8.13 3.65 2.22 0.04079 *
Tamano:Tipo1Stock -0.05 0.02 -2.75 0.01422 *
Comparacin de rectas
Var 2 3 X1 Var 2 X12Var 3 2 X1Cov 2 , 3
Para la construccin del intervalo de confianza se usa un t1-/2,n-p.
Predictores con ms de dos categoras
Ejemplo: Trfico
yi 0 1 xi1 2 xi 2 3 xi 3 4 xi 4 i
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 9.32 0.64 14.5 < 2e-16 ***
CTYPOP 6.5e-06 9.8e-06 0.662 0.51
as.factor(CLASS)2 -1.85 0.66 -2.82 0.006 **
as.factor(CLASS)3 0.87 0.76 1.13 0.26
as.factor(CLASS)4 -0.45 0.68 -0.66 0.51
CTYPOP:as.factor(CLASS)2 -5.4e-06 9.8e-06 -0.554 0.58
CTYPOP:as.factor(CLASS)3 -5.0e-06 9.8e-06 -0.510 0.61
CTYPOP:as.factor(CLASS)4 -5.2e-06 9.8e-06 -0.531 0.60
Interaccin no significativa
Modelo sin interaccin
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 9.62 0.32 30.4 < 2e-16 ***
CTYPOP 1.3e-06 3.1e-07 4.1 6.52e-05 ***
as.factor(CLASS)2 -2.17 0.34 -6.4 3.00e-09 ***
as.factor(CLASS)3 0.68 0.41 1.6 0.1025
as.factor(CLASS)4 -0.75 0.36 -2.1 0.0413 *