Escolar Documentos
Profissional Documentos
Cultura Documentos
Ejemplo
NACION %INMUNIZACION 1 "Bolivia" 77 2 "Brazil" 69 3 "Cambodia" 32 4 "Canada" 85 5 "China" 94 6 "Czech_Republic" 99 7 "Egypt" 89 8 "Ethiopia" 13 9 "Finland" 95 10 "France" 95 11 "Greece" 54 12 "India" 89 13 "Italy" 95 14 "Japan" 87 15 "Mexico" 91 16 "Poland" 98 17 "Russian_Federation" 73 18 "Senegal" 47 19 "Turkey" 76 20 "United_Kingdom" 90
Edgar Acua Analisis de Regresion Enero, 2008
Edgar Acua
Edgar Acua
Edgar Acua
Y = + X +
Considerando la muestra (Xi,Yi) para i=1,n
Yi = + X i+ei
Suposiciones del modelo:
La variable predictora X es no aleatoria Los errores ei son variables aleatorias con media 0 y varianza constante 2. Los errores ei y e j (ij=1,n) son independientes entre si
Edgar Acua Analisis de Regresion Enero, 2008 7
Q(, ) =
n
i =1
2 i
(y
i =1
x i ) 2
Derivando se obtiene un par de ecuaciones normales para el modelo, cuya solucion produce
= nxi yi xi yi
i=1 n n n i=1 n i=1
O equivalentemente
S xy S xx
nx (xi )
i=1 2 i i=1
x = y
Analisis de Regresion Enero, 2008 8
Edgar Acua
Edgar Acua
c) La varianza de es
1 x2 ( + ) n Sxx
2
2
Sxx
y la
de
es
Edgar Acua
10
r x
i =1
n i =1 i
=0
=0
r y
)
i
Edgar Acua
11
n2
r
i =1
n2
(MSE)
Edgar Acua
12
( yi y ) 2 =
i =1
) ( yi yi ) 2 +
i =1
n i =1
(y
y) 2
SSR =
2 ( x x ) i i =1
Edgar Acua
13
Un modelo de regresion con R mayor o igual a 75% se puede considerar bastante aceptable. Nota: El valor de R es afectado por la presencia de valores anormales.
2
Edgar Acua
14
Edgar Acua
15
Las sumas de cuadrados son formas cuadrticas del vector aleatorio Y y por lo tanto se distribuyen como una Ji-cuadrado. Se pueden establecer los siguientes resultados: i)
SST
2
SSE
ii)
2 ( n 2)
Equivalentemente
(n 2) s 2
~ (2n 2)
iii)
SSR
2S ) = 2 + 2S E ( SSR ) = E ( xx xx
Edgar Acua Analisis de Regresion Enero, 2008 16
Edgar Acua
17
Edgar Acua
18
1 x2 ) 1 x2 ( t ( n 2, / 2 ) s + , + t ( n 2, / 2 ) s + ) n Sxx n Sxx )
Edgar Acua
19
Prueba Estadstica
t=
~ t( n 2)
Rechazar Ho
si tcal<-t(,n-2) si |tcal |>t(/2,n-2) si tcal>t(,n-2) *Un P-value cercano a cero sugiere rechazar la hiptesis nula.
Edgar Acua Analisis de Regresion Enero, 2008 20
Edgar Acua
22
E(Y / x = x0 ) = + x0
xo o = + El estimador natural es Y Como las Ys se distribuyen o se distribuye normalmente con normalmente, entonces tambin Y media E(Y/X=xo)y varianza igual a:
2 ( x x ) 1 ) = 2( + 0 Var (Y ) 0 n Sxx
Edgar Acua
23
Y0 Y 0
2
se tiene
x t + 0 ( / 2 , n 2 ) s 1 +
1 ( x0 x ) + n Sxx
24
Edgar Acua
25
Tipos de residuales
i) Residual Estandarizado, se divide el residual entre la
desviacin estndar del error. Es decir, ) yi yi s
Edgar Acua
26
Edgar Acua
27
(e
i=2
i n
ei 1 ) 2
2 i
e
i =1
D vara entre 0 y 4. Si D esta cerca de 0 los errores estn correlacionados positivamente. Si D est cerca de 4 entonces la correlacin es negativa. La distribucin de D es simtrica con respecto a 2. As que un valor de D cercano a 2 indica que no hay correlacin de los errores.
Edgar Acua Analisis de Regresion Enero, 2008 29
x y
a) 1 1 b) La media condicional de Y dado X es E(Y / X ) = + x , donde: = y y = y x c) La varianzax condicional de las Y dado X, est dado por
2 2 2 y / x = y (1 )
r =
Notar que:
) Sxx r= Syy
Sxy SxxSyy
r2 =
Sxx
Syy
)2
SSR SST
Edgar Acua
31