Você está na página 1de 19

PICI-109 ANALISIS DE DATOS

Ejercicios Solemne I

Problema I.- (15 puntos) Suponga una regresin lineal que incluye dos conjuntos de variables
regresoras.
Y = X11 + X 2 2 +

(a) (3 puntos) Plantee el modelo que minimiza los errores al cuadrado.


Min S(1, 2 ) = Min (Y X 1 1 X 2 2 )' (Y X 1 1 X 2 2 )

Min S(1, 2 ) = Min {Y ' Y 2( X 1 1 + X 2 2 )' Y + 2 '1 X '1 X 2 2 + '1 X '1 X 1 1 + ' 2 X ' 2 X 2 2 }

(b) (9 puntos) Encuentre las ecuaciones normales del modelo de minimizacin


S ( 1 , 2 )
= 2 X '1 Y + 2 X '1 X 11 + 2 X '1 X 2 2 = 0
1
X '1 X 11 + X '1 X 2 2 = X '1 Y

Ecuacin Normal (1)

S ( 1 , 2 )
= 2 X '2 Y + 2 X '2 X 11 + 2 X '2 X 2 2 = 0
2
X '2 X 11 + X '2 X 2 2 = X '2 Y

X '1 X 1
X ' X
2 1

X '1 X 2 1 X '1 Y
=
X '2 X 2 2 X '2 Y

Ecuacin Normal (2)

Matriz de ecuaciones normales

(c) (3 puntos) Si X1 X2, encuentre una expresin para los estimadores de 1 y 2.


Si X1 X2, entonces X1X2 = X2X1 = 0 luego,

1 = ( X '1 X 1 ) X '1 Y
1

2 = ( X '2 X 2 ) X '2 Y
1

Dr. Nicols Bronfman

Problema II. (30 puntos) El siguiente modelo de regresin representa el costo marginal de corto
plazo de la produccin de un bien (Y) en funcin del nivel de produccin del bien (X).

Y = 0 + 1 X1 + 2 X 22 + 3 X1 X 2 + 4 X 42 + 5 X 53 +
Utilizando una muestra de 121 observaciones se realiza la regresin obteniendo los siguientes
resultados.
Y = 1, 7 X 1 + X 22 + 2 X 1 X 2 + 2 X 42 + 3 X 53
0 = 0, 02; 1 = 0,85; 2 = 2; 3 = 0,5 ; 4 = 4; 5 = 0, 75
R 2 = 0,85

Responda las siguientes preguntas considerando que los datos de la muestra fueron estandarizados de
121

manera que ( yi y ) = 120 .


2

i =1

(a) (3 puntos) Cumple el modelo el supuesto bsico de linealidad?

Cumple el supuesto de linealidad porque es un modelo lineal en los parmetros aunque no sea lineal en
las variables regresoras.

(b) (7 puntos) Cul es el valor de R2Adj?

Sabemos que
R2 =

SS Re g
SS T

Luego, R

2
Adj

SS Re g
120

= 0,85

SS Re g = 120 * 0,85 = 102

SS Re s = SS T SS Re g = 18

18
(120 5) = 1 18 = 97 = 0,843
MSRe s
= 1
= 1
120
115 115
MST
120

(c) (5 puntos) Cul es el valor del test F?

F=

MSRe g
MSRe s

102

5 = 11730 = 130,3
18
90
115

Dr. Nicols Bronfman

(d) (5 puntos) Considerando nicamente los valores del test F y R2Adj obtenidos en las preguntas
anteriores qu puede concluir del modelo?

El modelo posee un muy buen ajuste (elevado R2Adj) y con alta significancia estadstica (dado el
elevado valor del test F). Sin embargo, no se puede concluir nada ms dado que no conocemos la
significancia estadstica de los coeficientes de regresin, y tampoco se sabe si los residuos cumplen con
los supuestos bsicos de un modelo de regresin mltiple.

(e) (10 puntos) Analice la significancia estadstica de las variables regresoras.

1,70
= 2, 0 > t0,025 (116 ) = 1,981
0,85
1, 00
t=
= 0,5 < t0,025 (116 ) = 1,981
2, 00
2, 00
t=
= 4, 0 > t0,025 (116 ) = 1,981
0,50
2, 00
t=
= 0,5 < t0,025 (116 ) = 1,981
4, 00
3, 00
= 4, 0 > t0,025 (116 ) = 1,981
t=
0, 75

1: t =

Se rechaza H 0 : 1 = 0

2 :

Se acepta H 0 : 2 = 0

Se rechaza H 0 : 3 = 0

Se acepta H 0 : 4 = 0

Se rechaza H 0 : 5 = 0

3:
4 :
5 :

Dr. Nicols Bronfman

Problema III.- (20 puntos)

Suponga el siguiente modelo lineal: Y = + X11+ X22+ X33+ X44+


Utilizando una muestra de 20 observaciones, y considerando un trmino constante, se realiza la
regresin de Y sobre las cuatro variables regresoras.
Complete cada una de las siguientes tablas que resumen los resultados de la regresin.
Estadsticas de la regresin
Coef. de determinacin R2 =
R2 ajustado =
Error Tpico =
Nmero de Observaciones =

ANLISIS DE VARIANZA
Grados de
libertad
Regresin

Suma de Promedio de los


cuadrados
cuadrados

140

Valor crtico
de F

4,01E-05

Residuos
Total

175
Coeficientes Error tpico

Intercepto
Variable X 1

5
6

Variable X 2

10

Variable X 4

Inferior 95%

Superior 95%

0
1,5

Variable X 3

Dr. Nicols Bronfman

Estadstico t

-14

4
15

Problema IV.- Considere el siguiente modelo de regresin lineal simple:

zi = 0 + 1wi + i

i = 1, , n

a) (6 puntos) Obtenga las ecuaciones normales resultantes de estimar los parmetros 0 y 1 siguiendo
el mtodo de mnimos cuadrados.
n

La expresin a minimizar es: S ( 0 , 1 ) = ( i ) = ( zi 0 1wi )


2

i =1

S
0

0 ,1

S
1

= 2 ( zi 0 1wi ) = 0

(1)

i =1

i =1

zi = n0 + 1 wi

i =1
n

0 ,1

i =1

= 2 ( zi 0 1wi ) wi = 0

z w = w + w

i =1

i =1

i =1

i =1

2
i

z = 0 + 1 w
n

i =1

i =1

Ecuaciones Normales

zi wi = n0 w + 1 wi2

( 2)

b) (5 puntos) Obtener los valores de 0 y 1 que minimizan los errores del modelo.
n

0 = z 1w

1 =

z ( w w) z w nzw
i =1
n

( w w)
i =1

i =1
n

w
i =1

2
i

nw2

c) (7 puntos) Escriba el modelo ajustado (o modelo emprico) a partir de las siguientes observaciones
de zi y wi.

Obs
1
2
3
4
5

W
5,0
3,0
2,0
6,0
4,0

Dr. Nicols Bronfman

Z
4,0
5,0
4,0
5,0
7,0

Obs
1
2
3
4
5
Suma=
Promedio=

W
5,0
3,0
2,0
6,0
4,0
20,0
4,0

Dr. Nicols Bronfman

Z
4,0
5,0
4,0
5,0
7,0
25,0
5,0

WZ
20,0
15,0
8,0
30,0
28,0
101,0

W^2
25,0
9,0
4,0
36,0
16,0
90,0

B1=

1/10

B0=

46/10

Z=46/10+W/10

Problema V. (20 Puntos)

Considere el modelo de regresin lineal simple yi = + xi + i . A partir de una muestra de n


observaciones, e implementando el mtodo de mnimos cuadrados, se obtiene el modelo ajustado (recta
yi = a + bxi ) mostrado en la figura.
Utilizando los datos de la figura, obtenga una expresin para medir la cantidad de variabilidad de las
observaciones explicada por el modelo ajustado.
Y

a
yi

( xi , yi )

( x, y )

b ( xi x )

yi

( xi , yi )

( xi x )

y = a + bx

xi

X
n

Sabemos que la Suma de Cuadrados Totales es = SCT = (y i y )


del grafico se desprende que ( yi y ) = ( yi y i ) ( y y i )

i =1

Elevando al cuadrado y sumando para todos los valores de i, se obtiene que:


Luego, la SCT puede expresarse como
n

(y
i =1

i =1

i =1

y ) = (y i
y i ) 2 (y i y i )(y
y i ) + (y
yi )
2

i =1

Dado que ( yi y i )( y y i ) = b ( x x i ) ei = 0
i =1

i =1

(y
i =1

y)

= ( yi y i ) + ( y y i )
i =1

i =1

Luego, la variabilidad explicada por el modelo es:


n

( y y i ) = ( yi y ) ( yi y i )
i =1

i =1

Dr. Nicols Bronfman

i =1

SSR EG = SSTOT SS RES

Problema VI.- (35 pts)

Suponga que Usted quiere invertir parte importante de sus ahorros en un proyecto que consiste en el
lanzamiento al mercado de un nuevo producto relacionado con salud y educacin. Para ello a Usted le
gustara predecir la demanda de este nuevo producto. Uno de sus asesores le indica que, dadas las
caractersticas del producto, dicha demanda podra ser estimada a partir del consumo anual de un
producto con similares caractersticas, por medio del siguiente modelo lineal:

Yt = 0 + 1 X 1t + 2 X 2 t + 3 X 3t + 4 X 4 t + t
Donde:
Yt: Consumo anual de producto con similares caractersticas (miles de unidades)
X1: Remuneracin promedio nacional (miles de pesos)
X2: Gasto pblico en salud como funcin del PIB (%)
X3: Gasto nacional en educacin por alumno en relacin al PIB per cpita (%)
X4: ndice de ocupacin anual nacional (miles de personas).
El asesor le entrega una tabla con datos histricos y una tabla con los resultados del modelo al
implementar Mnimos Cuadrados. Lamentablemente, el asesor no pudo terminar a tiempo esta ltima
tabla, y solo le envo algunos resultados.

Periodo

1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005

Remuneracin
Promedio
(M$)
X1
$ 149,7
$ 170,1
$ 188,8
$ 205,5
$ 218,6
$ 228,6
$ 240,0
$ 249,5
$ 256,9
$ 265,8
$ 273,4
$ 276,7

Dr. Nicols Bronfman

Gasto
Pblico en
salud como
% del PIB
X2
2,4
2,3
2,4
2,4
2,6
2,8
2,8
3,0
3,0
3,0
2,8
2,9

Gasto por
alumno en
relacin al PIB
per cpita (%)
X3
9,0
8,9
9,6
9,5
11,2
12,2
12,3
12,4
12,7
13,1
12,5
12,0

Ocupacin
(Miles de
Personas)
X4
5.036
5.095
5.182
5.281
5.394
5.315
5.414
5.468
5.571
5.789
5.946
6.170

Consumo
(Miles de
Unidades)
Y
199,59
234,12
282,03
327,58
365,54
397,58
430,15
467,32
515,82
564,84
597,40
654,39

Estadsticas de la regresin
Coef. de determinacin R2 =

0,998

R ajustado =

0,997

Error Tpico =

8,333

Nmero de Observaciones =

12

ANLISIS DE VARIANZA
Grados de
libertad

Valor crtico
de F

837

1,86E-09

Estadstico t

Inferior 95%

Superior 95%

Suma de Promedio de los


cuadrados
cuadrados

Regresin

232.602

58150,6

Residuos

486,0

69,4

Total

11

233.088

Coeficientes Error tpico


Intercepto

1720

96

18

1528

1920

Variable X 1

0,25

0,5

1,5

Variable X 2

92

36

20

164

Variable X 3

-5

-0,625=1

-21

11

Variable X 4

0,2

0,02

10

0,165

0,268

a) (15 puntos) Complete las tablas anteriores utilizando hasta tres decimales en la tabla estadsticos de
regresin y valores enteros en las otras dos tablas.
b) (5 puntos) Segn su opinin experta, qu le podra decir a su asesor respecto del modelo propuesto?
Justifique claramente su respuesta.

Dr. Nicols Bronfman

Problema VII.- (20 pts)

Se ha ajustado la funcin de produccin de una empresa mediante una funcin de Cobb-Douglas:

Qt = b0 Lt 1 K t 2 e t
Donde

t = 1, , 23

Qt = Produccin; Lt = Trabajo; y K t = Capital

Para que este modelo sea lineal en los parmetros tomamos logaritmos:
LnQt = Lnb0 + 1 LnLt + 2 LnK t + t

t = 1,,23

El resultado de la estimacin por MCO es:

LnQ t = 0,5 + 2,6 LnLt + 0,70LnK t

con R 2 = 0,80 ; = 2,00 ; = 0,14 ; SS R = 100


1

Contraste individual y conjuntamente la significancia estadstica de las variables explicativas Kt y


Lt. Qu puede concluir?

Para contrastar la significancia individual de las variables Kt y Lt utilizamos las siguientes hiptesis nula
y alternativa:
H 0 : i = 0
H1 : i 0

i = 1, 2
t=

Para contrastar estas hiptesis utilizamos el estadstico t:

i
H
0 t (T 3)

i

2, 6
= 1,3 < t0,025 ( 20 ) = 2, 086
2, 0
0, 70
Capital: t =
= 5, 0 > t0,025 ( 20 ) = 2, 086
0,14
Trabajo: t =

Se acepta H 0 : 1 = 0

Se rechaza H 0 : 2 0

Es decir, con un nivel de significancia del 5%, se concluye que el factor Capital es estadsticamente
relevante para explicar la produccin.

Dr. Nicols Bronfman

10

Para contrastar la significancia conjunta de las variables Kt y Lt utilizamos las siguientes hiptesis nula
y alternativa:
H 0 : 1 = 2 = 0
H 1 : 1 0 y/o 2 0

F=

SS R df R
SS R k
MS R
=
=
SS Re s df Re s SS Re s (n k 1) MS Re s

SS T = SS R + SS Re s

F=

i = 1, 2

100
= 100 + SS Re s
0,8

sigue una distribuci n Fk , n k 1

SS Re s = 25

100 2
= 40
25 20

Luego, se rechaza la hiptesis nula: las variables Trabajo y Capital son conjuntamente significativas
para explicar la produccin, a un nivel de significancia del 5%.
Sin embargo, existe una contradiccin entre los contrastes individuales y conjunto por lo que podra
argumentarse que existe algn problema con las variables. Una posibilidad es que las variables Capital
y Trabajo estn fuertemente correlacionadas, violando as el supuesto de no colinealidad entre las
variables.

Dr. Nicols Bronfman

11

VIII.- Suponga que para el modelo Yt = 0 + 1Xt+ t se cuanta con los siguientes datos.

Yt
5
1
3
4
3

Xt
1
3
4
2
2

a) (15 puntos) Escriba las ecuaciones normales


Las ecuaciones normales se obtienen de la minimizacin de T respecto de
T

u' u = (Yt 0 1 X t )' (Yt 0 1 X t )


t =1

derivando respecto de los parmetros 0 y 1 e igualando a cero:

u' u
0

u' u
1

= 2 (Yt 0 1 X t ) = 0
t =1
T

= 2 X t (Yt 0 1 X t ) = 0
t =1

Luego, las ecuaciones normales son:

Yt = T0 + 1 X t
X t Yt = 0 X t + 1 X t2
Sustituyendo los valores numricos obtenidos de la tabla del enunciado, tendramos que para este caso
particular las ecuaciones seran:
16 = 5 0 + 12 1
34 = 12 + 34
0

Dr. Nicols Bronfman

12

Problema IX.- El siguiente modelo de regresin determina las ventas de un producto, Yt, en
funcin de los gastos de publicidad, Xt:

Yt = 1 + 2 X t + 3 X t2 + 4 X t3 + t
Los siguientes resultados se han obtenido estimando el modelo con 128 observaciones:
Yt = 73,41 + 0,0055 X t + 0,000005 X t2 0,000002 X t3

R 2 = 0,8372; SS T = 300379,85; 1 = 594,7

2 = 0,12; 3 = 0,0000008 ; 4 = 0,0000015


a) (3 puntos) Cumple el modelo el supuesto bsico de linealidad?
Cumple el supuesto de linealidad porque es un modelo lineal en los parmetros aunque no sea lineal en
las variables.
b) (7 puntos) Determine si los datos sugieren que bastara con una funcin cuadrtica.
Para verificar si solo se requiere una funcin cuadrtica hay que contrastar la significancia estadstica
del trmino cbico y cuadrtico del modelo.

t =

t =

0,000005
= 6,25 > t0, 025 (128 4 ) 1,98
0,0000008

0,000002
= 1,33 < t 0,025 (128 4) 1,98
0,0000015

Por lo tanto, no se rechaza la hiptesis, es decir, existe evidencia emprica a favor de que la funcin
cuadrtica es suficiente.

Dr. Nicols Bronfman

13

c) (10 puntos) Con la siguiente informacin, contraste si los datos sugieren que bastara con una funcin
lineal.
Yt = 721,8 + 0,139 X t 0,0005 X t2

R 2 = 0,8357; 1 = 70,91 ; 2 = 0,0096; 3 = 0,0000398

De forma anloga a la pregunta anterior, la relacin entre Yt y Xt sera lineal si el coeficiente que
acompaa al trmino cuadrtico en el modelo anterior es cero, es decir:
H 0 : 3 = 0
H1 : 3 0

t =

3 0

0,0005
= 12,56 > t 0,025 (128 4 ) 1,98
0,0000398

Luego, se rechaza la hiptesis, es decir, la relacin no es lineal sino cuadrtica.

Dr. Nicols Bronfman

14

Problema X.- Considere el modelo clsico de regresin lineal mltiple Y = X + . Se sabe que la
matriz de regresores X es no-estocstica y que se cuenta con una muestra grande.

a) (5 puntos) Cul es el valor medio del estimador de mnimos cuadrados de ?


(Justifique su respuesta)
Y = X +
= (X' X) -1 X' Y

= (X' X) -1 X' X + (X' X) -1 X = + (X' X) -1 X

[]

E =

b) (5 puntos) Cul es la varianza del estimador de mnimos cuadrados de ?


(Justifique su respuesta)

Y = X +
V = E ( - )' ( - ) = E (X' X) -1 X' ' X(X' X) -1

[] [

] [

[]

V = (X' X) -1 E[' ] = (X' X) -1 2 I

c) (5 puntos) Cul es la distribucin del estimador de mnimos cuadrados de ?


(Justifique su respuesta)
Dado que disponemos de una muestra grande, por TCL la distribucin del estimador de mnimos
cuadrados es normal con media y varianza (XX)-12.

N , (X' X) -1 2

Dr. Nicols Bronfman

15

Problema XI.- Suponga el siguiente modelo lineal: Y = + X11+ X22+ X33+ X44+ X55+
X66+

a) (15 puntos) Complete las siguientes tablas considerando que en el modelo de regresin se utilizaron
51 observaciones.
Estadsticas de la regresin
Coef. de determinacin R2 =
R2 ajustado =
Nmero de Observaciones =
ANLISIS DE VARIANZA
Grados de
libertad
Regresin

Suma de Promedio de los


cuadrados
cuadrados
250

Residuos

Total
Coeficientes Error tpico

Estadstico t

Inferior 95%

Superior 95%

Intercepto

25

Variable X 1

14

Variable X 2

12

Variable X 3

22

38

Variable X 4

32

48

Variable X 5

14

Variable X 6

15

b) (10 puntos) A partir de los resultados de la tabla anterior qu puede decir respecto de las variables
regresoras utilizadas?
Sobre la base del test F se rechaza la hiptesis de que 1 = 2 = 3 = 4 = 5 = 0, lo que es consistente
con los resultados obtenidos para los estimadores individuales, donde las razones t tambin indican que
i 0. Esto ltimo es un fuerte indicio de que el modelo est bien especificado.

Dr. Nicols Bronfman

16

Problema XII.- Si en el modelo de regresin lineal Yt = + X1t + X2t + t se satisface que X1t =

X2t.
a) Se pueden estimar por MCO los parmetros , y ? Justifique su respuesta
Yt = + X1t + X2t + t = + X2t + X2t + t = + ( + ) X2t + t
Yt = + * X2t + t
En el modelo inicial existe un problema de multicolinealidad perfecta, por lo que no se puede estimar
en forma nica los parmetros , y . Sin embargo, si se incluye en el modelo la relacin que existe
entre las variables regresoras, es posible estimar una forma nica para los parmetros y *. Los
parmetros y no se pueden estimar en forma nica porque existen infinitas combinaciones lineales
que satisfacen la igualdad * = + .
b) Se puede predecir bien E[Yt]?
No existe ningn problema en la prediccin de E[Yt] dado que con la combinacin lineal de parmetros
se puede estimar adecuadamente la variable explicada, as como tambin su valor esperado.

Dr. Nicols Bronfman

17

Problema XIII.- Suponga el siguiente modelo lineal: Y = + X11+ X22+ X33+ X44+ X55+

Al realizar la regresin de Y sobre las cinco variables regresoras (considerando un trmino constante),
se obtienen los resultados mostrados en la tabla de ms abajo:
a) (15 puntos) Al realizar la regresin se obtienen los resultados de la regresin mostrados mas de
abajo. Complete las tablas considerando que se utilizaron 31 observaciones de cada variable.
Estadsticas de la regresin
Coef. de determinacin R2 =
R2 ajustado =
Nmero de Observaciones =
ANLISIS DE VARIANZA
Grados de
libertad
Regresin

Suma de Promedio de los


cuadrados
cuadrados
250

Residuos
Total

300
Coeficientes Error tpico

Intercepto

10

Variable X 1

Estadstico t

5
4

1,5

Variable X 2

-4

-0,8

Variable X 3

30

7,5

Variable X 4

40

Variable X 5

Inferior 95% Superior 95%

4
5

1,0

b) (5 puntos) A partir de los resultados de la tabla anterior qu puede decir respecto de las variables
regresoras utilizadas?
Los resultados muestran un R2 alto pero pocas razones t significativas, lo que es un primer indicio de la
presencia de multicolinealidad.
Sobre la base del test F se rechaza la hiptesis de que 1 = 2 = 3 = 4 = 5 = 0, contradiciendo los
resultados obtenidos para los estimadores individuales, donde las razones t indican que 1 = 2 = 5 = 0.
Esto ltimo tambin es un fuerte indicio de la presencia de multicolinealidad en el modelo.

Dr. Nicols Bronfman

18

Problema XIV.- Suponga el siguiente modelo lineal: Y = + X11+ X22+ X33+ X44+

Utilizando una muestra de 20 observaciones, y considerando un trmino constante, se realiza la


regresin de Y sobre las cuatro variables regresoras.
Estadsticas de la regresin
Coef. de determinacin R2 =
R2 ajustado =
Error Tpico =
Nmero de Observaciones =

ANLISIS DE VARIANZA
Grados de
libertad
Regresin

Suma de Promedio de los


cuadrados
cuadrados

140

Valor crtico
de F

4,01E-05

Residuos
Total

175
Coeficientes Error tpico

Intercepto
Variable X 1

Estadstico t

5
6

Variable X 2

10

Variable X 4

Superior 95%

0
1,5

Variable X 3

Inferior 95%

-14

4
15

a) (15 puntos) Complete cada una de las tablas que resumen los resultados de la regresin.
b) (5 puntos) A partir de los resultados de las tablas Qu puede concluir respecto de las variables
regresoras utilizadas?

Dr. Nicols Bronfman

19

Você também pode gostar