Você está na página 1de 16

UNIVERISIDAD NACIONAL DE COLOMBIA FACULTAD DE CIENCIAS ECONMICAS MAESTRA EN CIENCIAS ECONMICAS MACROECONOMA AVANZADA Grace Andrea Torres Pineda

Frederick Andrs Mendoza Lozano Gonzalo Ramrez Carrillo TALLER 1 MAYO 30 DE 2011

Punto 1 1. La prueba Dickey Fuller (ms sencilla) permite probar la existencia de raz unitaria de un modelo de la forma:

A travs de la distribucin de un estadstico que es generado a partir de simulaciones de Montecarlo, cuando la hiptesis nula es cierta (esto se tiene cuando = 1), el modelo (1) puede expresarse como:

Que puede reescribirse como:

Donde . Por tanto, para que se cumpla la hiptesis de raz unitaria, en el modelo formulado en (3), el estimador debe ser igual a cero. 1.1 Mediante un archivo .m genere una simulacin de Montecarlo con un nmero de repeticiones nrep=8.000, con el que pueda analizar la distribucin del estadstico Dickey Fuller (distribucin del estadstico cuando se cumple Ho: b=0). El estadstico que usamos es el siguiente t= Donde b es el estimador y Desv(b) es la estimacin de la desviacin estndar de b Con una serie que contiene 100 observaciones y realizando 8000 repeticiones obtuvimos la siguiente distribucin:

1.2 Halle los valores de la distribucin del estadstico al 5%, 10% y 95% de significancia. Los valores del estadstico fueron: Perc5 = Perc10 = Perc95 =

-0.0067 -0.0054 0.0065

Que parece ser un estimador insesgado ya que la media aparenta ser 0 y adems perc5=-perc95.

Nota: Para simular el proceso generador de datos debe considerar un valor inicial por ejemplo. Luego, elimine las primeras 50 observaciones para librarse de un problema de colas. Punto 2. 2.1 Con los datos de la Encuesta Anual Manufacturera de 2006, vamos a realizar la regresin y el proceso boostrapping Pero para ello, eliminamos los datos observados en el

sector de la fila 31 columna 3, ya que para este sector no tenemos un dato (dato perdido), y tomamos esta decisin, en vez de simplemente poner un cero para no sesgar la muestra. Una vez corrida la regresin usando MatLab2009a, obtenemos los betas estimados, los errores y la variable dependiente en funcin de las variables exgenas. La siguiente tabla:

B1(Salarios)

289837,94

B2(Inversin) 6,38 B3(Energa) 1,35

2.2 Despues de hacer el bootstraping con 2000 repeticiones obtenernos el siguiente histograma de B3.
Distribucin de b3 60

50

40

30

20

10

1.5

2.5

3.5

4.5

Vemos que la media es un valor cercano a 2 y por lo tanto la hiptesis nula H0: b3=0 debe ser rechazada con un buen intervalo de confianza. 2.2 A continuacin evaluamos la potencia de la prueba. Para ello usamos el proceso MonteCarlo. Definimos las variables, los parmetros el proceso generador de datos y encontramos el factor k para la prueba de potencia, donde k es el nmero de veces en el que se rechaza Ho.

Corrido el modelo en MatLab2009a, para las 2000 repeticiones, vemos que en cada uno de los casos no rechazamos la hiptesis nula, por tanto K=2000.

Dado que la potencia obtenida es 1,la probabilidad de cometer error tipo 2 es igual a 1 y con toda seguridad estamos cayendo en error tipo 2, es decir estamos aceptando una hiptesis que es falsa. Punto 3 Para este caso utilizamos el mtodo de simulacin de bootstraping. Primero, presentamos los histogramas de distribucin de los Betas y luego los histogramas resultantes luego de sumar alfa que representa los errores de medicin. Distribuciones sin incluir errores de medicin:
Distribucin de b1 90 80 70 60 50 40 30 20 10 0

0.5

1.5

2.5

3.5 x 10
5

Distribucin de b2 70

60

50

40

30

20

10

0 -15

-10

-5

10

15

20

Distribucin de b3 60

50

40

30

20

10

1.5

2.5

3.5

4.5

3.1 sumando al vector de Y (variable explicada) un vector de nmeros aleatorios distribuidos normal con media cero y varianza 1, obtenemos los siguientes histogramas:

Distribucin de b1 100 90 80 70 60 50 40 30 20 10 0

0.5

1.5

2.5

3.5 x 10

4
5

Distribucin de b2 60

50

40

30

20

10

0 -15

-10

-5

10

15

20

Distribucin de b3 60

50

40

30

20

10

1.5

2.5

3.5

4.5

3.2 Ahora veamos los histogramas que resultan luego sumar a la variable Y (Variable explicada) un error alfa constante e igual a 30 000.

Distribucin de b1 90 80 70 60 50 40 30 20 10 0

1.5

2.5

3.5

4.5

5.5 x 10

6
5

Distribucin de b2 50 45 40 35 30 25 20 15 10 5 0 -20

-15

-10

-5

10

15

20

Distribucin de b3 60

50

40

30

20

10

0 2.5

3.5

4.5

5.5

6.5

7.5

3.3 Conclusin: En el primer caso (numeral 3.1) se observo que al sumar a la variable explicada Y un error distribuido normal con media cero y varianza 1, los histogramas de los betas no cambiaron significativamente. Las razones podran ser estas dos: Primero, los errores normales que han sido sumados a la variable explicada podran ser absorbidos por el vector de errores de la regresin. Segundo, analizando los valores aleatorios de alfa generados en matlab notamos que son pequeos en comparacin a los valores de Y En el segundo caso el promdio de los Betas cambio significativamente y tambin la forma de los histogramas. La razn es que el valor del error de medicin es bastante grande (comparable a la dimensin de los valores de Y) y con seguridad daa el supuesto de normalidad de los errores de la regresin. PUNTO 2

Con los datos de la Encuesta Anual Manufacturera de 2006, vamos a realizar la regresin y el proceso boostrapping. Pero para ello, eliminamos los datos observados en el sector de la fila 31 3, ya que para este sector no tenemos un dato (dato perdido), y tomamos esta decisin, en vez de simplemente poner un cero para no sesgar la muestra.

2.1 Una vez corrida la regresin usando MatLab2009a, obtenemos los betas estimados, los errores y la variable dependiente en funcin de las variables exgenas. Presentamos a continuacin los valores beta, donde b1 es la constante.

BETAS B1 B2 B3 B4

VALOR 1.0e+008*3.1038 1.0e+008*0.0007 1.0e+008*0.0000 1.0e+008*0.0000

2.2 Queremos ver a travs del anterior proceso la distribucin del estadstico de prueba para la hiptesis nula de que B4 es igual a cero. A travs del boostraping obtenemos la siguiente distribucin:

Distribucin B4. Y como vemos en la grfica de la distribucin, podemos ver que B3 no se distribuye normal y ello se debe a que el estadstico proviene de una muestra pequea, habra que analizar si el estadstico mantiene dicho comportamiento para una muestra mucho mayor. Si consideramos que la muestra es pequea, no convergi a una t, y esto puede ser porque los errores pueden no tener una distribucin normal.

1.3 A continuacin realizamos el remuestreo para hacer la prueba de potencia. Para ello usamos el proceso MonteCarlo. Definimos las variables, los parmetros el proceso generador de datos y encontramos el factor k para la prueba de potencia, donde k es el nmero de veces en el que se rechaza Ho.

Corrido el modelo en MatLab2009a, para las 2000 repeticiones, vemos que en cada uno de los casos no rechazamos la hiptesis nula, por tanto K=2000.

Dado que la potencia obtenida es 1,la probabilidad de cometer error tipo 2 es igual a 1 y con toda seguridad estamos cayendo en error tipo 2, es decir estamos aceptando una hiptesis que es falsa.

Punto 3. Variables intrumentales.

3.1 Estimar la siguiente regresin con el archivo Mroz.dta.

Resultados:

. reg lwage educ Source Model Residual Total lwage educ _cons SS 26.3264193 197.001022 223.327441 Coef. .1086487 -.1851968 df 1 426 427 MS 26.3264193 .462443713 .523015084 t 7.55 -1.00 P>|t| 0.000 0.318 Number of obs F( 1, 426) Prob > F R-squared Adj R-squared Root MSE = = = = = = 428 56.93 0.0000 0.1179 0.1158 .68003

Std. Err. .0143998 .1852259

[95% Conf. Interval] .0803451 -.5492673 .1369523 .1788736

3.2 Realice la prueba de variables omitidas y concluya.

. ovtest Ramsey RESET test using powers of the fitted values of lwage Ho: model has no omitted variables F(3, 423) = 3.01 Prob > F = 0.0301

La hipotesis de esta prueba es que no existen variables omitidas. Como el p-valor 0.03 es menor a un nivel de significancia del 5%, podemos rechazar la hiptesis nula y tenemos variables omitidas en el modelo inicial del salario.

3.3 Utilice instrumentos para estimar la siguiente ecuacin:

Los instrumentos escogidos son: Faminc ingresos de la familia. Motheedu educacin de la madre Fatheedu educacin del padre. Estos instrumentos son escogidos por dos razones: Relevancia: estn relacionadas con el nivel de educacin, porque se puede deducir que si los padres tienen un nivel de educacin dado los hijos la igualaran o superaran. Adems se tendr acceso a la educacin si hay mayores ingresos en la familia.

Exogeneidad: suponemos que no estn correlacionados con el error de la ecuacin inicial, en donde se encontraba la variable omitida habilidad. La educacin de los padres no se relaciona con la habilidad personal del hijo. El modelo corrido con MCO

. reg lwage educhat Source Model Residual Total lwage educhat _cons SS 11.3831391 211.944302 223.327441 Coef. .1337983 -.470682 df 1 426 427 MS 11.3831391 .497521835 .523015084 t 4.78 -1.35 P>|t| 0.000 0.178 Number of obs F( 1, 426) Prob > F R-squared Adj R-squared Root MSE = = = = = = 428 22.88 0.0000 0.0510 0.0487 .70535

Std. Err. .0279721 .3488916

[95% Conf. Interval] .0788177 -1.156445 .1887789 .2150812

El modelo corrido con MC2E

Instrumental variables (2SLS) regression Source Model Residual Total lwage educ _cons Instrumented: Instruments: SS 23.5884612 199.73898 223.327441 Coef. .1436869 -.6287412 df 1 426 427 MS 23.5884612 .468870844 .523015084 t 5.36 -1.85 P>|t| 0.000 0.066 Number of obs F( 1, 426) Prob > F R-squared Adj R-squared Root MSE = = = = = = 428 28.78 0.0000 0.1056 0.1035 .68474

Std. Err. .0267852 .3406822

[95% Conf. Interval] .0910392 -1.298369 .1963345 .0408862

educ faminc fatheduc motheduc

Los coeficientes en el segundo modelo son ms grandes en valor absoluto. La educacin tiene un impacto mas elevado cuando se soluciona problema de variables omitidas.

3.4 Eleccin entre los estimadores de MCO y de MCO2E. Al realizar la estimacin MCO si tenemos variables omitidas tenemos un estimador insesgado. Si tenemos MCO2E aunque solucionamos el problema de insesgamiento obtenemos estimadores con una mayor varianza. Para escoger utilizamos el test de Hausman de eficiencia.

. hausman mc2e Coefficients (b) (B) mc2e . educ .0737003 .1086487 (b-B) Difference -.0349483 sqrt(diag(V_b-V_B)) S.E. .0179983

b = consistent under Ho and Ha; obtained from ivreg B = inconsistent under Ha, efficient under Ho; obtained from regress Test: Ho: difference in coefficients not systematic chi2(1) = (b-B)'[(V_b-V_B)^(-1)](b-B) = 3.77 Prob>chi2 = 0.0522

Aqu tenemos que, dado que el p-valor es mayor a un nivel de significancia del 5% no se rechaza la hiptesis nula de que la diferencia entre la varianza de los coeficientes no es sistemtica. Es decir puedo quedarme con los coeficientes del MC2E porque la varianza no es muy diferente del MCO y adems es insesgado. 3.5 Evaluar los supuestos. Lo hacemos sobre el modelo MC2E.

Normalidad. Observamos primero el histograma de los errores para darnos una idea de su distribucin. Se puede decir que si tienen una distribucin con problemas de colas
.8 Density 0 .2 .4 .6

-3

-2

-1 Residuals

Con la prueba Jarque BERA tenemos un criterio estadstico.

. sktest error Skewness/Kurtosis tests for Normality Variable error Pr(Skewness) 0.000 Pr(Kurtosis) 0.000 adj chi2(2) 70.25 joint Prob>chi2 0.0000

Dado que la hiptesis nula es que hay normalidad, y el p valor 0.00 de la prueba conjunta es menor a un nivel de significancia del 5%, podemos rechazar la hiptesis, y no se cumple supuesto de normalidad.

Multicolinealidad. Segn los resultados no tendra sentido correr esta prueba porque solo hay una variable explicativa con varias instrumentales.
Variable educ Mean VIF VIF 1.00 1.00 1/VIF 1.000000

Homocedasticidad.

Prueba de Breusch Pagan.


. reg error2 fatheduc faminc motheduc Source Model Residual Total error2 fatheduc faminc motheduc _cons SS 3.97045958 521.458757 525.429217 Coef. .0109547 -6.15e-06 .0145731 .3780297 df 3 424 427 MS 1.32348653 1.22985556 1.23051339 t 0.59 -1.32 0.75 1.94 P>|t| 0.553 0.188 0.455 0.053 Number of obs F( 3, 424) Prob > F R-squared Adj R-squared Root MSE = = = = = = 428 1.08 0.3589 0.0076 0.0005 1.109

Std. Err. .0184464 4.67e-06 .0194947 .1949896

[95% Conf. Interval] -.025303 -.0000153 -.0237452 -.0052369 .0472124 3.02e-06 .0528914 .7612964

La hiptesis nula es no heterocedasticidad. Si la regresin de los errores al cuadrado contra las variables independientes es significativa, entonces se rechaza la hiptesis nula. Pero el pvalor 0.35 es mayor a un nivel de significancia, por tanto se cumple el supuesto de Homocedasticidad.

La prueba Hettest no funciona como comando despus del comando de estimacin ivregress.

3.4 Test de endogeneidad.

El test de endogeneidad permite saber si hay diferencias entre los coeficientes generados por las variables instrumentales y por el modelo de MCO, en cuanto a su eficiencia, ya que en esto siempre ser preferido MCO si no hay problemas de endogeneidad. Una forma de mirarlo es incorporar el error del modelo de las variables instrumentales en el modelo inicial. Si el error es significativo quiere decir que haba problemas de endogeneidad, ya que un error que explica a educ estara relacionado con lwage. El estimador del error no es significativo, por tanto no haba problemas de endogeneidad. Entonces se podra tomar el modelo MCO.

. reg lwage educ errorhaus Source Model Residual Total lwage educ errorhaus _cons SS 27.4612979 195.866143 223.327441 Coef. .1436869 -.0495615 -.6287412 df 2 425 427 MS 13.7306489 .460861513 .523015084 t 5.41 -1.57 -1.86 P>|t| 0.000 0.117 0.063 Number of obs F( 2, 425) Prob > F R-squared Adj R-squared Root MSE = = = = = = 428 29.79 0.0000 0.1230 0.1188 .67887

Std. Err. .0265554 .0315831 .3377599

[95% Conf. Interval] .0914905 -.11164 -1.292629 .1958832 .012517 .0351467

Você também pode gostar