Escolar Documentos
Profissional Documentos
Cultura Documentos
Integrantes:
► Roberto Jara
► Jorge Sepulveda
► Jimmy Arias
CONTENIDO
1. INTRODUCCION ..............................................................................................................................................................3
2. DATOS ............................................................................................................................................................................4
4. CONCLUSION ..................................................................................................................................................................8
2
1. INTRODUCCION
En el siguiente trabajo analizaremos como se ven afectados los salarios en relación al nivel
educacional de las personas, considerando también otros coeficientes como la edad y el
sexo. Los datos analizados corresponden a 65.000 hogares en EE.UU. tomados al azar, y
específicamente a los periodos del año 1992 y 2012. Este set de datos fue entregado por la
oficina de Estadísticas Laborales del Departamento de Trabajo, todos estos datos serán
procesados a través del software Stata para obtener nuestro modelo de estudio. Se
analizaran los distintos coeficientes antes mencionados para determinar cuánto explica el
modelo estas variables.
El método que usaremos para la estimación del salario dado el nivel educativo de las
personas es el de mínimos cuadrados ordinarios MCO. Y= B0+B1X1+
B2X2+B3X3+…+BkXk+u. El Objetivo de MCO es determinar aproximadamente los valores
reales de los coeficientes del modelo de regresión B0 y B1X1+ B2X2+B3X3... a partir de los
datos de una muestra de las variables, El estimador MCO se basa en una fórmula que
aplicada a los datos de la muestra proporciona estimaciones de los coeficientes del modelo
de regresión.
De acuerdo a las variables que tenemos disponibles, hemos definidos cuatro modelos para
estudiar el comportamiento de los salarios:
De acuerdo a estos cuatro de modelos de regresión lineal se escogerá para el análisis el que
tenga como resultado un mayor coeficiente de determinación, mientras mayor sea el R2,
mejor será el ajuste del modelo a los datos. Además se interpretarán todos los coeficientes
para entender el comportamiento de todas las variables y por último se realizará un test de
hipótesis para comprobar la consistencia del modelo.
3
2. DATOS
La información usada para definir y analizar nuestro modelo de Salarios y Nivel Educativo se
obtuvieron del archivo CPS92_12 ccontiene los datos de los años 1992 y 2012 (de las
encuestas de marzo de 1993 y 2013). Estos datos corresponden a trabajadores de tiempo
completo, con más de 35 horas de trabajo por semana durante al menos 48 semanas en el
año. Los datos se proporcionan para los trabajadores cuyo nivel de educación más alto es (1)
Licenciado Escuela Secundaria, y (2) Licenciatura Nivel Superior.
También se creó una nueva variable YEARDUM que tiene valor (1) si es año 1992 y valor (2)
si es año 2012.
4
3. RESULTADOS EMPIRICOS
En el cuadro anteriormente enseñado se puede ver una regresión lineal con todos las variables del
modelo, sin embargo la variable “year” presenta un problema en sus datos, ya que tiene
información del año 1992 y 2012 por lo tanto se tuvo que agregar una variable Dummy al modelo
llamada “yeardum” la cual para el año 1992 es 0 y para el año 2012 es uno, esto nos ayuda a
explicar la variación de los años dentro del modelo, lo cual se puede ver en la siguiente regresión
Cuadro N°3
Se pude apreciar que la variable yeardum tiene un valor diferente que en la regresión del cuadro
N°2, esta variable nos indica que una persona en el año 2012 con todas las demás variables
constantes gana 7,2 dólares más en promedio por hora trabajada en Estados Unidos que en el año
1992
5
Si realizamos un test T con una hipótesis donde: Ho; yeardum=0, Hi; yeardum≠0 y con 5 grados de
libertad. Podemos concluir que la variable es explicativa al modelo, ya que el valor del test es
57.1siendo mayor que 1.96, por lo tanto se rechaza la hipótesis nula yeardum=0 siendo la variable
estadísticamente significativa.
Sin embargo para poder comparar todas las regresiones lineales que se hicieron se hizo un cuadro
comparativo:
Cuadro N°4
Variable m1 m2 m3 m4 m5
legend: b/se
En el cuadro se pude ver que se realizaron 5 modelos diferentes, de los cuales el que tiene mayor r2
es el modelo número 1 que considera todas las variables del modelo.
Cuadro N° 5
6
. hettest bachelor female age yeardum
chi2(4) = 3552.96
Prob > chi2 = 0.0000
Para saber si las variables eran significativas al modelo se hizo un test de significancia global
Los resultados muestran que el modelo es estadísticamente significativo con un 95% de confianza.
Como se pude ver en el cuadro numero 5, el test de Breusch – Pagan arrojo que la regresión lineal
del modelo 1 tienen Heterocedasticidad, esto debido a que existe un sesgo en los estimadores de la
varianza y los errores estándar, debido a esto se invalidan las pruebas de hipótesis y se realizó una
regresión lineal aplicando errores estándar robustos, lo cual nos arrojó el siguiente modelo.
Variable m1 m2 m3 m4 m5 m1R
legend: b/se
7
4. CONCLUSION
Dado los modelos de regresión lineal y los diferentes test que se aplicaron, podemos concluir que
las variables son significativas, siendo las más relevantes Bachelor y Yeardum, lo que significa que
para obtener un mejor salario en dólares promedio, manteniendo todo lo demás constante, las
personas tienen que obtener su licenciatura. Cuando esta variable no fue considerada en el modelo
(m3) el r2 bajo considerablemente y la variable Yeardum aumento casi en un punto, lo que nos
indica que a mayor cantidad de años de trabajo el sueldo va a aumentar igual, sin embargo si la
persona cuenta con su licenciatura esta va a tener un aumento considerablemente mayor.
Las demás variables son significativas al modelo sin embargo no tienen mayores variaciones, por lo
que solo se evaluaron las dos anteriormente nombradas.