Você está na página 1de 9

24 de octubre 2014

Carolina Castillo Gonzlez


EJERCICIO PRCTICO N3
ANLISIS DE REGRESIN MLTIPLE

Ejercicio: Realice un anlisis de regresin mltiple considerando como variable dependiente el sueldo (ocupacin
principal).
Para ello, siga los siguientes pasos:
1. Realice un anlisis bivariado entre la variable dependiente y cada una de las variables independientes incluidas
en la base de datos (edad, escolaridad, nmero de horas y antigedad en aos). No es necesario que cruce las
variables independientes entre s.
Tabla N1: Correlaciones entre variables independientes y la variable dependiente
(Ingreso por ocupacin principal)
Ingreso
ocupacin
principal

Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Cuntas horas trabaj la semana pasada en
su empleo o actividad principal?
Sig. (bilateral)
N
Correlacin de Pearson
Escolaridad poblacin de 15 aos y ms
(aos)
Sig. (bilateral)
N
Correlacin de Pearson
Aos de antigedad en la ocupacin
principal
Sig. (bilateral)
N
**. La correlacin es significativa al nivel 0,01 (bilateral).
Edad (aos cumplidos)

,085**
,000
112362
,115**
,000
111886
,305**
,000
112334
,138**
,000
110854

En primer lugar, en cuanto a la correlacin de las variables Edad, Horas de trabajo, Escolaridad y Aos
de antigedad, con la variable dependiente ingreso por ocupacin principal, podemos observar lo
siguiente: La variable que presenta mayor correlacin con el ingreso por ocupacin principal es la
Escolaridad (0,305). Mientras que la que presenta menor correlacin es la variable Edad (0,085), lo
que podra relacionarse tambin con el amplio rango de variacin de esta variable. En trminos
generales, las correlaciones no superan el 0,2 (excepto en el caso de la Escolaridad).

24 de octubre 2014

Carolina Castillo Gonzlez

Tabla N2: Estadsticos descriptivos de variables


N

Rango

Mnimo

Mximo

Media

Desv. tp.

294791

108

108

34,57

22,155

116146

126

126

42,41

15,864

Escolaridad poblacin de 15 aos y ms (aos)

229780

22,00

,00

22,00

10,0385

4,21903

Ingreso ocupacin principal

112362

45120901

1099

45122000

399315,98

592798,702

Aos de antigedad en la ocupacin principal

115097

92,00

,00

92,00

8,4749

10,18184

N vlido (segn lista)

110395

Edad (aos cumplidos)


Horas trabajadas durante la semana

En trminos de edad, se observa que los encuestados tienen en promedio 35 aos, donde los encuestados se desvan
22,155 aos de la media. En segundo lugar, la media de horas trabajadas en los encuestados, alcanza las 42 horas
aproximadamente, donde los encuestados se distancian de la media en 15 horas aproximadamente.
En cuanto al nivel de escolaridad, la media de aos es de 10 aproximadamente, donde los encuestados se desvan de la
media en 4,21 aos, aproximadamente.
En cuanto al ingreso por ocupacin principal, el ingreso de los encuestados es en promedio $399.315, donde los casos
se desvan de la media en aproximadamente $592.798.
Finalmente, en el caso de los aos de antigedad en la ocupacin principal, los encuestados en promedio tienen 8 aos
de antigedad, mientras que los casos se dispersan de la media, en aproximadamente 10 aos.

2. Escriba la ecuacin del modelo de regresin multivariado.

Tabla N3: Ecuacin del modelo de regresin multivariado.


YOPRAJ

BO

B1 * EDAD

B2 * HORAS_TRABAJ

B3 * ESC

B4 * ANTIGUEDAD

24 de octubre 2014

Carolina Castillo Gonzlez

3. Realice un modelo de regresin en SPSS considerando como variable independiente solamente la escolaridad.
Interprete la constante y la pendiente.

Tabla N4: ANOVAa


Modelo
1

Suma de cuadrados

gl

Media cuadrtica

F
11556,849

Regresin

3683045779759784,000

3683045779759784,000

Residual

35799024104116656,000

112332

318689457181,539

Total

39482069883876440,000

112333

Sig.
,000b

a. Variable dependiente: Ingreso ocupacin principal


b. Variables predictoras: (Constante), Escolaridad poblacin de 15 aos y ms (aos)

En primer lugar, observamos que el modelo de regresin es significativo (0,000) mediante el test de ANOVA, con un
95% de confianza.

Tabla N5: Resumen del modelo


Modelo
1

R
,305a

R cuadrado

R cuadrado corregida

Error tp. De la estimacin

,093

564525,869

,093

a. Variables predictoras: (Constante), Escolaridad poblacin de 15 aos y ms (aos)

Por otro lado, se puede observar que el 9,3% de la varianza de la variable dependiente (ingreso por ocupacin
principal) es explicada por el modelo (0,093), lo cual no es un valor contundente.
Tabla N6: Coeficientesa
Modelo

Coeficientes no

Coeficientes

estandarizados

tipificados

B
1

(Constante)
Escolaridad poblacin de 15 aos y ms (aos)

Error tp.

-113367,806

5058,346

46726,936

434,658

Sig.

-22,412

,000

107,503

,000

Beta

,305

a. Variable dependiente: Ingreso ocupacin principal

Finalmente, se puede decir que en la medida que aumenta en un ao la escolaridad de los encuestados, se estima que el
ingreso por ocupacin principal aumenta en $46.726. Al mismo tiempo, se observa que el aumento en un ao de
escolaridad, genera un efecto de 0,305 desviaciones estndar en el ingreso por ocupacin principal. Se puede decir, al
mismo tiempo, que esta relacin es significativa a un 95% de confianza (0,000).
Finalmente, se puede decir que en el contexto en que la escolaridad tenga valor cero, el ingreso por ocupacin principal
tiene una constante de -11.3367.

24 de octubre 2014

Carolina Castillo Gonzlez

4. Pruebe la hiptesis nula de que el sueldo de la ocupacin principal es independiente de los aos de escolaridad
de la persona. Encuentre e interprete el valor t.
Tabla N7: Coeficientesa
Modelo

Coeficientes no

Coeficientes

estandarizados

tipificados

B
1

(Constante)
Escolaridad poblacin de 15 aos y ms (aos)

Error tp.

-113367,806

5058,346

46726,936

434,658

Sig.

-22,412

,000

107,503

,000

Beta

,305

a. Variable dependiente: Ingreso ocupacin principal

El valor t observado de los aos de escolaridad es 107,503 el cual es mayor que el valor t terico (1,96), por lo que se
puede decir que cae en la zona de rechazo y, por lo tanto, se rechaza la hiptesis nula de que el sueldo de la ocupacin
principal es independiente de los aos de escolaridad. Esto se puede corroborar por la significancia (0,000) en contraste
de un nivel de significancia de 95%. En este sentido, se puede aceptar la hiptesis alternativa que indica que s existe
una relacin entre ambas variables, la cual es significativa.

24 de octubre 2014

Carolina Castillo Gonzlez

5. Realice un modelo de regresin en SPSS considerando todas las variables independientes (edad, escolaridad,
nmero de horas y antigedad en aos). Interprete todos los coeficientes.

Tabla N8: Resumen del modelo


Modelo

R cuadrado

,384

R cuadrado

Error tp. de la

corregida

estimacin

,147

,147

549294,650

a. Variables predictoras: (Constante), Aos de antiguedad en la ocupacion principal, o10.


Cuntas horas trabaj la semana pasada en su empleo o actividad principal?, Escolaridad
poblacin de 15 aos y ms (aos), Edad (aos cumplidos)

En primer lugar, se observa que un 0,147 de la variable dependiente (ingreso por ocupacin principal)
es explicado por el modelo. Lo cual podra ser un nivel bajo de ajuste del modelo.

Tabla N9: ANOVAa


Modelo
1

Suma de cuadrados

gl

Media cuadrtica

Regresin

5761491983629848,000

1440372995907462,000

Residual

33307380004790620,000

110390

301724612780,058

Total

39068871988420472,000

110394

Sig.
,000b

4773,800

a. Variable dependiente: Ingreso ocupacin principal


b. Variables predictoras: (Constante), Aos de antiguedad en la ocupacion principal, o10. Cuntas horas trabaj la semana pasada en
su empleo o actividad principal?, Escolaridad poblacin de 15 aos y ms (aos), Edad (aos cumplidos)

Al mismo tiempo, se puede indicar que el modelo es significativo a un 95% de confianza, observando
el valor 0,000.
Tabla N10: Coeficientesa
Modelo

Coeficientes no estandarizados

Coeficientes

Sig.

tipificados
B
1

(Constante)

Error tp.

-702345,465

9764,744

55286,820

451,421

Edad (aos cumplidos)

6876,899

o10. Cuntas horas trabaj la semana pasada en su

Escolaridad poblacin de 15 aos y ms (aos)

Beta
-71,927

,000

,360

122,473

,000

148,713

,155

46,243

,000

3918,016

105,823

,103

37,024

,000

5312,945

189,479

,090

28,040

,000

empleo o actividad principal?


Aos de antigedad en la ocupacin principal
a. Variable dependiente: Ingreso ocupacin principal

Finalmente, podemos decir que las cuatro variables independientes, tienen un efecto significativo sobre la variable
dependiente (0,000) en todos los casos. Al mismo tiempo, se puede decir que la variable que ms explica la

24 de octubre 2014
Carolina Castillo Gonzlez
variabilidad de la variable dependiente, es la escolaridad, con un beta estandarizado de 0,360, el cual es mayor que en
el resto de las variables. Mientras que la que aporta en menor medida a la variabilidad es la variable aos de antigedad
en la ocupacin principal (0,090).
Finalmente se puede decir que en la medida en que aumenta un ao de escolaridad, el ingreso por ocupacin principal
aumenta en $55.286, controlado por las otras variables. Por otro lado, en la medida en que aumenta en un ao la edad
del encuestado, el ingreso por ocupacin principal aumenta en $6.876, controlado por las otras variables.
En otro sentido, se observa que si aumenta una hora de trabajo a la semana, el ingreso por ocupacin principal aumenta
en $3.918, mientras que si aumentan en un ao la antigedad en el empleo, el ingreso aumenta en $5.312 (en ambos
casos, controlado por las otras variables).

24 de octubre 2014

Carolina Castillo Gonzlez

6. Pruebe la hiptesis nula de que el sueldo de la ocupacin principal es independiente de los aos de antigedad.
Encuentre e interprete el valor p.
Tabla N11: Coeficientesa
Modelo

Coeficientes no

Coeficientes

estandarizados

tipificados

B
1

(Constante)

Error tp.

Sig.

-71,927

,000

Beta

-702345,465

9764,744

55286,820

451,421

,360

122,473

,000

Edad (aos cumplidos)

6876,899

148,713

,155

46,243

,000

o10. Cuntas horas trabaj la semana pasada

3918,016

105,823

,103

37,024

,000

5312,945

189,479

,090

28,040

,000

Escolaridad poblacin de 15 aos y ms (aos)

en su empleo o actividad principal?


Aos de antigedad en la ocupacin principal
a. Variable dependiente: Ingreso ocupacin principal

Por otro lado, en cuanto a los aos de antigedad, se puede observar que no es posible aceptar la hiptesis nula de que
la ocupacin principal es independiente de los aos de antigedad, ya que el valor P es de 0,000, siendo menor a la
significancia de 0,05 a un nivel de confianza de un 95% de confianza.

24 de octubre 2014

Carolina Castillo Gonzlez

7. Refirase al ajuste de los modelos considerados. Cul modelo es preferible en trminos de ajuste?
En trminos generales, se puede decir que el modelo que es preferible en trminos de ajuste es el modelo 2 (el que
incluye a todas las variables), ya que alcanza un nivel de explicacin de variabilidad de la variable independiente de un
14,7%. Mientras que en el caso del modelo N1, la explicacin de la variabilidad de la variable dependiente alcanza un
9,3%.
Tabla N12: Resumen del modelo
Modelo

R cuadrado

,305a

R cuadrado corregida

Error tp. de la estimacin

,093

564525,869

,093

a. Variables predictoras: (Constante), Escolaridad poblacin de 15 aos y ms (aos)

Tabla N13: Resumen del modelo


Modelo

R cuadrado

,384

R cuadrado

Error tp. de la

corregida

estimacin

,147

,147

549294,650

a. Variables predictoras: (Constante), Aos de antiguedad en la ocupacion principal, o10.


Cuntas horas trabaj la semana pasada en su empleo o actividad principal?, Escolaridad
poblacin de 15 aos y ms (aos), Edad (aos cumplidos)

24 de octubre 2014

Carolina Castillo Gonzlez

ANEXO
Sintaxis depurada
1. Se realiza una matriz bivariada de correlaciones con todas las
variables, pero despus se presenta la tabla editada.

2. Se solicitan los estadsticos descriptivos relacionados a la


variabilidad de las variables.
3. Se realiza un grfico de dispersin de la variable de ingreso por
ocupacin principal y la edad.
4. Se realiza un grfico de dispersin de la variable de ingreso por
ocupacin principal y las horas de trabajo en la semana.
5. Se realiza un grfico de dispersin de la variable de ingreso por
ocupacin principal y la escolaridad.
6. Se realiza un grfico de dispersin de la variable de ingreso por
ocupacin principal y la antigedad.
7. se realiza una regresin lineal slo con la variable escolaridad
como independiente.

8. Se realiza una regresin con todas las variables independientes


(escolaridad, horas de trabajo, antiguedad y edad)

CORRELATIONS
/VARIABLES=edad o10 esc yopraj ANTIGUEDAD
/PRINT=TWOTAIL NOSIG
/MISSING=PAIRWISE.
DESCRIPTIVES VARIABLES=edad o10 esc yopraj ANTIGUEDAD
/STATISTICS=MEAN STDDEV RANGE MIN MAX.
GRAPH
/SCATTERPLOT(BIVAR)=edad WITH yopraj
/MISSING=LISTWISE.
GRAPH
/SCATTERPLOT(BIVAR)=o10 WITH yopraj
/MISSING=LISTWISE.
GRAPH
/SCATTERPLOT(BIVAR)=esc WITH yopraj
/MISSING=LISTWISE.
GRAPH
/SCATTERPLOT(BIVAR)=antiguedad WITH yopraj
/MISSING=LISTWISE
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT yopraj
/METHOD=ENTER esc.
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT yopraj
/METHOD=ENTER esc edad o10 ANTIGUEDAD.