Escolar Documentos
Profissional Documentos
Cultura Documentos
a las Finanzas
Estadstica a travs de Regresin Lineal
ANLISIS DE REGRESIN
El anlisis de regresin es un proceso estadstico para relacionar variables. La regresin
lineal es un mtodo matemtico que modela una variable dependiente (y) relacionada con
varias variables independientes (xi) y un trmino aleatorio .
MODELO DE REGRESIN LINEAL MLTIPLE (MRLM)
Este modelo une a la teora econmica, la estadstica, y la matemtica para establecer
relaciones entre una variable dependiente llamada y y dos o ms variables explicativas
llamadas x, con el fin establecer un prediccin o en su defecto el impacto que tienen las
variables explicativas sobre la variable explicada. A la variable dependiente y, tambin se
le llama: regresando, explicada, predicha o endgena) y las variables independientes,
tambin se le conoce como: Regresores, explicativas, predictoras o exgenos).
Uriel y Alds (2005), nos dice que el MRLM es uno de los ms conocidos y aplicados del
anlisis multivariante y constituye el ncleo en el cual se ha desarrollado la econometra.
La variable respuesta es de tipo cuantitativa y las variables explicativas deben ser
cuantitativas y/o categricas (en situaciones especiales). (Sifuentes, V 2002)
1. VENTAJAS DEL MRLM
Nos permite encontrar el efecto combinado de dos o ms variables sobre una variable que
es explicada. Adems nos permite conocer la relacin de una sola explicativa (x) sobre la
0 , 1 ,..., p
0
,
es el trmino
V ( ) 2
E ( ) 0
normal, con media 0. Es decir
y varianza constante.
y
Son los valores estimados de la variable aleatoria dependiente y
b0 , b1 ,..., bp
Entonces los valores de los estadsticos muestrales
0 , 1 ,..., p
.
Para el caso particular de dos variables independientes, la lnea de regresin
mltiple estimada sera:
y b0 b1 x1 b2 x2
En este caso el clculo de b0, b1 y b2
i min ( yi - yi )2
i
Donde
yi
se le llama error aleatorio, es la diferencia entre el valor observado (
) menos
yi
el valor esperado (
positiva. Para hacer estudios inferenciales de regresin el error debe tener las siguientes
propiedades:
1) E i 0
2) V i 2
3) Cov i , j 0
i j
La primera propiedad indica que en promedio los errores es igual a cero, la segunda que
las varianza de cada error, para un conjunto de variables x determinado son constantes
(homocedstico) y la tercera que es que debe existir incorrelacin entre los errores.
(Sifuentes, 2002).
En regresin lineal simple se trabaja con conjuntos de datos relativamente pequeos, ah
0 y 1
fue posible usar las frmulas para obtener
b0 , b1 ,..., bp
, se utiliza el lgebra matricial y se obtiene los resultados manualmente luego
de un proceso no muy rpido; el uso de estas frmulas no es el objetivo de la presente
sesin. Para la estimacin de dichos parmetros se utilizar el paquete estadstico IBM
SPSS en cualquier versin.
Solo para ilustrar, si son dos las variables independientes, entonces las tres ecuaciones
normales son:
y nb x b x b
0
1.
1 1
2 2
yx x b x b x x b
1
2.
2
1 1
1 0
1 2 2
yx x b x x b x b
2
3.
2 0
1 2 1
2
2 2
b0 , b1 y b2
.
5. COEFICIENTE DE CORRELACIN MLTIPLE Y COEFICIENTE DE DETERMINACIN
MLTIPLE
Al igual de determinacin simple, el coeficiente de determinacin mltiple R 2, mide el
porcentaje de la varianza de y que queda explicada al conocer dos o ms variables
independientes. Cuanto mayor es R2, mayor es el ajuste del plano de regresin y menor
es la dispersin de los datos.
El coeficiente de regresin mltiple se puede definir de manera general como la raz
cuadrada de la suma de los cuadrados explicados sobre la suma de los cuadrados
totales.
R2
SCR R
SCT
(Y Y )
(Y Y )
2
1.23
Donde:
SCR = Suma de cuadrados debido a la regresin
SCT = Suma de cuadrados totales
SCE = Suma de cuadrados debido a los errores
r Y,X1= 0.675
r Y,X2= 0.715
r Y,X1= 0.675
r Y,X3= 0.667
r Y,X2= 0.715
r Y,X3= 0.667
Si hay multicolinealidad
No hay multicolinealidad
No hay multicolinealidad
Modelo
1
R cuadrado
,675a
R cuadrado
Error estndar
ajustado
de la estimacin
,456
,444
2,823
MODELO 2: YX2
Modelo
1
R cuadrado
a
,715
R cuadrado
Error estndar
ajustado
de la estimacin
,512
,501
2,675
MODELO 3: YX3
Resumen del modelo
Modelo
1
R
,667a
R cuadrado
R cuadrado
Error estndar
ajustado
de la estimacin
,445
,433
2,852
MODELO 4: YX1X3
Resumen del modelo
Modelo
1
R
,828a
R cuadrado
,685
R cuadrado
Error estndar
ajustado
de la estimacin
,671
2,172
MODELO 5: YX2X3
Resumen del modelo
Modelo
1
R cuadrado
a
,816
R cuadrado
Error estndar
ajustado
de la estimacin
,666
,651
2,236
ORDEN
4
3
5
1
2
Modelos
Y X1
Y X2
Y X3
Y X1X3
Y X2X3
R2 Corregido
0.444
0.501
0.433
0.671
0.651
Y X1X3
0.671
Prueba Global:
Ho: 1 = 3 =0
H1: al menos un i es 0
ANOVAa
Suma de
Modelo
1
Media
cuadrados
gl
cuadrtica
Regresin
461,631
230,815
Residuo
212,369
45
4,719
Total
674,000
47
Sig.
,000b
48,909
Coeficientesa
Coeficientes
Coeficientes no estandarizados
Modelo
1
B
(Constante)
Error estndar
15,672
1,179
edad
-,143
,025
salario
-,039
,007
estandarizados
Beta
Sig.
13,289
,000
-,516
-5,854
,000
-,504
-5,717
,000
Ho: 1 = 0
H1: 1 0
Ho: 3 = 0
H1: 3 0
Para 1
Sig = 0.000 < 0.05, Se rechaza Ho. El aporte de 1 es significativo para el modelo.
Para 3
Sig = 0.000 < 0.05, Se rechaza Ho El aporte de 3 es significativo para el modelo.
Conclusin: Con un nivel de significacin del 5%, se puede afirmar que el modelo es
vlido.
4. Determine el modelo de regresin estimado e interprete los coeficientes de
regresin. (Mtodo de mnimos cuadrados)
^y =15,6720,143 x 10,039 x 3
1 = -0.143
Cuando la edad del trabajador se incrementa en un ao, se espera que en promedio
los das de absentismo laboral disminuyan en un 0,143 das; manteniendo constante
a la variable salario.
3 = -0.039
Cuando el salario del trabajador se incrementa en una unidad monetaria, se espera
que en promedio los das de absentismo laboral disminuyan en un 0,039 das;
manteniendo constante a la variable edad.
5. Probar los supuestos del modelo de regresin lineal mltiple.
OBS.: Tener en cuenta si los errores estn autocorrelacionados, las estimaciones pierden
fidelidad. (Es decir los trminos de perturbacin correlacionados)
PRUEBA DE NORMALIDAD
Ho: Los errores tienen distribucin normal
H1: Los errores no tienen distribucin normal
48
a,b
Media
Desviacin estndar
,0000000
2,12567440
Mximas diferencias
Absoluta
,116
extremas
Positivo
,068
Negativo
-,116
Estadstico de prueba
Sig. asinttica (bilateral)
,116
,105c
Modelo
1
R cuadrado
,828a
R cuadrado
Error estndar
ajustado
de la estimacin
,685
,671
CONCLUSION:
Se cumplen los dos supuestos
6. Estimaciones y pronsticos. Puntual e intervalar
2,172
Durbin-Watson
1,841
Salario
anual (Y)
1
2
3
4
5
6
7
8
55
60
59
59
58
56
56
53
Aos de
experiencia
(X1)
5,5
9
4
8
9,5
3
7
1,5
Aos de educacin
despus de secundaria
(X2)
4
4
5
4
5
4
3
4,5
a. Realizar los pasos que se necesita para plantear y modelar la ecuacin que tiene
mayor r^2 corregido.
b. Interprete los valores de cada parmetro estimado y seleccionado
c. Qu variable explicativa es ms relevante para la variable explicada?
d. Evaluar e interpreta la bondad de ajuste del modelo
e. Estimar el sueldo anual de un trabajador si este tiene ocho aos de experiencia y
cinco aos de educacin. Ser posible realizar la estimacin?
2.
La empresa Salsberry Realty vende casas en la costa este de Estados Unidos. Una de las
preguntas que los posibles compradores hacen con ms frecuencia es: si adquirimos esta
casa, Cunto tendremos que pagar por la calefaccin en invierno? Se le pidi al
departamento de investigacin de la compaa que elabore algunos lineamientos
relacionados con los costos de calefaccin para casas unifamiliares. Se consider que el
costo incluye tres variables: (1) la temperatura media diaria en el exterior, (2) el espesor en
pulgadas del material de aislamiento trmico que se coloca en el desvn, y (3) la
antigedad del calefactor. Para realizar esta investigacin, el departamento en cuestin
seleccion una muestra aleatoria de 20 casas vendidas recientemente. Determin el costo
de la calefaccin de cada casa en el mes de enero, la temperatura exterior en la regin, el
espesor en pulgadas de material aislante instalado en el desvn, y la antigedad del
calefactor. En la tabla se presenta la informacin muestral.
3.
Aos de servicio
Edad
N de hijos
600
620
500
700
800
850
750
900
500
5
4
2
7
7
9
4
6
3
33
34
35
34
35
40
38
29
39
0
3
4
2
2
0
3
4
6
g. El salario estimado para un trabajador que tiene 10 aos de servicio, tiene 37 aos
y con 3 hijos es:
4.
5.
GLOSARIO
1. Regresin: En trminos generales, se designa con el trmino de regresin al retroceso o
a la accin de volver hacia atrs especialmente una actividad, proyecto o proceso, entre
otros. En trminos estadsticos
Direcciones electrnicas:
http://www.definicionabc.com/general/regresion.php
http://personal.us.es/aggonzalez/Docencia/Problemas_3.pdf
http://www.youtube.com/watch?v=Bye0ZBdd6iI&feature=fvst