Você está na página 1de 26

MODELOS DE PRONOSTICOS

Anlisis de regresin mltiple

Segundo semestre 2012

El modelo lineal de tres variables

El anlisis de regresin mltiple se usa para probar hiptesis


acerca de la relacin entre una variable dependiente Y, y dos o
ms variables independientes Xs. El modelo se escribe como:

Yi 1 2 X 1i 3 X 2i

La suposicin adicional (a la del modelo de regresin simple) es


que no hay relacin lineal exacta entre las Xs

A partir de las ecuaciones normales se obtienen las siguientes


expresiones
2

x
y
x

1
i
i
2
i x2i yi x1i x2i
2
x12i x22i x1i x2i 2

x2i yi x12i x1i yi x1i x2i

3
x12i x22i x1i x2i 2

1 Y 2 X 1 3 X 2

El modelo lineal de tres variables

El estimador B2 mide el cambio en Y por variaciones unitarias en X1


mientras se mantiene constante X2, B3 se define anlogamente.
Los estimadores se llaman coeficientes de regresin parcial y son
MELI (mejores estimadores linealmente insesgados).
Ejemplo:
Considere la siguiente tabla la cual nos entrega la relacin entre la
cantidad de maz Y explicado por la cantidad de fertilizante X1i y la
cantidad de insecticida X2i.

Ao

X1

X2

x1

x2

x1y

x2y

x1x2

x12

x22

1971

40

-17

-12

-8

204

136

96

144

64

1972

44

10

-13

-8

-8

104

104

64

64

64

1973

46

12

-11

-6

-7

66

77

45

36

49

1974

48

14

-9

-4

-5

36

45

20

16

25

1975

50

16

-5

-2

-3

10

15

1976

58

18

12

1977

60

22

14

12

16

1978

68

24

20

11

66

88

48

36

64

1979

74

26

21

17

136

153

72

64

81

1980

80

32

24

23

14

12

322

276

168

196

144

n=10

Sm=570

Sm=280

Sm=120

Sm=0

Sm=0

Sm=0

Sm=956

Sm=900

Sm=524

Sm=576

Sm=504

El modelo lineal de tres variables

Con lo anterior se puede calcular:

x1i yi x22i x2i yi x1i x2i (956)(504) (900)(524) 0.65


(576)(504) (524) 2
x12i x22i x1i x2i 2
2

x
y
x

2
i
i
1
i x1i yi x1i x2i (900)(576) (956)(524)
3

1.11
2
2
2
2
(576)(504) (524)
x1i x2i x1i x2i
2

1 Y 2 X 1 3 X 2 57 (0.65)(18) (1.11)(12) 31.98

Finalmente la ecuacin de regresin queda de la forma:

Yi 31.98 0.65 X 1i 1.10 X 2i

Prueba de significacin de los


estimadores de parmetros

Con el fin de probar la significacin estadstica de los


estimadores de parmetros de la regresin mltiple, se
requiere conocer la varianza de estos estimadores
2
x

2i
var 2 2
2
2
2

x
x

x
x
1i 2i 1i 2i
2
x
1i
var 3 2
2
2
2

x
x

x
x
1i 2i 1i 2i

Como vimos antes la varianza del error es desconocida


por lo tanto ocupamos una estimacin insesgada de esta

2
u
i

nk

Donde k es el nmero de parmetros estimados

Prueba de significacin de los


estimadores de parmetros

Luego las estimaciones insesgadas de la varianza son


las siguientes

s2

s2

nk x x x x
u
x

nk x x x x
2
i

2
2i

2
1i

2
2i

2
i

1i 2 i

2
1i

2
1i

2
2i

1i 2 i

Aplicando raz cuadrada a las cantidades anteriores se


obtienen los errores estndares de cada estimador

Prueba de significacin de los


estimadores de parmetros

Ejemplo
Consideremos la tabla anterior acerca de la produccin de
maz considerando la cantidad de fertilizantes y la cantidad
de insecticida.
Ao

X1

X2

Y estimado

e2

y2

1971

40

40.32

-0.32

0.1024

289

1972

44

10

42.92

1.08

1.1664

169

1973

46

12

45.33

0.67

0.4489

121

1974

48

14

48.85

-0.85

0.7225

81

1975

50

16

52.37

-0.37

0.1369

25

1976

58

18

12

57.00

1.00

1.0000

1977

60

22

14

61.82

-1.82

3.3124

1978

68

24

20

69.78

-1.78

3.1684

121

1979

74

26

21

72.19

1.81

3.2761

289

1980

80

32

24

79.42

0.58

0.3364

529

n=10

Sm=570

Sm=280

Sm=120

Sm=0

Sm=13.6704

Sm=1634

Prueba de significacin de los


estimadores de parmetros

Usando los valores de ambas tablas presentadas se


obtiene:
s
s

2
2

2
3

nk x x x x
u
x

nk x x x x
2
i

2
2i

2
1i

2
2i

13.6704
504

0.06 ee( 2 ) 0.24


2
10 3 (576)(504) (524)

13.6704
576

0.07 ee( 3 ) 0.27


2
10 3 (576)(504) (524)

1i 2 i

2
i

2
1i

2
1i

2
2i

1i 2 i

Por lo tanto

2
t
2
ee

0.65
2.7
0.24

3
t
3
ee

1.11
4.11
0.27

con t 5%, g de l 7 2.365

Puesto que ambos estadsticos


de prueba exceden el valor de
t los estimadores son
estadsticamente significativos

Coeficiente de determinacin mltiple

El coeficiente de determinacin mltiple, R2, se define como la


proporcin de la variacin total de Y explicada por la regresin
mltiple de Y sobre X1 y X2, se puede calcular de la siguiente
forma:
2
ei2 2 yi x1i 3 yi x2i

2 yi
R
1

2
2
yi
yi
yi2

Considerando que el aumento de variables independientes o


explicativas probablemente incremente la SEC para una misma
STC, lo que implica un aumento de R2. Para tomar en cuenta esto,
se calcula un R2 ajustado
2
2 n 1

R 1 1 R

nk

n nmero de observaciones
k nmero de parmetros estimados

Coeficiente de determinacin mltiple

Ejemplo

El R2 para el ejemplo de maz-fertilizante-insecticida


es:
R

ei2

1
yi2

13.6704
1 0.0084 0.9916 99.16%
1634

Entonces se debe corregir este valor, de la forma:


R 2 1 (1 R 2 )

n 1
10 1
1 (1 0.9916)
0.9892 98.92%
nk
10 3

Prueba de significacin global de


regresin

La significacin global de la regresin se puede probar con la


relacin de la varianza explicada a la varianza no explicada, es
decir una relacin entre el origen de la varianza de la regresin
y la varianza del error.
Esta sigue una distribucin F con k-1 y n-k grados de libertad,
donde n es el nmero de observaciones y k es el nmero de
parmetros estimados;
2

y
i / (k 1)

R 2 / (k 1)
F

2
2
e
/
(
n

k
)
(1

R
) / (n k )
i

Si la relacin F calculada excede el valor tabulado de F a nivel


especificado de significacin y grados de libertad, se rechaza la
hiptesis nula de que todos los parmetros de la regresin son
iguales a cero.

Prueba de significacin global de


regresin

Ejemplo
Para probar la significacin global de la regresin estimada al
nivel de significacin, podemos usar R2=0.9916, es as que:

0.9916 / 2
F
413.17
(1 0.9916) / 7

Ya que el valor de F calculado excede al valor de F tabulado se


puede rechazar la hiptesis de que los parmetros de
estimacin B2 y B3, son iguales a cero y se puede afirmar que
R2 es significativamente diferente a cero

Coeficiente de correlacin parcial

El coeficiente de correlacin parcial mide la correlacin neta entre la


variable dependiente y una variable independiente despus de excluir la
influencia que sobre ellas dos ejercen las otras variables independientes del
modelo. Por ejemplo rYX1,X2 es la correlacin parcial entre Y y X 1, despues de
eliminar la influencia de X 2 sobre Y y sobre X1
rYX 1 , X 2

rYX 2 , X 1

rYX1 rYX 2 rX 1 X 2
2
1 rX2 X 1 rYX
1 2
2

rYX 2 rYX 1 rX 1 X 2
2
1 rX2 X 1 rYX
1 2
1

Donde rYX1 es el coeficiente de correlacin simple entre Y y X 1, y rYX2, rX1X2 se


definen en forma anloga. Los coeficientes de correlacin parcial oscilan
entre -1 y 1, tienen el signo del parmetro estimado correspondiente, y se
usan para determinar la importancia relativa de las diferentes variables
explicativas en una regresin mltiple

Coeficiente de correlacin parcial

Ejemplo
Considerando el problema maz-fertilizante-insecticida se
tiene:
rYX1
rYX 2
rX 1 X 2

x y 956 0.9854
576 1634
x y
x y 900 0.9917
504 1634
x y
524
x x

0.9725
504
576
x x
1i

2
1i

2
i

2i

2
2i

2
i

1i 2 i

2
1i

2
2i

asi se tiene entonces :


rYX1 rYX 2 rX 1 X 2
0.9854 (0.9917)(0.9725)
rYX1 , X 2

0.7023 70.23%
2
2
2
2
1 rX1 X 2 1 rYX 2
1 0.9725 1 0.9917
rYX 2 , X 1

rYX 2 rYX1 rX 1 X 2
1 r

2
X1 X 2

1 r

2
YX 1

0.9917 (0.9854)(0.9725)
1 0.9725

1 0.9854

0.8434 84.34%

Coeficiente de correlacin parcial

Por lo tanto X2 es ms importante que X1 para explicar la


variacin en Y.

Los resultado globales del ejemplo de maz-fertilizanteinsecticida se puede resumir como:

Y 31.98 0.65 X 1 1.10 X 2


valores t (2.70) (4.11)
R 2 0.992

R 2 0.989

rYX1 , X 2 0.70

F2,7 413.17
rYX 2 , X 1 0.84

Resultados

rYX1 0,9854
rYX 2 0,9917
rX1 X 2 0,9725

Resultados

R 2 0,992 R 0,989
Hay alta
significatividad
conjunta en los
coeficientes

Resultados

Y 31,981 0, 650 X 1 1,110 X 2

ee 2 0, 250 ee 3 0, 267

t2 2,599

t 3 4,150

Todos los coeficientes son significativos (se comprueba con


intervalos de confianza positivos)

Resultados

Correlacin simple entre Y y X1

Correlacin parcial entre Y y X1


despus de eliminar la influencia
de X2 sobre Y y sobre X1

rYX1 0,985 rY , X1 0, 701


rYX 2 0,992 rY , X 2 0,843

Resultados

Informacin sobre valores pronosticados y residuos

Resultados

Los residuos no siguen una


distribucin aproximadamente
normal
Se puede hacer prueba ks

Resultados

???

Resultados

No hay homoscedasticidad
(no hay relacin)
Se puede hacer prueba
homoscedasticidad

Resultados

Relacin fertilizanterendimiento

Resultados

Relacin fertilizanteinsecticida

Resultados
Intervalo de confianza para la media
Valores pronosticados

Intervalo de confianza
para valores individuales

Você também pode gostar