Você está na página 1de 13

EJERCICIOS

GUIA MULTICOLINEALIDAD 1

1) Determinar modelo MCO

Modelo 1: MCO, usando las observaciones 1-8
Variable dependiente: Y
const
X
X1
X2

Coeficiente
0.286058
0.634615
0.199519
0.271635

Desv. Tpica Estadstico t


1.60586
0.1781
0.271046
2.3414
0.119408
1.6709
0.470237
0.5777

valor p
0.8673
0.0793
0.1701
0.5945

Media de la vble. dep.


7.000000
D.T. de la vble. dep.
Suma de cuad. residuos
2.814904
D.T. de la regresin
R-cuadrado
0.872050
R-cuadrado corregido
F(3, 4)
9.087390
Valor p (de F)
Log-verosimilitud
7.173455
Criterio de Akaike
Criterio de Schwarz
22.66468
Crit. de Hannan-Quinn


a) Representar el modelo de regresin lineal mltiple

1.772811
0.838884
0.776087
0.029354
22.34691
20.20370


Y= 0,28+0,63+0,19+0,27

b) Detectar la presencia de multicolinealidad
Sntomas de Multicolinealidad

R2 alto, esto quiere decir que el modelo se explica en un 87%


Prueba de Significancia individual de los Betas

t(4)
probabilidad en la cola derecha = 0.025
probabilidad complementaria = 0.975
probabilidad a dos colas = 0.05
Valor crtico = 2.77645 (T tabla)

Con el anterior T tabla podemos inferir que a un 95% de confianza ningn


estadstico resulta significativo, sin embargo el modelo se explica en un 87%, esto
refleja un problema de incongruencia.

Contraste VIF
Factores de inflacin de varianza (VIF)
Mnimo valor posible = 1.0
Valores mayores que 10.0 pueden indicar un problema de
colinealidad
X
X1
X2

1.827
1.935
1.100

VIF(j) = 1/(1 - R(j)^2), donde R(j) es el coeficiente de


correlacin mltiple
entre la variable j y las dems variables independientes
Diagnsticos de colinealidad de Belsley-Kuh-Welsch:
lambda
3.838
0.099
0.050
0.013

cond
1.000
6.227
8.740
17.275

--- proporciones de la varianza --const


X
X1
X2
0.002
0.004
0.001
0.007
0.001
0.182
0.007
0.753
0.336
0.428
0.015
0.228
0.661
0.386
0.976
0.012

lambda = valores propios de X'X, del ms grande al ms pequeo


cond
= ndice de condicin
nota: las columnas de proporciones de la varianza suman 1.0

Problemas con VIF: NO


Determinantes: NO


Coeficientes de correlacin, usando las observaciones 1 - 8
valor crtico al 5% (a dos colas) = 0.7067 para n = 8
X

X1

X2

1.0000

0.6727
1.0000

0.1917
0.3008
1.0000

X
X1
X2



Podemos observar un R= 0,67 lo cual refleja una asociacin fuerte, sntoma
de colinealidad.





Calculamos modelo MCO solo contemplando X1




Modelo 3: MCO, usando las observaciones 1-8
Variable dependiente: X
X1

Coeficiente
0.241208

Desv. Tpica Estadstico t


0.0231311
10.4279

valor p
<0.0001

***

Media de la vble. dep.


4.250000
D.T. de la vble. dep.
1.581139
Suma de cuad. residuos
9.797783
D.T. de la regresin
1.183082
R-cuadrado no centrado
0.939520
R-cuadrado centrado
0.440127
F(1, 7)
108.7405
Valor p (de F)
0.000016
Log-verosimilitud
12.16237
Criterio de Akaike
26.32473
Criterio de Schwarz
26.40417
Crit. de Hannan-Quinn
25.78893


Como podemos observar el modelo no mejor, por lo tanto sacamos X1
Modelo 7: MCO, usando las observaciones 1-8
Variable dependiente: Y
const
X
X2

Coeficiente
2.23729
0.932203
0.457627

Desv. Tpica Estadstico t


1.28476
1.7414
0.238134
3.9146
0.532484
0.8594

valor p
0.1421
0.0112
0.4294

**

Media de la vble. dep.


7.000000
D.T. de la vble. dep.
1.772811
Suma de cuad. residuos
4.779661
D.T. de la regresin
0.977718
R-cuadrado
0.782743
R-cuadrado corregido
0.695840
F(2, 5)
9.007092
Valor p (de F)
0.022001
Log-verosimilitud
9.291221
Criterio de Akaike
24.58244
Criterio de Schwarz
24.82077
Crit. de Hannan-Quinn
22.97504


TT 0,025 ; 5 = 2,5 , POR LO TANTO AHORA B1 ES SIGNIFICATIVO Y POR ENDE EL
MODELO MEJORA











Ahora sacamos X a ver si mejora nuestro modelo



Modelo 8: MCO, usando las observaciones 1-8
Variable dependiente: Y
const
X1
X2

Coeficiente
0.248355
0.383224
0.254934

Media de la vble. dep.


Suma de cuad. residuos
R-cuadrado
F(2, 5)
Log-verosimilitud
Criterio de Schwarz

Desv. Tpica Estadstico t


2.18897
0.1135
0.123955
3.0916
0.647486
0.3937

7.000000
6.672697
0.696696
5.742544
10.62584
27.49000

D.T. de la vble. dep.


D.T. de la regresin
R-cuadrado corregido
Valor p (de F)
Criterio de Akaike
Crit. de Hannan-Quinn

valor p
0.9141
0.0271
0.7100

**

1.772811
1.155223
0.575374
0.050664
27.25168
25.64427

TT 0,025 ; 5 = 2,5 , POR LO TANTO AL SACAR X EL MODELO MEJORA, NO


OBSTANTE EL R ES INFERIOR AL R ANTERIOR, VALE DECIR, SE EXPLICA EN
MENOR MEDIDA EL MODELO.



























Ejercicio 2
Modelo 1: MCO, usando las observaciones 1-6
Variable dependiente: Y
const
x1
x2

Coeficiente
121,545
3,26235
0,143759

Media de la vble. dep.


Suma de cuad. residuos
R-cuadrado
F(2, 3)
Log-verosimilitud
Criterio de Schwarz

Desv. Tpica Estadstico t


31,0822
3,9104
0,816802
-3,9941
0,931219
-0,1544

69,16667
15,60021
0,994655
279,1533
11,38021
28,13569

Valor p
0,02971
0,02812
0,88711

D.T. de la vble. dep.


D.T. de la regresin
R-cuadrado corregido
Valor p (de F)
Criterio de Akaike
Crit. de Hannan-Quinn

**
**

24,16126
2,280366
0,991092
0,000391
28,76041
26,25960


Ecuacin de regresin= 121,545-3,26-0,1437

Sntomas de enfermedad del modelo

R2 alto, cercano a 1 (modelo explicado en un 99%)
Test significancia individual : x2 no significativo (p value alto)
T tabla= 3,18 , B2 no significativo
X2 signo incorrecto ya que al ser sustituto su signo debera ser
positivo


Modelo VIF



Podemos observar que existe multicolinealidad .


Matriz de correlacin




Esto quiere decir que ambas variables estn fuertemente asociadas
Esta correlacin es estadsticamente significativa
H0 r=0
H1 r 0 no hay asociacin

Tc = -12, 137 0,025 ; 6 = 2,770

Por lo tanto, estn estadsticamente asociadas.



3) X2= B0+ B1X1 (Variable enferma)
Modelo 3: MCO, usando las observaciones 1-6
Variable dependiente: x2
const
x1

Coeficiente
33,2928
0,865461

Media de la vble. dep.


Suma de cuad. residuos
R-cuadrado
F(1, 4)
Log-verosimilitud
Criterio de Schwarz

Desv. Tpica Estadstico t


1,19142
27,9437
0,0713074
-12,1370

20,16667
5,996608
0,973564
147,3078
8,511935
20,60739

Valor p
<0,00001
0,00026

D.T. de la vble. dep.


D.T. de la regresin
R-cuadrado corregido
Valor p (de F)
Criterio de Akaike
Crit. de Hannan-Quinn

***
***

6,735478
1,224399
0,966955
0,000264
21,02387
19,35666

Soluciones para este problema



Puedo sacar las x pero nuestro modelo tendra menos poder explicativo.

1) saco x2 ; ya que no es significativa
Modelo 5: MCO, usando las observaciones 1-6
Variable dependiente: Y
const
x1

Coeficiente
116,759
3,13793

Media de la vble. dep.


Suma de cuad. residuos
R-cuadrado
F(1, 4)
Log-verosimilitud
Criterio de Schwarz

Desv. Tpica Estadstico t


1,92929
60,5190
0,115469
-27,1755

69,16667
15,72414
0,994613
738,5102
11,40394
26,39141

Valor p
<0,00001
0,00001

D.T. de la vble. dep.


D.T. de la regresin
R-cuadrado corregido
Valor p (de F)
Criterio de Akaike
Crit. de Hannan-Quinn

***
***

24,16126
1,982684
0,993266
0,000011
26,80789
25,14068


Sacamos nuestra variable enferma (x2) pero ahora nuestro modelo es menos
representativo ya que nuestro R2 es menor, no obstante dicha diferencia entre el
actual R2 y el anterior es mnima debido a que sacamos el factor enfermo.

2) tambin podemos ampliar nuestra muestra para ver si nuestro modelo mejora,
ya que de esta forma habra una menor varianza existente entre los datos.


Modelo 1: MCO, usando las observaciones 1-10
Variable dependiente: Y
const
x1
x2

Coeficiente
69,0866
2,03843
1,47351

Media de la vble. dep.


Suma de cuad. residuos
R-cuadrado
F(2, 7)
Log-verosimilitud
Criterio de Schwarz

Desv. Tpica Estadstico t


4,49871
15,3570
0,130194
-15,6569
0,158152
9,3170

59,50000
87,73409
0,980153
172,8482
25,04801
57,00378

Valor p
<0,00001
<0,00001
0,00003

D.T. de la vble. dep.


D.T. de la regresin
R-cuadrado corregido
Valor p (de F)
Criterio de Akaike
Crit. de Hannan-Quinn

***
***
***

22,16228
3,540260
0,974482
1,10e-06
56,09603
55,10022


Ahora al ampliar nuestra muestra:
Todos significativos (***)
X2 positivo
R2 disminuy
VIF baj (entre ms cercano a 1 es mejor) (nuestro VIF anterior era cercano
a 32)

HETEROCEDASTICIDAD

Modelo 1: MCO, usando las observaciones 1-8
Variable dependiente: Y
const
X
X1
X2

Coeficiente
0,286058
0,634615
0,199519
0,271635

Media de la vble. dep.


Suma de cuad. residuos
R-cuadrado
F(3, 4)
Log-verosimilitud
Criterio de Schwarz

Desv. Tpica Estadstico t


1,60586
0,1781
0,271046
2,3414
0,119408
1,6709
0,470237
0,5777

7,000000
2,814904
0,872050
9,087390
7,173455
22,66468

Valor p
0,86728
0,07926
0,17006
0,59446

D.T. de la vble. dep.


D.T. de la regresin
R-cuadrado corregido
Valor p (de F)
Criterio de Akaike
Crit. de Hannan-Quinn

1,772811
0,838884
0,776087
0,029354
22,34691
20,20370



Sntomas de problema

2) Ningn estadstico es significativo, puesto que el T tabla es 2.77, no
obstante el r2 de nuestro modelo es cercano a 1 (0,8720) claramente existe
incoherencia en el modelo.
3) Posteriormente grafico los residuos al cuadrado y verifico si hay un patrn
4) Entre ms plana sea la recta, menos se explica el modelo.
5) Mtodo White





















Contraste WHITE






Ahora contrastamos el estadstico (5,062137) con la tabla chi cuadrado.

Grados de libertad= nmero de x (6) y probabilidad = 0,95 (alpha 0,05)
Contrastamos 5,0623 y t tabla (chi cuadrado) = 12.59

Por lo tanto NRH0, NO HAY HETEROCEDASTICIDAD.
Al 95% de confianza, NORH0 y es Homocedastico.

Si me hubiera salido que hay heterocedasticidad debo ver cual estadstico es
significativo, dichos estadsticos significativos los incorporo en el modelo
como solucin para corregir el problema.











Contraste Breusch Pagan






Test t = 1.35 Tabla chicuadrado = 7,81 NORH0 , por lo tanto no hay
heterocedasticidad.




















Gua 3

Modelo 1: MCO, usando las observaciones 1-20
Variable dependiente: costo
const
temperatura
aislamiento
antig

Coeficiente
280.549
8.24879
14.8309
6.10103

Media de la vble. dep.


Suma de cuad. residuos
R-cuadrado
F(3, 16)
Log-verosimilitud
Criterio de Schwarz

Desv. Tpica Estadstico t


44.1499
6.3545
1.39017
5.9336
4.75441
3.1194
4.01212
1.5207

205.2500
41695.28
0.804170
21.90118
104.8029
221.5887

valor p
<0.0001
<0.0001
0.0066
0.1479

D.T. de la vble. dep.


D.T. de la regresin
R-cuadrado corregido
Valor p (de F)
Criterio de Akaike
Crit. de Hannan-Quinn

***
***
***

105.8588
51.04855
0.767452
6.56e-06
217.6058
218.3833



Ecuacin de regresin= 280,549 8.24879 Temperatura-14,8309 aislamiento +
6.10 Ant

B0 = Es el costo promedio sin considerar, temperatura, antigedad y aislamiento.


(280,549)
B1= Coherente con la teora puesto que a mayor temperatura ambiente, mayor es
el costo y viceversa. Por ende, el signo est bien y el efecto sobre el costo de la
temperatura ambiente. (-8,24879)
B2= Efecto aislamiento trmico de una casa sobre los cotos de calefaccin. Entre
mayor aislamiento trmico, menores son los costos.
B3= Antigedad del sistema de calefaccin y su efecto sobre los costos, el signo es
coherente puesto que ha mayor antigedad, mayor es el costo de la calefaccin.

2) Analizo si hay sntomas para analizar
a) Prueba de significancia individual


t(16)
probabilidad en la cola derecha = 0.025
probabilidad complementaria = 0.975
probabilidad a dos colas = 0.05
Valor crtico = 2.11991


Todos los betas son significativos, menos B3

Heterocedasticidad


3) Heterocedasticidad : Es una situacin de las x , de las especificacin del modelo,
que va repercutiendo en el residuo y por lo tanto como ya sabemos los residuos al
cuadrado repercuten directamente en la varianza.

!! esta comienza a moverse a lo largo de las desviaciones.
Al moverse la varianza del residuo si mueve V (B)
ee (B)
T
A) Efectuar contraste de White



A) Efectuar contraste de White

Contraste de heterocedasticidad de White
MCO, usando las observaciones 1-20
Variable dependiente: uhat^2
Coeficiente Desv. Tpica Estadstico t valor p
----------------------------------------------------------------const
2330.38
12400.8
0.1879
0.8547
temperatura
173.985
543.728
0.3200
0.7556
aislamiento
1018.77
2214.26
0.4601
0.6553
antig
645.347
1798.63
0.3588
0.7272
sq_temperatura
7.30374
10.2582
0.7120
0.4927
X2_X3
57.0467
54.9931
1.037
0.3240
X2_X4
35.6090
52.0584
0.6840
0.5095
sq_aislamiento
23.2056
103.118
0.2250
0.8265
X3_X4
192.817
176.664
1.091
0.3007
sq_antig
32.8187
80.7259
0.4065
0.6929
R-cuadrado = 0.300690
Estadstico de contraste: TR^2 = 6.013802,
con valor p = P(Chi-cuadrado(9) > 6.013802) = 0.738536

Qu variables explican el residuo?


U2*t = 30% por estas variables
TR2= 0,300690*20= 6,01
H0 homocedasticidad , no existe heterocedasticidad
H1= Heterocedasticidad
Tr2= 6,013802
Tabla Chicuadrado , gl ( son las x del modelo White)
TT (Chicuadrado) = 16,91

Ahora contrastamos el 16,91 y 6,013802 , por lo tanto NRHO y esto quiere decir
que NO HAY HETEROCEDASTICIDAD.

Al 95% de confianza, NORH0 y es Homocedastico.

B) test para medir heterocedasticidad (B-P)





Contraste de heterocedasticidad de Breusch-Pagan
MCO, usando las observaciones 1-20
Variable dependiente: uhat^2 escalado
Coeficiente Desv. Tpica Estadstico t valor p
-------------------------------------------------------------const
1.86560
1.00049
1.865
0.0807 *
temperatura
0.0103236
0.0315031
0.3277
0.7474
aislamiento 0.144066
0.107741
1.337
0.1999
antig
0.00277058
0.0909195
0.03047
0.9761
Suma de cuadrados explicada = 2.72449
Estadstico de contraste: LM = 1.362247,
con valor p = P(Chi-cuadrado(3) > 1.362247) = 0.714408

Para medir las hiptesis relevantes construye SCE (En este caso representa a la
variabilidad promedio de u2 que el modelo explica.
SCE= 2,72449
Con este dato SCE/2 = 1,3622 es el estadstico que contrasta con la tabla
Tt (chicuadrado) = 7,81 y contrasto con el estadstico de contraste 1,36
Por lo tanto NRH0 y esto quiere decir que no existe Heterocedasticidad. Es
Homocedastico.

c) Test Koenker


Contraste de heterocedasticidad de Breusch-Pagan
MCO, usando las observaciones 1-20
Variable dependiente: uhat^2 escalado (variante robusta de Koenker)
Coeficiente Desv. Tpica Estadstico t valor p
-------------------------------------------------------------const
1804.57
2085.78
0.8652
0.3997
temperatura
21.5223
65.6764
0.3277
0.7474
aislamiento 300.344
224.614
1.337
0.1999
antig
5.77601
189.546
0.03047
0.9761
Suma de cuadrados explicada = 1.18413e+07
Estadstico de contraste: LM = 2.257591,
con valor p = P(Chi-cuadrado(3) > 2.257591) = 0.520694