Você está na página 1de 81

Facultad de Economa - UNMSM

Econometra I
Mg. Beatriz Castaeda
20010-1

Econometra

La Econometra se ocupa del estudio de


estructuras que permitan analizar
caractersticas o propiedades de una
variable econmica utilizando como
causas explicativas otras variables
econmicas.

Mg. Beatriz Castaeda

Modelo
Un modelo es la representacin
simplificada de cualquier fenmeno,
proceso, institucin y en general de
cualquier sistema.
Un sistema es un conjunto de elementos
que se encuentran en interaccin.

Mg. Beatriz Castaeda

Tipos de modelo

Modelo mental: Representacin no explcita o


exteriorizada.
Modelo verbal: Descripcin del modelo mental
en lenguaje ordinario.
Modelo fsico: Representacin de un sistema en
forma material o mediante objetos.
Modelo matemtico: Descripcin del sistema
con la ayuda del lenguaje matemtico.

Mg. Beatriz Castaeda

Modelo econmico y modelo


economtrico

Modelo econmico. Son leyes o relaciones econmicas


que son aplicables con validez general a diversos
sistemas concretos a travs del tiempo.

Modelo economtrico: Es un modelo especfico de


aplicacin a sistemas reales concretos, basado en un
modelo econmico pero desarrollado con las
caractersticas particulares del sistema en estudio. Tiene
validez limitada por el sistema de referencia o el periodo
temporal.

Mg. Beatriz Castaeda

Objeto y mtodo de la investigacin


economtrica

El papel esencial de la econometra es la estimacin y


verificacin de los modelos economtricos.

Proceso:
Especificacin del modelo en forma matemtica.
Reunin de datos apropiados y relevantes de la
economa o sector que el modelo se propone
describir.
Con los datos se estima los parmetros del modelo
Realizar pruebas con el modelo para analizar si es
valido o si es necesario modificar la especificacin.

Mg. Beatriz Castaeda

Tipos de modelos economtricos

Modelos estructurales: la especificacin,


lineal o no lineal, del modelo se basa en
las relaciones estructurales establecidas
por el modelo econmico para explicar el
comportamiento, la variable o sistema
bajo estudio
Modelos

de regresin uniecuacionales
Modelos de simulacin o multiecuacional
Mg. Beatriz Castaeda

Tipos de modelos economtricos

Modelos de series temporales: Examinan el


comportamiento pasado de una serie temporal
para inferir su comportamiento futuro. Se utiliza
cuando se tiene escaso conocimiento sobre las
relaciones causales del proceso que se trata de
predecir. Son muy fiables para predicciones a
corto plazo.
Modelos

Uniecuacionales: ARIMA, SARIMA


Modelos Multiecuacionales: VAR

Mg. Beatriz Castaeda

Relacin entre variables econmicas


y regresin esprea

Todo modelo economtrico exige una


teora econmica previa, sin ella caeremos en el mero clculo de relaciones
observacionales entre las variables.

Regresin esprea: Es aquella regresin


que no tiene significado ni explicacin en
la teora econmica

Mg. Beatriz Castaeda

El clculo de coeficientes de correlacin y el trazado satisfactorio de


lneas de regresin no debe confundirse con un mtodo para hallar
leyes, confusin tan frecuente en las ciencias sociales.
Cuando se adopta un modelo de regresin lineal y se calculan los
parmetros a partir de los datos, la ley central que se supone rige esa
informacin ruidosa (dispersa) no se ha descubierto, sino que se ha
supuesto desde el principio.
No hay elaboracin de datos estadsticos que produzca por si nuevas
hiptesis, por no hablar ya de leyes, en general, no hay esfuerzo
tcnico, por grande que sea, ni emprico, ni matemtico, que pueda
ahorrarnos el trabajo de inventar nuevas ideas, aunque sin duda
aquel trabajo tcnico puede muy bien disimular la falta de ideas.

Mario Bunge
Mg. Beatriz Castaeda

10

Proceso de contrastacin de teoras segn


Koutsoyiannis (1973)
Teora

Expresin matemtica de la teora:


Modelo

Confrontacin del modelo


con los datos

Aceptacin de la
teora si es compatible
con lo datos

Rechazo de la teora
si es incompatible
con lo datos

Revisin de la teora
si es incompatible
con lo datos

Confrontacin con
nuevos datos
Mg. Beatriz Castaeda

11

PROCESO GENERAL DE CONTRASTACIN DE TEORIAS


Teora

Modelo adoptado para contrastacin

Confrontacin del modelo


con datos del marco de referencia

Conjunto de
datos 1

Conjunto de
datos 2

Conjunto de
datos N-1

Conjunto de
datos N

Modelo economtrico 1

Modelo economtrico 2

Modelo economtrico N-1

Modelo economtrico N

Compatibilidad con datos


con elevada probabilidad

Incompatibilidad con datos


con elevada probabilidad

Para todos los modelos


y conjuntos de datos

Para algunos modelos


y conjuntos de datos

Para todos los modelos


y conjuntos de datos

Confirma eventualmente
la bondad de la teora

Informa sobre grado de


aceptabilidad de la teora

Rechazo
de la teora

Nuevos desarrollos tericos


la misma
lnea
Mg.en
Beatriz
Castaeda

Nuevos desarrollos tericos c/posibles correc.

Bsqueda de nuevos
caminos tericos

Contraste con datos no concluyente (reducida prob. o resultados opuestos compensados)

Nuevos
desarrollos
tericos

Nuevos
modelos
economtricos
y aplicacin
con nuevos
12
datos

El papel de los modelos economtricos en la


investigacin econmica aplicada
Sea el modelo estimado

Yt b0 b1 X t b2 Z t

El conocimiento de los coeficientes b0, b1 y b2 nos permite realizar


a)

Anlisis estructural: Nos permite evaluar el impacto en Yt de


las variaciones ocurridas en Xt y Zt.

b)

Prediccin de Yt dados unos hipotticos valores futuros para


Xt y Zt.

c)

Evaluacin de polticas o simulacin de los efectos que


tienen sobre YT+h diferentes estrategias que afectan a las
variables explicativas.

Mg. Beatriz Castaeda

13

MODELO ECONOMETRICO

LINEAL

Uniecuacional

Mg. Beatriz Castaeda

NO LINEAL

Multiecuacional

Uniecuacional

Multiecuacional

14

Modelo de regresin lineal mltiple


Sean las variables Y, X2, ., Xk, donde:
Y : variable observable (variable endgena o variable explicada)
X2, ., Xk : variables predeterminadas (variable exgenas o variables explicativas)
: variable aleatoria no observable (variable perturbacin)
Se plantea el modelo:

Yi 1 2 X 2 i .... k X ki i , para i 1, n
Dada una muestra de tamao n, tenemos:

Y1 1 2 X 21 ... K X K 1 1
Y2 1 2 X 22 ... K X K 2 2
............
Yn 1 2 X 2 n ... K X Kn n
Mg. Beatriz Castaeda

15

Notacin matricial
Yi 1 2 X 2 i .... k X ki i , para i 1, n

Y1 1 2 X 21 ... K X K 1 1
Y2 1 2 X 22 ... K X K 2 2
............
Yn 1 2 X 2 n ... K X Kn n
y1 1
y 1
2
... ...


yn 1

x 21
x 22
...

x 31
x 32
...

...
...
...

xk 1
xk 2

...

x2n

x3n

...

x kn

1 1

2 2
... ...


k n

Y = X +
Mg. Beatriz Castaeda

16

Supuestos del modelo


1. Yi es variable observable, variable dependiente.
2. Xi son variables fijas (con valores predeterminados, no colineales
(linealmente independientes). Rango (X) = K. Variables explicativas o
independientes.
i son variables aleatorias homocedasticas e incorrelacionadas, es decir,
E( i ) = 0; V( i ) = 2 ; Cov ( i, j ) = 0.
E ( 1 ) 0
E ( ) 0
2

E ( )

.....

E ( n ) 0

2

V ( ) E ( ) E
... 1

...

E ( 12 )

E ( 1 2 )

...

E ( 1 n )

E ( 2 1 )

...

E ( n 1 )

E ( 22 )
...
E ( n 2 )

...
...
...

E ( 2 n )
...

E ( n2 )

...

0
2
...
0

4. El nmero de observaciones excede al de parmetros a estimar.


Mg. Beatriz Castaeda

... 0

... 0
... ...

... 2
17

Propiedades de matrices y
Distribuciones de probabilidad
1. A es simtrica

2. A es idempotente

AT = A

An = A

3. A es simtrica e idempotente

4. Si AB y BA

Mg. Beatriz Castaeda

(A) = Traza (A)

Traza (AB) = Traza (BA)

18

Propiedades de matrices y
Distribuciones de probabilidad
5. Si X(kx1) es N(, V) y si Tpxk es una matriz de coeficientes con (T) = p
TX tiene distribucin N(T, TVT)

Puesto que TX genera


combinaciones lineales de
variables normales

6. Si X(kx1) es N(0, I) y A es una matriz simtrica e idempotente


XAX es 2(r) con r = Traza(A)

7. XAX y XBX son formas cuadrticas independientes

Mg. Beatriz Castaeda

AB=0

19

Estimador de Mnimos Cuadrados


Ordinarios (MCO)
Sea

Yi 1 2 X 2 i .... k X ki i , para i 1, n
Dado el estimador

Obtenemos el valor calculado

...

Yi 1 2 X 2 i 3 X 3 i ... k X ki
y el residuo o error de estimacin

e i Yi Yi Yi ( 1 2 X 2 i 3 X 3 i ... k X ki )
Mg. Beatriz Castaeda

20

El mtodo de mnimos cuadrados ordinarios consiste en obtener los estimadores


de i minimizando la suma de cuadrados de los errores, esto es,
n

i 1

i 1

S ( ) e 2i [Yi ( 1 2 X 2 i 3 X 3 i ... k X ki )]2 ee

S ( ) ee e1

e2

... e n

e1
e
n
2
e2

i
...
i 1

en

Y1 Y1

Y Y

Y Y

......

Yn Yn

S ( ) ee (Y Y )(Y Y ) (Y X )(Y X )

Mg. Beatriz Castaeda

21

Para minimizar S ( )

respecto a cada

por la condicin de primer orden obtenemos las derivadas

e igualamos a 0

S ( ) [Yi ( 1 2 X 2 i 3 X 3 i ... k X ki )]2


i 1

n
S ( )
2 (Yi ( 1 2 X 2 i 3 X 3 i ... k X ki ) ( 1) 0

i 1
1

n
S ( )
2 (Yi ( 1 2 X 2 i 3 X 3 i ... k X ki ) ( X 2 i ) 0

i 1
2

.
n
S ( )
2 (Yi ( 1 2 X 2 i 3 X 3 i ... k X ki )( X ki ) 0
k
i 1

Con estas igualdades formamos un sistema de ecuaciones, denominadas ecuaciones normales


Mg. Beatriz Castaeda

22

Sistema de ecuaciones normales


n

i 1

i 1

i 1

i 1

Yi n1 2 X 2 i 3 X 3i ... k X ki
n

Y
i 1

X 2i

i 1

i 1

i 1

i 1

1 X 2 i 2 X 22i 3 X 2 i X 3 i ... k X 2 i X ki

.
n

i 1

i 1

i 1

i 1

i 1

Yi X ki 1 X ki 2 X ki X 2i 3 X ki X 3 i ... k X ki2
1 1 1
x x x
21 22 23
... ... ...

xk 1 xk 2 xk 3

... 1
... x2 n
... ...

... x kn

y1 n
y x
2 2i
... ...

yn xki

XY = (XX)
Mg. Beatriz Castaeda

x
x

2i
2
2i

...
x2i xki

x
x x
3i

2i 3i

...
...

...
...
x3i xki ...

x
x x

1

2 i ki 2
... ...
2
x ki k
ki

( X X ) 1 X Y
23

Utilizando la expresin matricial para S ( )

S ( ) ee (Y X )(Y X ) (Y X ) (Y X )
Y Y X Y Y X X X
Y Y 2 X Y X X
S ( )
2 X Y 2( X X ) 0

X Y ( X X )

Mg. Beatriz Castaeda

( X X ) 1 X Y
24

Propiedades de los estimadores


1) Insesgado:

E ( )

( X X ) 1 X Y ( X X ) 1 X ( X ) ( X X ) 1 X
Funcin lineal de las obs. Y

Funcin lineal de las perturbaciones

E ( ) [( X X ) 1 X ]E ( )
2)

V ( ) 2 ( X X ) 1

( X X ) 1 X
1
1
V ( ) E[( )( )] E[( X X ) X X ( X X ) ]

( X X ) 1 X E ( ) X ( X X ) 1 ( X X ) 1 X ( 2 I ) X ( X X ) 1

2 ( X X ) 1
Mg. Beatriz Castaeda

25

Teorema de Gauss-Markov
El estimador MCO es el estimador lineal insesgado ptimo, en el sentido de
que cualquier otro estimador lineal insesgado tiene una matriz de
covarianzas mayor que la del estimador MCO

Demostracin

~ ~
~
Sea A Y un estimador lineal de y sea A A ( X X ) 1 X ; matriz kxT , de mod o que

~
[ A ( X X ) 1 X ]Y [ A ( X X ) 1 X ] ( X ) AX [( X X ) 1 X ]

~
Luego E ( ) AX

~
as ser insesgado slo si A es tal que AX 0

Si se cumple condicin, el vector quedara expresado como:

~
[ A ( X X ) 1 X ]

~
La matriz de convarianzas de ser
~
~
~
V ( ) E[( )( )] E ([ A ( X X ) 1 X ] )([ A ( X X ) 1 X ] )

2 AA 2 ( X X ) 1 2 ( X X ) 1 V ( MCO )
Mg. Beatriz Castaeda

26

Estimador de 2
e Y X X X ( X X ) 1 X Y
X X ( X X ) 1 X ( X )
X ( X X ) 1 X
[ I X ( X X ) 1 X ] M
M es simtrica e idempotent e
M [ I X ( X X ) 1 X ] I X ( X X ) 1 X M
MM [ I X ( X X ) 1 X ][ I X ( X X ) 1 X ]
I X ( X X ) 1 X X ( X X ) 1 X X ( X X ) 1 X X ( X X ) 1 X

I X ( X X ) 1 X M
Mg. Beatriz Castaeda

27

S ( ) ei2 ee ( M )( M ) M M M

E ( e ) E ( M ) E
2
i

a
i 1

ii

2
i

a ij i j
i j

a ii 2 a ij E ( i j )
2 Traza ( M ) 2 ( n k )
Traza ( M ) Traza ( I nxn X ( X X ) 1 X )
Traza ( I ) Traza ( X ( X X ) 1 X )
n Traza (( X X ) 1 X X ) n Traza ( I kxk ) n k
2
e
i

ee

nk nk
2

Mg. Beatriz Castaeda

Es un estimador insesgado de

28

Clculo de

S
2

2
e

2
e
i

ee

nk nk
2

ee Y Y 2 X Y X X
ee Y Y 2 X Y X X [( X X ) 1 X Y ]

ee Y Y X Y

Y Y ( X Y )
S
nk
2

Mg. Beatriz Castaeda

2
e

29

Para las variables Y, X2, X3, X4 se plante el siguiente modelo

Yi 1 2 X 2 i 3 X 3 i 4 X 4 i i , para i 1, n
Obtenemos los estimadores de los parmetros con la siguiente informacin
resumida de la data obtenida para una muestra:

Y`Y = 10 X Y

3
3

2 0

( X X ) 1 X Y

4 2 0
8

X `X

10
4

0.52
0.64


0.16

0.38

0
0

( X `X ) 1

0.1364 0.0682 0.0455


0.0682 0.1591 0.0227

0.0455

0.0227

0.1818

0
0
0

0.125

Y Y ( X Y ) 10 4,9205
S

0,8466
nk
6
2

2
e

Yi 0.52 0.64 X 2 i 0.16 X 3 i 0.38 X 4 i


Mg. Beatriz Castaeda

30

Yi 1 2 X 2 i 3 X 3 i 4 X 4 i i , para i 1, n

Modelo:

Modelo estimado

Yi 0.52 0.64 X 2 i 0.16 X 3 i 0.38 X 4 i ei


S e2 0,8466 ;

0.1154 0.058 0.0385


0.058 0.1347 0.019

V ( ) S ( X `X )
2
e

0.0455

Mg. Beatriz Castaeda

S e 0,9201

0.019 0.1539
0

0
0
0

0.1058

31

Coeficiente de determinacin R2
Yi 1 2 X i

y
yi

Yi y

(Y

SCR
R2

SCT

i 1

( y y )
(Y y )

(Y y

Y )

i 1

SCT

Variacin
no explicada
error

SCE

( y i y )
Variacin
explicada por
la regresin

( y
i 1

Y )2

SCR

Este coeficiente indica en que proporcin


la variacin de Y es explicada por el
modelo de regresin

SCE
R2 1
1
SCT
Mg. Beatriz Castaeda

(Yi y i )

Variacin
Total

xi

(Y

2
i

y )2
32

SCE
R 1
1
SCT
2

R2

2
2
(
Y

Y
)

e
i
i

(Yi Y )

(Y

2
i

y )2

2
2
Y

n
Y
(Y Y X Y )
i
2
2
Y

n
Y
i

n
Y
R2
Y Y n Y 2

Mg. Beatriz Castaeda

33

Coeficiente de determinacin ajustado


R2 1

(Y

2
i

y )2

Al considerar a R2 como un indicador del poder explicativo del modelo, debemos


tener en cuenta que al comparar dos modelos con diferente nmero de variables
explicativas, el modelo con ms variables siempre tendr un R2 mayor.
Para determinar que tanto mejora el poder explicativo del modelo al adicionar
nuevas variables se propone una modificacin en el clculo del R2 al que se
denomina R2 ajustado.
2

R 1

[ SCE /( n k )]
n1
1
(1 R 2 )
[ SCT /( n 1)]
nk

Este coeficiente es sensible al nmero de variables adicionadas, de manera que si las


variables adicionadas no incrementan de manera significativa el poder explicativo el
R2 ajustado se reducir.
Mg. Beatriz Castaeda

34

Distribuciones de los estimadores


Si el vector de perturbaciones tiene distribucin normal multivariante N ( 0, 2 I )

entonces:
1
1
1) ( X X ) X Y ( X X ) X

Es funcin lineal de las perturbaciones, y por lo tanto

tiene distribucin normal N ( , 2 ( X X ) 1 )


Luego, cada i tiene distrib . N ( i , 2 a ii ); donde a ii ( X X ) 1
2)

tiene dist . N (0, I n )


( n k ) S e2 M
2

tiene
dist
.

( n k )
2
2

Mg. Beatriz Castaeda

35

3)

( )[V ( )]1 ( ) tiene dist . (2k )


( ) X X ( )
1

( )[V ( )] ( )
2
[ X ( )] [ X ( )] ( N )( N ) N

2
2

X ( ) X X Y (Y ) (Y Y )

M ( I M ) ( X ( X X ) 1 X ) N
Traza(N) = K
Mg. Beatriz Castaeda

36

( n k ) S e2 M
2

tiene
dist
.

( n k )
2
2

N
1
2

( )[V ( )] ( )
tiene
dist
.

(k )
2
MN M ( I M ) M MM 0
Entonces las dos formas cuadrticas son independientes
Luego

[( ) X X ( )] / k
F
tiene dist . F( k , n k )
2
Se

Mg. Beatriz Castaeda

37

Estimacin y Prueba de Hiptesis para los parmetros del modelo


1. Para i

Como i es N ( i , 2 a ii )
y

( n k ) S e2
tiene dist . (2n k )
2

( i i )

t 1 / 2

- t1-/2

Mg. Beatriz Castaeda

t1-

t(n-k)

a ii

( n k ) S e2

( n k ) 2

Estimacin por intervalo

( i i )

es t ( n k )
S e a ii

( i i )
T
t 1 / 2
S e a ii

Obtenemos

L i t1 / 2 S

38

Prueba de Hiptesis

H 0 : i i*

H 1 : i i*

Estadstica de la Prueba

( i i* )
T
es t ( n k ) si H 0 es cierta
S e a ii
Decisin

Rechazar la H0 a favor de H1 si

T t 1 / 2 o

Mg. Beatriz Castaeda

- t1-/2

t1-

t(n-k)

T t 1 / 2
39

2. Para

( n k ) S e2
2
tiene
dist
.

( n k )
2

1-

2
/2

Obtenemos

Mg. Beatriz Castaeda

12 / 2

(2n k )

( n k ) S e2
Li
12 / 2

2
/2

( n k ) S e2
2

1 / 2
2

( n k ) S e2
Ls
2 / 2
40

10
0
2
0


....
0
k

Prueba de Hiptesis

H0 : 0

H1 : 0

Estadstica de la Prueba

[( 0 )[ X X ]( 0 )] / k
F
tiene dist . F( k , n k ) si H 0 es cierta
2
Se
Decisin

Rechazar la H0 a favor de H1 si
F > F1-

Mg. Beatriz Castaeda

F1-

F(k ,n-k)

41

Prueba de Hiptesis para restricciones lineales


Sea el modelo

Yi 1 2 X 2 i .... 5 X 5 i i , para i 1, n
Para el cual se formula las siguientes hiptesis

1.

3 3 5 8

H 0 : 4 4 1 0
3 2
5 2

Restricciones lineales

H 0 : R r
1

0 0 3 0 1 2

1 0 0 4 0

0 1 0 0 3 4

R
Mg. Beatriz Castaeda

8
0
2

r
42

Prueba de Hiptesis para restricciones lineales

H 0 : R r

H 0 : R r

Rqxk ; q k
Rango( R ) = q (las restriciones son
linealmente independientes)

1. Prueba o Test de Wald


Estadstica

W ( R r )[V ( R r )]1 ( R r ) es (2q )

es N ( , 2 ( X X ) 1 )
E ( R r ) R E ( ) r R r 0
V ( R r ) R[V ( )]R

( R r ) es N (0, R[V ( )] R)

W ( R r )[ 2 R ( X X ) 1 R]1 ( R r ) es (2q )
W ( R r )[ S e2 R ( X X ) 1 R]1 ( R r ) (2q )
Mg. Beatriz Castaeda

12

(2n k )
43

2. Prueba F

H 0 : R r

H 0 : R r

Rqxk ; q k

{( R r )[ R ( X X ) 1 R]1 ( R r )} / q
F
es F( q ,n k )
ee /( n k )

F1

F( q ,n k )

W ( R r )[ 2 R ( X X ) 1 R]1 ( R r ) es (2q )
( n k ) S e2 ee
2

tiene
dist
.

(
n k )
2
2
Mg. Beatriz Castaeda

W qF
44

Estimacin de un modelo de Regresin mltiple con EViews


1. Ingresar a EViews

File

New

workfile

File
New
workfile

Mg. Beatriz Castaeda

45

2. Frequency

Mg. Beatriz Castaeda

anual

Range

OK

46

3. Ingreso de datos:

Mg. Beatriz Castaeda

Quick

Empty group

47

Aparece una planilla en blanco en la que se asigna nombre a las variables y se ingresa los
datos como en una planilla excel

Mg. Beatriz Castaeda

48

3. Estimacin de la ecuacin:

Mg. Beatriz Castaeda

Quick

Estimate equation

49

En la ventana se especifica el modelo ingresando a la izquierda la v. dependiente luego la


constante y las variables explicativas, luego presionar en OK

Mg. Beatriz Castaeda

50

El programa ofrece los resultados de la estimacin

Mg. Beatriz Castaeda

51

Modelo estimado

INV 5.23 0.21 PNB 0.83 R e


Dependent Variable: INV
Method: Least Squares
Date: 04/01/07 Time: 17:38
Sample: 1971 1994
Included observations: 24
Variable

Coefficient

Std. Error

t-Statistic

Prob.

5.228449

29.00686

0.180249

0.8587

PNB

0.213205

0.011921

17.88539

0.0000

-0.828817

3.239046

-0.255883

0.8005

R-squared

0.941937

Mean dependent var

41.13333

Adjusted R-squared

0.936407

S.D. dependent var

20.97122

S.E. of regression

5.288459

Akaike info criterion

6.285400

Sum squared resid

587.3238

Schwarz criterion

6.432656

F-statistic

170.3368

Prob(F-statistic)

0.000000

Log likelihood
Durbin-Watson stat
Mg. Beatriz Castaeda

-72.42479
0.787335

52

Para guardar el modelo: Name

Mg. Beatriz Castaeda

Se escribe el nombre

OK

Se escribe la especificacin

53

Anlisis de significancia de las variables


Sea el modelo

Yi 1 2 X 2 i .... k X ki i , para i 1, n
1) Anlisis de significancia de la variable Xi

H0 : i 0

H1 : i 0

Estadstica de la Prueba

i
T
S

es t ( n k ) si H 0 es cierta
i

Mg. Beatriz Castaeda

- t1-/2

t1-

t(n-k)

54

2) Anlisis de la significancia de un subvector de s variables

q 1

q 2
H0 :
.....

R 0 qxs I sxs

sx 1

0
0

...

0

0
0

...

...

...

...

1
...

... ... ... ... ... ... ...

sx 1

...

...

sxk

q 1
q 2

...
k

0
0

...

sx 1

kx 1

Ninguna de las s variables es


significativa para explicar a Y

Con H0 se define una particin en la matriz X :

1 X 21
1 X
22
X
... ...

1 X 2 n
Mg. Beatriz Castaeda

X1

X X1 X 2

...

X q1

X q 1 1

...

...
...
...

X q2
...
X qn

X q 1 2
...
X q 1 n

...
...
...
X2

X k1

X k 2
...

X kn
55

X X1 X 2

B1

B2

Y X1 X 2

H 0 : B2 0

B1
B X 1 B1 X 2 B2
2

H 1 : B2 0

H 0 : R 0 sxq I sxs

A11
R ( X X ) R 0 I
A21
1

Mg. Beatriz Castaeda

B1
B B2 0
2

A12 0
A22

A22 I

56

B11
X X
B21

B12

B22

A11
( X X )
A21
1

A12

A22

1
A11 ( B11 B12 B22
B21 ) 1

1
A12 B11
B12 A22

A22 ( B22 B21 B111 B12 ) 1

1
A21 B22
B21 A11

X 1'

X X

'
2

X1

X 1' X 1

X 1' X 2

'
X 2 X1

X 2' X 2

X2

R( X X ) 1 R A22 [ X 2' X 2 X 2' X 1 ( X 1' X 1 ) 1 X 1' X 2 ]1 [ X 2' M 1 X 2 ]1


Donde M 1 [ I X 1 ( X 1' X 1 ) 1 X 1' ]
Del modelo restringido
Mg. Beatriz Castaeda

Y X 1 B1 1
57

H 0 : B2 0

H 1 : B2 0

H 0 : R 0 sxq I sxs

B1
B B2 0
2

Entonces la estadstica

{( R r )[ R ( X X ) 1 R]1 ( R r )} / q
F
es F( q ,n k )
ee /( n k )
Se reduce a:

2' [ X 2' M 1 X 2 ] 2 / s
F
es F( s , n k )
2
Se
Mg. Beatriz Castaeda

58

Contraste de significacin, mediante sumas residuales


H 0 : B2 0

H 1 : B2 0

Modelo restringido

Modelo sin restriccin

Modelo sin restriccin


(MSR)

Y X1 X 2

e MY

Modelo restringido
(MR)

B1

B2

B1
B X 1 B1 X 2 B2
2

SCE ( MSR ) ee Y M Y

Y X 1 B1 1

SCE ( MR ) e1e1 Y M 1 Y
e1 M 1Y

Mg. Beatriz Castaeda

59

En el MSR

Y X 1 B 1 X 2 B 2 e

M 1Y M 1 X 1 B 1 M 1 X 2 B 2 M 1e M 1 X 2 B 2 e
M 1 X 1 1 [ I X 1 ( X 1' X 1 ) 1 X 1' ] X 1 1 0
X Y ( X X )

Luego

Mg. Beatriz Castaeda

X 1'

X 1' e

0
e '
'
X2
X 2 e 0

X (Y X ) X e 0

M 1e [ I X 1 ( X 1' X 1 ) 1 X 1' ]e e

60

M 1Y M 1 X 2 B 2 e
( M 1Y )( M 1Y ) ( M 1 X 2 B 2 e )( M 1 X 2 B 2 e )
Y M 1Y B 2 X 2 M 1 M 1 X 2 B 2 B 2 X 2 M 1 e e M 1 X 2 B 2 ee
2 X 2 M 1e 2 X 2 e 0

e M 1 X 2 2 [ 2 X 2 M 1e ] 0

Y M 1Y B 2 X 2 M 1 X 2 B 2 ee

SCE(MR)

Luego

SCE(MSR)

B 2 X 2 M 1 X 2 B 2 SCE ( MR ) SCE ( MSR )


Y Y 1 X 1Y (Y Y X Y )
( X Y nY 2 ) ( X Y nY 2 )
1

SCR(MSR)
Mg. Beatriz Castaeda

SCR(MR)

61

H 0 : B2 0

H 1 : B2 0

Estadstica de la prueba

2' [ X 2' M 1 X 2 ] 2 / s
F
es F( s , n k )
2
Se
Equivale a:

[ SCE ( MR ) SCE ( MSR )] / s [ SCR( MSR ) SCR( MR )] / s


F

es F( s , n k )
SCE ( MSR ) /( n k )
SCE ( MSR ) /( n k )

[ X Y 1 X 1Y ] / s
F
[Y Y X Y ] /( n k )
Mg. Beatriz Castaeda

62

ANALISIS DE VARIANZA: Contraste de significacin

Fuente de variacin

Suma de cuadrados

G.L.

C.M.

Razn F

SCR
K 1

SCR / k 1
SCE / n k

SCR2
kr

SCR2 / k r
SCE / n k

SCR2

k2 / a kk
SCE / n k

SCE
nk

Debido a X2, , XK

SCR X Y nY 2

k-1

Debido a X2, , Xr

SCR1 1 X 1 Y nY 2

r-1

Debido a Xr+1, , XK

SCR2 X Y 1 X 1 Y

Debido a X2, , XK-1

SCR1 X Y nY 2 k / a kk

Debido a XK

SCR2 k2 / a kk

k-r
k-2

Debido al error

SCE Y Y X Y

n-k

Total

Y Y nY

n-1

Mg. Beatriz Castaeda

63

Modelo en desviaciones de media


Yi 1 2 X 2 i .... k X ki i , para i 1, n

Yi 1 2 X 2 i .... k X ki e i , para i 1, n
Y 1 2 X 2 .... k X k ya que

1 Y ( 2 X 2 .... k X k )

Yi Y 2 ( X 2 i X 2 ) .... k ( X ki X k ) ei

yi 2 x 2 i .... k x ki ei

y xB 2 e

y : Vector de las observaciones Y en desviaciones de media

x:

Matriz de observaciones de las variables Xs en desviaciones de media

Mg. Beatriz Castaeda

64

Yi 1 2 X 2 i .... k X ki ei , para i 1, n
Modelo en desviaciones

y xB 2 e

B 2 ( x x ) 1 x y
E ( B 2 ) B2

1 Y ( 2 X 2 .... k X k )

V ( B 2 ) 2 ( x x ) 1
2

V ( 1 )
2 X 2 ( x x ) 1 X 2
n

V ( 1 ) V [Y ( 2 X 2 .... k X k )] V [Y X 2 B 2 ] V (Y ) X 2 V ( B 2 ) X 2

cov( 1 , B 2 ) Cov[Y X 2 B 2 , B 2 ] X 2 V ( B 2 ) 2 X 2 ( x x ) 1
Mg. Beatriz Castaeda

65

y xB 2 e

ee
y y B 2 x y

nk nk
nk
2
i

e y xB 2

SCE
y y B 2 x y
R 1
1
SCT
y y
2

Mg. Beatriz Castaeda

ee y y B 2 x y

B 2 x y
R
y y
2

66

Prediccin utilizando el modelo de Regresin Mltiple


Modelo:

Yi 1 2 X 2 i .... k X ki i , para i 1, n

E (Yi ) 1 2 X 2 i .... k X ki X 'i

Prediccin del promedio


Prediccin puntual

Yi 1 2 X 2 i 3 X 3 i ... k X ki X 'i

Prediccin por intervalo

E (Yi ) E ( X 'i ) X 'i


V (Yi ) V ( X 'i ) X 'i V ( ) X i

Mg. Beatriz Castaeda

Si i es N (0, 2 )
T

Yi E (Yi )
2
e

'
i

S X ( X X ) X i

es t ( n k )

L Yi t1 / 2 S e2 X i' ( X X ) 1 X i
67

Prediccin de un valor individual


Prediccin puntual

Yi 1 2 X 2 i .... k X ki i

Yi 1 2 X 2 i 3 X 3 i ... k X ki X 'i

Prediccin por intervalo

E (ei ) 0

e i Yi Yi X i' i X i'

Si i es N (0, 2 )
T

V (ei ) 2 X 'i V ( ) X i

Yi Yi
1

S (1 X ( X X ) X i )
2
e

'
i

es t ( n k )

L Yi t1 / 2 S e2 (1 X i' ( X X ) 1 X i )
Mg. Beatriz Castaeda

68

Coeficientes estandarizados
Yi 1 2 X 2 i .... k X ki i , para i 1, n

Yi Y 2 ( X 2 i X 2 ) .... k ( X ki X k ) i
Yi Y
SX2
2 S
SY
Y

j j
*

X 2i X 2

SX j

S X2

....

S Xk
SY

X 2i X 2
S X2

Variables en su nivel

Variables en
desviaciones de media

Variables estandarizadas

Se denomina coeficiente estandarizado o coeficiente Beta

SY

Los coeficientes beta informan respecto de la importancia relativa de las variables


explicativas en el modelo de regresin mltiple.
Indican cual es el cambio en unidades estandarizadas de la variable dependiente
ante un cambio en una desviacin estndar de la variable dependiente.
Mg. Beatriz Castaeda

69

Correlacin Parcial
En el modelo de regresin mltiple interesa medir cun relacionada est la
variable dependiente con cada una de las variables independientes, luego de
eliminar completamente el efecto de las otras variables independientes en el
modelo.
Ejemplo
Sea el modelo:

Yi 1 2 X 2 i 3 X 3 i i

y sean los modelos auxiliares

1) Yi 1 2 X 3 i

2) X 2 i 1 2 X 3 i

Eliminamos de Y y X2 la influencia lineal de X3 y obtenemos:

de 1) Y * Yi Yi

de 2) X *2 i X 2 i X 2 i

Al coeficiente de correlacin entre Y* y X*2 se denomina correlacin parcial


entre Y y X2.
Mg. Beatriz Castaeda

70

rYX 2 : Correlacin simple entre Y

y X2

rYX 3 : Correlacin simple entre Y

y X3

rX 2 X 3 : Correlacin simple entre X 2

y X3

rYX 2 . X 3 : Correlacin parcial entre Y


rYX 2 . X 3

rYX 2 rYX 3 rX 2 X 3

2
1 rX22 X 3 1 rYX
3

X2
Y
X3

y X 2 ( controlada por X 3

SY .3

2 rY 2.3
S 2.3

SY.3 : Desv. est. de los residuos en la regresin de Y en X3


S2.3 : Desv. est. de los residuos en la regresin de X2 en X3

Mg. Beatriz Castaeda

71

Anlisis del modelo


Supuestos del modelo
1) Las variables X son no colineales
2) Las perturbaciones tienen distribucin normal

3) Regresores son no estocsticos


4) Las perturbaciones tienen varianza constante

5) Las perturbaciones son incorrelacionadas

Mg. Beatriz Castaeda

Violacin del supuesto


Multicolinealidad
No normalidad de las
perturbaciones
Regresores estocsticos
Heterocedasticidad
Autocorrelacin

72

Problema de Multicolinealidad

MCO ( X X ) 1 X Y
Si alguna variable X es combinacin lineal de las otras, entonces

( X X ) K

No existe ( X X ) 1

Por lo tanto no podramos obtener los estimadores de los coeficientes del modelo,
lo que nos llevara a reformular el modelo en funcin de las otras variables
teniendo en cuenta la relacin lineal.
Si no existe colinealidad perfecta pero las correlaciones son muy altas, esto
implicara distorsiones en las estimaciones de los coeficientes, pues su varianza
sera muy grande (estimadores poco precisos).

Mg. Beatriz Castaeda

73

Problema de Multicolinealidad
Sea el modelo

Ejemplo:

S 22
x x ( n 1)
S 23

Yi 1 2 X 2 i 3 X 3 i i

S 23
( n 1)
2
S3

r23 S 2 S 3

S 32

S 22

r23 S 2 S 3

S 32
1
( x x )

( n 1)[ S 22 S 32 r232 S 22 S 32 ] r23 S 2 S 3


1

r23 S 2 S 3
S 22

V ( 2 )

S 32 2
2

( n 1) S 22 S 32 (1 r232 ) ( n 1) S 22 (1 r232 )

Si r23

V ( 3 )

S 22 2
2

( n 1) S 22 S 32 (1 r232 ) ( n 1) S 32 (1 r232 )

Si r23

Mg. Beatriz Castaeda

1
FIV
1 r232

Factor de incremento varianza


74

Consideremos el modelo restringido


2

u
V ( 21 )
( n 1) S 22

Yi 1 21 X 2 i ui
En cambio para el modelo sin restriccin
2
2
1

V ( 2 )
(1 r232 ) ( n 1) S 22 u2

En general

Donde

2
1
2
u

V ( 2 ) V ( 21 )

Si r23 = 0
As FIV

Yi 1 2 X 2 i 3 X 3 i i

1
1 r232

Indica en que medida ir creciendo la varianza del estimador


cuando las variables estn correlacionadas.

FIV

Mg. Beatriz Castaeda

1
1 Ri2

2
i

R :

es el coeficiente de determinacin en el modelo


de Xi dadas las otras variables Xs
75

Deteccin del problema de Multicolinealidad


1. Caracterstica tpica de la multicolinealidad es que todos los coeficientes de
regresin pueden ser no significativamente diferentes de cero a nivel
individual, aunque en conjunto todas las variables sean muy significativas.
2. Al examinar la matriz de correlacin de las variables regresoras, R, y su
inversa R-1, se encuentra que el i-simo elemento de la diagonal principal de
R-1 (tii) es el factor de incremento de varianza (FIV) del coeficiente de la
variable Xi.

Si t ii FIV ( X i )

Tolerancia = 1- R2i

Mg. Beatriz Castaeda

1
10
1 Ri2

Indica una alta multicolinealidad

Indica la porcin de la variable que no es explicada por las


otras variables

76

3. Al examinar los valores propios de (XX) o R y calcular el ndice de


condicionamiento

IC

Mximo valor propio de R


Mnimo valor propio de R

Se tiene el siguiente criterio


IC > 30

Existe alta multicolinealidad

10 IC 30

Existe multicolinealidad moderada

IC < 10

Matriz de datos est bien definida

Mg. Beatriz Castaeda

77

4. Test de Farrar Glauber


i) Test de ortogonalidad

H 0 : Las X son ortogonales entre s


H 1 : Las X no son ortogonales entre s
Estadstica

2
calc
k2( k 1) / 2

2
calc
n 1 ( 2 k6 5 ) ln R

K: n de variables explicativas
R: matriz de correlaciones simples

p
2
calc

2( k ( k 1) / 2 )

R.C.
Mg. Beatriz Castaeda

78

ii) Test F
Para determinar que regresor se encuentra ms colineado con las dems
variables.
Se obtiene la regresin de cada variable en funcin del resto de variables
y se calcula el R2 para el modelo de cada variable.
2
H 0 : Rmax
0

2
H 1 : Rmax
0

Estadstica
2
Rmax
/( k 1)
Fi
F( k 1, n k )
2
(1 Rmax ) /( n k )

K: n de variables explicativas

F( k ,n k )

Fi
R.C
Mg. Beatriz Castaeda

79

iii) Test t
Para determinar que regresor se encuentra ms correlacionado con una de
las otras variables
2
H 0 : rmax
0

2
H 1 : rmax
0

Estadstica

rmax

n 2

2
1 rmax

Rmax es el coeficiente de
correlacin simple mximo

t n 2

- t1-/2
R.C.
Mg. Beatriz Castaeda

t1-

t(n-k)

R.C
80

Tratamiento
1. Eliminar o excluir regresores del modelo, eligiendo aquellos que tengan mayor
multicolinealidad con las otras variables, es decir, FIV > 10
2. Incluir informacin externa a los datos de manera que se rompa el problema
de multicolinealidad (Se considera que este problema es un problema de la
muestra a mano)
3. Utilizar un modelo multiecuacional
4. Estimar los coeficientes utilizando el mtodo de regresin cresta, el cual es
un mtodo exploratorio que consiste en utilizar una modificacin a la matriz
(XX)
Eligiendo desde 0.01 hasta obtener resultados estables, es
( X X ) I
decir, tales que las varianzas de los estimadores no cambien
significativamente al cambiar algunos datos
5. Utilizar restricciones lineales para los coeficientes
6. Utilizar un modelo de componentes principales
Mg. Beatriz Castaeda

81

Você também pode gostar