Você está na página 1de 6

T.E.A.

(Disciplina Preparatria para o Exame da ANPEC)


Mdulo de Estatstica - Professor: Eduardo Lima Campos

O Problema da Endogeneidade
Em uma regresso linear simples, todos os
fatores que possam influenciar Y alm de X
so considerados parte do termo de erro u.
22. ERROS DE Exemplo 22.1 - Imagine que voc queira
ESPECIFICAO explicar a nota de um aluno a partir de sua
frequncia s aulas, utilizando um modelo
de regresso linear simples com Y = nota
e X = nmero de faltas. Quais efeitos no
estariam sendo considerados por modelo?

Variveis omitidas no ocasionam problemas


para os estimadores dos coeficientes do modelo, Se Cov(X,u) 0, X chamada endgena.
exceto se apresentam correlao com X.
Se Cov(X,u) = 0, X chamada exgena.
No exemplo 22.1, a aptido do aluno tem
alguma relao com o nmero de faltas?
Sim, e neste caso, temos: Cov(X,u) 0. A nomenclatura oriunda da literatura
de equaes simultneas, assunto a ser
Se a varivel X apresenta correlao com o abordado no captulo 24 deste material.
erro u, temos o problema da endogeneidade.

Um argumento intuitivo para entender porque Na presena de endogeneidade, os


a endogeneidade causa problemas que ela estimadores do coeficiente de X e do
torna impossvel isolar - e portanto estimar - intercepto so viciados e inconsistentes.
o impacto ceteris paribus de X sobre Y. Demonstrao (para 1 ) - aplicando
o limite em probabilidade ao estimador :
Isto porque, se X varia, os fatores omitidos
correlacionados com ela tambm variaro.
n

( X i X )(Yi Y )
O argumento formal apresentado a seguir.
( )
Plim 1 = Plim
i =1
n
(X i X )
2

i =1

1
T.E.A. (Disciplina Preparatria para o Exame da ANPEC)
Mdulo de Estatstica - Professor: Eduardo Lima Campos

Usando que o Plim da razo


Dividindo, dentro do Plim, igual razo dos Plims :
numerador e denominador por n :
n

( X i X )( Yi Y )
( X X )( Y Y ) P lim i =1
n
(X i X )(Yi Y)
n

(X X )(Y Y ) i i
n
i =1
n
i =1

i i Plim n =
Plim i =1 n = Plim n

n
n
2
i (X i X )
n 2
(X i X )
2
(X i X )
2
( X X )

i =1
i =1 i =1 P lim i =1
n n
n

Aplicando a Lei dos Grandes Nmeros :


Finalmente, supondo V(X) 0 (RLS. 3) :
sob a
validade
n

(X i X )(Yi Y )
( )
da RLS. 2
Cov(X, Y)
P lim i =1
= Cov(X, Y ) Plim 1 = .
n V (X)

n
2
(X i X )
e P lim i =1
= V (X ). Resta obter o lado direito da equao
n como funo do parmetro 1. Esta

conta mostrada no slide seguinte.

RLS. 1
Ou seja, se Cov(X,u) 0, ento o limite em
Cov(X, Y) = Cov( X, 0 + 1X + u ) probabilidade do estimador de MQO de 1
= Cov(X, 0 ) + Cov(X, 1X) + Cov( X, u ) diferente de 1, logo ele inconsistente para 1.
= 0 + 1Cov(X, X) + Cov(X, u ).
Como 0 funo de 1 , conclui - se que,
Assim : sob as RLS. 1 a 4, tambm inconsistente.
0

( )
V (X) + Cov(X, u )
Plim 1 = 1
V(X )
= 1 +
Cov(X, u )
V(X )
. Adicionalmente, Cov(X,u) 0 E(u|X) 0,
tornando os estimadores de MQO viciados.

2
T.E.A. (Disciplina Preparatria para o Exame da ANPEC)
Mdulo de Estatstica - Professor: Eduardo Lima Campos

Clculo do Vcio por Omisso de Varivel Prova-se (apndice A22.1) que:

Modelo Real: Y = 0 + 1X + ZZ + u E ( 1 ) = 1 + Z ZX
(este o modelo que deveramos estimar)
estimativa da inclinao
Modelo Estimado: Y = 0 + 1X + v da regresso de Z em X

Nesta notao, 0 e 1 so os parmetros do Interpretao : 1 no mede o efeito


modelo que omite Z. Estudaremos a seguir ceteris paribus de X sobre Y, sendo
as propriedades dos estimadores de 0 e 1. " contaminado" pelo efeito de Z sobre X e Y.

Vicio/Vis por Omisso de Varivel Condies para Ausncia de Vcio:

Z ZX Perceba que o estimador de 1 ser


no viciado se Z = 0 e/ou rXZ = 0.

Note que o sinal do vcio depende do sinal Caso contrrio, a direo do vcio ser
do coeficiente do modelo real e do sinal da determinada pelo sinal do produto
correlao amostral entre X e Z. Ambos, na entre as duas quantidades supracitadas.
prtica, so baseados em suposies tericas.

Resumo das Consequncias (supondo Z 0):


Caso 1.2) rXZ = 0
Caso 1.1) rXZ 0
0 e 1 so no viciados e consistentes.
0 e 1 so viciados e inconsistentes.
(este, infelizmente, o caso mais comum) Mas V( 1 ) viciado para V( 1 ), pois
2 ser estimado incorretamente.
As varincias tambm so estimadas
com vcio (ver apndice A22.2). A direo do vcio imprevisvel.

3
T.E.A. (Disciplina Preparatria para o Exame da ANPEC)
Mdulo de Estatstica - Professor: Eduardo Lima Campos

Obs - Incluso de Varivel Irrelevante

Outro possvel erro de especificao Neste caso, prova-se que a nica


a incluso de uma varivel irrelevante: consequncia que as varincias dos
estimadores, embora estimadas sem vcio e
de forma consistente, no so, em geral,
Modelo Real: Y = 0 + 1X + u eficientes. A consequncia de omitir uma
varivel relevante muito mais grave!
Modelo Estimado: Y = 0 + 1X + ZZ + v

no pertence ao modelo populacional

Exemplo 22.2 - Seja Y = salrio, R: a experincia profissional um fator


X = educao e o seguinte modelo: possivelmente correlacionado com Y
(positivamente) e com X (negativamente),
fazendo com que o modelo de regresso
ln(Y) = 0 + 1X + u. simples no possibilite que se estime
corretamente (isto , que se isole) a
relao de causalidade entre X e Y.
Discuta fatores que devem causar a
endogeneidade de X no modelo acima, Como a experincia profissional observvel,
e possveis solues para este problema. podemos incorporar esta varivel ao modelo.

Exemplo 22.3 - Vamos ampliar a


especificao do modelo, incluindo a Ao incorporar a experincia ao modelo de
forma explcita (como varivel explicativa,
varivel X2 = experincia profissional.
tirando ela do termo de erro), eliminamos
a endogeneidade que ela causava em X1.
Assim, sejam Y = salrio, X1 = educao,
X2 = experincia profissional, e o modelo: Tecnicamente, dizemos que estamos
controlando a experincia, com o objetivo
de tornar a interpretao ceteris paribus
Y = 0 + 1X1 + 2X2 + u. de 1 mais prxima da realidade.

4
T.E.A. (Disciplina Preparatria para o Exame da ANPEC)
Mdulo de Estatstica - Professor: Eduardo Lima Campos

Neste modelo, 1 mede o efeito da educao Neste caso, apenas queremos controlar X2,
sobre o salrio, considerando a experincia para eliminar/atenuar a endogeneidade e
fixa, mesmo que haja alguma correlao tornar mais realista a interpretao ceteris
entre anos de educao e a experincia. paribus de 1, o parmetro de real interesse
(esta, inclusive, a situao mais comum).

O fato de incorporarmos X2 ao modelo no


Como veremos, no h problema srio em
necessariamente implica que estejamos
termos no modelo X1 e X2 correlacionadas
interessados na interpretao de 2.
(contanto que a correlao no seja perfeita).

Exemplo 22.4 - Seja Y = nota em um exame Exemplo 22.5 - No modelo do exemplo


e X1 = nmero de faltas, em uma disciplina de 22.3, a incluso de uma varivel X3 = idade,
nvel superior. recomendvel controlar as junto com X2 = experincia profissional,
aptides, incluindo no modelo variveis como: pode causar multicolinearidade perfeita,
X2 = C.R., X3 = nota no exame de admisso dependendo da forma como se define
(ENEM) e X4 = mdia geral no ensino mdio. experincia. Por exemplo, em algumas
Algum pode argumentar que os resultados aplicaes, define-se experincia como:
obtidos no sero confiveis, porque X2, X3 e idade anos de educao - 6. Neste caso,
X4 so colineares. Qual o contra-argumento? um modelo com X2 e X3 violaria a RLM. 3.

Omisso de Varivel Relevante no MRLM Uma questo pertinente:


Por que algum, em s conscincia,
Seja Z a varivel omitida.
omitiria uma varivel relevante do modelo?
Se Corr(Xj,Z) 0, em geral no somente
R: por uma das seguintes razes:
o estimador de j, mas todos os demais
tambm sero viciados e inconsistentes, 1 - Ignorncia (no ter identificado
mesmo se a correlao das respectivas que Z pode ter influncia sobre Y)
variveis com Z for zero. Todavia, se
houver alguma varivel descorrelacionada 2 - Ausncia de dados. No caso mais
com Z e com Xj, o estimador do respectivo extremo, a varivel Z no observvel.
coeficiente ser no viciado e consistente. (solues para este caso captulo 23)

5
T.E.A. (Disciplina Preparatria para o Exame da ANPEC)
Mdulo de Estatstica - Professor: Eduardo Lima Campos

A22.1 - demonstrao da frmula do vis


de especificao por omisso de varivel.

O estimador de MQO de 1 :
APNDICE DO n
(X i X )(Yi Y )
1 = i =1
.
CAPTULO 22 n
(X i X )
i =1
2

Sob o modelo verdadeiro:


Yi = 0 + 1Xi + ZZi + ui.

n
Logo: 1 (X i X ) 2
(Yi Y) = 1 (Xi X) + Z (Zi Z) + (ui u). 1 = n
i =1
+
(X
i =1
i
X)2
Substituindo em 1 : n n

Z
(X i X )( Zi Z) (X i
X )(u i u )
i =1
n + i =1
n
1 = (Xi =1
i
X )2 (Xi =1
i
X)2
n
(Xi X)[1 (Xi X) + Z ( Zi Z) + (u i u )] n

i =1
. (X i
X )(u i u )
n = 1 + Z ZX + i =1
.
(X i X )
2 n

i =1 (X i X ) 2
i =1

Tomando o valor esperado, condicional Estimadores das Varincias:


a X e Z (Wooldridge, p.87): 2v 2u
n
V( 1 ) = n e V( 1 ) = n .
(X i X ) Xi Xi (1 rXZ2 )
E( 1 ) = 1 + Z ZX + i =1
n E (u i u ). i =1 i =1

(X
i =1
i
X) 2
Note que, mesmo se rXZ = 0, V( 1 ) viciado para
V( ), pois 2 viciado para 2 . Porm, a direo
Mas E(u i u ) = E(u i ) E( u ) = 0 0 = 0. 1 v u
n n
do vcio no trivial, pois, embora vi2 > u i2 ,
i =1 i =1

Assim : E ( 1 ) = 1 + Z ZX estimativa o denominador de n - 1, maior que n - 2, logo


2

de ZX
v

no d pra afirmar que E( 2v ) ser maior que 2u .

Você também pode gostar