Escolar Documentos
Profissional Documentos
Cultura Documentos
PPGE UFF
Reviso de econometria bsica
Introduzindo a revoluo Novo Clssica
Bibliografia: introduction to econometrics
G S Maddala e Kajal Lahiri
4a. Edio 2009
Dados em Economia
= mdia da populao = ?
varincia da populao = ?
2 =
n.
... .
..
desvio padro:
=
= mdia da amostra
VAR(x) = varincia da amostra
Estimativas no-tendenciosas de e 2 :
1
= 1/
=
1
correo de Bessel
Variveis Randmicas
Uma varivel randmica uma varivel cujo valor qualquer um dos resultados de um
experimento aleatrio. Cada possvel valor de uma varivel randmica tem uma
probabilidade associada a ela, o que chamamos de distribuio de probabilidade.
Denotamos variveis randmicas por letras maisculas e usamos letras minsculas
para denotar valores particulares destas variveis. Desta maneira, a varivel randmica X
pode assumir o valor xi que associado probabilidade pi, isto : P(X = xi) = pi. A soma das
probabilidades de cada um dos valores possveis de uma varivel randmica sempre
igual a 1:
Exemplos:
1.
2.
3.
= 1
X o valor observado quando se joga um dado. Isto , voc joga um dado e X o valor observado. Os
valores possveis so {1,2,3,4,5,6} e a probabilidade associada a cada um destes valores 1/6. Fig.1(a)
Y 1 se a moeda d cara e 0 se d coroa. Os valores possveis so {0,1} e a probabilidade de cada um
.
Z a quantidade de pizzas entregues por dia pela empresa A. Neste caso, os valores possveis e as
suas probabilidades podem ser calculados a partir das frequncias relativas (se um houver um perodo
bastante longo de observaes). Fig1(b)
Distribuio de Probabilidades:
Fig. 1
Note que a probabilidade de uma varivel randmica tomar um valor menor ou igual a xi
igual P(X xi) = p1 + p2 + + pi , pois so eventos mutuamente excludentes. Por
exemplo, a probabilidade do dado rolar um nmero menor ou igual a 3 igual a 1/6 +
1/6 + 1/6 = 0.5 (na Fig.1(a), basta somar as 3 primeiras barras). J a probabilidade de
serem entregues 1, 2 ou nenhuma pizza igual a 0.02 + 0.05 + 0.10 = 0.17 (i.e. a
soma das 3 primeiras barras da Fig.1(b)). Na Fig.1(b), a soma da terceira, quarta e
quinta barra d a probabilidade de serem entregues 2, 3 ou 4 pizzas. A soma de todas
as barras sempre igual a 1.
As variveis randmicas dos exemplos anteriores (1 a 3) so chamadas de variveis
randmicas discretas, porque os valores possveis so valores discretos, isto ,
nmeros inteiros. A caracterstica que estes valores podem ser contados (mesmo que
sejam em quantidade infinita).
A mdia de uma varivel randmica, tambm chamada de valor esperado ou
expectativa, denotada como X ou E(X): =
. E(X) igual ao resultado
mdio de um experimento depois de um grande nmero de tentativas. Por exemplo, a
mdia (i.e. o valor esperado) para uma quantidade grande de lanamentos de um dado
3.5 (mesmo que seja impossvel rolar um 3.5 com um dado de 6 faces):
1(1/6)+2(1/6)+3(1/6)+4(1/6)+5(1/6)+6(1/6) = 3.5.
Agora imagine que a varivel randmica X o volume de chuva que ocorrer no ms
seguinte. Este valor pode ser 8.0 mm, 8.01 mm, 8.0005 mm, . Uma infinidade de
valores podem ser observados. Nem faz sentido falar de um valor exato de 8.0mm. Este
tipo de varivel denominada varivel randmica contnua. A ocorrncia de qualquer
valor exato de X pode ser considerado como tendo probabilidade zero.
Fig. 2
Fazendo barras cada vez mais estreitas no limite tem-se uma curva. Neste caso,
podemos definir que uma varivel randmica contnua associada a uma funo f(x),
chamada de funo de densidade de probabilidade. A probabilidade de uma varivel
randmica cair dentro de um particular intervalo de valores dada pela integral de f(x)
neste intervalo, ou seja: a probabilidade dada pela rea abaixo da curva (Fig.3).
= !
P(a X b)
f(x)
P(X b)
f(x)
= !
"
a b
Fig. 3
!
Na realidade, a definio de
varincia diretamente feita em
termos de E(X): var(X) = E([X
E(X)]2), o que desenvolvendo leva
var(X) = E(X2)-(E(X))2.
&
f(x,y)
y
f(x|y)
19
Carmem Feij Curso Macroeconomia Avanada
x
y=26
Fig. 4
92 x
8
Algumas propriedades:
( = )|+
1. E(XY|Y) = Y E[E(X|Y)]
2. E(X) = E[E(X|Y)] , conhecida como Lei das Expectativas Totais (ou Lei Simples das Expectativas Iteradas)
3. E(X|Y1) = E[E(X|Y1,Y2)|Y1), conhecida como Lei das Expectativas Iteradas. Note que Y1 parte do conjunto que
estamos condicionando. Poderamos tambm apresentar esta propriedade como E(X|Y1) = E[E(X|Z)|Y1), onde Y1 um
elemento de Z (ou seja, Y1 est contido em Z). Esta lei diz que o conjunto de menor informao ganha!
Independncia e Correlao
10
Independncia e Correlao
Se o momento vetorial (cross moment) igual a zero, i.e. E(XY) = 0, dizemos que X
ortogonal a Y (e vice-versa). Ortogonalidade s corresponde a zero-correlao se E(X)
ou E(Y) zero.
Se X e Y so independentes, ento:
Neste caso de apenas duas variveis, costumamos usar o quadrado deste coeficiente,
denotado por R2 e chamado de coeficiente de determinao, que varia de 0 a 1. Quanto mais
perto de 1, mais correlacionado est (ou seja, X mais explica linearmente Y).
cov(X,Y) = 0.
E(X|Y) = E(X)
Propriedades da Covarincia
cov(X,Y) = cov(Y,X)
cov(X,X) = var(X)
cov(X,Y+Z) = cov(X,Y) + cov(X,Z)
cov(X,a) = 0 , se a constante
cov(aX,bY) = ab cov(X,Y)
cov(X+a,Y+b) = cov(X,Y)
var(X + Y) = var(X) + 2cov(X,Y) + var(Y)
11
Distribuio Normal
2=
>
.? A
@
Fig. 5
No caso de densidade conjunta f(x,y), se ~3 5. , . e %~3 5/ , / ento dizemos que temos uma
distribuio normal bivariada (bivariate normal distribution). Neste caso, f(x,y) uma expresso que
depende de 5. , 5/ , . , / e . O parmetro o coeficiente de correlao que mede o quo
fortemente as duas variveis variam juntas.
Se as variveis econmicas no so normalmente distribudas, sempre podemos considerar
transformaes das variveis de maneira que as variveis transformadas tm distribuio normal.
12
Distribuio Log-Normal
Denotamos com ~BCD3 5, para indicar que a varivel randmica X tem uma
distribuio log-normal com mdia 5 e varincia . Uma distribuio log-normal uma
distribuio cujo logaritmo normalmente distribudo. Portanto, se X distribudo de
maneira log-normal, ento Y = log(X) tem uma distribuio normal. Da mesma maneira,
se Y tem uma distribuio normal, ento X =eY tem uma distribuio log-normal.
A partir da definio de X log-normalmente distribuda, podemos mostrar que
=
A @ A
?I
>
=
@A
>
Por exemplo, se uma varivel randmica Z tem uma distribuio normal, i.e. Z~3 5, ,
GAH
A
13
14
onde os parmetros S, T, /|.
esto relacionados com a componente condicional %
da distribuio conjunta %, , enquanto que os parmetros , . esto
relacionados com a componente marginal ) . Costumamos indicar os conjuntos de
parmetros como: [ = S, T, /|.
e [ = , . . Lembre que /|.
a notao para a
varincia condicional
% e que .
(). Note que, por construo, \C , Z = 0
e os erros so independentes entre si, i.e. \C Z, = 0.
Podemos tambm deduzir (com algum algebrismo) que, no caso acima, temos:
S = % T()
/.
T=
.
/.
/|.
= /
.
onde /. a notao para \C %, .
16
Erro
Fontes de erro
1.
2.
3.
17
Erro
Uma suposio que facilita os mtodos de regresso supor que o erro i da equao
de regresso linear a seguinte: i so independente entre si e normalmente distribudo
com mdia zero e uma varincia comum 2. Indicamos esta situao como Z ~93(0, ).
Outra suposio simplificadora considerar que i e os regressores xj e zj , no exemplo
anterior, so independentes para todos os i e j. Isto significa que a distribuio de no
depende do valor de x nem do valor de z.
Para visualizar as duas condies acima, suponha a equao % = S + T + Z . Desta
maneira, para um dado valor de x, teremos valores aleatrios de y que acompanha a
distribuio normal do erro . Por exemplo, para x = 5, y poderia ser 10.0, 10.6, 9.6, .
Pela Fig.6, y seria 10.0, porque corresponde ao valor mais provvel (os valores dos
coeficientes so estimados com esta suposio).
y
% = 2 + 0.5 + Z
mais provvel
independentes
y = 10.0
y = 9.6
independentes
Fig. 6
x = 5.0
Carmem Feij Curso Macroeconomia Avanada
independentes
x
18
A amostra das n observaes dos regressores forma a matriz de dados (hachureada nas figuras abaixo):
% = S + T + ]^ + Z
h
Obs.
x1
z1
y1
x2
z2
y2
xi
zi
yi
xn
zn
yn
vetor da i-sima
observao
de 2 regressores:
h = ^
matriz de dados
Fig. 7
% = S + T + T + + T` ` + Z
h
x1
x2
xK
x11
x12
x1K
y1
x21
x22
x1K
y2
xi1
xi2
xik
xiK
yi
xn1
xn2
xnK
yn
vetor da i-sima
observao
de K regressores:
h =
`
matriz de dados
Fig. 8
Z |h , , h = 0 a = 1,2, ,
Na Fig.7 a notao acima significa: Z | , , , = 0
^
^ ^
19
=0
Note que a ortogonalidade diz respeito tanto ao termo de erro i com a mesma observao
i, como ao termo de erro i e qualquer outra observao j.
3. Porque a expectativa do termo do erro zero, as condies de ortogonalidade (2) equivalem
a condies de correlao-zero: \C Z , k = 0 > \C Z , ^k = 0 a, m = 1, ,
20
Na Fig. 7, por exemplo, se xi = 2zi + 5, temos dois regressores perfeitamente colineares, o que
inviabiliza o modelo. Na prtica, nunca temos multicolinearidade perfeita, exata. O que temos
so variveis fortemente, mas no exatamente, relacionadas. Multicolinearidade causa valores
elevados de erros-padro, valores de estatstica-t pequenos e excessiva sensibilidade
(pequenas mudanas nos dados ou retirada/adio de variveis provocam grandes mudanas
nos parmetros estimados).
Suposio 3 (homoskedasticity):
21
cov Z , Zk |h , , h = Z Zk |h , , h Z |h , , h Z |h , , h = Z Zk |h , , h = 0
22
Fig. 9
Fig. 10
D
D
h
% = + % + e
% = ^ + % +
endgenas: y1 e y2
exgenas: x e z
23
=Nv
=Nv
O =
=Ny
=Ny
O
O
\ = =Nx
\ = =Ny O O
O =
24
Quando obtemos estimativas de todos os coeficientes estruturais de uma equao a partir das
estimativas dos coeficientes da forma reduzida, dizemos que esta especfica equao exatamente
identificada, ou simplesmente identificada. Porm, algumas vezes, isto no possvel. Uma equao
pode ter um excesso de exgenas e a forma reduzida do modelo pode levar a coeficientes estruturais
com mltiplas estimativas (e no saberemos qual valor escolher). Neste caso, dizemos que a equao
sobre-identificada (overidentified). Outra situao quando a equao tem exgenas de menos e ns
no conseguimos obter estimativas dos coeficientes estruturais. Neste caso, onde a soluo impossvel,
dizemos que a equao subidentificada (underidentified), tambm denominada de equao no
identificada. Note que num mesmo modelo podemos ter uma equao exatamente identificada e outra
subidentificada, assim como qualquer outra combinao de identificao (identificao uma propriedade
de cada equao). Veja estas situaes nos seguintes modelos:
Caso 1:
=
+ f + \ ^ + Z (identificada)
=
+ f + \ + Z (identificada)
Caso 2:
=
+ f + \ ^ + Z (no identificada)
=
+ f + Z
(identificada)
Caso 3:
=
+ f + \ ^ + ! + Z (no identificada)
=
+ f + Z (sobreidentificada)(mltiplas)
g=2
h
g-1
Caso 4:
=
+ f + \ ^ + Z (identificada)
=
+ f + \ + Z (no identificada)
No necessrio encontrar a forma reduzida para verificar o tipo de identificao. H testes para
determinar o tipo de identificao de uma equao. Para o Caso 2 est apresentado o teste mais simples
de condies apenas necessrias (mas no suficientes):
25
% = X + % + e
% = + % +
Endgenas: y1 e y2 Exgenas: x e z
% = + % + e
% = X + % +
Endgenas: y1 e y2 Exgenas: x e z
26
At meados da dcada de 70, a abordagem para modelos de equaes simultneas era a dominada
pela proposta da Cowles Foundation (Univ. de Chicago) que estabeleceram (no final dos 40s e incio
dos 50) a seguinte premissa: a classificao de variveis em endgenas e exgenas e a estrutura
causal do modelo so todos dados a priori e no so testveis (i.e. exogeneidade e causalidade no
podem ser testadas). O foco da Cowles Foundation era em mtodos economtricos de estimativa. Isto
no resiste s observaes que j fizemos com relao a exogeneidade nem mais contundente
crtica de todas: aquela feita por R.E.Lucas em seu trabalho Econometric Policy Evaluation: A Critique,
em 1976, que hoje conhecida como a Crtica de Lucas.
Um dos principais propsitos da estimativa de equaes simultneas prever o efeito de mudanas nas
variveis exgenas sobre as variveis endgenas. Entretanto, se as variveis exgenas so mudadas e
os agentes de maximizao de lucros percebem as mudanas vindo, eles certamente modificaro seus
comportamentos de acordo com tais mudanas. Portanto, os coeficientes dos modelos de equaes
simultneas no podem ser assumidos invariantes, independentes, das mudanas nas variveis
exgenas. Esta a essncia da Crtica de Lucas. Uma soluo para a Crtica de Lucas seria tornar os
coeficientes dos sistemas de equaes simultneas dependentes das variveis de polticas exgenas.
Modelos de parmetros variveis j foram propostos. Entretanto, o uso de Expectativas Racionais,
propostas pelo prprio Lucas, representa a linha dominante neste sentido. Veremos, mais a frente, que
a Crtica de Lucas conduziu a propostas de tipos de exogeneidade, onde a chamada
superexogeneidade seria o tipo relacionado Crtica de Lucas e representaria uma condio
necessria para propsitos de polticas. Entretanto, nem as Expectativas Racionais nem a
superexogeneidade encontraram evidncias empricas claras at o momento.
Lucas (1976) considera um modelo condicional dinmico usado e especificado para simulao de
polticas macroeconmicas. Os parmetros de tal modelo devem refletir as regras de deciso dos
agentes econmicos. Estes agentes so supostos integrarem tanto o conhecimento sobre polticas
passadas como as expectativas sobre possveis deslocamentos futuros das polticas. Com estas
consideraes no podemos esperar que as regras de deciso fiquem invariantes quando sujeitas a
intervenes de polticas.
27
Para Lucas o comportamento passado um guia pobre para avaliar os efeitos das aes de poltica.
Concluiu que modelos de forma reduzida no conseguem prover informao til sobre as reais
consequncias de polticas alternativas porque a estrutura da economia muda quando a poltica muda
(e, portanto, os parmetros estimados variam). Propos um novo programa de pesquisa, real business
cycle (ou equilibrium business cycle), onde os modelos usados para anlise de polticas so imunes
crtica de Lucas no sentido de que so modelos de equilbrio com comportamento olhando para frente
(forward-looking behavior). Em 1983, foi proposto o conceito de superexogeneidade com o objetivo de
ser usado para testar a relevncia emprica da crtica de Lucas algo que no foi ainda empiricamente
evidenciado. Apesar disto, esta nova classificao de exogeneidade tem sido bastante usada. Para a
classificao e o uso de superexogeneidade ver: Engle, Hendry e Richard (1983) e Engle e Hendry
(1993).
As variveis exgenas em geral tm um grau fraco de exogeneidade, chamada de exogeneideade
fraca (weak exogeneity). Podemos observar isto no caso de regresso linear simples (slide 15), onde
vemos que a estimativa de [ = S, T, /|.
no necessita de informao sobre [ = , . ., i.e. [
e [ so dois conjuntos de parmetros separados. Quando os parmetros associadaos distribuio
marginal de uma varivel exgena x no so necessrios para a estimativa dos parmetros associados
distribuio condicional da varivel endgena y, dizemos que x fracamente exgena para a
estimativa de y. Este resultado pode ser estendido para sistemas de equaes simultneas com vrias
variveis exgenas. Normalmente so todas fracamente exgenas.
A situao de mais forte exogeneidade, no sentido da crtica de Lucas, seria quando os parmetros
relacionados distribuio condicional de y (e.g. [ no caso da regresso linear simples) permanecem
invariantes a mudanas (i.e. a intervenes) na distribuio marginal da varivel exgena x. Neste
caso dizemos que x uma varivel superexgena. No exemplo da regresso linear simples, x
fracamente exgenas, mas no superexgena, porque mudanas em [ = , . provocam
mudanas em [ = S, T, /|.
.
28
= S + S % +
A precedncia que impede uma varivel ser fortemente exgena pode ser verificada pelo conhecido
teste de causalidade de Granger que testa se xt falha causar % . A expresso causar no teste teste
de Granger significa preceder (ou seja causalidade de Granger significa precedncia de Granger
i.e. trata-se apenas de um termo inapropriado, porm muito usado). Um outro teste alternativo fazer
uma regresso de % sobre todos os x defasados (passado), correntes e futuros. Neste caso se os
coeficientes futuros da regresso forem zero, dizemos que xt falha causar % .
29
,
podemos chegar frmula da expectativa adaptativa:
= (1 [)
[
= (1 [) .
A maneira mais fcil de estimar uma equao dentro do modelo de expectativas adaptativas
a chamada estimativa na forma autoregressiva. Nesta tcnica de estimativa (h
outras), primeiro defasamos a equao original de 1 perodo no passado, a multiplicamos
por e a subtraimos da original. Depois aplicamos a frmula da expectativa adaptativa e
obtemos uma nova equao.
30
Expectativas Racionais
As expectativas dos agentes representam o melhor palpite do futuro que usa todas as informaes
disponveis no momento. Assumimos que as expectativas dos agentes podem estar erradas, mas so
corretas na mdia ao longo do tempo (i.e. tm um corportamento verdadeiramente estatstico e notendencioso).
Muth (1961) considerou que o erro de previso no-correlacionado com o conjunto completo de
informaes que est disponvel para o agente na ocasio em que a previso feita. Denotamos este
conjunto por 9 para representar toda a informao disponvel no tempo t1.
= + Z ou = Z
onde depende de 9 e no correlacionado com Z ; alm de Z no ser correlacionado com
qualquer uma das variveis no conjunto de informao 9 .
Aplicando a mdia esperada (i.e. a expectativa matemtica) nesta equao, temos que:
= |9
expectativa subjetiva
expectativa objetiva
A interpretao que a parte esquerda a expectativa subjetiva e a parte direita a expectativa objetiva
condicionada aos dados disponveis quando a expectativa foi formada (i.e. os agentes se comportam
como se tivessem completo conhecimento sobre o modelo que os econometristas esto estimando em
outras palavras: os agentes se comportam como se conhecessem no apenas a estrutura do modelo, mas
tambm todos os seus parmetros). Desta maneira, h uma conexo entre as crenas subjetivas dos
agentes econmicos e o comportamento vigente do sistema econmico.
A idia bsica verificar se o erro no-correlacionado com as variveis no conjunto de
informaes 9 .
Exemplo : = T + ] ^ + e (onde quantidade, o preo no tempo t conforme esperado no
tempo t1 e ^ uma exgena). Quando todas as variveis so conhecidas no tempo t1(i.e. todas esto
no conjunto de informaes 9 ), basta substituir = Z na equao e estimar (at mesmo com OLS)
a equao ento resultante: = T + ] ^ + , onde o termo de erro = e T Z .
31