Revisão Básica Econometria Material de Apoio Curso de Teoria Macroeconomica PPGE UFF PDF

Material de apoio ao curso de Teoria Macroeconomica
PPGE UFF
Reviso de econometria bsica
Introduzindo a revoluo Novo Clssica
Bibliografia: introduction to econometrics
G S Maddala e Kajal Lahiri
4a. Edio 2009
Carmem Feij Curso Macroeconomia Avanada
Dados em Economia
Amostra ou dados so uma coleo de n observaes que so tratadas como variveis

randmicas (i.e. variveis cujos valores esto sujeitos ao acaso). Seja o seguinte
levantamento (observao) de dados x:
Populao: renda das famlias

Amostra da populao = x
= mdia da populao = ?
varincia da populao = ?
2 =
n.
... .
..
desvio padro:
=

= mdia da amostra
VAR(x) = varincia da amostra
Estimativas no-tendenciosas de e 2 :

1
= 1/ =

1
correo de Bessel
x uma varivel randmica. Os valores xi so independentes entre si e igualmente

provveis.
Varincia uma medida de disperso: quanto menor, menos dispersos so os valores.
Varincia nula significa que todos os valores so idnticos. A raiz quadrada da varincia
(i.e. o desvio padro) d um valor mais semelhante a uma distncia para indicar a
disperso em relao mdia.
Variveis Randmicas
Uma varivel randmica uma varivel cujo valor qualquer um dos resultados de um
experimento aleatrio. Cada possvel valor de uma varivel randmica tem uma
probabilidade associada a ela, o que chamamos de distribuio de probabilidade.
Denotamos variveis randmicas por letras maisculas e usamos letras minsculas
para denotar valores particulares destas variveis. Desta maneira, a varivel randmica X
pode assumir o valor xi que associado probabilidade pi, isto : P(X = xi) = pi. A soma das
probabilidades de cada um dos valores possveis de uma varivel randmica sempre

igual a 1:
Exemplos:
1.
2.
3.
= 1

X o valor observado quando se joga um dado. Isto , voc joga um dado e X o valor observado. Os
valores possveis so {1,2,3,4,5,6} e a probabilidade associada a cada um destes valores 1/6. Fig.1(a)
Y 1 se a moeda d cara e 0 se d coroa. Os valores possveis so {0,1} e a probabilidade de cada um
.
Z a quantidade de pizzas entregues por dia pela empresa A. Neste caso, os valores possveis e as
suas probabilidades podem ser calculados a partir das frequncias relativas (se um houver um perodo
bastante longo de observaes). Fig1(b)
Distribuio de Probabilidades:
Fig. 1
Variveis Randmicas: discretas
Note que a probabilidade de uma varivel randmica tomar um valor menor ou igual a xi
igual P(X xi) = p1 + p2 + + pi , pois so eventos mutuamente excludentes. Por
exemplo, a probabilidade do dado rolar um nmero menor ou igual a 3 igual a 1/6 +
1/6 + 1/6 = 0.5 (na Fig.1(a), basta somar as 3 primeiras barras). J a probabilidade de
serem entregues 1, 2 ou nenhuma pizza igual a 0.02 + 0.05 + 0.10 = 0.17 (i.e. a
soma das 3 primeiras barras da Fig.1(b)). Na Fig.1(b), a soma da terceira, quarta e
quinta barra d a probabilidade de serem entregues 2, 3 ou 4 pizzas. A soma de todas
as barras sempre igual a 1.
As variveis randmicas dos exemplos anteriores (1 a 3) so chamadas de variveis
randmicas discretas, porque os valores possveis so valores discretos, isto ,
nmeros inteiros. A caracterstica que estes valores podem ser contados (mesmo que
sejam em quantidade infinita).
A mdia de uma varivel randmica, tambm chamada de valor esperado ou
expectativa, denotada como X ou E(X): =
. E(X) igual ao resultado
mdio de um experimento depois de um grande nmero de tentativas. Por exemplo, a
mdia (i.e. o valor esperado) para uma quantidade grande de lanamentos de um dado
3.5 (mesmo que seja impossvel rolar um 3.5 com um dado de 6 faces):
1(1/6)+2(1/6)+3(1/6)+4(1/6)+5(1/6)+6(1/6) = 3.5.
Agora imagine que a varivel randmica X o volume de chuva que ocorrer no ms
seguinte. Este valor pode ser 8.0 mm, 8.01 mm, 8.0005 mm, . Uma infinidade de
valores podem ser observados. Nem faz sentido falar de um valor exato de 8.0mm. Este
tipo de varivel denominada varivel randmica contnua. A ocorrncia de qualquer
valor exato de X pode ser considerado como tendo probabilidade zero.
Variveis Randmicas Contnuas
No caso de variveis randmicas contnuas, as probabilidades

devem ser discutidas em termos de algum intervalo, e.g. a
probabilidade do volume de chuva estar no intervalo [8.0, 8.2]
mm. Neste caso poderamos construir uma distribuio de
probabilidades semelhante ao caso das variveis randmicas
discretas (Fig. 2). Observe que a soma de todas as barras
igual a 1.
Fig. 2
Fazendo barras cada vez mais estreitas no limite tem-se uma curva. Neste caso,
podemos definir que uma varivel randmica contnua associada a uma funo f(x),
chamada de funo de densidade de probabilidade. A probabilidade de uma varivel
randmica cair dentro de um particular intervalo de valores dada pela integral de f(x)
neste intervalo, ou seja: a probabilidade dada pela rea abaixo da curva (Fig.3).

= !

P(a X b)
f(x)
P(X b)
f(x)
= !
"
a b
Fig. 3
Variveis Randmicas Contnuas
A mdia de uma varivel randmica contnua, i.e. o valor esperado ou expectativa,

dado por:
A varincia, como medida de disperso, permanece sendo uma distncia do ponto ao

valor mdio que elevada ao quadrado, porm ponderada pelo valor da funo de
densidade de probabilidade:
=

!
Na realidade, a definio de
varincia diretamente feita em
termos de E(X): var(X) = E([X
E(X)]2), o que desenvolvendo leva
var(X) = E(X2)-(E(X))2.
Carmem Feij Curso Macroeconomia

Avanada
Propriedades da Expectativa e da Varincia

1. E(X + Y) = E(X) + E(Y)
2. var(X + Y) = var(X) + var(Y)
Se c uma constante (i.e. no-randmico):
3. E(cX) = cE[X]
4. var(cX) = c2var(X)
5. var(X + c) = var(X)
Densidade Conjunta e Condicional
No caso de dois eventos A e B, P(AB) a probabilidade da ocorrncia conjunta de A e

B (i.e. a interseo dos dois eventos).
A probabilidade de um evento A, dado que um outro evento B ocorreu denotada por
P(A|B) e definida como P(A|B) = P(AB)/P(B). Isto : P(AB) = P(A|B)P(B).
No caso de variveis randmicas contnuas, definimos uma funo de densidade de
probabilidade conjunta (ou simplesmente densidade/distribuio conjunta) f(x,y)
para descrever a situao conjunta (Fig. 4). A integral dupla de f(x,y) igual ao volume
abaixo da superfcie. No caso de todo o domnio, este volume igual a 1. Para um
evento conjunto A (e.g. 55<x<74 e 1<y<26) a probabilidade de A igual a:
= # , % !!%
&
A funo de densidade de probabilidade

condicional f(x|y) corresponde funo de
densidade de X dado Y = y.
Similarmente probabilidade condicional f(x|y) =
f(x,y)/fY(y). Isto : f(x,y) = f(x|y)fY(y).
fY(y) chamada de densidade marginal.
f(x|y) para y = 26 na Fig.4 corresponde ao corte
transversal da superfcie.
f(x,y)
y
f(x|y)
19
x
y=26
Fig. 4
92 x
8
Expectativa Condicional e Varincia
Definimos expectativa condicional de X dado Y = y como:

|( = % = )|+ |% !

Note que essencialmente = ' ! com f(x|y) no lugar de f(x). Por

simplicidade, indicamos Y = y por Y, i.e. escrevemos expectativa condicional como E[X|Y].
O condicionamento pode ser sobre vrias variveis, e.g. E[X|Y1,Y2,,Yn]. Neste caso, a
funo de densidade condicional f(x|y1,y2,,yn).
Podemos definir varincia condicional em termos da mdia condicional:

( = |( |( = ( [|(]
Uma notao para varincia condicional:
Algumas propriedades:

( = )|+
1. E(XY|Y) = Y E[E(X|Y)]
2. E(X) = E[E(X|Y)] , conhecida como Lei das Expectativas Totais (ou Lei Simples das Expectativas Iteradas)
3. E(X|Y1) = E[E(X|Y1,Y2)|Y1), conhecida como Lei das Expectativas Iteradas. Note que Y1 parte do conjunto que
estamos condicionando. Poderamos tambm apresentar esta propriedade como E(X|Y1) = E[E(X|Z)|Y1), onde Y1 um
elemento de Z (ou seja, Y1 est contido em Z). Esta lei diz que o conjunto de menor informao ganha!
Propriedades devidas linearidade das expectativas condicionais:

4. E(a|Y) = a se a uma constante
5. E(aX|Y) = aE(X|Y) se a uma constante
6. E(aX+ bZ | Y) = aE(X|Y) + bE(Z|Y) se a e b so constantes
7. E(g(Y)X|Y) = g(Y)E(X|Y) e, em particular, E(g(Y)|Y) = g(Y) onde g uma funo g:
Independncia e Correlao
Duas variveis randmicas X e Y so ditas independentes se a densidade conjunta f(x,y)

puder ser fatorada em um produto: f(x,y) = fX(x) fY(y)
Esta situao anloga de eventos independentes. Dizemos que os eventos A e B
so independentes se a probabilidade de ocorrncia de um no depende se o outro
tenha ocorrido ou no. Neste caso, a probabilidade da ocorrncia conjunta de A e B
dada por P(AB) = P(A)P(B).
fX e fY so chamadas de densidades marginais.
Se as distribuies fX e fY forem as mesmas, ento dizemos que X e Y so independente
e identicamente distribudas (iid), i.e. X e Y tm a mesma distribuio de densidade e
so mutuamente independentes. Esta suposio existe em cross-sectional data.
Quando duas variveis randmicas no so independentes, calculamos a covarincia
para ter uma idia de o quo fortemente elas esto relacionadas entre si. Uma forma fcil
de calcular a covarincia dada por: cov(X,Y) = E(XY)E(X)E(Y). E(XY) chamada de
momento vetorial (cross moment). Uma notao para covarincia )+ .
Uma melhor quantidade para avaliar este grau de interelacionamento, por ser
adimensional, o coeficiente de correlao: corr(X,Y) = cov(X,Y)/XY.
Dizemos que duas variveis so no-correlacionadas (uncorrelated) se e somente se
corr(X,Y) = 0 (ou, o que o mesmo, cov(X,Y) = 0). corr(X,Y) varia no intervalo [-1,1].
Se X e Y so independentes, ento elas so no-correlacionadas. Porm o inverso no
vale (e.g. em Y = X2, Y e X so perfeitamente dependentes, mas tm cov(X,Y) = 0).
10
Independncia e Correlao
Quando trabalhamos com uma amostra com n medidas de X e Y, o coeficiente de

correlao da amostra rxy pode ser usado para estimar o coeficiente de correlao da
populao corr(X,Y):

% %0
./ =

% %0
Se o momento vetorial (cross moment) igual a zero, i.e. E(XY) = 0, dizemos que X
ortogonal a Y (e vice-versa). Ortogonalidade s corresponde a zero-correlao se E(X)
ou E(Y) zero.
Se X e Y so independentes, ento:
Neste caso de apenas duas variveis, costumamos usar o quadrado deste coeficiente,
denotado por R2 e chamado de coeficiente de determinao, que varia de 0 a 1. Quanto mais
perto de 1, mais correlacionado est (ou seja, X mais explica linearmente Y).
cov(X,Y) = 0.
E(X|Y) = E(X)
Propriedades da Covarincia
cov(X,Y) = cov(Y,X)
cov(X,X) = var(X)
cov(X,Y+Z) = cov(X,Y) + cov(X,Z)
cov(X,a) = 0 , se a constante
cov(aX,bY) = ab cov(X,Y)
cov(X+a,Y+b) = cov(X,Y)
var(X + Y) = var(X) + 2cov(X,Y) + var(Y)
11
Distribuio Normal
Dizemos que uma varivel randmica X no intervalo [, ] segue uma distribuio

normal se a sua funo de densidade de probabilidade tem a forma de um sino,
simtrica, centrada no seu valor esperado e tem varincia 2 de maneira que:
=
2=
>
.? A
@
Denotamos com: X~3(5, ). Quando uma coleo de variveis randmicas independente e

7
identicamente distribudas (iid) indicamos como ~ 3(0, ) ou ~93(0, ) ou ~3. 9. 9. ;. (0, ).

A Fig.5 ilustra algumas distribuies normais, sendo a mais interessante a que tem mdia zero
~3(0, ). Quando uma varivel randmica tem mdia zero e varincia 1, i.e. ~3(0,1),
chamamos X de varivel normal padro (standard normal variable).
Fig. 5
No caso de densidade conjunta f(x,y), se ~3 5. , . e %~3 5/ , / ento dizemos que temos uma
distribuio normal bivariada (bivariate normal distribution). Neste caso, f(x,y) uma expresso que
depende de 5. , 5/ , . , / e . O parmetro o coeficiente de correlao que mede o quo
fortemente as duas variveis variam juntas.
Se as variveis econmicas no so normalmente distribudas, sempre podemos considerar
transformaes das variveis de maneira que as variveis transformadas tm distribuio normal.
12
Distribuio Log-Normal
Denotamos com ~BCD3 5, para indicar que a varivel randmica X tem uma
distribuio log-normal com mdia 5 e varincia . Uma distribuio log-normal uma
distribuio cujo logaritmo normalmente distribudo. Portanto, se X distribudo de
maneira log-normal, ento Y = log(X) tem uma distribuio normal. Da mesma maneira,
se Y tem uma distribuio normal, ento X =eY tem uma distribuio log-normal.
A partir da definio de X log-normalmente distribuda, podemos mostrar que
J> ~3 5, >LC > ) ~BCD3 5,
Se X uma varivel distribuda de forma log-normal, ento:
=
A @ A
?I
>
e, em particular, para n = 1 e mdia u = 0:
=
@A
>
Por exemplo, se uma varivel randmica Z tem uma distribuio normal, i.e. Z~3 5, ,
ento > F = >
GAH
A
13
Equao de Regresso Linear
Lembrar a essncia do que estimativa de variveis randmicas e estimador.

Suponha que queremos uma estimativa %N de uma varivel randmica Y, sabendo apenas a sua funo
de densidade de probabilidade % . Uma maneira minimizar o erro quadrtico mdio (mean square
error - MSE) entre o resultado do experimento e a estimativa %N (lembre que mdia dada pela
expectativa E( )). Matematicamente queremos o valor que minimiza a seguinte expresso: ( %N =
' % %N % !%. Derivando esta expresso com relao a %N e igualando a zero, obtemos %N = ( , ou
seja a estimativa de Y o seu valor mdio (i.e. a sua expectativa) (a rigor tambm temos que calcular a
segunda derivada e verificar que positiva o que no caso d o valor 2). Ademais, o mnimo erro quadrtico
mdio obtido substituindo %N = ( em ( %N , o que d ( [(] ; o que por sua vez igual
varincia de Y - no slide 5: var(X) = E([X E(X)]2)
Considere agora que Y relacionada a uma outra varivel randmica X cujos valores j foram
observados. O clculo similar e o valor que minimiza ( %N() | = = ' % %N() %, !%
%N() = (| = , ou seja: a estimativa a expectativa condicional de Y dado X = x. O mnimo erro
quadrtico mdio a varincia condicional var(Y|X).
Na prtica, estamos interessados no estimador (i.e. no procedimento ou funo que produz a
estimativa) e no no resultado quando a varivel X assume um especfico valor. Estimativa e estimador
so diferentes (assim como so diferentes o valor de uma funo num especfico ponto e a prpria
funo). Portanto, falaremos do estimador (O = ((|) ao invs da estimativa %N() = (| = , onde (O
uma varivel randmica, mas %N() no o (porque x um valor especfico). ((|) uma varivel
randmica e no um nmero. Vamos tambm abusar da notao e usar letras minsculas: % = % .
Propriedade da Decomposio: qualquer varivel randmica y pode ser expressa como
%=
% + Q onde Q uma varivel randmica satisfazendo (1) Q = 0 e (2) (Q ) = 0, i.e. Q no
correlacionada com qualquer funo de x.
Ao invs do estimador geral Mnimo MSE (onde f(y|x) difcil de determinar), escolhemos uma relao
linear entre y e x para minimizar o MSE (estimador Mnimo MSE Linear): % = S + T (equao de
regresso linear); que equivalente a % = S + T + Q , onde Q o erro e y o estimador. E como a
varivel x no est correlacionada com o erro Q, temos que = + , onde o erro.
14
Parmetros de uma Equao de Regresso Linear
Se a distribuio conjunta de y e x, i.e. %, = (%|)) , normal bivariada e a

relao entre y e x linear, podemos mostrar que:

% = S + T + Z Z~93 0, /|.
= + ~ 93 0, .

onde os parmetros S, T, /|.
esto relacionados com a componente condicional %
da distribuio conjunta %, , enquanto que os parmetros , . esto
relacionados com a componente marginal ) . Costumamos indicar os conjuntos de

parmetros como: [ = S, T, /|.
e [ = , . . Lembre que /|.
a notao para a
varincia condicional % e que . (). Note que, por construo, \C , Z = 0
e os erros so independentes entre si, i.e. \C Z, = 0.
Podemos tambm deduzir (com algum algebrismo) que, no caso acima, temos:
S = % T()
/.
T=
.

/.

/|.
= /
.
onde /. a notao para \C %, .
Portanto, podemos ver que regredir a equao U = V + WX + Y equivalente a

determinar os parmetros da distribuio conjunta.

15
Modelos de Regresso Linear
Dadas n observaes, todas as variveis e todos os erros so randmicos.

Tipos de variveis
endgenas (ou dependentes)

predeterminadas
exgenas
defasadas (lagged)
artificiais (dummy)
Suposio de Linearidade: % = S + T + ]^ + Z para a observao i, sendo i = 1, , n.

xi e zi so variveis randmicas exgenas denominadas de regressores. Para
simplificar a notao, estamos apresentando apenas dois regressores, mas seriam K
regressores: S + S + + S` ` + Z (a = 1,2, , ). yi a varivel randmica
exgena (i.e. dependente).
i o erro ou a pertubao. O termo de erro i representa a parte da varivel
dependente deixada sem explicao pelos regressores .
, e so os coeficientes de regresso. Eles representam os efeitos separados
dos regressores (tambm chamados de efeitos marginais). Por exemplo,
representa a mudana na varivel dependente quando o regressor xi aumenta de 1
(uma) unidade, enquanto todos os outros so mantidos constantes.
Matematicamente isto significa b% b = T. A suposio de linearidade implica que o
efeito marginal no depende do nvel dos regressores.
16
Erro
Fontes de erro
1.
2.
3.
Elemento imprevisvel de aleatoriedade quando se observam respostas humanas

pessoas no se comportam com a regularidade de uma mquina!
Variveis omitidas
Erros de medidas
Erro no processo de registro
Erro por usar uma varivel proxy (visto que a verdadeira varivel no mensurvel). Um
exemplo de varivel proxy anos de escolaridade que supomos ser uma aproximao,
um representante (proxy), para educao.
Problemas com variveis proxy

Suponha que o verdadeiro modelo % = T + Z e que usamos os seguintes
proxies: % d = % + e
d = + e, onde v e u so erros de medida. x e y so chamadas de partes
sistemticas.
O modelo em termos das variveis observadas passa a ser % d = T d + f onde f =
Z + Te.
17
Erro
Uma suposio que facilita os mtodos de regresso supor que o erro i da equao
de regresso linear a seguinte: i so independente entre si e normalmente distribudo
com mdia zero e uma varincia comum 2. Indicamos esta situao como Z ~93(0, ).
Outra suposio simplificadora considerar que i e os regressores xj e zj , no exemplo
anterior, so independentes para todos os i e j. Isto significa que a distribuio de no
depende do valor de x nem do valor de z.
Para visualizar as duas condies acima, suponha a equao % = S + T + Z . Desta
maneira, para um dado valor de x, teremos valores aleatrios de y que acompanha a
distribuio normal do erro . Por exemplo, para x = 5, y poderia ser 10.0, 10.6, 9.6, .
Pela Fig.6, y seria 10.0, porque corresponde ao valor mais provvel (os valores dos
coeficientes so estimados com esta suposio).
y
% = 2 + 0.5 + Z
mais provvel
independentes
y = 10.0
y = 9.6
independentes
Fig. 6
x = 5.0
independentes
x
18
Suposies do Modelo de Regresso Linear
A amostra das n observaes dos regressores forma a matriz de dados (hachureada nas figuras abaixo):
% = S + T + ]^ + Z
h
Obs.
x1
z1
y1
x2
z2
y2
xi
zi
yi
xn
zn
yn
vetor da i-sima
observao
de 2 regressores:

h = ^

matriz de dados
Fig. 7
% = S + T + T + + T` ` + Z
h
x1
x2
xK
x11
x12
x1K
y1
x21
x22
x1K
y2
xi1
xi2
xik
xiK
yi
xn1
xn2
xnK
yn
vetor da i-sima
observao
de K regressores:

h =
`
matriz de dados
Fig. 8
Z |h , , h = 0 a = 1,2, ,

Na Fig.7 a notao acima significa: Z | , , , = 0

^
^ ^
Suposio 1 (Exogeneidade Estrita):
Note que a condicionalidade em relao a todos as n observaes de todos os K regressores !

A expectativa condicional Z |h , , h geralmente uma funo no-linear de h , , h . A
suposio de exogeneidade estrita diz que esta funo constante e de valor zero.
Uma outra maneira de definir Exogeneidade Estrita dizer que os regressores so estritamente
exgenos se h independente de j para todo i, j. Esta definio mais forte do que a
apresentada acima (mas no inconsistente com ela).
19
As consequncias da suposio de exogeneidade estrita so vrias:

1. a expectativa do termo do erro zero: E(i) = 0 (i = 1,2,,n)
isto decorre diretamente da Lei das Expectativas Totais: E Z = Z |h , , h
2. os regressores so ortogonais ao termo do erro para todas as observaes:
k Q = 0 > ^k Q = 0 a, m = 1, ,
=0
no caso geral de K regressores: kl Q = 0 a, m = 1, , ; o = 1, , p
Note que a ortogonalidade diz respeito tanto ao termo de erro i com a mesma observao
i, como ao termo de erro i e qualquer outra observao j.
3. Porque a expectativa do termo do erro zero, as condies de ortogonalidade (2) equivalem
a condies de correlao-zero: \C Z , k = 0 > \C Z , ^k = 0 a, m = 1, ,
Quando h correlao, dizemos que h problemas de endogeneidade. Isto geralmente

ocorre devido s fontes de erro relatadas no slide 13 e tambm quando lidamos com
modelos de equaes simultneas.
OBS: Para sries temporais (onde i o tempo), a consequncia de ortogonalidade da exogeneidade estrita
equivale a dizer que o termo de erro ortogonal aos regressores passados, correntes e futuros.
Mesmo quando o contexto no o de sries temporais, a presena de variveis defasadas (lagged) invalida a
suposio de exogeneidade estrita, e.g. % = T% + Z (que o modelo autoregressivo de primeira ordem
AR(1)); pois % Z = T% + Z Z = T% Z + Z = T % Z + Z = Z 0 mesmo quando
% Z = 0. Ademais, yi o regressor para a observao i+1, ou seja: o regressor no ortogonal ao termo
de erro passado o que viola a exogeneidade estrita!
20
Suposio 2 (inexistncia de multicolinearidade): nenhum dos K regressores pode

ser expresso como uma combinao linear dos outros
Na Fig. 7, por exemplo, se xi = 2zi + 5, temos dois regressores perfeitamente colineares, o que
inviabiliza o modelo. Na prtica, nunca temos multicolinearidade perfeita, exata. O que temos
so variveis fortemente, mas no exatamente, relacionadas. Multicolinearidade causa valores
elevados de erros-padro, valores de estatstica-t pequenos e excessiva sensibilidade
(pequenas mudanas nos dados ou retirada/adio de variveis provocam grandes mudanas
nos parmetros estimados).
Z |h , , h = \CJL L> a = 1,2, ,
Suposio 3 (homoskedasticity):
Em geral Z |h , , h uma funo no-linear de h , , h , mas a suposio de

homoskedasticity diz que uma funo constante. Se as condies de exogeneidade estrita
so observadas, a suposio de homoskedasticity pode ser expressa em termos da varincia,
que tem uma interpretao mais simples: Z |h , , h = para todo i. Isto : h uma
varincia comum para todos os termos de erro.
Z |h , , h = Z |h , , h Z |h , , h
= Z |h , , h = \CJL L>, pois Z |h , , h = 0
Quando esta suposio violada, dizemos que h heteroskedasticity. Quando

heteroskedasticity detectada (h testes para tal), algumas solues podem ser tentadas
(incluindo a tentativa simples de transformar os dados em forma logartmica).
21
Suposio 4 (independncia entre erros):

Z Zk |h , , h = 0 a, m = 1,2, , ; a m
Se as condies de exogeneidade estrita so observadas, a suposio de erros independentes

pode ser expressa em termos da covarincia: cov Z , Zk |h , , h = 0 a, m = 1, , ; a m
cov Z , Zk |h , , h = Z Zk |h , , h Z |h , , h Z |h , , h = Z Zk |h , , h = 0
Para sries temporais, a suposio de erros independentes significa admitir que no h

correlao serial no termo de erro.
Nas 4 suposies acima, explicitamos a condicionalidade com h , , h , tais como em

Z |h , , h = e Z Zk |h , , h = 0. Entretanto, usual dispensar h , , h a
ttulo de simplificao de notao. Neste caso apresentamos: Z = , Z Zk = 0,
Z = e cov Z , Zk = 0.
22
Modelos de Equaes Simultneas
As principais formas de endogeneidade (i.e. quando h correlao entre regressores e o termo de

erro) so:
as oriundas de erros (variveis omitidas e erros de medida) e
simultaneidade (quando a varivel explanatria conjuntamente determinada com a varivel
dependente, tipicamente atravs de um mecanismo de equilbrio).
Suponha que escrevemos uma equao estrutural (estrutural no sentido de que vem da teoria
econmica e tem interpretao causal; ou seja, no sentido de que vem de uma estrutura causal na
economia) do tipo = + f + \ ^ + Z . Se w for uma varivel endgena (i.e. w determinada
pelo funcionamento do modelo) no poderemos regredir a equao e devemos buscar mais uma
equao que, junta com a primeira, revele a relao entre h e w, e.g.: = + f + \ + Z . Estas
duas equaes formam um Modelo de Equaes Simultneas, onde a simultaneidade
responsvel pela correlao entre regressores e o termo de erro. No exemplo acima, esta correlao
facilmente percebida se colocarmos a primeira equao na segunda, quando ento w revela sua
dependncia de Z .
O exemplo acima o de um possvel modelo de oferta (supply) e demanda (demand) do mercado de
trabalho, onde h a quantidade de horas de trabalho, w o salrio por hora mdio, z o salrio
mdio de manufatura do pas, e P a preo mdio da passagem do domiclio ao local de trabalho. As
variveis endgenas so h e w e as exgenas so z e P. Neste modelo, a curva de demanda 7 =
+ f + \ ^ + Z e a curva de oferta u = + f + \ + Z so relacionadas atravs da
interseo da demanda e da oferta, que devem estar em equilbrio 7 = u (Fig.9). Em um outro
exemplo qualquer de modelo de equaes simultneas, as relaes entre variveis explanatrias e variveis
dependentes nem precisam vir de um mecanismo explcito de equilbrio (como no caso acima) nem terem a mesma
varivel no lado esquerdo das equaes (Fig.10).
Fig. 9
Fig. 10
D
D
h
% = + % + e
% = ^ + % +
endgenas: y1 e y2
exgenas: x e z
23
Modelos de Equaes Simultneas
Em um modelo de equaes simultneas, as variveis exgenas permitem que as equaes sejam

identificadas (i.e. identificadas no sentido de que os seus parmetros so estimados e as equaes
so reconhecidas). Se, por exemplo, a equao que estamos tentando estimar seus parmetros
puder ser obtida como uma combinao linear das outras, no ser possvel identific-la. Ter o
nmero exato de exgenas permite a identificao da equao.
Independente das equaes serem identificadas ou no, as equaes estruturais do modelo no
podem ser regredidas pelo mtodo OLS. Mas se transformarmos as equaes estruturais de
maneira que as variveis explanatrias so todas exgenas (i.e. no lado direito das equaes s
existem exgenas), podemos regredir (as equaes transformadas) com o mtodo OLS e atravs das
transformaes usadas poderemos obter os valores dos parmetros das equaes originais. As
equaes transformadas desta forma so chamadas de forma reduzida do modelo (ou equaes de
forma reduzida). E este procedimento de estimar os parmetros do modelo chama-se de mtodo
LS Indireto (Indirect Least Squares).
No exemplo anterior de demanda-oferta, a forma reduzida do modelo obtida colocando a primeira
equao na segunda e vice-versa, de maneira a resolver as duas equaes para h e w em termos de
z e D. As equaes transformadas e os parmetros originais calculados atravs das estimativas =Nk
(obtidos por uma regresso LS) so os seguintes:
= = + = ^ + =v ; + onde

= =

f = =w + =x ^ + =y ; +
\
= =

=v =
=Nv
=Nv
O =
=Ny
=Ny
O
O
\ = =Nx
\ = =Ny O O
O =
N = =N O =Nw N = =N O =Nw
24
Modelos de Equaes Simultneas - Identificao
Quando obtemos estimativas de todos os coeficientes estruturais de uma equao a partir das
estimativas dos coeficientes da forma reduzida, dizemos que esta especfica equao exatamente
identificada, ou simplesmente identificada. Porm, algumas vezes, isto no possvel. Uma equao
pode ter um excesso de exgenas e a forma reduzida do modelo pode levar a coeficientes estruturais
com mltiplas estimativas (e no saberemos qual valor escolher). Neste caso, dizemos que a equao
sobre-identificada (overidentified). Outra situao quando a equao tem exgenas de menos e ns
no conseguimos obter estimativas dos coeficientes estruturais. Neste caso, onde a soluo impossvel,
dizemos que a equao subidentificada (underidentified), tambm denominada de equao no
identificada. Note que num mesmo modelo podemos ter uma equao exatamente identificada e outra
subidentificada, assim como qualquer outra combinao de identificao (identificao uma propriedade
de cada equao). Veja estas situaes nos seguintes modelos:
Caso 1:
= + f + \ ^ + Z (identificada)
= + f + \ + Z (identificada)
Caso 2:
= + f + \ ^ + Z (no identificada)
= + f + Z
(identificada)
Caso 3:
= + f + \ ^ + ! + Z (no identificada)
= + f + Z (sobreidentificada)(mltiplas)
g=2
h
g-1
Caso 4:
= + f + \ ^ + Z (identificada)
= + f + \ + Z (no identificada)
No necessrio encontrar a forma reduzida para verificar o tipo de identificao. H testes para
determinar o tipo de identificao de uma equao. Para o Caso 2 est apresentado o teste mais simples
de condies apenas necessrias (mas no suficientes):
25
Modelos de Equaes Simultneas O Problema de Exogeneidade
Em modelos de equaes simultneas, a classificao de variveis como endgenas e exgenas

termina sendo bastante arbitrria. Geralmente, valores correntes de algumas variveis so tratados
como endgenos e valores defasados (lagged) destas mesmas variveis so tratadas como exgenas
(mesmo quando os valores correntes e defasados esto altamente correlacionados). A recomendao,
portanto, ao invs de simplesmente contar o nmero de variveis exgenas, devemos investigar o
quo fortemente as variveis esto correlacionadas. Algumas vezes elas esto to fracamente
correlacionadas que compensa considerar uma delas como exgena.
Algumas vezes a endogeneidade de um modelo de equaes simultneas aparente; isto , no h
vis (bias) de simultaneidade.
Variveis exgenas tambm podem levantar questionamentos sobre como validar modelos. Por
exemplo, nos seguintes dois modelos (o primeiro o mesmo da Fig.10), temos a mesma forma
reduzida. Ento fica a questo: o efeito de x sobre % ou o efeito de z sobre % ? Isto levanta a
crtica de que a capacidade de fazer previso de uma equao no pode ser tomada como evidncia
para a validade de qualquer teoria.
A maior crtica, entretanto, dos Novos Clssicos est na conhecida Crtica de Lucas ( slide 27).
% = X + % + e
% = + % +
Endgenas: y1 e y2 Exgenas: x e z
% = + % + e
% = X + % +
Endgenas: y1 e y2 Exgenas: x e z
26
Modelos de Equaes Simultneas Superexogeneidade
At meados da dcada de 70, a abordagem para modelos de equaes simultneas era a dominada
pela proposta da Cowles Foundation (Univ. de Chicago) que estabeleceram (no final dos 40s e incio
dos 50) a seguinte premissa: a classificao de variveis em endgenas e exgenas e a estrutura
causal do modelo so todos dados a priori e no so testveis (i.e. exogeneidade e causalidade no
podem ser testadas). O foco da Cowles Foundation era em mtodos economtricos de estimativa. Isto
no resiste s observaes que j fizemos com relao a exogeneidade nem mais contundente
crtica de todas: aquela feita por R.E.Lucas em seu trabalho Econometric Policy Evaluation: A Critique,
em 1976, que hoje conhecida como a Crtica de Lucas.
Um dos principais propsitos da estimativa de equaes simultneas prever o efeito de mudanas nas
variveis exgenas sobre as variveis endgenas. Entretanto, se as variveis exgenas so mudadas e
os agentes de maximizao de lucros percebem as mudanas vindo, eles certamente modificaro seus
comportamentos de acordo com tais mudanas. Portanto, os coeficientes dos modelos de equaes
simultneas no podem ser assumidos invariantes, independentes, das mudanas nas variveis
exgenas. Esta a essncia da Crtica de Lucas. Uma soluo para a Crtica de Lucas seria tornar os
coeficientes dos sistemas de equaes simultneas dependentes das variveis de polticas exgenas.
Modelos de parmetros variveis j foram propostos. Entretanto, o uso de Expectativas Racionais,
propostas pelo prprio Lucas, representa a linha dominante neste sentido. Veremos, mais a frente, que
a Crtica de Lucas conduziu a propostas de tipos de exogeneidade, onde a chamada
superexogeneidade seria o tipo relacionado Crtica de Lucas e representaria uma condio
necessria para propsitos de polticas. Entretanto, nem as Expectativas Racionais nem a
superexogeneidade encontraram evidncias empricas claras at o momento.
Lucas (1976) considera um modelo condicional dinmico usado e especificado para simulao de
polticas macroeconmicas. Os parmetros de tal modelo devem refletir as regras de deciso dos
agentes econmicos. Estes agentes so supostos integrarem tanto o conhecimento sobre polticas
passadas como as expectativas sobre possveis deslocamentos futuros das polticas. Com estas
consideraes no podemos esperar que as regras de deciso fiquem invariantes quando sujeitas a
intervenes de polticas.
27
Modelos de Equaes Simultneas Superexogeneidade
Para Lucas o comportamento passado um guia pobre para avaliar os efeitos das aes de poltica.
Concluiu que modelos de forma reduzida no conseguem prover informao til sobre as reais
consequncias de polticas alternativas porque a estrutura da economia muda quando a poltica muda
(e, portanto, os parmetros estimados variam). Propos um novo programa de pesquisa, real business
cycle (ou equilibrium business cycle), onde os modelos usados para anlise de polticas so imunes
crtica de Lucas no sentido de que so modelos de equilbrio com comportamento olhando para frente
(forward-looking behavior). Em 1983, foi proposto o conceito de superexogeneidade com o objetivo de
ser usado para testar a relevncia emprica da crtica de Lucas algo que no foi ainda empiricamente
evidenciado. Apesar disto, esta nova classificao de exogeneidade tem sido bastante usada. Para a
classificao e o uso de superexogeneidade ver: Engle, Hendry e Richard (1983) e Engle e Hendry
(1993).
As variveis exgenas em geral tm um grau fraco de exogeneidade, chamada de exogeneideade
fraca (weak exogeneity). Podemos observar isto no caso de regresso linear simples (slide 15), onde

vemos que a estimativa de [ = S, T, /|.
no necessita de informao sobre [ = , . ., i.e. [
e [ so dois conjuntos de parmetros separados. Quando os parmetros associadaos distribuio
marginal de uma varivel exgena x no so necessrios para a estimativa dos parmetros associados
distribuio condicional da varivel endgena y, dizemos que x fracamente exgena para a
estimativa de y. Este resultado pode ser estendido para sistemas de equaes simultneas com vrias
variveis exgenas. Normalmente so todas fracamente exgenas.
A situao de mais forte exogeneidade, no sentido da crtica de Lucas, seria quando os parmetros
relacionados distribuio condicional de y (e.g. [ no caso da regresso linear simples) permanecem
invariantes a mudanas (i.e. a intervenes) na distribuio marginal da varivel exgena x. Neste
caso dizemos que x uma varivel superexgena. No exemplo da regresso linear simples, x
fracamente exgenas, mas no superexgena, porque mudanas em [ = , . provocam

mudanas em [ = S, T, /|.
.
28
Modelos de Equaes Simultneas Exogeneidade Forte
Continuando a classificao de egogeneidade, h uma situao intermediria entre a fraca e a super,

chamada de exogeneidade forte. Este conceito est relacionado precedncia no tempo. Portanto
usaremos o subescrito t nas variveis.
Se a varivel xt fracamente exgena e se xt no precedida (no tempo) por nenhuma das outras
variveis endgenas do sistema, dizemos que xt uma varivel fortemente exgena.
Um contraexemplo o seguinte:
% = T + e
= S + S % +
onde e e tm uma distribuio normal bivariada e so serialmente independentes

(i.e. \C e , = 0). Nestas condies, xt fracamente exgena (porque a distribuio marginal
de xt no envolve os parmetros [ = T, / |. relacionados distribuio condicional de y).
Porm xt no fortemente exgena, porque a segunda equao mostra que % precede xt
(xt depende de % ).
A precedncia que impede uma varivel ser fortemente exgena pode ser verificada pelo conhecido
teste de causalidade de Granger que testa se xt falha causar % . A expresso causar no teste teste
de Granger significa preceder (ou seja causalidade de Granger significa precedncia de Granger
i.e. trata-se apenas de um termo inapropriado, porm muito usado). Um outro teste alternativo fazer
uma regresso de % sobre todos os x defasados (passado), correntes e futuros. Neste caso se os
coeficientes futuros da regresso forem zero, dizemos que xt falha causar % .
29
Modelos de Expectativas Adaptativas
Modelos de expectativas consideram a expectativa do agente econmico com relao a

variveis econmicas. Vamos denotar X como sendo a expectativa de . Por exemplo,
% = + e .
No modelo de expectativas adaptativas, agentes formam suas expectativas sobre o que
acontecer no futuro baseados no que aconteceu no passado. Neste modelo, partindo de
que = T + T + T + , e considerando pesos geometricamente
decrescentes do tipo T = T [ , com 0 < [ < 1 de maneira que a soma acima converge,
,
podemos chegar frmula da expectativa adaptativa:
= (1 [)
onde representa uma reviso da expecativa e representa o erro mais

recente. Na prtica usamos uma frmula equivalente (aps um algebrismo bem fcil):
[
= (1 [) .
A maneira mais fcil de estimar uma equao dentro do modelo de expectativas adaptativas
a chamada estimativa na forma autoregressiva. Nesta tcnica de estimativa (h
outras), primeiro defasamos a equao original de 1 perodo no passado, a multiplicamos
por e a subtraimos da original. Depois aplicamos a frmula da expectativa adaptativa e
obtemos uma nova equao.
No exemplo acima, subtraindo % = + e de [% = [

+ [e e considerando a
frmula [ = (1 [) , obtemos a seguinte expresso: % = [% + d + ,

onde d = (1 [) e = e [e . Esta equao envolve a regresso de % sobre % , o
que chamamos de forma autoregressiva. A autocorrelao do novo termo de erro tambm
fica evidente.
30
Expectativas Racionais
As expectativas dos agentes representam o melhor palpite do futuro que usa todas as informaes
disponveis no momento. Assumimos que as expectativas dos agentes podem estar erradas, mas so
corretas na mdia ao longo do tempo (i.e. tm um corportamento verdadeiramente estatstico e notendencioso).
Muth (1961) considerou que o erro de previso no-correlacionado com o conjunto completo de
informaes que est disponvel para o agente na ocasio em que a previso feita. Denotamos este
conjunto por 9 para representar toda a informao disponvel no tempo t1.
= + Z ou = Z
onde depende de 9 e no correlacionado com Z ; alm de Z no ser correlacionado com
qualquer uma das variveis no conjunto de informao 9 .
Aplicando a mdia esperada (i.e. a expectativa matemtica) nesta equao, temos que:
= |9
expectativa subjetiva
expectativa objetiva
A interpretao que a parte esquerda a expectativa subjetiva e a parte direita a expectativa objetiva
condicionada aos dados disponveis quando a expectativa foi formada (i.e. os agentes se comportam
como se tivessem completo conhecimento sobre o modelo que os econometristas esto estimando em
outras palavras: os agentes se comportam como se conhecessem no apenas a estrutura do modelo, mas
tambm todos os seus parmetros). Desta maneira, h uma conexo entre as crenas subjetivas dos
agentes econmicos e o comportamento vigente do sistema econmico.
A idia bsica verificar se o erro no-correlacionado com as variveis no conjunto de
informaes 9 .
Exemplo : = T + ] ^ + e (onde quantidade, o preo no tempo t conforme esperado no
tempo t1 e ^ uma exgena). Quando todas as variveis so conhecidas no tempo t1(i.e. todas esto
no conjunto de informaes 9 ), basta substituir = Z na equao e estimar (at mesmo com OLS)
a equao ento resultante: = T + ] ^ + , onde o termo de erro = e T Z .
31

Revisão Básica Econometria Material de Apoio Curso de Teoria Macroeconomica PPGE UFF PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Revisão Básica Econometria Material de Apoio Curso de Teoria Macroeconomica PPGE UFF PDF

Enviado por

Direitos autorais:

Formatos disponíveis

Material de apoio ao curso de Teoria Macroeconomica

Carmem Feij Curso Macroeconomia Avanada

Amostra ou dados so uma coleo de n observaes que so tratadas como variveis

Populao: renda das famlias

x uma varivel randmica. Os valores xi so independentes entre si e igualmente

Carmem Feij Curso Macroeconomia Avanada

Carmem Feij Curso Macroeconomia Avanada

Variveis Randmicas: discretas

Carmem Feij Curso Macroeconomia Avanada

Variveis Randmicas Contnuas

No caso de variveis randmicas contnuas, as probabilidades

Carmem Feij Curso Macroeconomia Avanada

Variveis Randmicas Contnuas

A mdia de uma varivel randmica contnua, i.e. o valor esperado ou expectativa,

A varincia, como medida de disperso, permanece sendo uma distncia do ponto ao

Carmem Feij Curso Macroeconomia

Propriedades da Expectativa e da Varincia

Carmem Feij Curso Macroeconomia Avanada

Densidade Conjunta e Condicional

No caso de dois eventos A e B, P(AB) a probabilidade da ocorrncia conjunta de A e

A funo de densidade de probabilidade

Expectativa Condicional e Varincia

Definimos expectativa condicional de X dado Y = y como:

Note que essencialmente   = '  ! com f(x|y) no lugar de f(x). Por

Uma notao para varincia condicional:

Propriedades devidas linearidade das expectativas condicionais:

Carmem Feij Curso Macroeconomia Avanada

Duas variveis randmicas X e Y so ditas independentes se a densidade conjunta f(x,y)

Carmem Feij Curso Macroeconomia Avanada

Quando trabalhamos com uma amostra com n medidas de X e Y, o coeficiente de

Carmem Feij Curso Macroeconomia Avanada

Dizemos que uma varivel randmica X no intervalo [, ] segue uma distribuio

Denotamos com: X~3(5,   ). Quando uma coleo de variveis randmicas independente e

identicamente distribudas (iid) indicamos como  ~ 3(0,   ) ou  ~93(0,   ) ou  ~3. 9. 9. ;. (0,   ).

Carmem Feij Curso Macroeconomia Avanada

J> ~3 5,   >LC > ) ~BCD3 5,  

Se X uma varivel distribuda de forma log-normal, ento:

e, em particular, para n = 1 e mdia u = 0:

ento  > F = >

Carmem Feij Curso Macroeconomia Avanada

Equao de Regresso Linear

Lembrar a essncia do que estimativa de variveis randmicas e estimador.

Carmem Feij Curso Macroeconomia Avanada

Parmetros de uma Equao de Regresso Linear

Se a distribuio conjunta de y e x, i.e.  %, = (%|)) , normal bivariada e a

Portanto, podemos ver que regredir a equao U = V + WX + Y equivalente a

Carmem Feij Curso Macroeconomia Avanada

Modelos de Regresso Linear

Dadas n observaes, todas as variveis e todos os erros so randmicos.

endgenas (ou dependentes)

Suposio de Linearidade: % = S + T + ]^ + Z para a observao i, sendo i = 1, , n.

Carmem Feij Curso Macroeconomia Avanada

Elemento imprevisvel de aleatoriedade quando se observam respostas humanas

Problemas com variveis proxy

Carmem Feij Curso Macroeconomia Avanada

Suposies do Modelo de Regresso Linear

Suposio 1 (Exogeneidade Estrita):

Note que a condicionalidade em relao a todos as n observaes de todos os K regressores !

Carmem Feij Curso Macroeconomia Avanada

Suposies do Modelo de Regresso Linear

As consequncias da suposio de exogeneidade estrita so vrias:

no caso geral de K regressores:  kl Q = 0 a, m = 1, , ; o = 1, , p

Quando h correlao, dizemos que h problemas de endogeneidade. Isto geralmente

Note que essencialmente = ' ! com f(x|y) no lugar de f(x). Por

Denotamos com: X~3(5, ). Quando uma coleo de variveis randmicas independente e

identicamente distribudas (iid) indicamos como ~ 3(0, ) ou ~93(0, ) ou ~3. 9. 9. ;. (0, ).

J> ~3 5, >LC > ) ~BCD3 5,

ento > F = >

Se a distribuio conjunta de y e x, i.e. %, = (%|)) , normal bivariada e a

Suposio de Linearidade: % = S + T + ]^ + Z para a observao i, sendo i = 1, , n.

no caso geral de K regressores: kl Q = 0 a, m = 1, , ; o = 1, , p

Z |h , , h = \CJL L> a = 1,2, ,

Em geral Z |h , , h uma funo no-linear de h , , h , mas a suposio de

= Z |h , , h = \CJL L>, pois Z |h , , h = 0

N = =N O =Nw N = =N O =Nw

onde representa uma reviso da expecativa e representa o erro mais

No exemplo acima, subtraindo % = + e de [% = [

frmula [ = (1 [) , obtemos a seguinte expresso: % = [% + d + ,