Você está na página 1de 60

Mtodos Quantitativos II

Mestrado em Economia Aplicada Faculdade de Economia e Administrao Prof. Rogrio Silva de Mattos

ECONOMETRIA CLSSICA

Notas de Aula

1. INTRODUO

1.1 OBJETIVOS Modelos economtricos Mensurao Verificao de teorias Previso

1.2 VISES DA ECONOMETRIA Escola Clssica Escola Inglesa

1.3 VISO ESTATSTICA Modelo Populacional Modelo Gerador dos Dados (MGD) Modelo Probabilstico Modelo Gerador dos Dados (MGD)

2. MODELO DE REGRESSO MLTIPLA 2.1 MODELO LINEAR GAUSSIANO (verso bsica) MGD: Y
Yi b1 b2 X 2i bk X ki
i

varivel dependente; X 2 ,, X k variveis independentes ou explicativas;


E (Yi ) ou coeficiente de sensibilidade de Y em relao Xj; Xj
b1 b2 X 2i bk X ki a mdia de Y e representa um hiperplano

bj
E (Yi )

que corta o espao euclidiano Rk; Hipteses Bsicas 1. Y uma funo linear de X 2 , , X k ; 2. X 2 , , X k so variveis no-estocsticas; 3. Cada X j no uma funo linear das demais X s , j s, j, s 1,, k; ; 4. E ( i ) 0 ; 2 5. Var ( i ) e E ( i j ) 0; i j, i, j 1,n; ; 6.
i

~ N (0,

Yi ~ N ( E (Yi ),

).

Observaes Modelo linear vem da rea de planejamento de experimentos, da a hiptese 2 que diz que cada Xj no varivel aleatria; Hiptese 3, implica que cada X j no combinao linear das demais variveis explicativas; Hipteses 4, 5, e 6 dizem respeito ao termo de erro aleatrio i , que apresenta as seguintes caractersticas:
mdia nula (hip. 4); homocedstico, pois possui varincia constante (hip. 5); no autocorrelacionado com os demais j (hip. 5); distribuio normal (hip. 6), logo Yi tambm normal com mdia E (Yi ) e varincia 2 ;

2.2 REPRESENTAO MATRICIAL Assumindo n observaes para Y, X2,...,Xk MGD: onde:


Y1
n 1

Xb

Yn

n k

1 X 21 X k1 1 X 2 n X kn

k 1

b1 bk

1 n 1

E(Y )

Xb .

Hipteses Bsicas Re-escritas 1. Vetor Y funo linear dos vetores colunas da matriz X; 2. X uma matriz no-estocstica; 3. X possui posto completo igual a k; 4. E( ) 0 , onde 0 um vetor n1 de elementos nulos; 2 I , onde I uma matriz identidade nn; 5. Var ( ) E ( ) 2 Y ~ MN ( Xb, 2 I ) ; 6. ~ MN (0, I ) Observaes As hipteses correspondem s anteriores para a verso nomatricial; Hiptese 3 implica que cada coluna de X no uma combinao linear exata das k-1 colunas restantes; Hipteses 4-6 dizem respeito ao vetor de erros aleatrios ; Hiptese 6 diz que vetor segue uma distribuio normal multivariada com vetor de mdias 0 e matriz de varinciacovarincia 2 I ; Hiptese 6 tambm diz que vetor Y segue uma distribuio normal multivariada com vetor de mdias Xb e matriz de varincia-covarincia 2 I ;

2.3 ESTIMADOR DE MNIMOS QUADRADOS ORDINRIOS Conceitos Modelo Amostral: Preditor Linear: Resduo: Representao Matricial Modelo Amostral: Preditor Linear: Resduo:
Y1 Yn b1 bk

n 1

Yi Yi
i

b1 b2 X 2i bk X ki b1 b2 X 2i bk X ki
Yi Yi Y b
i

b2 X 2i bk X ki

Y Y

Xb Xb

Y Y

Xb
1 n

onde:

n 1

k 1

Problema: A partir de n observaes amostrais, achar estimadores b1 ,, bk de boa qualidade para b1 ,, bk ;


n

Soluo: Minimizar a soma dos quadrados dos resduos


i 1

i para b , ou

seja, minimizar para b . Assim, encontra-se o estimador de mnimos

quadrados ordinrios (EMQO):


b (X X ) 1 X Y

Prova
Como se tem de minimizar uma funo de b , usa-se as regras de determinao de valores mnimos de funes diferenciveis de vrias variveis. Ou seja, acha-se as derivadas parciais da funo, iguala-se estas a zero e resolve-se o sistema resultante. Os passos so os seguintes:

1. (Y Xb) (Y Xb) (Y YY 2b X Y b X Xb

b X )(Y
b
( b) 2
2

Xb)

YY

bXY
0

YXb b X Xb

2. Condio de 1. Ordem:
3. b ( X X ) 1 X Y

2X Y

2 X Xb

EMQO para b.
2( X X )
k k

4. Condio de 2. Ordem:

definida positiva*

* Como X tem posto k, segue que a matriz quadrada XX de ordem kk tambm apresenta posto k e, logo, no singular. Sendo no singular, possui inversa. Alm disso, XX definida positiva ( z X Xz 0, z 0 ; veja-se, por exemplo, JD, 1988:

p. 484). Logo, b ponto de mnimo absoluto para .

Nota: Derivao Vetorial Seja a um vetor k 1 de constantes, A uma matriz k k de constantes e b um vetor k 1 de variveis. Ento:
( a b) b (b Ab) b (b a) b 2 Ab a

Exemplo: Vendas trimestrais de automveis nos EUA (1959.I-1988.I). MGD: onde: S = consumo pessoal de automveis novos em US$ bilhes; YP = renda pessoal em US$ bilhes; R = taxa de juros trimestral (de ttulo do Tesouro Americano); CPI = ndice de preos ao consumidor para novos carros (1983=100)
Modelo Emprico: S t 35,7 0,0391YPt 1,586Rt 0,654CPI t
St b1 b2YPt b3 Rt b4 CPI t
t

2.4 MDIA E VARINCIA DOS EMQO


Resultado (R1): b b ( X X ) 1 X

Prova:
b (X X ) 1 X Y ( X X ) 1 X ( Xb ) b (X X ) 1 X . Do que segue que b b ( X X ) 1 X .

Mdia
Vis(b) E (b b) E (b) b . E (X X ) 1 X ( X X ) 1 X E( ) 0;

Varincia R2: Prova


Var (b) E[( X X ) 1 X ( X X ) 1 X E( (X X ) 1 X (
2 2

Var (b)

(X X )

X ( X X ) 1] )X (X X ) I)X (X X )
1 1

(X X )

2.5 PROPRIEDADES DOS EMQO Eficincia Eficincia Restrita: dadas as hipteses 1-5, o EMQO o mais eficiente (no enviesado e com varincia mnima) dentro da classe dos estimadores lineares de b; ou seja, o EMQO o Melhor Estimador Linear No Enviesado (MELNE) de b.
Nota: Um estimador linear aquele que pode ser escrito como b uma matriz k n.

MY , onde M

Prova (Teorema de Gauss Markov): A prova s usa hipteses 1-5. Sejam A ambas de ordem k n. Por R1, b b A , ~ Seja tambm b ( A C )Y um estimador ~ Ento, pode-se escrever b ( A C)( Xb ) ~ b ser no enviesado, ele tem de satisfazer:
~ E(b )

e C matrizes, e por R2, Var(b) 2 AA . linear alternativo de b. ( A C ) Xb ( A C ) . Para

(X X ) 1 X

AXb CXb b CXb ( I CX )b b . ~ Logo, preciso que CX 0 . Supondo CX 0 , ento (b b) ( A C ) ~ ~ ~ de modo que Var(b ) E[(b b)(b b) ] pode ser desenvolvida como:
~ Var (b ) E[( A C )
2

( A C )' ] ( A C ) E (

)( A C )

( A C )( A C )

Mas,
( A C )( A C ) AA (X X ) (X X ) CA
1 1

AC CC

CC
1

CX ( X X )

(X X ) 1 X C

CC

Pois CX

X 'C '

0 . Ento:
CC ] Var (b)

~ Var (b )

[( X X )

CC

Nota: Resultados de lgebra matricial garantem que CC semidefinida positiva. Ser

CC

~ 0 somente quando C = 0. Mas, neste caso b b ; logo, no pode haver outro

estimador linear, diferente do EMQO, que seja mais eficiente (no-enviesado e com varincia mnima).

Eficincia Irrestrita: Quando vale tambm a hiptese 6 (erros normalmente distribudos), o EMQO o mais eficiente dentre todos os estimadores (lineares e no-lineares). A prova envolve mostrar que no caso de normalidade dos erros o EMQO equivalente ao Estimador de Mxima Verossimilhana (EMV).

Consistncia
EMQO consistente para b, ou seja, p lim(b) b ;

Prova: Dadas as hipteses 1-5 e R1, segue que:


p lim(b) p lim(b ( X X ) 1 X ) b b p lim[( X X ) 1 X ] p lim X'X n XX n
1 1

X n X n

p lim

Dado que X no estocstica (hip. 2), segue que:


p lim X n E( X ) X E( ) 0

k 1

Logo:
p lim(b) b

Normalidade Assinttica (Propriedade MUITO IMPORTANTE!) Quando n


, (b j b j ) /
bj

N (0,1) ;

Ou seja, em amostras grandes, podemos aproximar a distribuio de b j como uma normal, isto : para n grande, b j ~ N (b j , b2j ) ; Logo, se a amostra grande, no precisamos da hiptese 6. Qualquer que seja a distribuio de i , podemos aplicar a teoria da normal para o EMQO e os procedimentos de testes de hiptese;

2.6 QUALIDADE DO AJUSTAMENTO Como avaliar se o modelo est aderindo bem aos dados ou no? Estatsticas descritivas: R 2 , R 2 , Critrio de Informao de Akaike (AIC) e Critrio de Schwarz (SC)
R2

Mede o grau de ajustamento do modelo aos dados;


Yi Y

Yi Yi
Desvio Noexplicado

Yi Y
Desvio Explicado

Desvio Total

Elevando ao quadrado e agregando para todas as observaes:


n

(Yi Y ) 2
i 1

(Yi
i 1

+ Yi ) 2

n i 1

(Yi Y ) 2

Variao Total

Variao Noexplicada

Variao Explicada

Matricialmente: y y onde: y Y Y
n 1

yy

y
n 1

Y Y

n 1

Y Y

Grau de ajustamento
R2 yy yy

ou

R2 1

yy

Propriedades
R2 [0,1] ;

R 2 1 ; Fraco ajustamento Bom ajustamento R2 0 ; R 2 tende a aumentar sempre com novas variveis explicativas; R 2 nunca diminui com novas variveis explicativas

R 2 ou R 2 - ajustado

Corrige limitao do grau de ajustamento R 2


R2 1 (n 1) y y (n k )

Propriedades
R 2 R 2 se k = 1; R 2 R 2 se k > 1; R 2 pode diminuir se incluo variveis pouco explicativas; R 2 pode ser negativo;

Critrio de Informao de Akaike AIC


AIC log n 2k n

Propriedades ; Quanto menor AIC, melhor o ajustamento; AIC penaliza bem mais que o R 2 a presena de variveis irrelevantes; AIC valoriza mais a parcimnia.
AIC

Critrio de Schwarz SC
SC log n k log n n

Propriedades ; Quanto menor SC, melhor o ajustamento; SC penaliza bem mais que o R 2 a presena de variveis irrelevantes; SC tambm valoriza mais a parcimnia do que o AIC, penalizando mais ainda o nmero de parmetros/variveis no modelo.
SC

2.7 VARINCIA RESIDUAL DA REGRESSO


2

Var ( i ) tambm um parmetro desconhecido do MGD;

Caminho natural de estim-lo seria:


n

i2 n

i 1

Problema: 2 um estimador enviesado de 2 ; Soluo: usa-se um corretor de vis que redunda em:
n

i2

S2

i 1

n k

n k

S 2 a chamada varincia residual e ser usada em vrios contextos, por exemplo, o R 2 - ajustado pode ser escrito como:
n

R2 1

S , onde: S Y2 2 SY

(Yi
i 1

Y )2

n 1

S 2 tambm usada para se estimar a matriz de varincia-covarincia dos EMQO:


Sb2 S 2(X X )
1

Exemplo: Consumo Anual Brasil 1960-2004 MGD: COt


b1 b2Yt b3GR b4 I t b5 NE t
t

Sada (Compactada) do Eviews


Dependent Variable: CO Method: Least Squares Date: 06/24/05 Time: 11:01 Sample: 1960 2004 Included observations: 45 Variable Constante Y GR I NE R-squared Adjusted R-squared S.E. of regression Sum squared resid Coefficient 23372214 0.836903 -0.789323 -0.737619 -0.764959 0.994985 0.994483 24391210 2.38E+16 Std. Error 9915664. 0.031319 0.067470 0.119547 0.105569 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion 8.19E+08 3.28E+08 36.96178 37.16252

Nota: Dados anuais referentes ao Brasil; CO = consumo das famlias; Y = renda disponvel das famlias; GR = gastos do governo; I = investimento direto; NE = Exportaes lquidas

Observaes A coluna correspondente a Std. Error refere-se a:


sb
k 1

diag S b2

O modelo emprico dado por:


CO t 23.372.214 0,837Yt 0,789GR 0,738I t 0,765NE t

2.8 RESULTADOS IMPORTANTES Supondo que valem todas as hipteses, inclusive a 6, de normalidade dos erros : R3. /
2

2 n k

;
~
2 n k

R4. (n k )S 2 /

R5. (b j b j ) ~ N (0, 2V j ) , onde V j o j-simo elemento da diagonal principal de ( X X ) 1 ;

R6. (n k ) S 2 /

e (b j b j ) so independentes;
(b j bj ) S Vj ~ tn
k

R7. De R4-R6, segue que:

Prova: De R5, segue que computando:


(b j bj ) Vj

(b j b j ) /

V j ~ N (0,1) .

Agora

(n k ) S 2 , (n k ) 2

temos uma VA N(0,1) dividida pela raz quadrada de uma VA 2 n k (dividida, por sua vez, por n k), ambas independentes, o que resulta numa VA tn-k. Fazendo as simplificaes necessrias, obtm-se o resultado R7.

2.9 ESTIMAO INTERVALAR Objetivo: achar intervalos de confiana para bj; Em geral, usa-se intervalos bilaterais; Critrio: P(b jL b j b jH ) 1 ;
b j , L = limite inferior b j , H = limite superior
1

= nvel de confiana

Soluo:
b j,L b j,H bj bj t1 t1
/ 2,n k b j / 2,n k b j

Prova: Defina sb

S V j . Ento, usando R7, podemos escrever:


bj
/ 2, n k

t1

bj sb
j

t1

/ 2,n k

P t1

/ 2,n k b j

bj

bj

t1

/ 2, n k b j

Multiplicando todos os componentes da tripla desigualdade por -1:


P t1
/ 2, n k b j

bj

bj

t1

/ 2,n k b j

e somando b j aos trs componentes:


P bj t1
/ 2,n k b j

bj

bj

t1

/ 2,n k b j

2.10 TESTES DE SIGNIFICNCIA DE PARMETROS E VARIVEIS MGD:


Yi b1 b2 X 2i bk X ki
i

Exemplos de hipteses de interesse: H0: b1 = 0 (E(Y) atravessa a origem do espao Rk); H1: b1 0 (E(Y) no atravessa a origem do espao Rk); H0: b2 = 0 (variaes em X2 no explicam variaes em Y); H1: b2 0 (variaes em X2 explicam variaes em Y); H0: b3 = 1 (variaes em X3 produzem variaes idnticas em Y); H1: b3 1 (variaes em X3 no produzem vars. idnticas em Y); Conceitos e definies = nvel de significncia = P(Erro Tipo I) = P(Rejeitar H0|H0 V); = P(Erro Tipo II) = P(No Rejeitar H0|H0 F); Poder do teste = 1 - ; Representao Geral H0: bj = b0j ; H1: bj b0j Caso tpico em econometria: b0j = 0; Por R7, segue que (b j b0, j ) Sb ~ t n k ou b S b ~ t n k (caso b0j= 0);
j j

Procedimentos do teste t (tpico) 1. Enunciado das hipteses: H0: bj = 0 ; H1: bj 2. Escolha de = nvel de significncia; 3. Clculo de tb
bj
j

S b

4. Aplicao da regra de deciso pelo valor de prova (p-value): Se P( | Tn k | tb )


j

No rejeito H0;
j

Se P( | Tn k | tb )

Rejeito H0;

Exemplo: Consumo Anual Brasil 1960-2004

MGD: COt

b1

b2Yt

b3GR b4 I t

b5 NE t

Sada (Compactada) do EViews


Dependent Variable: CO Method: Least Squares Date: 06/24/05 Time: 11:01 Sample: 1960 2004 Included observations: 45 Variable C Y GR I NE R-squared Adjusted R-squared S.E. of regression Sum squared resid Coefficient 23372214 0.836903 -0.789323 -0.737619 -0.764959 0.994985 0.994483 24391210 2.38E+16 Std. Error 9915664. 0.031319 0.067470 0.119547 0.105569 t-Statistic 2.357100 26.72190 -11.69886 -6.170097 -7.246070 Prob. 0.0234 0.0000 0.0000 0.0000 0.0000 8.19E+08 3.28E+08 36.96178 37.16252

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion

2.12 TESTE F (SIGNIFICNCIA GERAL DA REGRESSO) H0: b2 b3 bk 0 (nenhuma Xj explica variaes em Y); H1: pelo menos um b j 0 (pelo menos uma Xj explica variaes em Y); j = 2...,k-1; Suponha vlidas as hipteses 1 a 6 e considere H0 verdadeira: R8.
n i 1

(Yi

Y )2

yy

b* x* x*b*

2 k 1

, onde

* n ( k 1)

X*

X*

a matriz X em forma de desvios em relao mdia com a primeira coluna (referente constante) excluda. Prova: Ver [VA: pp. 59-60]; R9.
y y /(k 1) ~ Fk /(n k )
1, n k

Prova Combinando R3 com R8:


yy (k 1) (n k ) S 2 (n k ) 2 y y /(k 1) ~ Fk S2

1, n k

Estatstica de Teste:
F y y /(k 1) /(n k ) Variao Explicada /(k 1) Variao No Explicada /(n k )

Regra de deciso pelo valor de prova: o Dado uma escolha de : Se P( Fk Se P( Fk


1, n k 1, n k

F) F)

No rejeito H0; Rejeito H0;

2.13 MULTICOLINEARIDADE Caso 1: Modelo com 1 var. dependente e 2 vars. independentes:


Yi b1 b2 X 2i b3 X 3i
i

fcil verificar que o EMQO neste caso seria:

b2 b3

2 ( x2i yi x3i ) ( x3i yi )( x2i x3i ) 2 2 ( x2i )( x3i ) ( x2i x3i ) 2 2 ( x3i yi x2i ) ( x2i yi )( x2i x3i ) 2 2 ( x2i )( x3i ) ( x2i x3i ) 2

b1

b2 X 2

b3 X 3

Colinearidade Perfeita Coeficiente de correlao linear entre X2 e X3:


1 r23 x 2 i x 3i
2 2 x 2 i x 3i

Se X 2

X 3 , com

0 (violao da hiptese 2):

o Os numeradores de b2 e b3 so iguais a 0; 2 2 2 o r23 1 ( x2i )( x3i ) ( x2i x3i ) 2 0


Logo, com b2 b3 0 0 , impossvel computar os EMQO b1 , b2 , b3 .

Alta mas no perfeita colinearidade possvel computar EMQO, pois hip. 2 no violada; Sejam as varincias estimadas dos EMQO, (obtidas como os 2 ltimos elementos da diagonal principal de S b2 S 2 ( X X ) 1 ):
S b2 S2 2 x2i (1 r23 ) S b2 S2 2 x3i (1 r23 )

2 Seja r23 1 , mas considere que:

2 r23

Sb

e Sb

Logo:
2 r23

t b

0 e t b

Conseqncias da Multicolinearidade Estatsticas t podem ficar artificialmente muito baixas; Inclusive, possvel acontecer R 2 1 com t b contraditrio;
2

0 e t b

0 , o que

Solues Alternativas Retira-se uma das variveis do modelo; Trabalha-se com variveis em diferenas: o Exemplo: Modelo de interesse: C t b1 b2Yt b3Wt t Se Yt e Wt muito correlacionadas, usa-se: Ct Ct 1 b2 (Yt Yt 1 ) b3 (Wt Wt 1 ) ( t t 1 )

Caso 2: Modelo com 1 var. dependente e k-1 vars. independentes: Multicolinearidade Perfeita
Yi b1 b2 X 2i bk X ki
i

Neste caso, no pode acontecer por exemplo:

X 2i

X 3i

X ki

Ou seja, uma varivel explicativa no pode ser linearmente dependente das demais.

Alta mas no perfeita Multicolinearidade

Por exemplo, pode acontecer:


X 2i
3

X 3i

X ki

Uma varivel explicativa quase linearmente dependente das demais.

2.14 ESTIMAO POR MXIMA VEROSSIMILHANA (EMV)

Pela hiptese 6: Yi ~ N ( E(Yi ), Funo densidade:


1 2
2

);

f (Yi )

exp

(Yi

b1 b2 X 2i bk X ki ) 2 2 2

Funo de verossimilhana:
n

L(b1 ,, bk ,

)
i 1

f (Yi ) 1 2
2 n 2 n

exp

i 1

(Yi

b1 b2 X 2i 2
2

bk X ki ) 2

Em forma matricial:
L(b,
2

1 2
2

n 2

exp

(Y

Xb) (Y 2 2

Xb)

Log-verosssimilhana:
n ln 2 2 n ln 2 (Y Y b X Y YXb b X Xb) 2 2

(b,

Maximizando a log-verossimilhana Condio de 1. Ordem:


b
2

1 2
2

(2 X Y

~ 2 X Xb ) 0

~ b
~2

(X X ) 1 X Y
~~ n

n 2 ~2

~~ 2 ~4

~ onde: ~ Y Xb

Condio de 2. Ordem: garante que o EVM de b e global (ver JD: p. 146).


~

mximo

Logo, o EMV de b ( b ) o mesmo que o EMQO ( b ); e o EMV de 2 ~2 ( ) difere do usado antes para 2 ( S 2 ) apenas no denominador;

Propriedades do EMV para pequenas amostras


~ b no enviesado para b; ~ 2 enviesado para 2 ; ~ ~ A varincia de b atinge o limite mnimo de Cramer-Rao, logo b

tambm eficiente;

Propriedades do EMV para grandes amostras


~ b e ~ 2 so consistentes; ~ b apresenta normalidade assinttica;

Concluso Sob hiptese 6 de normalidade dos erros, EMQO e EMV so equivalentes e portanto constituem o melhor estimador de b dentre os estimadores lineares e os no-lineares.

2.15 PREVISO Objetivo: acertar um valor de Y condicional a valores particulares de X 2 ,, X k ; Previso Pontual Seja x f
[1 X 2 f X kf ] , ento:

Yf

b1 b2 X 2 f

bk X kf

xf b

o Previso dentro da amostra:


xf Yf xi Yi [1 X 2i xi b X ki ] i 1,, n

o Previso fora da amostra:


xf Yf x0 Y0 [1 X 20 X k 0 ] x0 b o i

Pelo T. Gauss-Markov:
o b o melhor estimador linear de b; o Logo, Y f um preditor timo de Yf;

Erro de previso: e f

Yf

Yf ;

o Note que: E(Y f ) x f E(b) x f b E(Y f ) ; o Logo: E(e f ) E(Y f Y f ) E(Y f ) E(Y f ) 0; o Ou seja Y f um previsor no enviesado de Y f .

Varincia do erro de previso: Var (e f )


2 f

2 f

Var (Y f Var (
2 2 f

Y f ) Var (

x f (b b))
2 2

) Var ( x f (b b))
2

E[ x f (b b)(b b) x f ]

x f Var (b) x f [1 x f ( X X ) 1 x f ]

xf (X X ) 1 xf

Estimao da Varincia do erro de previso:


S2 f S 2 (1 x f ( X X ) 1 x f )

Resultados de interesse Sejam vlidas hips. 1-6. Considere os seguintes resultados: R10. R11. R12. R13.
(Y f (Y f Y Yf )
2 f

f
2 f

ef
~
2 n k

~ N (0,1);
2 f

(n k ) S

; so independentes;

Yf )
Yf Sf

e (n k ) S 2 f
k

~ tn

Prova Por R10, R11 e R12, segue que a razo:


Yf
f

Yf

(n k ) S 2 f (n k )
2 f

Y Yf Sf

~ tn k ,

Fazendo-se as simplificaes necessrias, temos o resultado R13.

Previso Intervalar

Objetivo: Achar intervalo de confiana para Y f de acordo com o


critrio P(Y fL Y f Y fH ) 1

Soluo:
Y fL Y fH Yf Yf t1 t1
/ 2, n k

Sf Sf

/ 2,n k

Prova Usando R13, verificamos que:


P ( t1 Yf
/ 2,n k

Yf Sf

t1

/ 2,n k

) 1

De onde imediato que, aps manipulaes algbricas simples:


P(Y f t1
/ 2, n k

Sf

Yf

Yf

t1

/ 2, n k

Sf ) 1

Isto :
P(Y fL Yf Y fH ) 1

Exemplo: Previso do Consumo Anual Brasil 2005-2010 Modelo Economtrico:


CO t
ANO 2005 2006 2007 2008 2009 2010

29.589.820 0,789Yt
CL 1046 1073 1095 1114 1132 1148 C 1087 1114 1136 1156 1174 1190 CH 1128 1155 1177 1197 1215 1233

0,686GR 0,606I t
Y 1848 1907 1958 2008 2055 2102 G 157 165 173 182 191 201

0,781NE t
I 364 382 401 421 442 464 NE 94 97 99 101 102 102

Nota: Valores em R$ bilhes

3. USOS E EXTENSES DO MODELO DE REGRESSO MLTIPLA 3.1 COEFICIENTES PADRONIZADOS Os coeficientes do MGD linear no podem ser comparados entre si; Suas magnitudes dependem da escala de medida das variveis explicativas; Soluo: modelo com as variveis padronizadas, isto :
Yi SY Y
* b2

X 2i X 2 S X2

* bk

X ki X k S Xk

ei

Relao entre coeficientes originais e padronizados:


b* j bj SXj SY

j = 2,...,k.

Coeficientes padronizados so a-dimensionais, isto , no possuem uma unidade particular de medida; A comparao entre coeficientes padronizados possvel porque agora todas as variveis apresentam a mesma mdia e varincia; 3.2 ELASTICIDADES Muito usada em microeconomia, a elasticidade mede a variao relativa na varivel dependente dada uma variao relativa numa varivel independente (com as demais constantes);
Ej E (Yi ) X ji X ji E (Yi ) bj X ji E (Yi )

No modelo linear, a elasticidade estimada obtida como:


E ji X ji bj Y
i

Elasticidades no ponto mdio:


Ej Xj bj Y

No caso do modelo log-log (todas as variveis so medidas em logaritmos), a elasticidade constante para todo i = 1,...,n.

3.3 MODELOS NO-LINEARES Modelo Linear: Yi b1 b2 X 2i bk X ki i Modelo No-Linear: qualquer modelo que no linear.
Yi F ( X 2i ,, X ki , i )

Modelos no-lineares intrinsecamente lineares (MNLIL): o So lineares nos parmetros ou ; o Podem ser transformados em lineares nos parmetros; Modelos no-lineares intrinsecamente no-lineares (MNLINL): o no podem ser transformados em lineares nos parmetros.

Modelos intrinsecamente lineares

Modelo polinomial: Yi Modelo log-log: ln Yi


b1

b1

b2 X i
2

b3 X i2 bk X ik
k

1 i

b b Modelo multiplicativo: Y b1 X 2i X ki

* i
i

b2 ln X 2i

bk ln X ki

o Note-se que o modelo multiplicativo, porque:


b1 lnb1 b2 b2
bk

log-log
bk
i

deriva
ln
* i

do

modelo

Modelo exponencial: Yi Modelo log-lin: ln Yi Modelo recproco: Yi


b1

exp(b1 b2 X 2i

b2 X 2i

bk X ki ) ln

bk X ki

b1

b2 X 2i

1 bk X ki

o Que pode ser transformado em:


1 Yi b1
b1

b2 X 2i
b2 ln X 2i

bk X ki
bk ln X ki b3 X 3i
i i

Modelo lin-log: Yi

Modelo interativo: Yi

b1

b2 X 2i

b4 ( X 2i X 3i )

3.4 TESTE F PARA SIGNIFICNCIA DE BLOCOS DE VARIVEIS Considere o MGD: Yi Teste de Hiptese: o H0: b4 o H1: b4 Definies: o Modelo irrestrito (IR): Yi o Modelo restrito(R): Yi
b1 b1 b2 X 2i b2 X 2i b3 X 3i
i

b1 b2 X 2i

b3 X 3i

b4 X 4 i

b5 X 5i

b5

0 (X4 e X5 no so significativas); 0 (X4 e/ou X5 /so significativa(s));

0 e/ou b5

b4 X 4 i

b5 X 5i

b3 X 3i

o SQT = Soma dos Quadrados Totais = o SQE = Soma dos Quadrados Explicados:

(Yi

Y )2

y y;

(Yi
i2

Y )2

y y;

o SQR = Soma dos Quadrados dos Resduos:

Estatstica de Teste:
F ( SQE IR SQE R ) /(k IR k R ) ~ Fk IR SQRIR (n k IR )
k R , n k IR

Regra de deciso pelo valor de prova: o Dado uma escolha de : Se P( Fk Se P( Fk


IR

k R , n k IR k R , n k IR

F) F)

IR

No rejeito H0; Rejeito H0;

Exemplo: Modelo consumo vs renda e tendncia quadrtica MGD: Ct H0: b3 b4 H1: b3


b1 b2Yt b3t b4 t 2

0; (termo de tendncia no significativo)

0 e/ou b4

0 (termo de tendncia significativo)

Implementao do teste com

= 5%;

Usando-se n = 15 observaes anuais, estimou-se:


Modelo irrestrito: Ct 2,1
(16, 56 )

0,77 Yt
( 6 , 35)

1,1 t
(1, 59 )

0,32 t 2
(1, 43)

o SQEIR o SQRIR o k IR
4;

65.965,10 ; 77,17 ;

Modelo restrito: Ct

2,3
(17 , 31)

0,77 Yt
( 7 , 49 )

o SQER o kR
F

65.898,24 ;

2
4,765

(65965,10 65898,24) /(4 2) 77,17 (15 4)

P( F2,11

4,765)

0,0323

Rejeitamos H0 a 5% de significncia

Caso Geral do Teste F para bloco de variveis

MGD:

Yi

b1

b2 X 2i

bk X ki

Divida o conjunto {X2,...,Xk} em 2 grupos, sendo um deles formado por q < k 1 variveis a serem testadas; Agrupe as variveis a serem testadas no final do MGD, reescrevendo-o como segue:
Yi b1 b2 X 2i bk q X k bk Xk bk X ki

q ,i

q 1

q 1,i

H0: bk

q 1

bk

0 ( Xk

q 1

,, X k so no-significativas);

H1: pelo menos um bs significativa); Escolha um valor para ;

0 (pelo menos uma Xs, s = k

q + 1,...,k,

Estime os modelos irrestrito e restrito; Compute:


( SQE IR SQE R ) /(k IR k R ) ; SQRIR (n k IR )

Aplique a regra de deciso: o Se P( Fk o Se P( Fk


IR

k R , n k IR k R , n k IR

F) F)

No rejeito H0; Rejeito H0;

IR

Nota: modernos softwares economtricos, como o Eviews, implementam automaticamente esse procedimento, sendo necessrio informar apenas o grupo de q variveis a serem testadas em bloco;

3.5 VARIVEIS DUMMY Variveis qualitativas: que refletem estado, situao, classe, etc., ou seja, eventos qualitativos que no podem ser medidos numericamente; Varivel dummy: varivel binria (assume valor 0 ou 1) usada para representar, num modelo quantitativo/matemtico como o MGD, as influncias de eventos qualitativos; Variveis dummy podem ser usadas no papel de dependente ou independente num modelo economtrico. Veremos por ora s o caso de variveis dummy independentes; Regresso com uma varivel dummy MGD: Yi
b1 b2 Di
i

Yi uma varivel quantitativa; Di uma varivel dummy (qualitativa) que assume s valores 0 ou 1; Exemplo: Estudo americano em escola secundria n = 20 professores pesquisados; Yi = renda do i simo professor; Di = sexo do i simo professor (1

homem; 0

mulher);

Interpretao do MGD: E (Yi | Di 0) b1 o salrio mdio/esperado de uma professora;


E (Yi | Di 1) b1 b2 o salrio mdio/esperado de um professor;

Modelo emprico: Yi
Yi | ( Di Yi | ( Di 0) 1) b1 b1

21,2 1,5 Di
( 3.15) ( 2, 7 )

21,2 ; b2 21,2 1,5 22,7 ;

Hiptese de interesse: H0: b2

0 (no h discriminao sexual);

Regresso com duas variveis dummy MGD: Yi


b1 b2 DSi b3 DRi
i

Exemplo: Estudo americano em escola secundria (continuao) n = 20 professores pesquisados; Yi = renda do i simo professor; DSi = sexo do i simo professor (1 homem; 0 mulher); DRi = raa do i simo professor (1 branco(a) ; 0 negro(a));
Sexo\Raa Homem (H) Mulher(M) Branco (B) DS = DR = 1 DS = 0, DR = 1 Negro (N) DS=1, DR = 0 DS = DR =0

Interpretao do MGD: o E (Yi | DSi DRi 0) b1 : sal. mdio/esperado da M.N.; o E (Yi | DSi 1, DRi o E (Yi | DSi o E (Yi | DSi
0, DRi DRi 1)
( 3, 74 )

0) 1) b1

b1 b1 b2
( 3,14 )

b2 : sal. mdio/esperado do H.N.; b3 : sal. mdio/esperado de uma M.B.; b3 : sal. mdio/esperado do H.B.;
(1, 01)

Modelo emprico: Yi 19,2 1,03 DSi 0,74 DRi


o Yi | ( DSi o Yi | ( DSi o Yi | ( DSi DRi 0) 19,2 ; 0) 19,2 1,03 20,23 ;

o Yi | ( DSi 1, DRi 0, DRi DRi

1) 19,2 0,74 19,94 ; 1) 19,2 1,03 0,74 20,97 ;

Nota: a rigor, no se somaria o coeficiente estimado b3 0,74 porque ele se no mostrou diferente de zero a 5% de significncia. Apenas para fins ilustrativos que o inclumos;

Hipteses de interesse: o H0: b2 0 (no h discriminao sexual); o H0: b3 0 (no h discriminao racial); o H0: b2
b3 0 (no h discriminao de qualquer tipo);

Regresso com 1 varivel dummy e 1 varivel quantitativa MGD: Yi


b1 b2 Di b3 X i
i

Exemplo: Estudo americano em escola secundria (continuao) n = 20 professores pesquisados; Yi = renda do i simo professor; Di = sexo do i simo professor (1 homem; 0 mulher); Xi = nmero de anos de servio do i-simo professor. Interpretao do MGD: o E (Yi | Di 0, X i ) b1 b3 X i : salrio mdio/esperado da professora como funo do nmero de anos de servio.; o E (Yi | Di 1, X i ) (b1 b2 ) b3 X i : salrio mdio/esperado do professor como funo do nmero de anos de servio;

Modelo emprico: Yi 19,5 1,12 Di 0,53 X i


( 3,19 ) ( 2 , 77 ) ( 3,15)

o Yi | ( Di

0, X i ) 19,5 0,53X i ;

o Yi | ( Di 1, X i ) 20,67 0,53X i ;

Hiptese de interesse: o H0: b2 0 (no h diferena, entre homens e mulheres, na relao entre salrio recebido e anos de servio );

Variveis dummy sazonais MGD1: Yt


D jt

a b1 D1t
1 t j 0 outro

b2 D2t

bs 1 Ds

1,t

j 1,..., s 1

s = comprimento do perodo sazonal: s = 2 (semestral) s = 6 (bimestral) s = 3 (quadrimestral) s = 12 (mensal) s = 4 (trimestral) bj = fator sazonal do j simo ms, bimestre, etc. (j = 1,...,s 1); usa se s s-1 dummies p/evitar colinearidade perfeita c/a constante; Normalizao dos fatores sazonais MGD2:
Yt
s j 1

a b1 D1t bj 0

b2 D2t

bs Dst

Verifica se que este modelo pode ser re escrito como: MGD2: Yt o Onde: D
* jt

a b1 D1*t

b2 D1*t

bs 1 Ds* 1,t

1 t

j j 1,..., s 1

1 t s 0 outro

Exemplo: Sazonalidade trimestral (s=4); MGD: Y MGD1: Yt


D1 1 0 0 0 1 0 0 0

Xb
a
D1* 1 0 0 1 1 0 0 1
* D2

, X [1n D] .
3 j 1

a
D2 0 1 0 0 0 1 0 0

3 j 1

b j D jt

MGD2: Yt

b j D* jt

D3 0 0 1 0 0 0 1 0

* D3

0 1 0 1 0 1 0 1

0 0 1 1 0 0 1 1

4. VIOLAO DE HIPTESES BSICAS 4.1 AUTOCORRELAO SERIAL DOS ERROS Violao da hiptese 5 ( E( i , j ) Cor( i , j ) Cov( i , j ) 0 , i Caso Geral MGD:
Yi b1 b2 X 2i 0 bk X ki ui Cor (u i , u j )

j);

para algum j

Caso de Sries de Tempo MGD:


Cor (ut , ut j )
Yt b1 b2 X 2t bk X kt E (u t , ut j ) ut 0

Cor (ut , ut j )

j = 1, 2, ...

0 chamada autocorrelao serial de j-sima ordem;

Autocorrelao Serial de 1. Ordem (ACS1) MGD:


Yt b1 b2 X 2t 0 bk X kt ut

Cor (ut , ut 1 )

Razes para haver ACS1 o Inrcia tpica das variveis econmicas; o Varives explicativas excludas do MGD considerado: MGD: Yt
b1 b2 X 2t b3 X 3t b1
t

MGD considerado: Yt o Forma funcional incorreta: MGD: Yt


b1 b2 X t

b2 X 2t

ut

b3 X t2
b1

MGD considerado: Yt o Defasagens excludas: MGD: Yt


b1 b2 X 2t

b2 X t

ut

b3 X 2,t
b1

b4Yt

MGD considerado: Yt

b2 X 2t

ut

Conseqncias da ACS1: Propriedades do EMQO: o b continua no enviesado para b; o b (EMQO) no mais o MELNE para b, logo ineficiente; Varincia residual enviesada: u t2 (n k ) em geral subestima 2 ; o S2 o Elementos de diag(S b ) ficam, em geral, subestimados; o R 2 e R 2 ficam, em geral, superestimados; o Estatsticas t b b j S b (j = 1,...,k) ficam,
j j

em

geral,

superestimadas; o Estatstica F fica superestimada; o Critrios de informao AIC e SC ficam em geral subestimados; Matriz de var-covar dos parmetros: 2 o Com ACS1: Var(b) ( X X ) 1 C( , xt , xt 1, ) ; o
Cor (u t , u t 1 ) ;

o Computadores tipicamente reportam resultados calculados com base na ausncia de ACS1, isto : S b2 S 2 ( X X ) 1 ; Verificando a presena/ausncia de ACS1 Graficamente:
Termo de Erro com ACS1
0.8 0.6 0.4 0.2 0 -0.2 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 -0.4 -0.6 -0.8 -1

Termo de erro Sem ACS1


0.4 0.3 0.2 0.1 0 -0.1 -0.2 -0.3 -0.4 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49

Teste de Durbin-Watson o Assuma que:


Yt b1 ut
t

b2 X 2t
1 t 1 t

bk X kt

ut
2

o MGD: o Onde o H0:


ut ut

ut Cor (
1 t

0; E ( t )

0,Var ( t )

chamado

processo

AR(1)

Cor (u t , u t 1 ) ;

0 ; H1:

0;
n

(u t
n t 1

ut 1 ) 2 u
2 t n

o Estatstica DW: DW o Onde


n t 2 t

t 2

2(1

u ut

n 2 t 1 t

u ;

o Note-se que:
0 1 1 1 1 0 0

DW 0 2 DW DW DW DW

0 2 2 4 4

o Regra de deciso Se
0
dL
dU 4 dU

DW
DW
DW DW

dL
dU
4 dU 4 dL

Decidir Rejeitar H0 (h ACS1 +) No decidir No Rejeitar H0 No decidir Rejeitar H0 (h ACS1 )

4 dL

DW

o Onde [dL,dU] = f (n,k, );

Exemplo: Consumo Anual Brasil 1960 2004


Dependent Variable: CO Method: Least Squares Date: 06/24/05 Time: 11:01 Sample: 1960 2004 Included observations: 45 Variable Coefficient C Y GR I NE R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 23372214 0.836903 -0.789323 -0.737619 -0.764959 0.994985 0.994483 24391210 2.38E+16 -826.6401 0.395263

Std. Error 9915664. 0.031319 0.067470 0.119547 0.105569

t-Statistic 2.357100 26.72190 -11.69886 -6.170097 -7.246070

Prob. 0.0234 0.0000 0.0000 0.0000 0.0000 8.19E+08 3.28E+08 36.96178 37.16252 1983.966 0.000000

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)

o Considerando n = 45, k = 4 e

= 0,05, dL=1,34 dU=1,72

Teste de Ljung Box (tambm para ACS de ordens maiores) o H0:


1 2

0 ; H1: pelo menos um

0 (j=1,...,m)

o Estatstica de Ljung Box:


m

QLB

n(n 2)
j 1

2 j n j

2 m

Exemplo: Consumo Anual Brasil 1960 2004


Date: 06/06/06 Time: 10:58 Sample: 1970 2004 Included observations: 35 Autocorrelation Partial Correlation

AC ( j) 0.725 0.525 0.345 0.209 0.160

PAC

Q-Stat (LB) 20.017 30.812 35.634 37.451 38.561

Prob

. . . . .

|****** |**** |*** |**. |* .

. |****** . | . . *| . . | . . |* .

1 2 3 4 5

0.725 -0.002 -0.072 -0.034 0.087

0.000 0.000 0.000 0.000 0.000

Estimador de Mnimos Quadrados Generalizados (EMQG)


Yt b1 ut
t

b2 X 2t
1 t 1 t

bk X kt

ut
2

MGD:

ut Cor (

0; E ( t )

0,Var ( t )

Equao de diferenas generalizadas (EDG):


Yt* b1*
* b2 X 2t * bk X kt t

o Onde Yt* Yt

Yt 1 , X * jt

X jt

X j ,t

ut

ut 1 ;

Ento, estima se a EDG por MQO, obtendo se b* (b1* , b2 ,, bk ) ;


o b1 b1* (1 );
2

o Primeira observao: Y1* Y1 1 Representao matricial MGD: Note que Var (u ) E (uu )
1 1
2
2

, X *1 j

X j1 1

Xb u ,

, porque h ACS1;

n 1 n 2 n 3

o Onde

2 n n

n 1

n 3

1
n 3

1 1 0 1 0 0 1 0 1 0 0 0
2

Agora, seja a seguinte matriz: H

n n

0 0 0

o Pr multiplicando o MGD por essa matriz: HY o Seja Hu . Ento, minimizando se EMQG:


~ b (X
HH;
1

HXb Hu ;
u H Hu , tm se o

i2
1

X) 1X

o Note se que
~

o b eficiente, consistente assintticamente;

e normalmente distribudo

Estimao de (Mtodo de Cochrane Orcutt ou CORC):


1. Estima se o MGD por MQO e obtm se u t (1) ; 2. Estima se: u(1),t u(1),t
1

v(1),t ;
t ;

* * 3. Usa se para estimar EDG: Yt* b1* b2 X 2t bk X kt

4. Computa se: u( 2),t

Yt

b1 b2 X 2t bk X kt ;

5. Repete se passos 2, 3 e 4 iterativamente at que: | 1 | 0 (onde indica iterao); Exemplo: Consumo Anual Brasil 1960 2004
Dependent Variable: CO Sample (adjusted): 1971 2004 Included observations: 34 after adjustments Convergence achieved after 22 iterations Variable C Y GR I NE AR(1) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient 1.22E+08 0.769876 -0.679646 -0.828333 -0.932487 0.865912 0.997571 0.997138 9368116. 2.46E+15 -590.7392 2.156901 Std. Error 54126485 0.043924 0.062333 0.074674 0.087990 0.070015 t-Statistic 2.257963 17.52743 -10.90354 -11.09262 -10.59761 12.36746 Prob. 0.0319 0.0000 0.0000 0.0000 0.0000 0.0000 7.49E+08 1.75E+08 35.10231 35.37167 2300.268 0.000000

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)

Estatstica Q de Ljung Box Date: 06/07/06 Time: 15:20 Sample: 1971 2004 Autocorrelation
. *| . . . . *| . .

Partial Correlation
. *| . . . . *| . .

J 1 2 3 4 5

AC -0.094 0.087 -0.110 -0.016 0.112

PAC -0.094 0.079 -0.097 -0.041 0.127

Q-Stat 0.3309 0.6192 1.0987 1.1097 1.6421

Prob

|* . | . |* .

|* . | . |* .

0.431 0.577 0.775 0.801

4.2 HETEROCEDASTICIDADE Violao da hiptese 5 ( Var ( i ) Caso Geral MGD:


Yi b1 b2 X 2i
2 i
2

i ; ou Var ( ) E (

I );

bk X ki

ui

Var (ui )

Caso de Sries de Tempo MGD:


Yt b1 b2 X 2t
2 t

bk X kt

ut

Var (ut )

Exemplo Grfico: Caso de 1 varivel explicativa X

Atualmente, heterocedasticidade ocorre em dados temporais e de seo cruzada (cross section);

Consequncias da Heterocedasticidade Propriedades do EMQO: o b continua no enviesado para b; o b (EMQO) no mais o MELNE para b, logo ineficiente; Varincia residual enviesada: n 2 k ) um estimador enviesado de sigma2i; o S2 i 1 ui ( n o Elementos de diag(S b ) ficam enviesados; o R 2 e R 2 ficam enviesados; o Estatsticas t b b j S b (j = 1,...,k) ficam enviesadas;
j j

o Estatstica F fica enviesada; o Critrios de informao AIC e SC ficam enviesados; Matriz de var-covar dos parmetros: 2 o Sob heterocedasticidade: Var (b) , onde ( X X ) 1 ; o Computadores tipicamente reportam resultados calculados com base na ausncia de heterocedasticidade, isto : S b2 S 2 ( X X ) 1 ; Mnimos Quadrados Ponderados (MQP) um caso particular do EMQG; MGD: Supondo
2 i

Yi

b1

b2 X 2i
2 i

bk X ki

ui

Var (ui )

conhecida, transforma se o MGD segundo:


Yi
i

b1

1
i

b2

X 2i
i

bk

X ki
i

ui
i

* * o Isto : Yi* b1Wi b2 X 2i bk X ki

o No novo modelo, o termo Prova: Var ( i ) Var


ui
i

ui
1
i

homocedstico;
2 i 2 i

Var ui 2

Estima se o modelo transformado por EMQO.

Representao Matricial do EMQP MGD: Note que Var (u ) E (uu )


2 1
2

Xb u ,

, onde :
0 0
2 3

0
2 2


1
1

0 0 0 ;
2 n

2 n n

0 0 0

0 0

0 1
2

0 0 1
n

H Agora, seja a seguinte matriz: n n

0 0

o Pr multiplicando o MGD por essa matriz: HY o Seja Hu . Ento, minimizando se EMQP:


~ b (X
1

HXb Hu ;
u H Hu , tm se o

i2

X) 1X

o Note se que (
~

HH ;

o b eficiente, consistente assintticamente; Quando


2 i

e normalmente distribudo

desconhecida

Assume se que uma funo das variveis do modelo:


Var (ui )
2 i

cZ i

cZ (Yi , X 1i ,, X ki )

Onde c uma constante no nula.

Transforma se o MGD conforme:


Yi Zi b1 1 Zi b2 X 2i Zi bk X ki Zi ui Zi

fcil verificar que:


Var ui Zi 1 Var u i Zi cZ i Zi c

Logo, no MGD transformado o termo de erro homocedstico. Exemplos de funes Zi que podem ser usadas: o Z i Yi ; o Zi o Zi o Zi
X ji ;
X2; ji
c1 X 1i c 2 X 2i c k X ki ;

Exemplo: Consumo Anual Brasil 1970 2004 Mnimos Quadrados Ponderados: Assumindo que Var(ut)=c.Yt
Dependent Variable: CO/SQR(Y) Method: Least Squares Date: 06/12/06 Time: 15:01 Sample (adjusted): 1970 2004 Included observations: 35 after adjustments Variable 1/SQR(Y) SQR(Y) GR/SQR(Y) I/SQR(Y) NE/SQR(Y) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Coefficient 42489845 0.794932 -0.664485 -0.690385 -0.705055 0.956610 0.950824 545.4779 8926386. -267.5234 Std. Error 11564215 0.032469 0.076533 0.115316 0.110605 t-Statistic 3.674252 24.48296 -8.682316 -5.986888 -6.374556 Prob. 0.0009 0.0000 0.0000 0.0000 0.0000 21405.12 2459.812 15.57277 15.79496 0.336312

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat

Verificando a Presena de Heterocedasticidade Graficamente Plotar Plotar Plotar


i

X 2i ,

X 3i , ...,
2 i 2 t

X ki ;
2 i

2 i
t

X 2i ,
t ou

X 3i , ..., t.

X ki ;

Teste de White H0: no h heterocedasticidade; Estatstica de teste: nR 2 ~


a 2 q

, onde q [k (k 1) 2] 1 ;

o O cmputo dessa estatstica de teste envolve regredir os quadrados dos resduos de um MGD estimado por MQO contra um conjunto V de variveis formado por: Todas as variveis explicativas no redundantes; Os quadrados dessas variveis; Os produtos cruzados entre si dessas variveis; Regra de Deciso o Se P( o Se P(
2 q 2 q

nR 2 ) nR 2 )

No Rejeite H0; Rejeite H0.

Ilustrao do teste de White: o MGD: Yi


b1 b2 X 2i b3 X 3i
i

o Estime por MQO e compute: i Yi b1 b2 X 2i b3 X 3i ;

o Estime por MQO a regresso:


i2 a1 a 2 X 2i a3 X 3i
2 c 2 X 2i 2 c3 X 3i

c4 ( X 2i X 3i ) wi ;

o Compute R 2 1 (w w 2 ) para essa regresso;

o Compute a estatstica de teste nR 2 o Escolha e aplique a regra de deciso.

Exemplo: Consumo Anual Brasil 1960 2004


Dependent Variable: CO Method: Least Squares Date: 06/24/05 Time: 11:01 Sample: 1960 2004 Included observations: 45 Variable C Y GR I NE R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient 23372214 0.836903 -0.789323 -0.737619 -0.764959 0.994985 0.994483 24391210 2.38E+16 -826.6401 0.395263 Std. Error 9915664. 0.031319 0.067470 0.119547 0.105569 t-Statistic 2.357100 26.72190 -11.69886 -6.170097 -7.246070 Prob. 0.0234 0.0000 0.0000 0.0000 0.0000 8.19E+08 3.28E+08 36.96178 37.16252 1983.966 0.000000

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)

Exemplo: Consumo Anual Brasil 1960 2004


(Continuao)

Teste de Heterocedasticidade de White


White Heteroskedasticity Test: F-statistic Obs*R-squared 16.41214 32.19742 Prob. F(14,20) Prob. Chi-Square(14) 0.000000 0.003755

Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 06/12/06 Time: 14:57 Sample (adjusted): 1970 2004 Included observations: 35 after adjustments Variable C Y Y^2 Y*GR Y*I Y*NE GR GR^2 GR*I GR*NE I I^2 I*NE NE NE^2 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient 3.22E+15 -25802647 0.025064 -0.103383 -0.088866 0.067251 72030518 0.134210 0.098590 -0.162626 68674186 0.043314 0.109893 -89816669 -0.138321 0.919926 0.863875 3.66E+14 2.67E+30 -1213.511 2.029315 Std. Error 1.03E+15 9318834. 0.009505 0.038220 0.047901 0.040232 25197051 0.048908 0.089595 0.113055 35064179 0.067828 0.141270 21962399 0.103752 t-Statistic 3.118874 -2.768871 2.636992 -2.704923 -1.855195 1.671590 2.858688 2.744141 1.100397 -1.438473 1.958528 0.638594 0.777892 -4.089565 -1.333191 Prob. 0.0054 0.0118 0.0158 0.0136 0.0784 0.1102 0.0097 0.0125 0.2842 0.1658 0.0643 0.5303 0.4457 0.0006 0.1975 4.78E+14 9.91E+14 70.20062 70.86719 16.41214 0.000000

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)

4.3 VARIVEIS INDEPENDENTES ESTOCSTICAS Estudaremos este assunto com base na regresso simples: MGD: Yi
a bX i
i

Violao da hiptese 2, isto : X i estocstica ( uma V.A.); Situaes em que X uma V.A.: o Erro de medida nas variveis independentes; o Variveis independentes tambm dependem da dependente; o Varivel dependente defasada entre as independentes; Nesses casos, possvel que Cov( X i , i ) EMQO enviesado e inconsistente:
X,

0 e, se isso ocorre,

Prova o Seja a seguinte forma em desviosdo MGD: y i bxi ei ; onde e ei i . Neste caso, o EMQO yi Yi Y , xi X i X para b dado por:
b xi y i x
2 i

xi (bxi x
2 i

ei )

xi e i xi2

o Computando o E(,) em ambos os lados: E (b) b E

xi e i xi2

o Nada

que porque E(b) b 2 2 E[ xi ei xi ] E[ xi ei ] E[ xi ] . No entanto, aplicando o operador plim(,) em ambos os lados:

garante

p lim(b)

p lim(b)

p lim

xi e i x
2 i

p lim p lim

xi e i n x
X,
2 i

X, 2 X

o Fica claro que tudo depende de Cov( X i , i )

Se X , 0 , ento b consistente para b (embora no se possa determinar se enviesado ou no); Se X , 0 , isto significa que b inconsistente para b (e, em decorrncia, tambm enviesado para b);

Mnimos Quadrados de Variveis Instrumentais (MQVI) Seja X estocstica e Cov( X i , i ) MQO inconsistente neste caso?
xi z i n zi ei n
X ,Z

X ,e

0 . Como estimar b j que

Definio de instrumento: Seja Z uma V.A. tal que: o p lim o p lim o onde xi
0; 0;

Z,

Xi

X e zi

Zi

Z.

Ento, o estimador MQVI dado por: b

z i yi xi z i

consistente para b;

Prova o Novamente, seja o MGD em forma de desvio: Ento, o EMQVI pode ser desenvolvido como:
~ b z i yi xi z i b xi z i xi z i z i (bxi xi z i zi e i b zi e i xi z i ei ) (bxi z i xi z i z i ei )

yi

bxi

ei .

o Aplicando plim(,) a ambos os lados: o p lim(b ) p lim(b) Caso Geral MGD: Yi


b1 b2 X 2i bk X ki
i

p lim p lim

zi e i n xi zi n

Z, X ,Z

X2i,...,Xki so todas estocsticas; Cada Xji (j = 2,...,k) correlacionada com o termo de erro i; Aplicar o MQVI neste caso envolve usar um instrumento para cada varivel independente; Z 2i X 2i ,..., Z ki X ki . E usar o estimador geral de MQVI:
~ b (Z X ) 1 Z Y

Onde Z a matrix n k de instrumentos para a matriz X;

5. INTRODUO A SISTEMAS DE EQUAES SIMULTNEAS

Trigve Haavelmo
(1911-1999) Economista Noruegus Premio Nobel de Economia de 1989
Abordagem probabilstica em econometria Sistemas de equaes simultneas

Objetivo: introduzir mais variveis dependentes no MGD; MGD:


Y1i Y2i b10 b20 b12Y2i b21Y1i
11

X 1i X 1i

12

X 2i X 2i

1i 2i

21

22

Terminologia: o Y variveis endgenas; o X variveis exgenas; o b coeficientes das endgenas; o coeficientes das exgenas o Variveis pr determinadas: Exgenas; Endgenas defasadas; Mdia:
E (Y1i ) E (Y2i ) b10 b20 b12Y2i b21Y1i
Y1i Y2i b10 b b10 b
11

X 1i X 1i

12

X 2i X 2i
12 X 2i 22 X 2i 22 X 2i 12 X 2i 1i 2i

21

22

Modelo Amostral: Preditor linear:


Y1i Y

20

b12Y2i b Y

11 X 1i 21 X 1i 21 X 1i 11 X 1i

21 1i

2i

20

b12Y2i b Y

21 1i

Forma Estrutural x Forma Reduzida

Forma Estrutural: endgenas como funo de endgenas e pr determinadas; MGD(FE):


Y1i Y2i b10 b20 b12Y2i b21Y1i
11

X 1i X 1i

1i 2i

21

Forma Reduzida: endgenas como funo de pr determinadas; MGD(FR):


Y1i Y2i
10 20 11

X 1i X 1i

w1i w2i

21

Relao entre parmetros da FE e da FR;


b10 b12 b20 1 b12 b21 b20 b21b10 1 b12 b21 b12 21 11 w1i 1 b12 b21 b21 11 21 w2 i 1 b12 b21 b12 2i 1i 1 b12 b21 b21 1i 2i 1 b12 b21

10

11

20

21

Problema da Identificao Definio: Em um SES uma equao est identificada quando possvel obter se estimativas numricas dos parmetros estruturais a partir de estimativas dos parmetros da forma reduzida; Status de identificao: o Equao no identificada: no possvel; o Equao identificada exatamente: obtm se uma nica estimativa dos parmetros estruturais; o Equao sobre identificada: obtm se mais de uma estimativa dos parmetros estruturais; Sistema Identificado: quando todas as equaes do SES esto identificadas (exatamente ou sobreidentificadas); Condio de Ordem (necessria) para identificao Regra: Em um SES com M equaes simultneas, uma equao estar identificada se o nmero de varveis pr determinadas excludas da equao (K k) for maior ou igual ao nmero de endgenas includas na equao (m) menos um ( K k m 1 );
Y1i b10 b20 b30 b12Y2i b21Y1i b31Y1i
12 21 3i

X 2i X 1i

1i 22

(1) X 2i
2i

Exemplo: MGD: Y2i


Y3i

(2) (3)

Equao (1) (2) (3)

M=3 m=2 m=2 m=2

K=2 k=1 k=2 k=0

Status K k = 1 = m 1 = 1: identificada exatamente K k = 0 < m 1 = 1: no identificada K k = 2 > m 1 = 1: sobre identificada

Condio de Posto (suficiente) para identificao

Regra: Em um SES com M equaes em M variveis endgenas, uma equao identificada se e somente se no mnimo um determinante no nulo de ordem (M 1) (M 1) puder ser construdo a partir dos coeficientes das variveis (endgenas e pr determinadas) excludas daquela equao particular mas includas em outras equaes do modelo; Ilustrao
Y1i Y2i Y3i Y4i b10 b20 b30 b40 b31Y1i b41Y1i b42Y2i b12Y2i b13Y3i b23Y3i
11 21 31

X 1i X 1i
22 32

1i

X 2i X 3i

2i 3i 43 4i

X 1i

X 2i

Pela condio de ordem verifica se que:


Equao (1) (2) (3) (4) M=4 m=3 m=2 m=2 m=3 K=3 k=1 k=2 k=2 k=1 Status K k = 2 = m 1 = 2: identificada exatamente K k = 1 = m 1 = 1: identificada exatamente K k = 1 = m 1 = 1: identificada exatamente K k = 2 = m 1 = 2: identificada exatamente

Tabela de Coeficientes do Sistema


Eq. (1) (2) (3) (4) 1 b10 b20 b30 b40 Y1 1 0 b31 b41 Y2 b12 1 0 b42 Y3 b13 b23 1 0 Y4 0 0 0 1 X1
11 21 31

X2 0
22 32

X3 0 0 0
43

Pela condio de Posto:


0
22 32

0 0
43

o Equao (1): A

0 1 0

Det(A) = 0, logo eq. (1) no est identificada; o Equao (2): A


1 b31 b41 0 0 1 0 0
43

Det(A) = 0, logo eq. (2) no est identificada; o Equao (3): A


b12 1 b42 0 0 1 0 0
43

Det(A) = 0, logo eq. (3) no est identificada; o Equao (4): A o Det(A)


b13 b23 1
11 21 31

0
22 32

0, logo eq. (4) est identificada;

Procedimentos para aplicar a condio de posto Passo 1: re escrever o SES com todas as variveis e parmetros do lado esquerdo e s os erros aleatrios do lado direito; Passo 2: montar a tabela de coeficientes do sistema; Passo 3: construir para cada equao a matriz A respectiva (a partir dos coeficientes nulos da linha correspondente equao em anlise); Regra Geral de Identificao K k>m 1 Posto de A = M 1 Eq. Sobre identificada K k=m 1 Posto de A = M 1 Eq. Exatam. identificiada K k m 1 Posto de A < M 1 Eq. Sub identificada K k<m 1 Eq. No identificada (Posto de A < M 1)

Problema da simultaneidade MGD:


Y1i Y2i b10 b20 b12Y2i b21Y1i
11

X 1i X 1i

12

X 2i X 2i

1i 2i

21

22

Simultaneidade: quando h causalidade bidirecional entre endgenas; Problema: correlao da endgena do lado direito com o termo de erro; No MGD acima: Cor (Y2i , 1i ) 0 e Cor (Y1i , 2i ) 0 , logo: o EMQO inconsistente para estimar parmetros das duas equaes; Quando no h simultaneidade, possvel usar EMQO, desde que as hipteses bsicas do SES sejam satisfeitas; Estimao de SES
Y1i b10 b20 bM 0 b12Y2i b21Y1i bM 1Y1i b1g Ygi b2 g Ygi bM , M 1YM
1,i 11

X 1i
21


M1

1k

X ki
2k

1i

MGD:

Y2i YMii

X 1i

X ki

2i

X 1i

Mk

X ki

Mi

Hipteses Bsicas: o Relao linear entre as variveis; o Xjis so no estocsticas, j = 1,...,k; o E ( ri ) 0 , Var ( ri ) r2 , Cov( ri , rj ) 0 para r = 1,...,M e i o Cov( ri , o
ri
si

j;

)
2 r

0 para r

s; r = 1,...,M; s = 1,...,M;
2 r

~ N (0,

Yri ~ N ( E (Yri ),

) , r = 1,...,M.

Antes da estimao, verificar: o Identificao; o Simultaneidade; Mtodos de Informao Limitada: considera restries relacionadas apenas equao de interesse; o EMQO; o Estimador de Mnimos Quadrados Indiretos (EMQI); o Estimador de Mnimos Quadrados de 2 Estgios (EMQ2E); Mtodos de Informao Completa: considera restries entre equaes; o Estimador de Mnimos Quadrados de 3 Estgios (EMQ3E); o Estimador de Mxima Verossimilhana com Informao Completa (EMVIC);

Tipologia de SES: o Equaes no relacionadas


Y1i Y2i Cov( b10 b20
1i , 11

X 1i X 2i 0

1i 2i

22 2i )

o Equaes aparentemente no relacionadas (SURE)


Y1i Y2i Cov( b10 b20
1i 11

X 1i 0

1i 2i

22 X 2 i 2i

Nota: neste caso, estima se por algum mtodo sistmico, o mais usual sendo o MQ3E;

o Sistemas Recursivos
Y1i Y2i Cov( b10 b20
1i 11

X 1i 0

12 21

X 2i

1i 22

b21Y1i
2i

X 1i

X 2i

2i

Nota: observe que Y1i E (Y1i ) implica que Cov(Y1i , 2i ) 0;

1i

; substituindo na 2. equao

o Sistemas Bloco Recursivos


Y1i Y2i Y3i Cov( b10 b20 b30
1i

b12Y2i b21Y1i b31Y1i


2i

11

X 1i

12

X 2i

1i 2i 32 2i

21 X 1i

22 X 2 i 31 3i

b32Y2i
1i

X 1i Cov(

X 2i ,
3i

3i

Cov(

o Sistemas Simultneos:
Y1i Y2i

b10 b20

b12Y2i b21Y1i

11

X 1i X 1i

12

X 2i X 2i

1i 2i

21

22

Nota: estima se por MQI ou MQ2E;

Mnimos Quadrados de 2 Estgios Caso particular do EMQVI; Serve para estimar equaes exatamente ou sobre identificadas; Seja o seguinte:
Y1t Y2t b10 b20 b12Y2t b21Y1t X 1t X 2t

MGD:

11 2t

12

1t

fcil verificar (pelas condies de ordem e de posto) que: o 1. equao no est identificada; o 2. equao est sobre identificada; o Logo, s possvel estimar a 2. equao; fcil verificar tambm que devido causalidade bidirecional (simultaneidade) entre Y1t e Y2 t , ocorre:
0;

Cov(Y1t ,

2t

Estimao da 2. equao por MQ2E: o 1. Estgio: construo de instrumento para Y1t via forma reduzida; Forma Reduzida (FR):
Y1t Y2t
10 20 11

X 1t X 1t

12

X 2t X 2t

w1t w2t

21

21

Estima se por MQO a 1. equao da FR:


Y1t 10 11 X 1t 12 X 2t

o 2. Estgio: usa se Y1t no lugar de Y1t para estimar a 2. equao da FE por MQVI;

Y2t

b20 b20 b20

b21 (Y1t w1t ) b21Y1t b21 w1t * b Y


21 1t 1t

2t 2t

o Estima se usando as frmulas de MQVI:


y 2t y1t y1t y1t

b21

b20

Y2

b21Y1

Nota: possvel mostrar que a formula acima para b21 equivalente ao estimador de MQO (ver PR pg. 402)

Observe se que Y1t de fato um instrumento para Y1t :

o p lim o p lim

y1t y1t n y1t n


* 1t Y1Y1

0;
* 1t

Cov( E (Y1t ),

Logo, EM2QE um estimador consistente para os parmetros estruturais de equaes exatamente ou sobre identificadas.

Exemplo: Consumo Anual Brasil 1970 2004

Estimao por EMQ2E


(Opo TSLS do Eviews em Quick\Estimate Equation)
Dependent Variable: CO Method: Two-Stage Least Squares Date: 06/20/06 Time: 11:05 Sample (adjusted): 1970 2004 Included observations: 35 after adjustments Instrument list: GR NE Variable C Y R-squared Adjusted R-squared S.E. of regression Durbin-Watson stat Coefficient 1.83E+08 0.470996 0.954299 0.952914 40600140 0.449011 Std. Error 28288823 0.023360 t-Statistic 6.469929 20.16266 Prob. 0.0000 0.0000 7.36E+08 1.87E+08 5.44E+16 5.20E+17

Mean dependent var S.D. dependent var Sum squared resid Second-stage SSR

Estimao da Forma Reduzida no 1. Estgio


Dependent Variable: Y Method: Least Squares Date: 06/20/06 Time: 11:08 Sample (adjusted): 1970 2004 Included observations: 35 after adjustments Variable C GR NE R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat Coefficient 8.49E+08 3.370831 1.672787 0.696523 0.677556 2.03E+08 1.32E+18 -717.5660 0.593245 Std. Error 51210803 0.449911 1.082381 t-Statistic 16.57725 7.492219 1.545469 Prob. 0.0000 0.0000 0.1321 1.17E+09 3.57E+08 41.17520 41.30852 36.72227 0.000000

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)