Você está na página 1de 91

Soluções para o Manual de Econometria

Rodrigo De Losso da Silveira Bueno

São Paulo – Março/2001


Soluções para o Manual de Econometria

Rodrigo De Losso da Silveira Bueno1

1
Mestre em Economia, Universidade de São Paulo. Master of Arts, The University of Chicago (Ph.D Pass).
Doutorando em Economia pela Universidade de São Paulo.

2
Nota – O parênteses abaixo representam a fonte de adaptação em alguns dos exercícios, da
seguinte forma:
1. (B&D) BROCKWELL, Peter J. & DAVIS, Richard A. Time Series: Theory and
methods. New York: Springer, 1991.
2. (J) JOHNSTON, J. Econometric Methods, 3rd. ed. New York: McGraw-Hill, 1984;
3. (K) KENNEDY, Peter. A Guide to Econometrics, 4th. ed. Cambridge, MA: MIT,
1998;
4. (E) ENDERS, Walter. Applied Econometric Time Series. New York: Wiley, 1995.
5. (C) exercícios ministrados na The University of Chicago;
6. Exercícios formulados pelo autor.

Índice

1. Metodologia da Econometria ___________________________________________ 4

2. Modelo de Regressão Linear Geral _______________________________________ 5

3. Extensões ao Modelo Básico de Regressão Linear _________________________ 12

4. Análise da Base de Dados e Utilização de Variáveis Binárias_________________ 23

5. Problemas Econométricos no Modelo Linear Geral ________________________ 33

6. Multicolinearidade___________________________________________________ 39

7. Econometria das Variáveis de Resposta Qualitativas e Limitadas _____________ 45

8. Sistemas de Equações Simultâneas______________________________________ 50

9. Análise de Séries de Tempo ____________________________________________ 59

10. Metodologia de Box-Jenkins para Modelos Univariados ____________________ 65

11. Modelos de Função de Transferência e de Análise de Intervenção ____________ 70

12. Testes de Raízes Unitárias e Co-Integração _______________________________ 77

13. Modelos GARCH ____________________________________________________ 87

3
1. Metodologia da Econometria

Não há exercícios.

4
2. Modelo de Regressão Linear Geral

1
2.1 Estime as regressões: Y ! ! " " X " # e X ! $ " %Y " & e conclua que "ˆ # 2, como

intuitivamente poderíamos afirmar.
Solução: Este exercício procura mostrar que regredir Y contra X, encontrando o
parâmetro "ˆ , NÃO é o mesmo que regredir X contra Y, encontrar o parâmetro %̂ e
1
inferir que "ˆ ! .

Sabemos que
n

%Y X i i $ nXY
"ˆ ! i !1
n
.
%X
i !1
i
2
$ nX 2

1
Agora, resta observar que "ˆ # . Note que

n n

% Yi X i $ nXY 1 %Y i
2
$ nY 2
"ˆ ! i !1
# ! i !1
.

n n

%X
i !1
i
2
$ nX 2
%Y X
i !1
i i $ nXY

2.2 Suponha o seguinte modelo linear: y ! X " " # , onde y e # são vetores n&1 , X < ∞ é
uma matriz n & k e β é um vetor k &1 .
a. Qual(is) a(s) hipótese(s) necessária(s) para estimar esse modelo por MQO?

b. Qual(is) a(s) hipótese(s) necessária(s) para que o β estimado, β! , exista e seja único?

c. Qual(is) a(s) hipótese(s) necessária(s) para que β! seja não viesado?

d. Qual(is) a(s) hipótese(s) necessária(s) para que β! seja eficiente?3

2
O acento circunflexo denota parâmetro estimado.
3
Este item apenas tem sentido em ser perguntado se, em aula, o professor apresenta os resultados da
regressão para X estocástico.

5
e. Qual(is) a(s) hipótese(s) necessária(s) para que se possa fazer inferência estatística?
Solução: Este exercício possui dois propósitos. Primeiro, induzir o estudante a
entender onde exatamente se aplica cada hipótese do modelo de regressão linear
múltipla, fazendo-o retornar a esses conceitos. Segundo, revisar os conceitos
estatísticos de viés e eficiência, aplicados à Econometria dos Mínimos Quadrados –
uma boa referência, para o professor, seria WHITE, Halbert. Asymptotic Theory for
Econometricians, 2nd. ed. Orlando: Academic Press, 2000. Note que nada é dito sobre
o comportamento do termo aleatório, justamente porque algumas perguntas referem-
se a seu comportamento.
a. Estimar o modelo por MQO é apenas um método matemático, nada mais. Portanto,
apenas necessitamos de uma condição matemática que é ' ' X ( ! k , isto é, o posto da

matriz X seja pleno. Precisamos disso porque, do contrário, X’X não seria inversível e,
então, não poderíamos estimar o modelo por MQO.

b. Outra vez, apenas necessitamos que ' ' X ( ! k , do contrário, β! não existiria. A

unicidade é dada justamente porque o posto é pleno. Se X fosse estocástico,


X )X
precisaríamos que p lim !Q #0 .
n
c. Aqui precisamos de várias hipóteses.
c.1 *"ˆ ;

c.2 β! é único;

c.3 Se X é não estocástico, como assumido neste capítulo, E'# X ( ! 0 ! E'#( , onde a

segunda desigualdade resulta da Lei das Expectativas Iterativas. Se X é estocástico,


X )#
precisamos que p lim !0.
n
d. Aqui usamos a hipótese de homocedasticidade. Por isso, podemos concluir que, para ser
não viesado, nada precisamos impor sobre a variância dos resíduos.
d.1 *"ˆ ;

d.2 β! é único;

6
X )#
d.3 p lim !0;
n
d.4 Se # ! '0, +( , onde + ! ( 2 I , basta estimar o modelo por MQO. Para

complementar, mesmo que o professor ainda não tenha dado heterocedasticidade, ele
poderia dizer que precisamos estimar por um outro método a ser aprendido,
denominado mínimos quadrados generalizados. Isto é dizer, formalmente, se + # ( 2 I ,
estime C $1 y ! C $1 X " " C $1#, + ! CC ) .
e. Para inferência estatística, admitimos que o erro tenha uma distribuição Normal e sejam
independentes entre si, de onde se seguem todos os resultados do capítulo. Se forem
normais, mas não independentes, ter-se-ia que estimar os parâmetros por mínimos
quadrados generalizados, pois, do contrário, as inferências estatísticas não seriam
válidas. Esta é a única hipótese necessária. Se não admitirmos que os erros têm
distribuição Normal, podemos assumir a hipótese mais fraca de que são identicamente e
independentemente distribuídos, mas nesse caso os testes somente serão válidos
assintoticamente. Em ambos os casos, pode-se argumentar que tais hipóteses são muito
fortes, a primeira mais forte do que a segunda.

2.3 Adão Ismiti queria verificar se a produtividade do trabalho aumentava com a divisão do
trabalho. Para isso, fez a seguinte experiência: regrediu a produtividade (p) de n
trabalhadores de fábricas de alfinetes contra o número de funções exercidas pelo
trabalhador (F), anos de escolaridade (E), salário (w) e número de filhos (N).
Formalmente a regressão foi: pi = β 1 + β 2 F1 + β 3 Ei + β 4 wi + β 5 N i + u i . Usando o

teste t-student, Ismiti aceitou a hipótese nula de parâmetro igual a zero para β̂ 3 . Retirou

a variável E da regressão e estimou o modelo restrito, observando que β̂ 5 tornou-se,


também, estatisticamente não significativo. Finalmente, retirou N da regressão e
estimou o modelo de novo.
a. Por que não foi preciso fazer o teste de F em "ˆ3 , para retirar E do modelo? Ou seja,
por que apenas o teste de t–student pôde ser feito?;
b. Justifique se o procedimento adotado por Smith está correto ou equivocado, para ter
eliminado a variável N do modelo.

7
Solução: Este exercício é muito ilustrativo e traz um pouco de problemas empíricos à
tona. Quer-se testar se o estudante entendeu como usar os testes t e F corretamente, e
evitar que ele cometa o erro de retirar variáveis explicativas, estatisticamente iguais a
zero, seqüencialmente. O certo é apenas fazer um teste de hipótese conjunta e, se for o
caso, concluir que tais variáveis não explicam o modelo.
a. A razão para não usar o teste F é que, quando estamos testando apenas um parâmetro, o
teste t e F se equivalem. Ou seja, pode-se usar um ou outro. Em geral, nos pacotes
econométricos o teste t sai automaticamente, por isso podemos olhar para ele sem
problemas. Vale lembrar que, para um parâmetro apenas, t2 é equivalente a F(1,n),
como provado no corpo do texto.
b. O procedimento de Ismiti está absolutamente equivocado. O correto seria testar,
conjuntamente, por F, se "ˆ3 e "ˆ5 são, simultaneamente, iguais a zero. A razão
específica é que no segundo teste, mudou-se o número de graus de liberdade, por isso o
equívoco. Ou, em outras palavras, no segundo teste, o modelo mudou em relação ao
primeiro.

2.4 (J) Para entender melhor como funciona o R2, prove que uma regressão estimada sem a
constante não implica que os resíduos somarão, necessariamente, zero e que o R2, se
e! ′e!
calculado como 1 − , pode ser negativo, onde e! = y − Xβ! , em que β! é o
y ′y − ny 2
vetor de parâmetro estimados estimado4.
Solução: Este exercício mostra que o R2 pode ser negativo, quando a regressão por
mínimos quadrados ordinários é feita sem constante (note que, mesmo com constante,
quando estimamos um modelo não linear por máxima verossimilhança, podemos ter
um R2 negativo, mas isso é um caso raro). Seu objetivo é alertar o estudante que,
quando o R2 é negativo, na regressão por MQO, é porque ele deve acrescentar a
constante ao modelo. O motivo é muito sutil e será explicitamente apresentado na
resolução. A primeira parte do exercício procura esclarecer por que os resíduos
somam zero, quando há constante, embora isto já esteja no corpo do capítulo. O

4
A segunda parte deste exercício é difícil.

8
exercício também é útil para treinar e entender várias passagens feitas no corpo do
texto.
Dada a regressão y ! X " " # , temos que:

yi ! X i1"1 " X i 2"2 " " " X ik "k " #i , i ! 1, 2, #, n.


n
, % #i2 n
i !1
! % ' yi $ X i1"1 $ X i 2"2 $"$ X ik "k (X ji ! 0, j ! 1, 2, #, k .
," j i !1

Isso não garante que o resíduos somarão zero, pois Xji pode ser diferente de 1, para todo i,
mesmo quando j = 1. Claramente, se X1i = 1, para todo i, os resíduos somarão zero. Isto
finaliza a primeira parte da questão. Sigamos para a segunda parte.
Lembremos que:
n
SQT ! % ' yi $ y ( ! ' y $ y () ' y $ y ( ' ! y )y $ ny 2 ;
2

i !1

SQE ! yˆ )yˆ $ nyˆ 2 ;


SQR ! eˆ)eˆ $ neˆ 2 .

Note como nada garante que ê seja zero, e, no cálculo do R2, não incluímos esse termo
(retorne à fórmula dada no exercício); é por isso que o R2 pode ser negativo. Note, também,
que: yi ! yˆi " eˆï - % yi ! % yˆ i " % eˆï - y ! yˆ , apenas quando % eˆ
ï ! 0 , o que

somente ocorre se o modelo é estimado com constante, como demonstrado na primeira


parte do exercício.
Sabemos, ainda, que y )y ! yˆ )yˆ " eˆ)eˆ . Com essas informações, temos:

eˆ)eˆ y )y $ yˆ )yˆ y )y $ ny 2 $ y )y " yˆ )yˆ $ny 2 " yˆ )yˆ


1$ ! 1$ ! ! .
y )y $ ny 2 y )y $ ny 2 y )y $ ny 2 y )y $ ny 2

Conseqüentemente, se ny 2 . yˆ )yˆ - R 2 / 0 .

Para ver por que o R2 é positivo quando existe constante, note que se y ! yˆ (caso com
n
constante), temos que $ny " yˆ )yˆ ! % ' yˆi $ y ( 0 0 5.
2 2

i !1

5
Veja a semelhança com a fórmula do SQT.

9
12Ct ! K1 " 0,9Yt " #1t
22
2Ct ! K 2 " 0,8Ct$1 " #2 t
2.5 (J) Dadas as seguintes estimativas de MQO: 23 , calcule as
22Ct$1 ! K 3 " 0, 7Yt " #3t
22
224Yt ! K 4 " 0,5Ct$1 " #4t
estimativas de MQO de "2 e "3 na regressão C t = β1 + β2 Yt + β3 Ct −1 + u t .

Solução: O exercício é de nível médio a difícil. Tem o objetivo de treinar os conceitos


básicos de regressão, para verificar se o aluno sabe formulá-los. A solução pode ser
avaliada em duas etapas. Na primeira etapa, o aluno deve ser capaz de oferecer as
seguintes respostas.
O modelo pode (e deve) ser formulado em relação aos desvios. O aluno deve perceber isso
pelo fato de não ser pedido o valor de "1 , ou seja
ct ! "2 yt " "3ct$1 " ut .
Sendo assim, pode-se concluir que:
5"ˆ 6 1 5 % ct2 $% yt ct$1 68 57 % yt ct 68
7 28 ! 7 .
7ˆ 8 7$ y c
79 "3 8: % yt % ct$1 $ '% yt ct$1 (
2 2
2
97 % t t$1 % yt2 8:8 797% ct ct$1 88:
Ainda, podemos concluir o seguinte:

0,9 !
% y c ;0,8 ! % c
t t c
t $1 t
; 0, 7 !
%yc
t t $1
; 0,5 !
%yc
t t $1
.
%y 2
t %c 2
t $1 %y 2
t %c 2
t $1

A segunda etapa começa aqui, pois, com essas informações, torna-se tranqüilo encontrar os
parâmetros desejados.

ˆ
"2 !
% ct2$1 % ct yt $% ct$1 yt % ct ct$1
!
% t % t$1 '% t$1 t (
2
y 2
c 2
$ c y

!
%c 2
t $1 0,9% yt2 $ 0, 7 % yt2 0,8% ct2$1
!
% yt2 % ct2$1 $0, 72 '% yt2 (
2

'0,9 $ 0, 7 ; 0,8( % ct2$1


! .
%c 2
t $1 $0, 7 2 % yt2

Mas, das duas últimas equações acima, 0, 7% yt2 ! 0,5% ct2 . Logo,

10
0, 7
0,34
0,5
% yt2
"ˆ2 ! ! 0,5231 .
< 0, 7 =>
?? $ 0, 7 >> % yt
2 2
?@ 0,5 A

Aplicando o mesmo procedimento, obtemos "ˆ3 ! 0,5385 .


Uma outra maneira de resolver o problema é a seguinte: seja 1 o índice da variável ct, 2 o
índice da variável y e 3 o índice de ct-1. Além disso, seja bij o coeficiente angular da
regressão que tem i como regressando e j como regressor, segue-se, então, que6:
b $b b 0,9 $ 0,8 ; 0, 7
"ˆ2 ! 12 13 32 ! ! 0,5231;
1$ b23b32 1$ 0, 7 ; 0,5
.
b $b b 0,8 $ 0,9 ; 0,5
"ˆ3 ! 13 12 23 ! ! 0,5385.
1$ b23b32 1$ 0, 7 ; 0,5

6
Ver Johnston (1984), cap. 3.

11
3. Extensões ao Modelo Básico de Regressão Linear

3.1 Qual é a intuição do método de estimação por máxima verossimilhança? Este método
produz resultados necessariamente iguais ao método de mínimos quadrados ordinários?
Por que é possível obter um R2 negativo quando estimamos um modelo (com constante)
pelo método de máxima verossimilhança?
Solução: (Sugestão de leitura adicional – CUTHBERTSON, Keith; HALL, Stephen &
TAYLOR, Mark. Applied Econometrics Techniques. Ann Arbor: Michigan, 1992)
Este é um exercício que reforça a idéia de máxima verossimilhança introduzida no
texto, procurando estimular o raciocínio intuitivo do alunos.
Dada uma seqüência de observações e supondo-se uma determinada distribuição para os
erros dessa seqüência e seu processo gerador de dados, o método de máxima
verossimilhança permite obter os parâmetros que mais aproximam a distribuição amostral
da suposta distribuição populacional dos erros. Nesse sentido, não importa se o método
produz erros pequenos ou grandes, desde que esses erros tenham a configuração de uma
normal, por exemplo. Por isso, a média desses erros pode ser bem diferente de zero, de
modo que o R2 pode ser negativo (ver exercício 2.5).
Observe que, nos pacotes econométricos, o R2 é calculado supondo-se que a estimação seja
feita por MQO com constante. Daí um dos motivos para que não seja uma boa medida de
regressão, necessariamente.

3.2 (C) Uma variável aleatória X tem uma distribuição exponencial, com parâmetro
" '" . 0( se X tem uma distribuição contínua pela qual a função densidade de

probabilidade, f.d.p.,
12" e$" x , para x . 0
f ' x, " ( ! 23 .
224 0, para x B 0

Para mais tarde, note que essa formulação implica que a função densidade acumulada,
f.d.c., é:
121$ " e$" x , para x . 0
F ' x, " ( ! 23 .
224 0, para x B 0

12
1
A média e a variância de uma distribuição exponencial com parâmetro " é E ' X ( ! e
"
1
Var ' X ( ! .
"2
a. Suponha que x1, x2, ..., xn formem uma amostra aleatória de uma distribuição
exponencial, cujo valor " é desconhecido. Encontre a estimativa de máxima
verossimilhança, EMV, de " .
1 1
b. Usando a propriedade de invariância da EMV, encontre a EMV de e 2 . (A
" "

propriedade da invariância da EMA significa que g ') ( ! g )ˆ ). '(


Solução: Este exercício serve de treino para derivar as condições de primeira ordem
da máxima verossimilhança, saindo um pouco da tão conhecida distribuição normal.
O exercício serve também para mostrar como se obtêm resultados para uma
estimativa, a partir de outra estimativa. Além disso, o exercício, apesar da enorme
formulação, é fácil.
a. Primeiro formulamos o problema na linguagem aprendida no livro.
n
n $" % xi
L '" ; X ( ! C " e$" xi ! " n e i!1
.
i !1

Tomando-se o log:
n
log 59 L '" ; X (6: ! l '" ; X ( ! n log '" ( $ " % xi .
i !1

As condições de primeira ordem dão;


,l n n
n 1
! $ % xi ! 0 - "ˆ ! D "ˆ ! .
," " i!1 n
X
%x
i !1
i

b. A segunda parte do problema é ainda mais fácil.

g '" ( !
1
"
' (
1
- g "ˆ ! ! X .

Da mesma forma:

g '" ( !
1
" 2 ' (1
- g "ˆ ! 2 ! X 2 .

13
É possível mostrar isso formalmente, utilizando a mesma metodologia anterior.

3.3 (C) Suponha que X1, X2, ..., Xn são variáveis aleatórias de Bernoulli i.i.d., com:
12 1, com probabilidade )
xi ! 23 .
2240, com probabilidade 1$ )

a. Encontre a EMV de ) e sua distribuição assintótica7.


b. Teste a hipótese H 0 : ) ! 0, 4 por Wald, LR e LM? Teste a hipótese H 0 : ) 2 ! 0,5 8?

Solução: Este exercício é bastante completo e verifica se o aluno entendeu como


funcionam os testes apresentados no corpo do texto.
a. Primeiro, vamos definir a função de Bernoulli, depois a função de verossimilhança para
achar o valor dos parâmetros e, em seguida, encontrar a distribuição assintótica.
A função de Bernoulli é dada por:

P ' X i ! x ) ( ! ) x '1$ ) (
1$ x
, x ! 0,1 .

Como Xi é i.i.d.:
n
P ' X 1 ! x, X 2 ! x,", X n ! x ) ( ! C ) xi '1$ ) (
1$ xi
.
i !1

Assim,
n n n
l '); x ( ! % ln 57) xi '1$ ) ( i 68 ! ln ') ( % xi " ln '1$ ) ( % '1$ xi ( .
1$ x

i !1
9 : i !1 i !1

As condições de primeira ordem resultam em:

% x $ % '1$ x ( ! 0 - '1$ ) (
)
i

1$ )
i
% x ! ) 'n $ % x ( -
i i

)ˆ !
% xi .
n
As condições de segunda ordem garantem o máximo.
Agora, tratemos da distribuição assintótica. Pelo Teorema Central do Limite de Levy-
(2
Lindberg, sabemos que, como E xi Fi!1 são i.i.d., E ' x( ! *, Var ' x( !
n
, logo:
n

7
Não é preciso resolver a parte de distribuição assintótica, embora seja simples a resposta.
8
Como se trata de uma restrição não linear, esta parte do exercício pode ser evitada.

14
X $* d
n GG H N '0,1( .
(2

'(
E )ˆ !
% E ' xi ( ! n) ! );
n n

'(
Var )ˆ !
% Var ' xi ( ! n) '1$ ) ( ! ) '1$ ) ( .
n2 n2 n
A segunda igualdade da variância é resultado da variância para o caso da distribuição de
Bernoulli. Desse modo:

)ˆ $ ) )ˆ $ )
! n GG
d
H N '0,1( .
) '1$ ) ( ) '1$ ) (
n
A solução apresentada para distribuição assintótica, no entanto, pode ser feita usando as
propriedades do EMV. Uma delas afirma que, sob determinadas condições encontradas
neste problema, o estimador de máxima verossimilhança é assintoticamente normal.
Formalmente, isso significa;

'
n )ˆ $ ) GG
d
(
H N '0, +$1 ( , onde
5 1 , 2 L '); x (6
+ ! $E 77 8.
8
79 n ,(
2
8:
Logo,
5 <
? %
+ ! E 77 ?? 2 "
1 xi % '1 $ x ( =6
>
i >8
< )ˆ
?
! E ?? 2 "
1 $ ˆ
) =
> ?
> ! E ??
' (
< )ˆ '1$ ) (2 " 1$ )ˆ ) 2 =>
>> !
2 > >8 2> > ? >>
79 @? ) '1$ ) ( >A8: ? ) '1$ ) ( >A ??@ ) '1$ ) (
2
A>
2
n @
< ) '1$ ) (2 " '1$ ) ( ) 2 => < ) '1$ ) ('1$ ) " ) (=>
? >> ! ?? >> ! 1
+ ! ?? > ? > .
?@ ) '1$ ) ( A> ?@ ) '1$ ) ( A> ) '1$ ) (
2 2 2 2

Portanto,

'
n )ˆ $ ) GG
d
(
H N '0, ) '1 $ ) (( .

b. O primeiro teste que devemos fazer é assim especificado:


H 0 : ) ! 0, 4& H1 : ) # 0, 4.

15
Apenas para formalizar melhor a idéia de máxima verossimilhança, temos que definir os
seguintes resultados:
H ') ( ! ) $ 0, 4 ! 0 , que a “função hipótese nula”;

,H ') (
! 1;
,)
' ( ' ( % x $ )ˆ % '1$ x ( .
2
, 2l )ˆ; x $ 1$ )ˆ i
2
i
!
,),) ) )ˆ '1$ )ˆ (
2 2

Teste de Wald
Com isso, o teste de Wald é dado por:
12 I2
2
W ! )ˆ $ 0, 4 231;
'
)ˆ 2 1$ )ˆ 2 ( 22
' (
22 1$ )ˆ
; 1
2
'
J )ˆ $ 0, 4 GG
d
(
H ,+2!1 .
' (
2

242 % xi " ) % '1$ xi ( 22K2


ˆ 2

Portanto, se W . ,+2!1'95%( , rejeitamos H0. Note que aqui, temos apenas que estimar o

modelo não restrito, ou seja, sem impor qualquer restrição.

Teste Razão de Verossimilhança – LR

LR ! $2 E% x 579ln ')ˆ($ ln '0, 4(68: " % '1$ x ( 579ln '1$ )ˆ($ ln '0, 6(68:F GGH ,
i i
d 2
+!1 .

Portanto, se LR . ,+2!1'95%( , rejeitamos H0. Note que aqui temos que calcular o modelo

restrito e o não restrito.

Teste Multiplicador de Lagrange – LM


No teste LM, temos apenas que calcular a verossimilhança com o modelo restrito.

< % xi n $ % xi =>) 212 )$2 '1$ )$2 (


I2<
2J2?? % xi $ n $ % xi >> GG
=
LM ! ??? $ > 2 d
H ,+2!1 ,
$ $ >
> 3 ? $ $ >
>
1$ ) A 22'1$ )$(
?@ )
% xi " )$2 % '1$ xi (222K?@ ) 1$ ) A
2

24
onde )$ é o vetor de parâmetros estimados do modelo restrito. Assim, temos:
< % xi n $ % xi => 12 I2
2

LM ! ??? 2 2 GG
0, 0576
$ >> J H ,+!1 .
d 2
3
?@ 0, 4 0, 6 A> 22 0,36% xi " 0,16% '1$ xi (22
4 K
Portanto, se LM . ,+2!1'95%( , rejeitamos H0.

16
O segundo teste que devemos fazer é assim especificado:
H 0 : ) 2 ! 0,5& H1 : ) 2 # 0,5 .
Apenas para formalizar melhor a idéia de máxima verossimilhança, temos que definir os
seguintes resultados:
H ') ( ! ) 2 $ 0,5 ! 0 ;

,H ') (
! 2) .
,)
Teste de Wald
12 I2
' (
2
22 )ˆ 2 1$ )ˆ 22 d
' (
2
W ! )ˆ $ 0,5 3
2
J GGH ,+2!1 .
22 1$ )ˆ
' ( % xi " )ˆ2 % '1$ xi (222K2
2

242

Teste Razão de Verossimilhança – LR

21 5 6 5 6 2I d
242 79
'(
LR ! $2 23% xi 7 ln )ˆ $ ln '0,5(8 " % '1$ xi ( 7ln 1$ )ˆ $ ln '0,5(8 2J GG
1
8 7
1
8 2
'
H ,+2!1 .(
2 : 9 2 : K2

Teste Multiplicador de Lagrange – LM

12 I2
)$2 '1$ )$(
2
22 22
LM ! '2) ( 3
2
J!
22 1$ )$
42' ( % i % ' i (22K2
$
2
x " ) 2
1 $ x

' (
2
4 ; 0,5 ; 0,5 1$ 0,5
GG
d
H ,+2!1.
'1$ ( % x " 0,5% '1$ x (
2
0,5 i i

3.4 (C) Seja yt ! + yt$1 " #t , #t ! i.i.d .N '0, ( 2 ( , + / 1 9.

9
Exercício difícil, mas importante para entender e trabalhar os conceitos de viés, consistência, EMV e MQO.
Consultar, também, capítulo 5 do livro.

17
a. Escreva a função log-verossimilhança para uma amostra com T observações (y1, y2, ...,
yT), a partir do processo acima, condicional à primeira observação. Escreva a função
de verossimilhança como:
f ' yt , yt$1 ,#, y1 ( ! f ' yt yt$1 , yt$2 , #, y1 ( f ' yt$1 , yt$2 , #, y1 ( !
! f ' yt yt$1 , yt$2 , #, y1 ( f ' yt$1 yt$2 , yt$3 , #, y1 ( f ' yt$2 , yt$3 , #, y1 ( !
!"!
! f ' yt yt$1 , yt$2 , #, y1 ( f ' yt$1 yt$2 , yt$3 , #, y1 (" f ' y2 y1 ( f ' y1 (.

Para o processo acima, os valores de (y1, y2, ..., yT-1) interessam para yT apenas através do
valor de yT-1. Assim, f ' yt yt$1 , yt$2 , #, y1 ( ! f ' yt yt$1 ( .

b. Mostre que +ˆEMV ! +ˆMQO ! +ˆ , onde +ˆMQO vem da regressão de yt contra yt-1 e +ˆEMV é a

EMV (condicional em y1).


c. Mostre que +̂ é um estimador viesado de + .

d. Mostre que +̂ é consistente.

e. Obtenha a distribuição assintótica de +̂ .


yt ! + yt$1 " #t , #t ! ut " )ut$1 ,
f. Agora, suponha que o processo seja alterado para O
ut ! i.i.d .N '0, ( 2 ( , + , ) / 1.

estimador de mínimos quadrados é consistente? Derive o limite de probabilidade.


Solução: No corpo do texto, usaram-se termos como consistência, viés, eficiência. Este
exercício serve para trabalhar esses termos, de modo a esclarecer seu significado. Daí
sua importância. No entanto, este exercício pode ser considerado difícil, a partir da
letra d. Note que aqui, implicitamente, estamos retirando a hipótese de que a matriz X
é não estocástica. Isto muda radicalmente os resultados. Sugerimos a seguinte
bibliografia adicional: HAMILTON, James D. Time Series Analysis. Princeton:
Princeton, p. 215, 1994.
a. Vamos primeiro definir a função de verossimilhança condicional a y1, como, aliás, já
foi ensinado no corpo do exercício.
5 ' y $ y (2 6
7$ 1 t t$1 8
1 7 8
2 $2
f ' yt yt$1 , yt$1 ,#, y1 ( ! '2-( (
77 2 (#2 88
9 :
# e .

Agora, seguindo a sugestão do exercício:

18
5 T 6
7
% ' yt $ yt$1 (
28
7 8
7 1 t !2 8
7$ 8
7 2 (#2 8
T $1 7 8
7 8
2 $ 2
f ' yt yt$1 , yt$1 , #, y1 ( ! '2-( #( e 79 8:
.

Dessa forma:
T $1 T $1 1 T
l 57+, (#2 ; ' yt (t !1 68 ! $ ln '2- ( $ ln '(#2 ( $ 2 % ' yt $ + yt$1 ( .
T 2

9 : 2 2 2(# t !2
T
b. Agora, é fácil ver que +ˆ * ! arg max l 57+, (#2 ; ' yt (t !1 68 ! arg min % ' yt $ + yt$1 ( . Assim,
T 2

9 : t !2

temos que +ˆEMV ! +ˆMQO .

De fato, tomando as condições de primeira ordem,

,l 57+, (#2 ; ' yt (t !1 68


T
T
9 :! 1
,+ (#2
%' y $+ y
t !2
t t $1 ( yt$1 ! 0 -
T T

% yt yt$1 $ +% yt2$1 ! 0 -
t !2 t !2
T

%y y t t $1
+ˆEMV ! t !2
T
! +ˆMQO .
%y
t !2
2
t $1

Apenas para constar, as condições de segunda ordem dão para + :


T

%y 2
t $1
$ t !2 2 /0.
(#
c. Para mostrar que é viesado, temos apenas que tomar a esperança da estimativa. Ou
seja,
5 T 6 5 T 6
7 % '+ yt$1 " #t ( yt$1 8 7 % #t yt$1 8
7 8 7 8
E 57+ˆ 68 ! E 7 t !2 8 ! + " E 7 t !T2 8.
9 : 7 T
8 7 8
7
79
%
t !2
2
yt$1 8
8:
7 % yt$1 8
79 t !2
2

8:
Temos que desenvolver o numerador da segunda parcela.

19
T T T

% #t yt$1 ! % #t '+ yt$2 " #t$1 ( ! % '#t #t$1 " +#t #t$2 " + 2#t yt$3 ( !
t !2 t !2 t !2

!"!
T j !t $1
!%
t !2
% '# #
j !1
t t$ j + j$1 " + j #t y1 (.

Podemos ver, a partir disso, que:


5 T j!t$1 6
E 7 % % '#t #t$ j + j$1 " + j #t y1 ( y1 8 ! 0 ,
7 t !2 j!1 8
79 8:
porém,
5 T j!t$1 6
7 % % '#t #t$ j + j$1 ( 8
7 2 1 8 5 g ' x ( 6 E 5 g ' x (6
E 7 t ! j! T y1 8 # 0, pois E 77 8# 9 :.
7 8 8
79 h ' y (8: E 9 h ' y (6:
5
7
77 % yt2$1 8
88
9 t !2 :
A conclusão, portanto, é que +̂ é viesado.
A intuição básica é que o denominador, que também depende dos erros, altera a razão, ou
seja, impõe uma estrutura de ponderação, cuja esperança não é mais zero.
d. A consistência é um conceito, quando tomamos a probabilidade do limite. Como,
nesse caso, pelo Teorema de Slutsky,
5 g ' x ( 6 p lim 5g ' x (6
p lim 77 8! 9 :,
8
79 h ' y (8: p lim 9 h ' y (6:
5

temos que:
T j !t $1 T j !t $1

% % '# #
t !2 j !1
t t$ j + j $1
( p lim %
t !2
% '# #
j !1
t t$ j + j$1 (
p lim +ˆ ! + " p lim T
!+" T
!
%y
t !2
2
t $1 p lim % y
t !2
2
t $1

T j !t $1 %&&&&&'&&&&&( !0

%
t !2
% p lim 59#t #t$ j 6:
+ j $1

j !1
!+" T
! +.
p lim % y 2
t $1
t !2

Logo, +̂ é consistente.
e. Este exercício não é difícil, mas exige atenção.

20
T

T %# y t t $1

% #t yt$1 t !2

T $1 .
+ˆ ! + " t !2
T
- T $1 +ˆ $ + !' ( T

%y
t !2
2
t $1 % yt2$1
t !2
T $1
Pelo Teorema Central do Limite,
T

%# y t t $1 < (4 =
t !2
GG
d
H N '0, (#2 E ' yt2$1 (( ! N ??0, # 2 >>> .
T $1 ?@ 1$ + A>

Pela Lei dos Grandes Números,


T

%y 2
t $1
(#2
t !2
GG
p
H .
T $1 1$ + 2
Para ver este último resultado, observe que
yt ! + yt$1 " #t - yt2 ! + 2 yt2$1 " 2#t yt$1 " #t2 -
E ' yt2 ( ! + 2 E ' yt2$1 ( " 2 E '#t yt$1 ( " E '#t2 ( -
*&&+&&, *&&&+&&&, )
H E' yt2 (
p
GG
p GG H0 GGp
H (#2

(#2
E'y (! 2
.
1$ + 2
t

Ou, de outra maneira, lembrando que a esperança é sobre uma amostra infinita:
L
T
(#2
yt ! % + j #t$ j - E ' yt2 ( ! % + 2 j (#2 ! .
t !2 t !2 1$ + 2
Portanto
< 2 =

'
T $1 +ˆ $ + GG
d
H ( 1
N ??0, (# >> ! N '0,1$ + 2 ( .
(#2 ?@ 1$ + 2 >>A
1$ + 2

f. Agora, como #t ! ut " )ut$1 , p lim #t yt$1 # 0 . Assim,

21
T T

% #t yt$1 ! % 'ut " )ut$1 (' yt$2 " ut$1 " )ut$2 ( -
t !2 t !2
T T T T

% #t yt$1 % ut yt$2 % ut ut$1 %u u t t $2


t !2
! t !2
" t !2
") t !2
"
T T
*&&&+&&&, T ,
*&&&+&&& T ,
*&&&+&&&
p p p
GG
H0 GG
H0 GG
H0
T T T

%u t $1 t $2y %u 2
t $1 %u u
t $1 t $2
") t !2
") t !2
") 2 t !2
-
T
*&&&&+&&&&, T
*&&+&&, T
*&&&&+&&&&,
p p p
GG
H0 H (u2
GG GG
H0
T

%# y t t $1
t !2
GG
p
H )(u2 # 0.
T

Agora, no denominador temos:


T T T T T

% yt2$1 % '+ yt$2 " ut$1 " )ut$2 ( % yt2$2 % ut2$1 %u


2 2
t $2
t !2
! t !2
! +2 t !2
" t !2
" )2 t !2
"
T T T
*&&+&&, T
*&&+&&, T
*&&+&&,
T p p
GG H (u2 GG H (u2
% yt2$1
H t !2
p
GG
T
T T T

%u t $1 t $2y %u y
t $2 t $2 %u u
t $1 t $2
"2+ t !2
" 2+) t !2
" 2) t !2
-
T
*&&&&+&&&&, T
*&&&&+&&&&, T
*&&&&+&&&&,
p p p
GG
H0 H (u2
GG GG
H0
T

%y 2
t $1
'1 " ) 2 " 2)+(
t !2
GG
H p
(u2 .
T 1$ + 2

Portanto,
T
p lim % #t yt$1
)(u2 '1$ + 2 ()
p lim +ˆ ! + " t !2
!+" !+" #+.
p lim % yt2$1
T
'1 " ) 2 " 2)+((u2 1 " ) 2 " 2)+
t !2 1$ + 2

Logo, podemos concluir que +ˆMQO é inconsistente.

22
4. Análise da Base de Dados e Utilização de Variáveis Binárias

4.1 Explique sucintamente como se faz o teste de Chow e para que ele serve. Apresente,
pelo menos, duas limitações ao teste de Chow.
Solução: O exercício pretende estimular o raciocínio do estudante quanto à
aplicabilidade do teste de Chow. O professor deve esperar que o estudante encontre
duas limitações, pois a terceira é bastante sutil, tratando-se de modelos não lineares.
Para teste de apenas uma mudança estrutural, divida a amostra em antes e depois da
mudança. Estime o modelo não restrito, ou seja, estime o modelo antes e depois da
mudança separadamente, calcule a soma dos quadrados dos resíduos para cada caso e
some-as. Estime o modelo sem mudança estrutural, usando todos os dados, e obtenha a
soma dos quadrados dos resíduos restritos. Use o teste F, tomando cuidado para especificar
corretamente o número de restrições. O teste de Chow serve para verificar se houve alguma
mudança estrutural na série.
A primeira limitação trata do fato de que o teste de Chow, usado para mudanças estruturais,
não é aplicável se o número de variáveis explicativas, k, é maior do que o número de
observações de uma das subamostras, isto é, se k > ni, para algum i. Na prática isso
dificilmente ocorre, mas trata-se um problema potencial. Imagine intervenções na economia
de poucos meses, por exemplo, o que poderia acarretar esse problema.
A segunda limitação é que o teste supõe um modelo homocedástico, ou seja, mesma
variância nas diversas subamostras, o que é fortemente implausível se há mudança
estrutural.
A terceira limitação é que o teste se aplica apenas a modelos lineares, e não se aplica a
modelos não lineares. Porém, o escopo desse livro é estudar estimação apenas em modelos
lineares. Para maiores detalhes sobre isso, ver DAVIDSON, Russel & MACKINNON,
James G. Estimation and Inference in Econometrics. New York: Oxford, pág. 376, 1993.

4.2 (K) Suponha que se estime y ! ! " " x " % D " # , onde D é uma dummy para estado
civil (casado ou solteiro). Suponha que saibamos que a fração de casados na amostra é
duas vezes maior do que a fração de solteiros na população Que modificação, se
houver, você sugeriria.

23
Solução: Este é um exercício destinado a treinar a atenção do aluno, para evitar que,
num trabalho real, ele cometa erros primários.
Nada, pois esta informação não tem qualquer implicação sobre os valores dos parâmetros.

4.3 (C) Suponha que o único determinante do consumo das famílias no Brasil, ci, é a idade,
ai, do chefe da família. Temos dados de cross-section de famílias. Considere o seguinte
modelo simples:

( 1 ) ci ! "1 " "2 ai " #i ,

e o modelo mais geral

( 2 ) ci ! "1 " $1 Di " "2 ai " $ 2 Di ai " #i ,

onde Di é uma variável dummy indicando se o chefe é aposentado ou não, definida da


seguinte forma:
121, se ai 0 60;
Di ! 23
2240, se ai / 60.

Assuma que todas as hipóteses padrões para pequenas amostras são satisfeitas para o
modelo ( 2 ) e que Var '#i ( ! ( 2 é desconhecido.

a. De acordo com ( 2 ), qual é a esperança condicional do consumo da família cujo chefe


tem 40 anos de idade? E para aquela cujo chefe tem 20 anos de idade?;

Para b. e c. considere as três figuras abaixo:

ci ci ci

60 60 60
ai ai ai
sem pulo sem pulo pulo

sem quina quina quina

24
b. Que restrições devem ser impostas sobre os parâmetros do modelo ( 2 ) para evitar
mudanças descontínuas na esperança condicional do consumo na época da
aposentadoria? Como você testaria essa restrição?
c. Suponha que a restrição de b. seja verdadeira. Imponha isso sobre ( 2 ) e derive um
teste de hipótese que não haja pulo (como imposto) e não haja quina na consumo na
época da aposentadoria.
Solução: O exercício aplica os conhecimentos de variáveis dummy. Ele tem o mérito de
induzir o estudante a pensar em como se usam as variáveis dummy.
a. O exercício é bastante simples, não demandando maiores dificuldades.
E 59 ci ai ! 406: ! "1 " "2 ; 40;
E 59 ci ai ! 206: ! "1 " "2 ; 20.

Ao passo que, por exemplo,


E 59 ci ai ! 736: ! "1 " $1 " '"2 " $ 2 (; 73 .

b. A restrição necessária para evitar o pulo é:


$1 " $ 2 ; 60 ! 0 .
Podemos testar,
H 0 : $1 " $ 2 ; 60 ! 0& H1 : $1 " $ 2 ; 60 # 0 ,
fazendo um teste t-student da combinação linear dos coeficientes. Assim, rejeite H0 se

R"ˆ $ 0
t ! 0 t ! 'n $ 4( , onde
5 $1
s 7 R ' X )X ( R )8
2 6 2
9 :
R ! M0,1, 0, 60N; " ) ! M "1 , $1 , "2 , $ 2 N.

c. Impondo a restrição de que não haja pulo sobre ( 2 ), obtemos:


ci ! "1 " "2 ai " $ 2 Di ' ai $ 60( " #i .

A restrição adicional para evitar quina é $ 2 ! 0 . Podemos, então, testar:

H 0 : $ 2 ! 0& H1 : $ 2 # 0 ,
fazendo um teste t-student da seguinte forma:

25
$ˆ 2 $ 0
t ! 0 t ! 'n $ 3( .
2 5 $1 6
s 7' X X ( 8
) 2
9 : 33
Se a desigualdade for verdadeira, rejeitamos H0.
Apenas note o número de graus de liberdade, entre parênteses.

4.4 (J) Um conjunto de dados “cross-section” de famílias com relação a renda, y, e


consumo, c, é dividida em subconjuntos de observações, da seguinte maneira:
a. Operários;
b. Assalariados; e
c. Autônomos.
Uma regressão do log(c) contra o log(y) é computada para cada sub-amostra e para a
amostra completa (com “dummy” para cada intercepto), produzindo:

β! s2 T

a. Operários 1,02 0,24 102


( 0 ,06 )

b. Assalariados 0,91 0,46 104


( 0 ,1 )

c. Autônomos 0,76 0,30 26


( 0 ,08 )

d. Todas famílias 0,86 0,39 232


( 0 ,05 )

Aqui β! é o coeficiente de declividade (com os erros-padrão entre parênteses), s 2 é a


variância residual, e T é o tamanho da amostra.
Teste as hipóteses de que:
a. A elasticidade de c com respeito a y é a mesma para todas as classes ocupacionais;
b. Seu valor é unitário.
Interprete os seus resultados e dê algumas possíveis explanações para as diferenças
observadas.
Solução: Este exercício é ilustrativo do uso das variáveis dummy, onde o aluno é
obrigado a raciocinar sobre sua utilização. Ao mesmo tempo, introduz-se um exemplo

26
prático, para aguçar a intuição do estudante. O exercício é muito bom, porque
esclarece muitos detalhes que em geral passam despercebidos, mesmo após uma
cuidadosa leitura do texto principal. Ao final da resolução, apresentamos uma
variante do exercício, muito ilustrativa, embora de um elevado grau de dificuldade, se
proposto aos alunos. Porém, tal variante poderia servir como um desafio, mais voltado
aos alunos aplicados.
a. Temos que fazer um teste de F para esse caso. Assim, precisamos encontrar os erros
quadrados da equação restrita e da não restrita. Não temos isso diretamente, mas
podemos calcular. Se somarmos os erros das três regressões separadas, teremos o erro
da equação não restrita, da mesma forma que é feito no corpo do texto. Vamos ver
isso, algebricamente.
eˆí)eˆí
si2 ! , i ! 1, 2,3 ,
n$k
1 representa os operários,
2 representa os assalariados,
3 representa os autônomos.
Com isso, podemos calcular o erro quadrado de cada regressão. Sabemos que o tamanho da
amostra, T, será nosso n da equação e k é o número de parâmetros estimados. Como temos
uma dummy para cada intercepto, cada equação foi estimada com duas variáveis
explicativas, e a última equação foi estimada com três dummy mais o coeficiente de
declividade. Este é o primeiro detalhe importante. Logicamente, a última equação trata do
modelo restrito, que será denotado por um asterisco, *. Assim, temos:
0, 24 '102 $ 2( ! eˆ1)eˆ1 - eˆ1)eˆ1 ! 24;
0, 46 '104 $ 2( ! eˆ2)eˆ2 - eˆ2)eˆ2 ! 46,92;
0,30 ' 26 $ 2( ! eˆ3)eˆ3 - eˆ3)eˆ3 ! 7, 2;
0,39 ' 232 $ 4( ! e*)e* - e*)e* ! 88,92.

A soma dos erros quadrados das três primeiras equações nos dá a soma dos quadrados dos
erros da equação não restrita. Calculando temos que 24 " 46,92 " 7, 2 ! 78,12 .
Agora, vamos especificar o teste F que desejamos fazer. Este segundo detalhe é muito
importante, pois define o número de restrições, q, para o teste de F, número esse que
freqüentemente causa confusões.

27
12"1 # "2
122"1 ! "2 22
H0 : 3 & H1 : 3 ou .
224"2 ! "3 22
224"2 # "3
O número de restrições é melhor entendido, pensando na hipótese alternativa. Dessa forma,
calculando F, obtemos:
'88,92 $ 78,12(
F! 2 ! 15, 62 . F '2, 226( .
95%
78,12
'232 $ 6(
Com esse resultados, rejeitamos H0 de que as declividades são idênticas para as três classes
laborais. Note que não sabemos se as três declividades são diferentes entres si, ou se apenas
uma delas difere das outras duas, nem qual delas seria. Apenas sabemos que são diferentes.
b. Agora temos que testar, para cada regressão, se a declividade é diferente. Basta usar
um teste t-student, bastante conhecido.
1, 02 $1
H 0 : "1 ! 1& H1 : "1 # 1: t ! ! 0,333 / t2,5% '100( ,
0, 06
de modo que aceitamos H0 ao nível de 5% de significância.
0,91$1
H 0 : "2 ! 1& H1 : "2 # 1: t ! ! 0,9 / t2,5% '102( ,
0,1
de modo que aceitamos H0 ao nível de 5% de significância.
0, 76 $1
H 0 : "3 ! 1& H1 : "3 # 1: t ! ! 3 . t2,5% '24( ,
0, 08
de modo que rejeitamos H0 ao nível de 5% de significância.
À luz do teste que fizemos no item anterior, observamos que a diferença de declividade
encontra-se no "3 . Ou seja, temos duas declividades iguais a 1 e uma diferente de 1. Não

fizemos o teste para verificar se "3 é maior ou menor do que 1 (nosso teste foi para
verificar se era diferente de 1), mas é de se esperar que seja menor do que 1, de acordo com
as explicações a seguir.
Uma possível explicação é a percepção do que a renda representa para cada classe laboral.
Os assalariados e operários percebem aquela renda de uma perspectiva de mais longo
prazo, ou seja, entendem aquela renda como fazendo parte de seu fluxo de renda
permanente. Os autônomos não sabem se a renda percebida será igual nos períodos

28
seguintes, ou seja, se se trata de renda permanente ou transitória. Por isso, os autônomos
têm uma propensão marginal a poupar maior do que as outras classes ocupacionais. À
propósito, isto é o que Milton Friedman propôs em suas Teoria da Renda Permanente. Esta
é a razão por que a elasticidade renda dos autônomos é menor.

Isto encerra o problema proposto.

O problema comporta algumas variantes de interesse. Inicialmente, suponha que não


tivesse sido citada uma dummy para cada intercepto. Então, isso traria ambigüidades, pois
não seria possível definir se em “todas famílias” foram regredidas com apenas um
intercepto ou com uma dummy para cada intercepto. Assim, a solução dada anteriormente
testa a seguinte hipóteses:
Modelo Restrito: diferentes interceptos e uma declividade comum;
Modelo não Restrito: diferentes interceptos e diferentes declividades.
Porém, se assumimos que “todas famílias” tem apenas um intercepto, então estaríamos
testando H0: interceptos são os mesmos e declividades são as mesmas. Formalmente:
12!1 ! !2 12!1 # !2 , ou
22 22
22!2 ! !3 2!2 # !3 , ou
H0 : 3 & H1 : 23
22 "1 ! "2 22 "1 # "2 , ou
22 22
24"2 ! "3 24 "2 # "3 .
Nesse caso, apenas o valor dos erros quadrados restritos é que mudariam para:
0,39 ' 232 $ 2( ! e*)e* - e*)e* ! 89, 70 .

O teste de F seria dado por:


'89, 70 $ 78,12(
F! 4 ! 8,38 . F ' 4, 226( .
95%
78,12
'232 $ 6(
De modo que rejeitaríamos a hipótese nula, sem saber se a rejeição seria causada por
interceptos diferentes, ou declividades diferentes, ou ambos.

Agora uma problema mais difícil. Supondo que a regressão “todas famílias” tenha, de fato,
um único intercepto, seria possível extrair a soma dos quadrados dos resíduos para um

29
modelo restrito com diferentes interceptos e uma declividade comum, a partir dos mesmos
dados fornecidos?
Se estimássemos os modelos a partir de seus desvios em relação à média, recuperaríamos
os betas. Isto é, a partir da média, para modelos com intercepto e declividade apenas:
y )x
"ˆ ! ,
x )x
onde y e x são desvios em relação à sua média. Disso, podemos deduzir que::

' y )x(
2

e*)e* ! y )y $ .
x )x
Dos dados do problema, temos que:
y1)x1 0, 24
! 1, 02 e ! 0, 062 ;
x1)x1 x1)x1
y2) x2 0, 46
! 0,91 e ! 0,102 ;
x2) x2 x2) x2
y3) x3 0,30
! 0, 76 e ! 0, 082.
x3) x3 x3) x3
Assim, obtemos:
x1)x1 ! 66, 67 e y1 x1 ! 68, 00;
x2) x2 ! 46, 00 e y2) x2 ! 41,86;
x3) x3 ! 46,88 e y3) x3 ! 35, 63;
x )x ! 159,55 e y )x ! 145, 49.
Assim:
145, 49
"ˆ ! ! 0,91 .
159,55
Isso difere da declividade de “todas famílias” de 0,86, confirmando nossa conjectura que a
regressão “todas famílias” não continha variáveis dummy que permitisse interceptos
diferentes. Quer dizer, se queremos testar para diferentes declividades apenas, devemos
estimar o " da equação restrita com dummy para os interceptos e declividade comum,
como assumimos para resolver o problema anterior.
Para estimar e*)e* , precisamos computar y )y ! y1) y1 " y2) y2 " y3) y3 . Para qualquer regressão:

30
' yí)xi (
2

eˆí)eˆí ! s ' n $ k ( ! yi)yi $


2
, i ! 1, 2,3 -
xí)xi
i

' yí)xi (
2

yi)yi ! " si2 'n $ k (.


xí)xi
Logo, temos;
68, 002
y1) y1 ! " 0, 24 '100( ! 93,36;
66, 67
41,862
y2) y2 ! " 0, 46 '102( ! 85, 01;
46, 00
35, 632
yi)yi ! " 0,30 ' 24( ! 34, 28;
46,88
y )y ! 212, 65.
Dessa forma, obtemos:
145, 49 2
e*)e* ! 212, 65 $ ! 80,50 .
159,55
Ou seja, se não avisássemos no enunciado do problema que “todas famílias” é calculado
com uma dummy para cada intercepto, teríamos que realizar todos os cálculos acima, para
obter a soma dos quadrados dos resíduos corretamente, a fim de testar para diferentes
declividades.
Finalmente, estamos prontos para testar que a elasticidade do consumo com relação à renda
é a mesma para todas as classes. Agora, há apenas duas restrições:
21"1 ! "2 21"1 # "2 ; ou
H 0 : 23 & H1 : 23 .
242"2 ! "3 242 "2 # "3

Fazendo o teste F:
'80,50 $ 78,12(
F95% '2, 226( - 3, 05 / F ! 2 ! 3, 44 / F '2, 226( - 3, 70 .
99%
78,12
'232 $ 6(
Portanto, podemos rejeitar a hipótese de declividades comuns ao nível de 5%, mas não ao
nível de 1%.
Estas conclusões estão sujeitas a qualificações, no entanto. Se os dados disponibilizados
tiverem sido arredondados, consideráveis erros podem ter sido introduzidos. Por exemplo,

31
se ("ˆ ! 0, 0501 (embora reportado 0,1), então x2) x2 ! 180,37 , não 46,00, como
2

assumimos. Assim, este exercício deve ser visto como pedagogicamente interessante, em
vez de empiricamente útil.
Para concluir o problema, suponha que aceitemos a hipótese de que as declividades sejam
iguais. Devemos, agora, testar se elas diferem da unidade. As informações que temos são as
seguintes:

e*)e* s2 0,353
"ˆ ! 0,91; s 2 ! ! 0,353; s"ˆ ! ! ! 0, 047 .
232 $ 4 x )x 159,55
O teste t é dado por:
0,91$1
t! ! 1,915 / t2,5% '226( ! 1,97 .
0, 047
Portanto, aceitamos a hipótese nula de que os coeficientes são conjuntamente iguais a 1.
Note que isso contrasta com os resultados obtidos pelo teste individual dos coeficientes,
feitos na resposta principal. O problema de se usar este tipo de teste é que estamos fazendo
um teste sobre outro. Isto é, aceitamos a hipótese de que os coeficientes são iguais; dado
isso, testamos se são iguais a 1. Nesse processo, perdem-se precisão e informação, motivo
pelo qual não recomendamos esse procedimento freqüentemente. Além disso, não é
intuitivo que os coeficiente sejam todos iguais a 1, conforme explicamos na resolução
principal, embora possam ser todos iguais.

32
5. Problemas Econométricos no Modelo Linear Geral

6.1 Suponha o modelo y ! X " " # , onde y e # são vetores n&1 , X < ∞ é uma matriz
n & k e β é um vetor k &1 , estimado por MQO com constante. Responda F(also) ou
V(erdadeiro) para cada alternativa e justifique sucintamente:
a. Heterocedasticidade nas perturbações produz estimativas consistentes de β ;
b. Heterocedasticidade nas perturbações geram estimativas ineficientes;
c. Heterocedasticidade nas perturbações resulta numa matriz de covariância das
estimativas inconsistente;
d. Testes de hipóteses sobre os coeficientes deixam de ser válidos se há
heterocedasticidade.
Solução: Este é um exercício que tenta dirimir dúvidas, dando ao estudante a
oportunidade de voltar aos conceitos básicos e entendê-los melhor.
A resposta do exercício exige que se façam algumas hipóteses não explicitadas no
enunciados. Elas são as seguintes:
i. # ! i.i.d .'0, O( ;

ii. X é não estocástico.


Com essas hipóteses, podemos responder a questão.

'(
a. Verdadeiro, pois prova-se, como está no corpo do texto, que E "ˆ ! " ;

' ( ' (
b. Verdadeiro, pois Var "ˆMQG ! ' X )O$1 X ( / Var "ˆMQO ! ' X )X ( X )OX ' X )X ( ;
$1 $1

c. Verdadeiro, decorrente de b.;


d. Verdadeiro, decorrente de b. Aqui, uma consideração. O teste de hipótese usando o
lado direito da igualdade em b. é válido. O problema é que muitos pacotes
econométricos simplesmente calculam como matriz de covariância como (X’X)-1 e não
a matriz de covariância correta.
Maiores detalhes a respeito deste exercício são encontrados em WHITE, H. A
Heteroskedasticity-Consistent Covariance Matrix and a Direct Test for Heteroskedasticity.
Econometrica, vol. 48, n.º 4, 1980.

33
6.2 Suponha um modelo de regressão linear múltiplo em que β! exista, seja não viesado e
eficiente, pois u é homocedástico. Suponha que você imponha falsas restrições sobre os
parâmetros do modelo.
a. Mostre que as estimativas nesse caso são viesadas;
b. Mostre que a variância das estimativas do modelo com restrições é menor do que a
variância das estimativas do modelo sem restrição;
c. Qual a implicação desse resultado em termos de previsão? Qual a intuição desse
resultado?
Sugestão: Lembre o que é EQM, ou seja, o erro quadrático médio.
Solução: O exercício procura ilustrar um caso que não é muito intuitivo, à primeira
vista, ou seja quando se impõem falsas restrições no modelo a variância reduz-se. Isto
é importante para se ter uma primeira intuição do erro quadrático médio, sua
importância e suas conseqüências para a previsão. Às vezes, impondo falsas restrições,
pode-se melhorar a previsão, pois reduz-se o erro de previsão, não obstante o viés
possa aumentar.
a. Primeiramente, note que
$1
' ( 10
"ˆsr ! "ˆ ! ' X )X ( X )Y ; "ˆcr ! " * ! "ˆ " K r $ R"ˆ ,
$1
K ! ' X )X ( R ) 57 R ' X )X ( R )68 .
$1 $1

9 :
Daqui podem-se tirar as seguintes conclusões:

'( $1
Var "ˆ ! ( 2 ' X )X ( ;

E '" * ( ! " " K 'r $ R" (.

Como r # R" - E '" * ( # " . Portanto, as estimativas são viesadas.

b. Há bastante álgebra neste exercício, mas, com calma, obtém-se a resposta.

10
Ver exercício 3.1.c.

34
5 65 6)
Var '" * ( ! E 77" ˆ " Kr $ KR"ˆ $ " $ Kr $ KR" 8 7"ˆ " Kr $ KR"ˆ $ " $ Kr $ KR" 8 !
*&&&&&&&&&&&&&&+&&&&&&&&&&&&&&, 8 7 *&&&&&&&&&&&&&&+&&&&&&&&&&&&&&, 8
79 !A 8: 79 !A 8:
! E 59 AA)6: !
5 6
'
! E 57 "ˆ $ " $ KR "ˆ $ "
9 (68: M AN) ! E 77' I $ KR('"ˆ $ " ('"ˆ $ " () ' I $ KR() 88 !
9 :
< =
! ' I $ KR ( B ' I $ KR () ( 2 ! ?? B $ BR )K ) $ KRB " *&&&+&&&,
KRBR )K )>>> ( 2 ,
?@ !D A
$1
B ! ' X )X ( .

Desenvolvendo D, temos:
$1
D ! ' X )X ( R ) 57 R ' X )X ( R )68 R ' X )X ( R )K ) ! BR )K ) .
$1 $1 $1

*&&&&&&&&&&& 9 &+&&&&&&&&&&& : &, *&&&+&&&,


!K !B

Dessa forma, conseguimos:

Var '" * ( ! ' B $ KRB( ( 2 ! ' I $ KR( B( 2 ! ' I $ KR(' X )X ( ( 2 .


$1

'(
Logo, se KR . 0 - Var '" * ( / Var "ˆ . Para ver este último fato, observe que
$1
KR ! ' X )X ( R ) 57 R ' X )X ( R )68 R .
$1 $1

9
*&&&+&&&, *&&&&&&&& : &,
&+&&&&&&&&
.0 )&L+&&
)LR
R
*&& &,
T )T

Agora, seja c = Tv, onde c é um vetor n&1 . Sendo assim, c’c = v’T’Tv > 0, como
queríamos demonstrar, pois c’c é um escalar.
c. Mesmo com falsas restrições, as previsões serão melhores se a diminuição da
variância for maior do que o aumento do viés. Formalmente, se EQM* < EQM. A
intuição do resultado é que impor falsos parâmetros significa que haverá menos
parâmetros variando, o que poderia reduzir o erro de previsão.

6.3 Responda:
a. Cite pelo menos dois testes para a hipótese de homocedasticidade;
b. Cite pelo menos um teste para a hipótese de autocorrelação dos resíduos;
c. Em caso de rejeição da hipótese nula em a., por que método você estimaria o modelo?
d. Em caso de rejeição da hipótese nula em b., por que método você estimaria o modelo?

35
Solução: O exercício pretende que o aluno volte ao livro-texto e verifique claramente
que testes ele pode aplicar e de que maneiras ele deve estimar o modelo, em caso de
rejeição da hipótese nula. Com isso, sistematiza-se todo o capítulo. Sugerimos
consultar, adicionalmente, Johnston e Dinardo (1998).
a. Há vários testes que podem ser usados: Breusch-Pagan, White, Goldfeld-Quandt,
Glesjer;
b. Durbin-Watson, ACF, Ljung-Box;
c. Mínimos quadrados generalizados, mínimos quadrados generalizados factíveis;
d. Pode-se usar o método de Cochrane-Orcutt, Durbin ou Variáveis instrumentais.

6.4 (C) Suponha o seguinte e verdadeiro modelo:


yt ! xt)" " #t , t ! 1, 2, #, T ,
porém um econometrista, equivocadamente, estima
yt ! xt)" " zt)$ " #t , t ! 1, 2, #, T ,

onde xt é k &1 e zt é m&1 . Assuma que E '# x, z ( ! 0, E '## ) x, z ( ! ( 2 I . Seja "ˆ o

estimador por MQO do modelo correto. Seja "$ e $ os estimadores do modelo equivocado.

a. "$ é não viesado para " ?;

b. Compute a matriz de covariância para '"$, $ ( . Compare o bloco da matriz de

covariância correspondente a "$ com a matriz de covariância de "ˆ . Quando elas são
as mesmas?
Solução: O exercício tem o objetivo de mostrar se variáveis omitidas causam viés.
Sabemos que não, conforme provado no corpo do texto. Por isso, o exercício apenas
busca formalizar melhor os resultados já conhecidos, aplicando-se o Teorema de
Frisch-Waugh-Lovell ou Frisch-Waugh11, entre tantas outras maneiras de resolvê-lo.
Tal teorema pode ser encontrado em livros como DAVIDSON, Russel &
MACKINNON, James G. Estimation and Inference in Econometrics. New York:
Oxford, cap. 1, 1993 ou GREENE, William H. Economic Analysis, 4th. ed. Upper

11
Veja exercício 6.1.c, onde se demonstra esse teorema.

36
Saddle River: Prentice Hall, 2000. À propósito, por se tratar de um teorema muito
útil, sugerimos que o mesmo seja apresentado em detalhes para os alunos.
a. Sim, "$ é não viesado. Para ver isso, reescreva o modelo como

( 3 ) Y ! X " " #, X T&k , YT&1 , #T&1 .

Reescreva o modelo equivocado como

( 4 ) Y ! X " " Z $ " ., ZT&m , .T&1 .

$1
Agora, pré-multiplique ( 4 ) por M z ! I $ Z ' Z )Z ( Z ) , observando que Mz é idempotente

e simétrica. Assim, obtemos,

( 5 ) M zY ! M z X " " M z . .

Pelo Teorema de Frisch-Waugh-Lovell, o " estimado usando-se ( 5 ) é idêntico àquele


usando-se ( 4 ). Agora, note que pré-multiplicando ( 3 ) por Mz, voltaríamos a ( 5 ). Isto é,
se " estimado por ( 3 ) é não viesado, então aquele estimado por ( 5 ) também não o é.
Formalmente, usando MQO em ( 5 ), conseguimos:
$1 $1
"$ ! ' X )M z X ( X )M zY ! " " ' X )M z X ( X )M z # -

E '"$( ! " " ' X )M z X ( X )M z E '#( ! ".


$1

Portanto, "$ é não viesado.


b. Podemos estimar o modelo da seguinte forma:
5" 6
Y !MX Z N7 8 " . -
79 $ 8:
5 "ˆ 6 5 X )X X )Z 6 $1 5 X )Y 6
7 8!7 8 7 8
7 $ˆ 8 7 Z )X Z )Z 8 7 Z )Y 8 .
97 :8 9 : 9 :
Agora, temos que relembrar uma propriedade de inversão de matrizes. Dada a seguinte
matriz:
5 A B6
M !7 8,
79C D 8:

então

37
5 A$1 ' I " BE $1CA$1 ( $ A$1BE $1 6
M $1 ! 77 8,
8
$1 $1 $1
79 $E CA E 8:
onde E = D – CA-1B.
Então, defina
$1
E ! Z )Z $ Z )X ' X )X ( X )Z ;
1
$1 2 $1 I
$1 2
A$1 ' I " BE $1CA$1 ( ! ' X )X ( 3 I " X )Z 57 Z )Z $ Z )X ' X )X ( X )Z 68 Z )X ' X )X ( J !
$1

242 9 : 2K2
12 5 < => 6
$1 I2
22 7 ?? 8 22
! ' X )X ( 3 I " X )Z 7 Z ) ?? I $ X ' X )X ( X )>>> Z 8 Z )X ' X )X ( 2J !
$1 2 $1 $1

22 7 ?? *&&&&&&&+&&&&&&&, >> 8 22
242 97 @ !M x A :8 2K2
$1
! ' X )X ( EI " X )Z 'Z )M Z (
x
$1 $1
Z )X ' X )X ( F.
' (
$1
Na primeira regressão, em ( 3 ), Var "ˆ ! ( 2 ' X )X ( . Agora,

Var '"$( ! ( 2 ' X )X ( " ( 2 ' X )X ( X )Z ' Z )M x Z ( Z )X ' X )X ( .


$1 $1 $1 $1

'(
Portanto, uma condição suficiente para que Var "ˆ ! Var '"$( é que X’Z = 0, isto é, que X e

Z sejam ortogonais.

38
6. Multicolinearidade

6.1 (C) Considere o modelo


yt ! x1)t "1 " x2)t "2 " #t , t ! 1, 2, #, T ,

onde x1t é k &1 e x2t é m&1 . Assuma que E '# X 1 , X 2 ( ! 0, E '## ) X 1 , X 2 ( ! ( 2 I , e

X 1)X 2 ! 0 . Seja "ˆ o estimador por MQO do modelo correto. As variáveis estão em termos
de seus desvios em relação a sua média.
a. Mostre que a único estimador de '"1 , "2 ( de variância mínima, não viesado e linear

pode ser escrito na forma:


$1 $1
"$1 ! ' X 1)X 1 ( X 1)y, "$2 ! ' X 2) X 2 ( X 2) y .

Note que estes são estimadores de MQO para os modelos yt ! !1 " x1)t "1 " #1t e

yt ! !2 " x2)t "2 " #2 t , respectivamente.

b. "$1 e "$2 são estimadores não viesados se X 1)X 2 # 0 ? Se são, compute o viés de cada
um.
$1
c. Suponha, agora, que X 1)X 2 # 0 . Seja M i ! I $ X i ' X i)X i ( X i), i ! 1, 2 . Qual é a

interpretação de M2X1 e M2y? Mostre que a estimativa de "1 pode ser escrita como
$1
"ˆ1 ! ' X 1)M 2 X 1 ( X 1)M 2 y ,

e similarmente para "ˆ2 . Compute as matrizes de covariância de "ˆ1 e "ˆ2 .

d. Considere o caso onde k = 1, m = 1 e X 1)X 2 # 0 . Expresse a variância de "ˆ1 como

uma função do coeficiente de correlação amostral entre X1 e X2, r122 . O que acontece

quando r122 H 1 ?
Solução: Este problema tem vários objetivos. O primeiro é mostrar as várias maneiras
de se obter as estimativas do modelo. O segundo é mostrar as conseqüências de não se
ter X1 e X2 ortogonais entre si, ou seja, mostrar o viés causado por variáveis omitidas.
Além disso, prova-se parte do importante Teorema de Frisch-Waugh. Finalmente,
mostram-se as conseqüências da multicolinearidade, inclusive graficamente.
a. Vamos reescrever o modelo na forma matricial

39
( 6 ) y ! X 1"1 " X 2 "2 " #, X 1T&k , X 2T&m , yT&1 , #T&1 .

Defina
$1
M i ! I $ X i ' X i)X i ( X i), i ! 1, 2 .

Pré-multiplicando ( 6 ) por M2, obtemos:

( 7 ) M 2 y ! M 2 X 1"1 " M 2# .

Por causa do Teorema de Frisch-Waugh-Lovell "ˆ1 estimado por ( 6 ) é idêntico ao "ˆ1 por
estimado por ( 7 )12. Logo,
$1
"ˆ1 ! ' X 1)M 2 X 1 ( X 1)M 2 y .

Como
. !0
$1
X 1)M 2 ! X 1) $ X 1)X 2 ' X 2) X 2 ( X 2 - X 1)M 2 ! X 1) ,

então,
$1
"ˆ1 ! ' X 1)X 1 ( X 1)y ,

como queríamos demonstrar.


Adotando o mesmo procedimento para "ˆ2 , obtemos
$1
"ˆ2 ! ' X 2) X 2 ( X 2) y .

b. Suponha que X 1 # X 2 , e que "$1 é estimado usando o modelo y ! X 1"1 " # , quando o
verdadeiro modelo é y ! X 1"1 " X 2 "2 " # . Então,
$1 $1
"$1 ! ' X 1)X 1 ( X 1)y ! ' X 1)X 1 ( X 1)M X 1"1 " X 2 "2 " # N !
$1 $1
! "1 " ' X 1)X 1 ( X 1)X 2"2 " ' X 1)X 1 ( X 1)#.

Logo

E '"$1 ( ! "1 " ' X 1)X 1 ( X 1)X 2 "2 .


$1

*&&&&&&&+&&&&&&&,
vies

Procedendo da mesma maneira,

12
Ver demonstração no item c. deste exercício.

40
E '"$2 ( ! "2 " ' X 2) X 2 ( X 2) X 1"1 .
$1

*&&&&&&&+&&&&&&&,
vies

$1
c. Primeiro observe que M 2 y ! y $ X 2 ' X 2) X 2 ( X 2) y é o resíduo da regressão de y
*&&&&&&+&&&&&&,
!"ˆ yX 2

contra X2.
Seguindo o mesmo raciocínio, observe que
$1
M 2 X 1 ! X 1 $ X 2 ' X 2 X 2 ( X 2) X 1 .
*&&&&&&+&&&&&&,
"ˆ X1X 2

Ou seja, isto é como se regredíssemos cada uma das colunas de X1 contra X2, e depois
calculássemos os resíduos de cada uma da k regressões.
Agora temos que provar que "ˆ1A ! "ˆ1B , onde

(A) y ! X 1"1 " X 2 "2 " # ;


(B) M 2 y ! M 2 X 1"1 " M 2# .
Este é o Teorema de Frisch-Waugh-Lovel que temos usado.
Tomando as condições de primeira ordem de (A), por mínimos quadrados ordinários,
obtemos:
5 X 1)X 1 X 1)X 2 6 57 "ˆ1 68 5 X 1)y 6
7 8 !7 8.
7 X 2) X 1
9 X 2) X 2 8: 77 "ˆ2 88 79 X 2) y 8:
9 :
Desenvolvendo essa expressão, chegamos a
12 X )X "ˆ " X )X "ˆ ! X )y - "ˆ ! X )X $1 X ) y $ X )X $1 X )X "ˆ
2 1 1 1 1 2 2 1 1 ' 1 1( 2 ' 1 1( 1 2 2
3
22 X 2) X 1"ˆ1 " X 2) X 2 "ˆ2 ! X 2) y.
24
Substituindo a primeira equação na segunda, temos:
$1 $1
X 2) X 1 ' X 1)X 1 ( X 1 y $ X 2) X 1 ' X 1)X 1 ( X 1)X 2 "ˆ2 " X 2) X 2 "ˆ2 ! X 2) y -
5 6 5 6
7 $1 8 7 $1 8
X 2 7 I $ X 1 ' X 1 X 1 ( X 1 8 X 2 "2 ! X 2 7 I $ X 1 ' X 1 X 1 ( X 1 8 y -
) ) ) ˆ ) ) )
7 *&&&&&&&&!+&&&&&&& &, 8 7 *&&&&&&&&!+&&&&&&& &, 8
97 M1 :8 97 M1 :8
X )M X "ˆ ! X )M y -
2 1 2 2 2 1
$1
"ˆ2 ! ' X 2)M 1 X 2 ( X 2)M 1 y.

Procedimento análogo dá:

41
$1
"ˆ1 ! ' X 1)M 2 X 1 ( X 1)M 2 y .

Para calcular a variância, note que:


$1 $1
"ˆ1 ! ' X 1)M 2 X 1 ( X 1)M 2 ' M 2 X 1"1 " M 2 #( ! "1 " ' X 1)M 2 X 1 ( X 1)M 2 # -
$1
"ˆ1 $ "1 ! ' X 1)M 2 X 1 ( X 1)M 2 # -

' (
E "ˆ1 ! "1 , e

Var '"ˆ ( ! E 57' X )M X ( X 1)M 2 ## )M 2 X 1 ' X 1)M 2 X 1 ( 68 ! ( 2 ' X 1)M 2 X 1 ( .


$1 $1 $1
1
9 1 2 1
:
Analogamente,

' (
$1
Var "ˆ2 ! ( 2 ' X 2) M 1 X 2 ( .

d. Primeiro, do apêndice sabemos que o coeficiente de correlação amostral é dado por:

' X1)X 2 (
2

r2
! .
12
' X 1)X 1 (' X 2) X 2 (
Dessa forma,
$1
$1 5 ' X 1)X 2 ( 68
2
2 7
' (
Var "ˆ1 ! ( 2 57 X 1)X 1 $ X 1)X 2 ' X 2) X 2 ( X 2) X 1 68
9
$1

:
! ( 7 X 1)X 1 $
7 X 2) X 2 8
8 !
9 :
$1
5 ' X 1)X 2 (
2 6
2 7 8 $1
)
! ( 7 X1 X1 $ X1 X1) 8 ! ( 2 579 X 1)X 1 $ X 1)X 1r122 68: !
7
9
' X 1)X 1 (' X 2) X 2 (8
:
( 2
! .
' X1)X1 ('1$ r122 (
Ou seja,
(2
' (
Var "ˆ1 ! - lim Var "ˆ1 ! L .
' X 1)X 1 ('1$ r122 ( r122 H1
' (
Graficamente, isso significa:

42
' (
Var "ˆ1

(2
X 1)X 1
r122
1

Interpretando X 1)M 2 X 1 como a soma dos quadrados dos resíduos de regressão de cada

' (
coluna de X1 contra X2, podemos ver que, quanto menor os resíduos, maior a Var "ˆ1 . Os

resíduos serão menores, quanto maior for a colinearidade entre X1 e X2. Assim, se r122 H 1 ,

' (
Var "ˆ1 vai para o infinito, e concluímos que o modelo tem variáveis redundantes. Isso

significa que podemos excluir uma das variáveis explicativas do modelo sem perder muita
informação.

6.2 (K) Retirar um variável pode ser uma “solução” para multicolinearidade? (explique
detalhadamente)
Solução: O exercício procura aguçar a intuição do estudante.
Note, inicialmente, que não existe uma solução para multicolinearidade. Em segundo
lugar, deve estar claro que retirar uma variável pode significar a omissão de variável
relevante, o que resulta no viés de estimação. Porém, se a variável retirada for altamente
correlacionada com outra do modelo, pouca informação se perderia, pois essa outra variável
do modelo já está incorporando a informação da outra que foi retirada. Portanto, quanto
mais correlacionadas forem duas variáveis, menos necessário é que apareçam
simultaneamente no modelo, pois uma contém a informação da outra. É nesse sentido que
retirar uma variável pode ser uma “solução” para multicolinearidade.

43
6.3 (K) Se x2 é uma função exata de x, defrontar-nos-íamos com exata multicolinearidade se
usássemos x e x2 simultaneamente como regressores. Explique.
Solução: Mais uma vez, o objetivo do exercício é aguçar a intuição do estudante.
A afirmação é falsa, pois não existe uma relação linear entre x e x2. A multicolinearidade é
causada quando há uma relação linear. O próprio nome já leva a pensar isso, pois pontos
colineares são pontos que pertencem à mesma linha (ou reta).

6.4 (K) No modelo de regressão linear clássico, a multicolinearidade poderia resultar em


viés na estimativa de suas variâncias? Explique.
Solução: Este é um exercício bastante sutil, por isso importante.
Afirmação falsa. As variâncias tornam-se grandes, mas suas estimativas também. Isso é
fácil de ser visto, pois variância e estimativas têm (X’X)-1 como fator comum, que fica cada
vez menor à medida que mais perfeita seja a multicolinearidade.

6.5 (K) Suponha um modelo de regressão linear clássico: y ! ! " " x " % w " # . Muitas
amostras são tais que x e w são correlacionados, porém, por sorte, você observa uma
amostra em que eles são não correlacionados. Então, você regride y contra x e um
intercepto, obtendo " * .

a. " * é não viesado?

b. A estimativa da variância de " * é não viesada?


Solução: Mais um exercício cuja sutileza lapida o conhecimento do estudante,
fazendo-o raciocinar sobre o problema.
a. " * é não viesado, haja vista que x e w são não correlacionados. Basta ver o primeiro
exercício deste capítulo.
b. A variância de " * é viesada, no entanto. Isto ocorre porque a estimativa de ( "2 é

viesada para cima. Para ver isso, lembre-se de que s2 é dividido por n – k, onde k
deveria ser igual a 3, mas neste caso, por falta de uma variável, será dividido por (n – k
– 1).

44
7. Econometria das Variáveis de Resposta Qualitativas e
Limitadas

7.1 Escreva o modelo de probabilidade de escolha Probit. Interprete o impacto de uma


modificação em uma variável explicativa.
Sugestão: Consulte GRIFFTHS, William E., HILL, R Carter, JUDGE, George G. Learning
and Practicing Econometrics. New York: Wiley, 1992.
Solução: Apesar do livro texto escrever a função Probit explicitamente, esta é uma
boa oportunidade para entendermos melhor as conseqüências do uso desse modelo.
De acordo com o modelo Probit temos:
Pi ! F ' X i)" ( ,

onde F ' X i)" ( é a função densidade de probabilidade acumulada, tal que


X i)"
1 5 z2 6
F ' X i)" ( ! P exp 7$ 8dz .
2- 7 28
$L 9 :
A questão agora e derivar essa função com respeito a Xj. Para isso, usamos o teorema de
Leibnitz que diz o seguinte:
A' x(

, P F ' x, z ( dz A' x(
B' x( ,F ' x , z (
! F ' A' x ( , z ( A) ' x( $ F ' B ' x( , z ( B ) ' x( " P dz .
,x B' x(
, x

Como B ' x( ! $L , então B ) ' x( ! 0 . Além diso, como F ' x, z ( ! F ' z ( , então

,F ' x, z (
! 0 . Logo o resultado da derivada é:
,x
5 ' X )" (2 6
exp 77$ 8 " ! f X )" " ,
1 i
8 j ' i ( j
2- 7 2 8
9 :
onde f ' X i)" ( é a função densidade de probabilidade.

Podemos, assim, ver que o impacto de uma modificação da variável explicativa dependerá
de f ' X i)" ( e " j , e não apenas de " j isoladamente, como em modelos lineares.

45
Vamos entender, intuitivamente, o que está ocorrendo. Quanto mais próximo de 1 ou 0
estiver a função densidade de probabilidade acumulada, F ' X i)" ( , menores serão os valores

da f.d.p., f ' X i)" ( . Com isso, a mínima modificação em Xj tem poucas chances de mudar a

decisão. Se F ' X i)" ( estiver ao redor de 0,5, então torna-se mais fácil modificar uma

decisão, pois a f ' X i)" ( estará em seu valor máximo.

Dessa discussão podemos concluir que, dado que f ' X i)" ( é sempre positiva, o sentido da

modificação dependerá do sinal de " j . Além disso, a magnitude da mudança na

probabilidade, dada uma variação em Xj, é determinada pela magnitude de " j e de

f ' X i)" ( , simultaneamente.

7.2 (C) Em um modelo de escolha discreta Probit, suponha que a utilidade líquida é
I ! X " " #, # ! N '0, (#2 ( ,

onde
122 D ! 1, se I 0 0
3
224 D ! 0, c.c.,

# ! X / " V ,V ! N '0, (V2 ( .

Assuma que, na amostra à sua disposição, as observações são independentes entre as


pessoas.
O que pode ser identificado de uma grande amostra de observações de pessoas, quando (dê
as condições precisas):
a. / ! 0 ?;
b. / # 0 ?.
Solução: Este é um exercício simples, apenas exigindo a montagem da função de
verossimilhança para fins estimação.
a. Vamos definir a função de verossimilhança primeiro, para, depois, responder as
questões.

46
I ! X " " # ! X " " X / "V .
Logo,
12 D ! 1, se I 0 0 - X '" " / ( " V 0 0
23
22
4 D ! 0, se X '" " / ( " V / 0.

Dessa forma,
<V X '" " / (=>
Pr ' D ! 1( ! Pr ' X '" " / ( " V 0 0( ! Pr ??? 0 $ >> !
?@ (V (V A>
<V X '" " /(>= < X '" " / (>=
Pr ??? B >> ! Q ??
??@
>>.
@? (
V ( V
>A ( V
>A

Aqui, Q ';( representa a função densidade de probabilidade acumulada. É preciso dividir as

expressões pela variância de V, pois os resultados estimados sempre referem-se a uma


normal-padrão.
Então, o modelo Probit fica:
$D
5 < X i '" " / (=>6 i
1
< X '" " / (=>
Di
n
L ! C Q ??? i >> 71$Q ??
7
>>8 ,
@? ( A> ?@? ( A >88
i !1 V 97 V :
donde obtemos a estimativa
'" " / (
.
(V
"
Assim, se / ! 0 , podemos identificar .
(V

'" " / ( " /


b. Se / # 0 , identificamos sem, no entanto, podermos separar de .
(V (V (V

7.3 (C) Seja 59'Y1 , x1 ( , 'Y2 , x2 ( ,#, 'Yn , xn (6: uma amostra aleatória de n observações, onde xi é

uma variável aleatória escalar, e Yi é variável aleatória de Bernoulli, que assume apenas
dois valores, 0 e 1, com as seguintes probabilidades:
exp ')1 " )2 xi (
Pr 'Yi ! 1 X ( ! ;
1 " exp ')1 " )2 xi (
1
Pr 'Yi ! 0 X ( ! .
1 " exp ')1 " )2 xi (

47
Esse modelo é conhecido como um modelo de resposta binária Logit. É uma alternativa ao
modelo Probit, como já sabemos.
a. Encontre a função esperança condicional de Yi dado X = (x1, x2, ..., xn);
b. Escreva a função log-verossimilhança para esse modelo.
Solução: Este é um exercício que requer apenas os conhecimentos de probabilidade. É
muito importante saber escrever a função log-verossimilhança, por isso a insistência
nesse conceito ao longo dos exercícios propostos.
a. Primeiro, vamos converter o problema em notação matricial, apenas para resolvê-lo de
uma maneira mais geral, mas isso não seria preciso, de fato.
e X i)
Pr 'Yi ! 1 X ( ! ;
1 " e X i)
1
Pr 'Yi ! 0 X ( ! .
1 " e X i)
Agora, é aplicar o operador esperança, simplesmente.
E 'Yi x1 , x2 , #, xn ( ! 1; Pr 'Yi ! 1 x1 , x2 , #, xn ( " 0 ; Pr 'Yi ! 0 x1 , x2 , #, xn ( !
e X i)
! .
1$ e X i )
b. Como assumimos cada observação independente da outra, temos:

< e X i ) >= i < 1 =1$Yi 'e X i) (


Y Yi

f 'Yi X i ( ! ?? > ? > ! -


?@1 " e X i) >>A ??@1 " e X i) >>A 1 " e X i)
n
L '); X ( ! C f 'Yi X i ( ! C
n
'e (
X i ) Yi

-
i !1 i !1 1" e X i)
n
l '); X ( ! ln L '); X ( ! % 57Yi X i) $ ln '1 " e X i ) (68
i !1
9 :

Para completar, fornecemos as condições de primeira ordem.


n n
exp ')1 " )2 xi (
M)1 N : % Yi ! % ;
i !1 i !1 1 " exp ')1 " )2 xi (

n n
exp ')1 " )2 xi ( xi
M)2 N : % Yi xi ! % .
i !1 i !1 1 " exp ')1 " )2 xi (

7.4 (K) Suponha que você deseja estimar a curva de demanda por bilhetes de futebol. Você
acredita que a demanda é determinada linearmente por uma séries de fatores, entre os

48
quais o preço do bilhete, o padrão relativo da equipe local e da equipe visitante, a renda
familiar da cidade, a renda total da cidade, etc. Você possui 10 anos de dados, durante
os quais, em várias ocasiões, os bilhetes estiveram esgotados. Qual a sua recomendação
para os dados quando os bilhetes estiveram esgotados?
Solução: Este é problema de dados censurados, em que se procura verificar se o
estudante entendeu a idéia geral para esses casos.
Um jogo cujos bilhetes estavam esgotados reflete uma demanda acima da capacidade dos
lugares. Essas observações devem ser tratadas como observações limites em um modelo
Tobit.

49
8. Sistemas de Equações Simultâneas

8.1 (C) Discuta a identificação e estimação do seguinte modelo de equações simultâneas:


12 y1t " $12 y2t " $13 y3t " "11 x1t " "13 x3t ! #1t
22
23 y " $ y " " x " " x ! #
22 2t 23 3t 22 2 t 23 3t 2t

224$ 31 y1t " y3t " "32 x2t ! #3t .

Aqui não há restrições de covariância. Assegure-se de considerar as condições de ordem e


rank (ou posto, em português) e explicitar as hipóteses de que você precisa para estimar os
parâmetros do modelo.
Solução: Este é um exercício básico para verificar a compreensão do aluno a respeito
do texto principal. Ele treina fartamente as condições de ordem e posto, necessárias à
estimação e identificação do modelo.
Vamos apresentar um método de resolução do problema, não necessariamente único, mas
que entendemos que seja compreensível. Na verdade, depois de entendida técnica é que se
verifica quão fácil é o método de identificação de equações simultâneas. Primeiramente,
vamos montar uma matriz, onde na linha superior estão as variáveis do modelo, endógenas
e exógenas. Na primeira coluna, representam-se as equações. Os zeros da matriz
representam as variáveis excluídas, endógenas ou exógenas. Com isso, podemos obter a
condição de ordem.

y1 y2 y3 x1 x2 x3
i y1 1 $12 $13 "11 0 "13
ii y2 0 1 $ 23 0 "22 "23
iii y3 $ 31 0 1 0 "32 0

Montada essa matriz, temos que preencher a seguinte tabela:

50
Cond. Ordem Exóg. Excl. End. Incl. – 1 Diagnóstico
i 1 < 2 não identificado
ii 1 = 1 Identificado?
iii 2 > 1 super identificado?

Note que, na matriz, separamos o bloco de endógenas do bloco de exógenas. Contamos as


exógenas excluídas olhando na linha da matriz. Para cada zero em cada linha, no bloco das
variáveis exógenas, temos uma exclusão. Com isso, preenchemos a segunda coluna da
tabela acima.
Depois contamos as endógenas incluídas. Outra vez, olhando em linha, para cada zero
temos uma endógena excluída, portanto o número de endógenas incluídas é o número total
de endógenas menos o número de zeros da linha. No nosso caso, temos três endógenas e, na
segunda linha, não há exclusões. Feito isso, preenchemos a quarta coluna da tabela, sem
esquecer de subtrair 1 do número de endógenas incluídas.
Note que as exógenas excluídas é o K00 do corpo do texto.
Depois disso, preenchemos a coluna três com o sinal apropriado, comparando as colunas 2
e 4. Se o número de endógenas incluídas menos um superar o de exógenas excluídas, não se
identificam os parâmetros daquela equação com certeza, ou seja, a equação é
subidentificada. Se são iguais ou maiores, aquela equação é candidata a identificação exata
ou superidentificação, respectivamente, dependendo da condição de posto a ser discutida a
partir de agora.
Temos que nos preocupar com as equações ii e iii. Para definir a condição de posto, temos
que olhar simultaneamente na linha, procurando os zeros para aquela equação, e a coluna,
para montar a matriz relevante para calcular o posto. Olhando na linha da equação ii o zero
aparece na terceira coluna, abaixo de 1 e acima de $ 31 ; depois aparece no bloco das

exógenas, abaixo de "11 e acima de outro zero. Montam-se com esses elementos a matriz
para se calcular o posto:
< 1 "11 =>
(ii) ?? >.
?@$ 31 0 A>>

51
Esta matriz tem posto 2, assumindo que "11$31 # 0 , ou seja, que nenhum desses parâmetros
seja zero, inclusive porque não seria lógico do contrário.
Utilizando mesmo procedimento para a equação (iii), obtemos a seguinte matriz:
<$12 "11 "13 =>
(iii) ?? >.
?@ 1 0 "23 >>A

No máximo, o posto dessa matriz é 2. Assumimos esse resultado, a menos que "11 ! 0 ou

"23 ! 0 , o que não teria sentido como já dissemos, ou "13 ! $12 "23 . Nesse caso, a equação
iii é super identificada.

8.2 (C) Considere o seguinte modelo de oferta e demanda:


212qs ! !0 " !1 p " !2 w " #s
22
3qd ! "0 " "1 p " "2 y " #d ,
22
224qs ! qd

onde w denota um vetor de observações T &1 a respeito do clima, y é um vetor de


observações da renda de mesma dimensão, ambos exógenos.
a. Discuta a questão de identificação sobre as equações de oferta e demanda;
b. Assumir !2 ! 0 impõe alguma restrição sobre os parâmetros da forma reduzida?
Cuidadosamente esquematize um teste H 0 : !2 ! 0& H1 : !2 # 0 , usando a forma

reduzida dos parâmetros. (Dica: escreva H0 como H 0 : RR ! q0 );


c. Suponha que a primeira equação é estimada por um estimador de informação limitada,
por exemplo, variáveis instrumentais. Você pode determinar se a primeira equação é
uma curva de demanda ou oferta apenas examinando o sinal de !1 ?;

d. Suponha que uma agência do governo fixe o preço a cada ano em pt0 , o qual pode ser
diferente de ano para ano. Que efeito esta política terá sobre a identificação e
estimação do modelo?
Solução: Este é um exercício que continua o anterior, relembrando e solidificando os
principais conceitos aprendidos no texto principal. Não se trata de um exercício difícil,
embora tenha um grande enunciado.
a. Vamos proceder como no exercício anterior, sem tantas explicações detalhadas.
Primeiro montamos a matriz de coeficientes para as três equações.

52
qs qd p 1 w y
i 1 0 $!1 $!0 $!2 0
ii 0 1 $"1 $"0 0 $"2
iii 1 $1 0 0 0 0

O detalhe aqui é que, embora não explicitamente, o vetor de 1s é uma variável explicativa
também.
Vamos agora preencher a tabela da condição de ordem.

Cond. Ordem Exóg. Excl. End. Incl. – 1 Diagnóstico


i 1 = 1 Identificado?
ii 1 = 1 Identificado?
iii 3 > 1 super identificado?

Agora vamos montar as matrizes para cada equação.


< 1 $"2 =>
(i) ' ?? >! 2,
?@$1 0 A>>

onde ' ';( representa o posto da matriz entre parênteses.

Note que o posto é válido assumindo que "2 # 0 . Portanto i é exatamente identificado.
< 1 $!2 =>
(ii) ' ?? >! 2,
?@$1 0 >>A

a menos que !2 ! 0 . Portanto ii é exatamente identificado.


<$!1 $!0 $!2 0 =>
' ?? >! 2 ,
?@$"1 $"0 0 $"2 A>>

assumindo que o parâmetros são tais que o posto é 2. Portanto, iii é super identificada.

b. Se !2 ! 0 , a equação ii torna-se subidentificada.


Para ver melhor isso, vamos reescrever o modelo em forma matricial

53
51 0 $!1 6 5 qs 6 5$!0 $!2 0 6 5 1 6 5 #s 6
7 87 8 7 87 8 7 8
7 0 1 $"1 8 7 qd 8 " 7$"0 0 $"2 8 7 w8 ! 7 #d 8 .
7 87 8 7 87 8 7 8
771 $1 0 88 77 p 88 77 0 0 0 8:8 797 y 8:8 797 0 8:8
9*&&&&&&+&&&&&&,: )
9 : 9*&&&&&&&&+&&&&&&&
&, ) )
!B !y !S !x !#

Calculando a inversa de B temos:


<$"1 !1 !1 =>
?? >
B$1 !
1 ??$"1 !1 "1 >> ,
!1 $ "1 ?? >>
?@ $1 1 1 >>A

com a condição de completude dada por !1 # "1 .


Dessa forma, obtemos:
5 qs 6 <$"1 !1 !1 >=5!0 !2 0 6 5 1 6 5 #s 6
7 8 ?? >7 87 8 7 8
7 qd 8 ! 1 ??$"1 !1 "1 >> 7 "0 0 "2 8 7 w8 " 7#d 8 !
7 8 ? >> 7 87 8 7 8
77 p 88 !1 $ "1 ??@ $1 1 1 >>A 77 0 0 0 88 77 y 88 77 0 88
9 : 9 :9 : 9 :
<$"1!0 " "0!1 $"1!2 "2!1 => 5 1 6 5 #s 6 ,
1 ??? >> 7 8 7 8
! ??$"1!0 " "0!1 $"1!2 "1!1 >> 77 w88 " 77 #d 88
!1 $ "1 ? >
?@ $!0 " "0 $!2 "2 A>> 797 y 8:8 797 0 8:8
*&&&&&&&&&&&&&&&&&+ &&&&&&&&&&&&&&&&&&,&
! B$1STR

Se !2 ! 0 , então a segunda coluna inteira de R desaparece. Em outras palavras, R seria


singular. Isto significa que o clima não tem qualquer efeito sobre a oferta ou a demanda.
Para testar, podemos pensar no teste de Wald, especificado da seguinte maneira, usando o
operador Vec13:

13
O operador Vec transforma todos os elementos da matriz em um único vetor (ver detalhes em
LÜTKEPOHL, Helmut. Introduction to Multiple Time Series Analysis, 2.nd ed. Springer-Verlag: Berlim,
1993).

54
H 0 : R3&9 R9&1 ! q0
5 -11 6
7 8
7 -12 8
7 8
7- 8
7 13 8
5 0 1 0 0 0 0 0 0 06 77 -21 88 5 06
7 8 7 8.
7 0 0 0 0 1 0 0 0 08 77 -22 88 ! 7 08
7 8 7 8
77 0 0 0 0 0 0 0 1 088 77 - 88 77 088
9 : 23 9 :
7 8
-
7 31 8
7 8
7 -32 8
7 8
797 -33 8:8

O teste de Wald, por sua vez, será dado por:

$1
< =>
) ??

W ! RR $ q0 ?? )( R var R ) '(
ˆ >
R )>>> RR' (
ˆ $q .
*&&&&+&&&&, ???3&9 *&&+&&, 9&3>> *&&&+&&&,
0

1&3 @ 9&9 A 3&1

Rejeitamos a hipótese nula se:


W . ,+2!3'95%( .

c. Não se pode determinar isso porque aquele coeficiente depende da estimativa de


outras equações.
d. Agora não há mais problema de simultaneidade. Pode-se usar uma regressão
aparentemente não correlacionada para estimar o modelo.

8.3 Responda as seguintes questões:


a. Quais são os métodos de estimação de equações simultâneas?;
b. Apresente as condições em que os métodos são equivalentes entre si, ordenando os
vários métodos em termos de consistência e eficiência.
Solução: Este é um exercício que procura sistematizar tudo o que foi aprendido no
capítulo.
a. Métodos de estimação com informação limitada, ou seja, quando se estima equação
por equação: variável instrumental (VI), mínimos quadrados a dois estágios (MQ2S),

55
mínimos quadrados indiretos (MQI), máxima verossimilhança com informação
limitada (MVIL).
Métodos com informação plena: Máxima verossimilhança com informação plena (MVIP),
mínimos quadrados a três estágios (MQ3S).
Note que a estimação de MVIP é feita usando-se máxima verossimilhança factível (MVF).
b. No caso de informação limitada, se uma equação é exatamente identificada, então VI
= MQI = MQ2S = MVIL.
Se há superidentificação, o método MVIL é melhor que VI, que é mais eficiente que
MQ2E e que MQI. Se, ainda, não houver heterocedasticidade e autocorrelação, então VI =
MQ2S = MVIL.

No caso de informação plena, com exata identificação de todas as equações, então: MQ2S
= MQ3S = MVIL = MVIP.
Quando a equação de interesse é superidentificada, mas todas as outras equações são
exatamente identificadas, então: MVIL = MVIP e MQ2S = MQ2S.
Se a hipótese de normalidade é correta, MVIP, estimado por MVF, é consistente,
assintoticamente normal e assintoticamente eficiente.
Se não há restrições de covariância, então MQ3S e MVIP são assintoticamente
equivalentes e assintoticamente eficientes. Com restrições de covariância, MVIP é mais
eficiente que MQ3S

Em resumo, a seguinte tabela é válida, onde H representa heterocedasticidade e A,


autocorrelação.

- Maior Consistência
Sem H e A Com H e/ou A U
Informação Limitada MQI, IV MQ2S < MVIL
Informação Plena MQ3S<MVIP Maior Eficiência

8.4 (K) Considere o modelo de equações simultâneas:

56
122 y1 ! !1 y2 " #1
3 ,
224 y2 ! !2 y1 " "1 x1 " "2 x2 " #2

onde
5 1 06 53 56
X )X ! 7 8 ; X )Y ! 7 8.
79 0 18: 795 18:

Quais são as estimativas de MQ2S dos parâmetros identificáveis?


Solução: Este é um exercício numérico, sem grandes dificuldades (basta ver a matriz
identidade para X’X), que retoma vários conceitos simultaneamente, inclusive a
álgebra matricial. Procura medir o grau de aprendizagem do aluno, levantando
alguns detalhes importantes.
Da primeira equação podemos ver duas variáveis exógenas excluídas e duas endógenas
incluídas. Logo !1 é candidato superidentificação. A segunda equação não tem variáveis
exógenas excluídas, donde se conclui que é subidentificada.
O primeiro detalhe a ser notado é o significado X’Y, onde a primeira coluna é X’y1 e a
segunda, X’y2.
Substituindo a primeira equação na segunda temos:

y2 ! !1!2 y2 " "1 x1 " "2 x2 " #2 " !2 #1 -


"1 "2 # " !2#1
y2 ! x1 " x2 " 2 -
$&+&&
1*&& !1!&2, $&+&&
1*&& !1!&2, 1 $ ! !
*&&&+&&&
1 2,
!-1 !-2 !.

y2 ! -1 x1 " -2 x2 " ..
Podemos encontrar agora o
$1
ŷ2 ! X ' X )X ( X )y2 .

Com isso, podemos obter a estimativa de !1 , por mínimos quadrados a dois estágios:
$
!ˆ1 ! ' yˆ 2) yˆ 2 ( yˆ 2) y1 ! 57 y2) X ' X )X ( X )X ' X )X ( X )y2 68 y2) X ' X )X ( X )y1 !
$1 $1 $1 1 $1

9 :
$
5 y ) X X )X $1 X )y 6 y ) X X )X $1 X )y .
1

79 2 ' ( 28
: 2 ' ( 1

Agora, é só substituir pelos valores apropriados. Por simplicidade, não incluímos X’X, que
é uma identidade.

57
$1
< 556 = 536 21
!ˆ1 ! ???M5 1N 7 8 >>> M5 1N 7 8 ! .
?@ 7918: >A 7958: 26

58
9. Análise de Séries de Tempo

9.1 Considere verdadeira a seguinte afirmação: Seja {zt} uma seqüência de variáveis
aleatórias i.i.d N(0,1), então {zt} é (estritamente) estacionária.
a. Qual a hipótese básica do resultado acima? Por quê?
b. Pode-se afirmar que estacionaridade é um reforço à hipótese de distribuição idêntica?
c. Pode-se afirmar que a hipótese de estacionaridade sobre um série qualquer é mais fraca
do que a hipótese i.i.d.? Por quê?
Solução: Este é um exercício para verificar se o aluno entendeu o uso e a necessidade
do conceito de estacionaridade, fundamental no tratamento de séries temporais.
a. A hipótese de independência é crucial. Se {zt} é simplesmente identicamente
distribuídas como normais-padrão, a seqüência não é, necessariamente, estacionária,
pois é possível construir diferentes distribuições conjuntas com distribuições
marginais normal. Se a distribuição conjunta muda com o tempo, poderíamos violar a
condição de estacionaridade, preservando a normalidade marginal.
b. Assim, estacionaridade é uma hipótese mais forte à distribuição idêntica, já que ela se
aplica a distribuições conjuntas e marginais simultaneamente.
Por outro lado, estacionaridade é uma hipótese mais fraca do que a hipótese i.i.d., já que
seqüências i.i.d. são estacionárias, mas seqüências estacionárias não precisam ser
independentes necessariamente.

9.2 Defina Processo Estocástico. Explique o significado de processo estocástico e ilustre


graficamente. O que é a realização de um processo estocástico? Por que as séries
econômicas podem ser entendidas como sendo geradas por processos estocásticos?
Solução: Este é um exercício para reforçar os conceitos introdutórios apresentados no
corpo do texto. Aqui, somos mais formais e detalhistas que o texto, pois esperamos que
o estudante tenha curiosidade suficiente para consultar outras fontes sobre este
assunto.
Seja uma seqüência temporal de valores que não podem ser previstos, mas com
probabilidades que podem se associadas a cada um dos diferentes valores a qualquer tempo
particular, temos então um processo estocástico.

59
Formalmente: Suponha-se um determinado espaço amostral de um dado experimento.
Considere-se, também, os possíveis subconjuntos desse espaço amostral. Além disso,
associe-se a cada um desses eventos uma probabilidade. Definindo-se a função
X ';,;( : S &T H V , onde S representa o espaço amostral e T, o tempo, ter-se-á um processo

estocástico.
Para cada t W T , X ';, t ( , tem-se uma variável aleatória nos espaço amostral, isto é, no tempo

definido, existe uma distribuição de probabilidade par aquela variável. Para cada
s W S , X ' s, ;( , tem-se uma função de t que se chama realização de um processo. X(s, t), para

dado s e t, é apenas um número real. A ilustração gráfica é dada na figura 9.1.


O problema prático que nos defrontamos é termos apenas a realização de um processo
estocástico para cada período de tempo, dos quais teríamos que deduzir os valores da média
e variância em cada instante de tempo, bem como das covariâncias. Mas, obviamente, dado
que temos menos observações do que o número de informação que gostaríamos de obter,
temos que impor restrições razoáveis que nos permitam trabalhar com a série disponível.
As séries de tempo podem ser decompostas em quatro elementos: tendência, ciclo,
sazonalidade e componentes irregulares. Tendência, ciclo e sazonalidade não serão simples
funções determinadas do tempo. Ao contrário, é típico encontrar-se elementos estocásticos
nesses componentes. Por isso, séries econômicas podem ser entendidas como sendo geradas
por processos estocásticos. É por isso, também, que se pode dizer que uma série de tempo é
uma coleção de observações geradas seqüencialmente no tempo.

9.3 Qual a razão de se impor restrições sobre a heterogeneidade temporal e sobre a


memória de um processo estocástico?
Solução: Este exercício verifica se o aluno compreendeu o problema que existe em
estimar séries temporais, indo aos pontos fundamentais da questão.
Um processo estocástico é temporalmente heterogêneo, o que significa que possui
momentos distintos a cada instante de tempo (pois, o processo gerador daquele evento pode
ser diferente a cada instante de tempo, como já se viu). Disso surge uma grande dificuldade
para modelar fenômenos reais, porque, usualmente, temos apenas uma observação para
cada t.

60
Em outras palavras, temos que estimar uma número de parâmetros maior que o número de
observações, o que é impossível. Por isso, temos que impor certas restrições para reduzir o
número de parâmetros a serem estimados. Essas recaem sobre a heterogeneidade temporal e
sobre a memória do processo.
i. Restrições sobre a heterogeneidade temporal – reduz o número de parâmetros a
serem estimados. Implica estacionaridade fraca ou restrita. Por exemplo, estabiliza
num mesmo nível a média e a variância, assumindo que todas as observações têm
mesma média e mesma variância;
ii. Restrições sobre a memória – espera-se que a dependência entre x(t1) e x(t2)
enfraqueça conforme a distância t2 – t1 cresça. Para isso, usamos a seguinte
definição:
Um processo estocástico Eu 't ( , t W T F é dito assintoticamente não correlacionado se existe

uma seqüência de constante E' '0 ( , 0 0 1F , definidas por

Cov 59u 't ( , u 't " 0 (6:


B ' ' 0 ( , Xt W T ,
Var 59u 't (6: Var 59u 't " 0 (6:

tal que
a. 0 B ' '0 ( B 1 e;
L
b. % ' '0 ( / L - lim ' '0 ( ! 0 .
0 !1
0 HL

Com isso, podemos fazer inferências estatísticas, a partir de nossas estimativas.

Os exercícios a seguir seção são apenas indicativos, dependendo do grau de


aprofundamento dado em sala de aula pelo instrutor.

9.4 Qual a diferença entre estacionaridade forte (ou estrita) e estacionaridade (fraca). Dê
exemplos mostrando quando uma implica a outra, e quando uma não implica a outra.
Solução: Embora no texto não tenho sido apresentada a definição de estacionaridade
forte, apresentamo-la aqui, comparando-a com a fraca. O resultado mais importante é

61
mostrar que estacionaridade forte não implica estacionaridade fraca, como o nome
poderia sugerir.
Estacionaridade forte (ou estrita) implica que a função de probabilidade acumulada
conjunta da série é igual para qualquer instante de tempo. Formalmente isso significa:
FX 't1 (, X 't2 (,#, X 'tn ( ' x1 , x2 , #, xn ( ! FX 't1 "k (, X 't2 "k (,#, X 'tn " k ( ' x1 , x2 ,#, xn ( ,

onde
F(.) é a função densidade de probabilidade acumulada,
X(.) é uma variável aleatória,
x(.) é a realização dessa variável.

Estacionaridade fraca implica que os momentos da série até ordem m são coincidentes a
cada instante, isto é:

E 57E X 't1 (F , E X 't2 (F ,#, E X 'tn (F 68 ! E 57E X 't1 " k (F , E X 't2 " k (F ,#, E X 'tn " k (F 68
m1 m2 mn m1 m2 mn

9 : 9 :
Se, por exemplo, x(ti) tem uma distribuição de Cauchy, não terá momentos finitos, porque
logo o primeiro momento, m1 não existe. Mas a função densidade de probabilidade
conjunta é invariante com relação ao tempo. Neste caso, então, estacionaridade forte (ou
estrita) não implica estacionaridade fraca.
d d
Por outro lado se x 'ti (# x 'ts ( , s # i , onde # significa distribuição diferente, porém os

momentos de x(ti) são iguais aos de x(ts), estão existe estacionaridade, mas não haverá
estacionaridade forte se a distribuição conjunta não for invariante com relação a t.

Se os momentos de xt existem até ordem 1, estacionaridade estrita implica estacionaridade


fraca até ordem 1. Para ver isso, note que:
E 597E X 't1 (F , E X 't2 (F ,#, E X 'tn (F6:8 ! E 597E X 't1 " k (F , E X 't2 " k (F , #, E X 'tn " k (F6:8 ,

logo para n = 1 e k = 1, temos

E 59 X 't1 (6: ! E 59 X 't2 (6: - E 59 X 't2 (6: ! E 59 X 't3 (6: .

Assim, por indução:

62
E 59 X 't1 (6: ! E 59 X 't1 (6: ! " ! E 59 X 'tn (6: .

Para n = 2 e k = 1, temos

E 59 X 't1 ( , X 't2 (6: ! E 59 X 't2 ( , X 't3 (6: ,

e por indução, concluímos que pela estacionaridade fraca.


Para n = 2 e k = 2, temos
E 59 X 't1 ( , X 't2 (6: ! E 59 X 't3 ( , X 't4 (6: ! E 59 X 't2 ( , X 't3 (6: ,

e por indução, concluímos que pela estacionaridade fraca.


Repetindo sucessivamente esse procedimento, provamos a afirmação.

Se {xt} é um processo gaussiano (= normal), então essa seqüência é estritamente


estacionário, pois é completamente caracterizada pelos dois primeiros momentos.

9.5 Mostre que o processo “passeio aleatório” y t = y t −1 + ε t é um movimento browniano em


tempo discreto quando ε t tem distribuição normal.
Sugestão: Consulte Spanos (1986).
Solução: A compreensão da resolução deste exercício pressupõe conhecimento de
processos brownianos.
Um processo estocástico Eu 't ( , t W T F é dito ser um processo ruído branco se:

i. E(u(t)) = 0;
12( 2 , se t ! 0
ii. E 59u 't ( , u '0 (6: ! 23 .
224 0, se t # 0

Com isso, y t = y t −1 + ε t será um passeio aleatório (“random walk”) e yt $ yt$1 ! #t , um


ruído branco, facilmente demonstrável.
5 t 6
E 597 yt2 6:8 ! E 77 % # j 88 ! t( 2 ;
97 j!1 :8
5 t m/t 6
E M yt ym N ! E 77 % # j % #i 88 ! m( 2 .
97 j!1 i!1 :8
Em particular, para m = t – s:

63
5 t m 6
E M yt yt$s N ! E 7 % # j % #i 8 ! 't $ s ( ( 2 .
7 j!1 i!1 8
97 :8
Ou seja, o processo é estacionário com incrementos independentes. Além disso, os
incrementos são normalmente distribuídos, pois #t ! N '0, ( 2 ( . Logo, passeio aleatório é

um movimento browniano, cuja distribuição é N '0, t ( , dada por quando #t ! N '0, ( 2 ( .

64
10. Metodologia de Box-Jenkins para Modelos Univariados

10.1 Responda:
a. Por que o processo de construção de Modelos ARIMA pode ser considerado um ciclo
iterativo, como afirmam Granger e Newbold?
b. Quais os principais instrumentos utilizados na identificação de um modelo ARIMA?
Por que essa é a etapa mais difícil para o pesquisador?
Solução:
a. O processo de construção de Modelos ARIMA constitui-se de 4 partes: identificação,
estimação, verificação e previsão. Se na verificação há problemas, volta-se à
identificação;
b. FAC e FACP, complementado pelo teste de Ljung-Box. Esta etapa é difícil, porque se
trabalha com resultados amostrais, o que dificulta a análise. Pode-se usar o critério
AIC e BIC, para a identificação, tomando-se aquele modelo que gerar o menor valor
para essas estatísticas.

10.2 Responda
a. Mostre algebricamente como um processo AR(2), com raízes fora do círculo unitário é
expresso como um MA( ∞) ;
b. Escreva um MA(1) sob a forma de um AR( ∞) ;
c. Por que as raízes do processo MA devem estar fora do círculo unitário?
Solução: O exercício treina, algebricamente os conceitos estudados no capítulo. Trata-
se de entender que toda série de tempo, se inversível ou estacionária, pode ser
reduzida a um processo com coeficientes finitos, mesmo que o número de termos seja,
inicialmente e aparentemente, infinito.
a. Seja yt ! +1 yt$1 " +2 yt$1 " #t , então temos:

#t
yt '1$ +1 L " +2 L2 ( ! #t - yt ! , onde
'1$ b1L('1$ b2 L(
+1 ! b1 " b2 ;
+2 ! b1b2.
Notando que:

65
$1
'1$ bi L( ! 1 " bi L " bi2 L2 "#,
por se tratar de uma progressão geométrica infinita de razão, em módulo, menor do que um,
temos:
L

%b #j !1
j
1 t$ j

yt ! .
'1$ b2 L(
Logo yt é um MA( ∞) .
b. Seja yt ! #t " )#t$1 . Assim, temos;

yt
! #t - yt '1 " ) L " ) 2 L2 " #( ! #t -
1$ ) L
L
yt ! $% ) i Li " #t - yt ! AR 'L(.
i !1

c. As raízes do processo de médias móveis devem estar fora do círculo unitário para que
o processo yt seja unicamente identificado e inversível.
10.3 Verifique se os modelos abaixo são estacionários e/ou inversíveis, em que L é o
operador defasagem.
a. (1 − L) yt = (1 − 0,5 L)εt ;
b. (1 + 0,8 L) y t = (1 − 1,2 L)εt ;
c. (1 − 0,7 L + 0,4 L ) y
2
t = (1 − 0,5 L)εt ;

d. (1 − 0,7 L − 0,4 L ) y = (1 − 1,6 L + 0,7 L )ε ;


2
t
2
t

e. (1 + 0,9 L) yt = (1 + 0,5 L + 0,4 L2 + 0,3 L3 )ε t


Solução: Este um exercício numérico, para verificar se o aluno compreendeu os
conceitos de estacionaridade e inversão. O principal é entender as expressões fora e
dentro do círculo unitário, pois devem ser cuidadosamente entendidas. Às vezes foram
e dentro do círculo unitário representam a mesma coisa, conforme esteja definida a
polinomial, pela qual se calculam as raízes da equação a diferenças.
a. Primeiro é preciso entender que L é um operador, logo não se podem fazer contas
usando L. Nesse caso, o truque é simples, troque L por uma variável qualquer,
digamos, z. Assim temos,
1$ z ! 0 - z ! 1 , logo não estacionário.

66
1$ 0, 5 z ! 0 - z ! 2 , logo, como z está fora do círculo unitário, o processo é
inversível.
b.
1 " 0,8 z ! 0 - z ! $1, 25 , outra vez, por ser, em módulo, maior que 1, o processo
estacionário.
5
1$1, 2 z ! 0 - z ! / 1 , logo não inversível.
6
c.
1
1$ 0, 7 z " 0, 4 z 2 ! 0 . Fazendo z ! , temos x 2 $ 0, 7 x " 0, 4 ! 0 , o que nos dá as
x
12 0, 7 " 1, 05i
22 x1 !
seguintes raízes: 23 2 . O módulo de um número complexo a + bi é dado por
22 0, 7 $1, 05i
22 x2 !
24 2

a2 " b2 .

Ambas as raízes terão o mesmo módulo, dado por: 0,352 " 0,5252 ! 0, 631 / 1 . Assim,
estando o módulo dentro do círculo unitário (como invertemos as variáveis, temos que
inverter o raciocínio), o processo é estacionário.
1$ 0, 5 z ! 0 - z ! 2 , então o processo é inversível.
d.
1$ 0, 7 z $ 0, 4 z 2 ! 0 . Adotando o mesmo procedimento do item anterior,

21 x1 ! 1, 0728
encontramos 23 . Ora, a primeira raiz está fora do círculo unitário, logo
224 x2 ! $0,3728

processo não estacionário.


$1, 6 Y 1, 05i
1$1, 6 z " 0, 7 z 2 ! 0 . A inversa das raízes são x ! , cujo módulo é
2

dado por 0,82 " 0, 2452 ! 0,836 / 1 , que é inversível.


e.
10
1 " 0,9 z ! 0 - z ! $ . 1 - estacionaridade.
9

67
12 z1 ! $1,597
22
1 " 0,5 z " 0, 4 z 2 " 0, 3z 3 ! 0 . As raízes dão: 3 z2 ! 0,132 " 1, 438i . Essas raízes
22
224 z3 ! 0,132 $1, 438i
estão obviamente fora do círculo unitário, logo a condição de inversibilidade está
satisfeita14.
10.4 Prove que na previsão para s passos à frente do modelo

(y t − µ ) = α ( y t −1 − µ ) + εt − βεt −1 ,εt ~ i .i. d .(0,σ 2 ) :

a. #ˆt "s ! ' yˆt "s $ *( ! ! s ' yt $ *( $ ! s$1"#t ;

1$ 2!" " " 2


b. Var '#ˆt "s ( ! ( 2 , quando s tende para o infinito.
1$ ! 2
Solução: Este é um exercício que procura esclarecer um pouco por que a previsão
mais distante no tempo é pior do que a mais recente, e notar que a variância é a
mesma no longo prazo. Na verdade, isto ocorre porque a variância de longo prazo é a
variância não condicional.
a. Apenas álgebra. Primeiro, chamemos xt ! yt $ * , para descarregar a notação.

xt "1 ! ! xt " #t "1 $ "#t - E ' xt "1 yt ( ! xˆt "1 ! ! xt $ "#t ;


xt "2 ! ! xt "1 " #t "2 $ "#t "1 - E ' xt "2 yt ( ! ! xˆt "1 ! ! 2 xt $ !"#t ;
/
xt "s ! ! xt "s$1 " #t "s $ "#t "s$1 - E ' xt "s yt ( ! ! xˆt "s$1 ! ! s xt $ ! s$1"#t .

Provando o que gostaríamos.


b. Aqui apenas temos que cuidar da álgebra, que é carregada.

14
O cálculo de um polinômio do terceiro graus não é simples. Sugiro usar um programa como Mathematica
ou Matlab para obter o resultado.

68
Var '#ˆt "s ( ! E 59' yt "s $ *($ ' yˆt "s $ *(6: ! E M xt "s $ xˆt "s N .
2 2

xt "s ! ! xt "s$1 " #t "s $ "#t "s$1 ! ! '! xt "s$2 " #t "s$1 $ "#t "s$2 ( " #t "s $ "#t "s$1 !
! ! 2 xt "s$2 " #t "s $ "#t "s$1 " !#t "s$1 $ !"#t "s$2 !
! ! 2 xt "s$2 " #t "s " '! $ " ( #t "s$1 $ !"#t "s$2 !
! ! 2 '! xt "s$3 " #t "s$2 $ "#t "s$3 ( " #t "s " '! $ " ( #t "s$1 $ !"#t "s$2 !
! ! 3 xt "s$3 " #t "s " '! $ " ( #t " s$1 " ! '! $ " ( #t "s$2 $ ! 2 "#t "s$3 !
/
s$2
! ! s xt "s " #t "s " '! $ " ( % ! j #t "s$ j$1 $ ! s$1"#t "s$3 .
j !0

Obtida a fórmula acima, calculemos a variância:


5 6 5 6
2
s$2 s$2
Var '#ˆt "s ( ! E 77 #t "s " '! $ " ( % ! j #t "s$ j$1 88 ! ( 2 771 " '! $ " ( % ! 2 j 88 !
2

97 j !0 :8 97 j !0 :8
5 1$ ! 2 s $2 6
! ( 2 71 " '! $ " ( ;1; 8-
2

7 1 $ ! 2 8
9 :
51$ ! " ! 2 " 2!" " " 2 6
2 5
2 1 " 2!" " "
26
lim Var '#ˆt "s ( ! ( 2 7 8 ! ( 7 8 , pois
sHL 7 1 $ ! 2 8 7 1$ ! 2 8
9 : 9 :
lim ! 2 s$1 ! 0.
sHL

69
11. Modelos de Função de Transferência e de Análise de
Intervenção

11.1 Determine a covariância cruzada do processo bivariado discreto (Xt, Yt) onde:
X t ! Z1,t " "11Z1,t$1 " "12 Z 2,t$1 ,
Yt ! Z 2,t " "21Z1,t$1 " "22 Z 2,t$1 ,

e {Z1,t} e {Z2,t} são processos puramente aleatórios com média zero e variância σ 2 .
Assim, avalie o espectro cruzado15.
Solução: O exercício serve para mostrar por que as covariâncias cruzadas não são
simétricas, como no caso de autocovariâncias.
Vamos calcular a função de covariância cruzada, lembrando que a covariância entre Z1 e Z2
é nula, por serem processos puramente aleatórios.
$ xy 'k ( ! E ' X tYt$k ( ! E ' Z1,t Z 2,t$k ( " "21 E ' Z1,t Z1,t$1$k ( " "22 E ' Z1,t Z 2,t$1$k ( "
*&&&&&+&&&&&, *&&&&&+&&&&&,
!0 !0

""11 E ' Z1,t$1Z 2,t$k ( " "11"21E ' Z1,t$1Z1,t$1$k ( " "11"22 E ' Z1,t$1Z 2,t$1$k ( "
*&&&&&+&&&&&, *&&&&&&+&&&&&&,
!0 !0

"12 E ' Z 2,t$1Z 2,t$1$k ( " "12 "21 E ' Z 2,t$1 Z1,t$1$k ( " "12 "22 E ' Z 2,t$1Z 2,t$1$k (.
*&&&&&&+&&&&&&,
!0

Portanto,
$ xy 'k ( ! "21 E ' Z1,t Z1,t$1$k ( " "11"21E ' Z1,t$1Z1,t$1$k ( "
""12 E ' Z 2,t$1Z 2,t$1$k ( " "12 "22 E ' Z 2,t$1Z 2,t$1$k (.

Agora, encontremos a função de covariância cruzada:


$ xy '0( ! ( 2 '"11"21 " "12"22 (;
$ xz '1( ! ( 2 "12 ;
$ xy '$1( ! ( 2 "21 ;
$ xy ' k . 1( ! 0.

Note como a covariância cruzada não é simétrica.


Apenas para completar, o espectro cruzado é dado por:

15
Não é obrigatório resolver esta parte da questão.

70
1
hxy '1 ( ! g xy ' z ( , z ! e$i1 , $- / 1 / - -
2-
1
g xy ' z ( ! %z $
k !$1
k
xy 'k ( -
(2
hxy '1 ( !
2-
' "11"21 " "12"22 " "12e$i1 " "21ei1 (.

11.2 (B&D) Seja {Yt} um série de tempo com média zero estacionária. Defina:
X t = Yt − 0,4Yt −1
.
Wt = Yt − 2 ,5Yt −1
a. Expresse a função de autocovariância de {Xt} e {Wt} em termos da função de
autocovariância de {Yt};
b. Mostre que {Xt} e {Wt} têm a mesma função de autocorrelação;
L
c. Mostre que o processo U t ! $% 0, 4 j X t " j satisfaz a equação a diferenças
j !1

U t $ 2,5U t$1 ! X t .
Solução: O exercício treina o conceito do operador avanço e mostra que séries
inversíveis têm a mesma autocovariância. Ou seja, para médias móveis, podemos ter
duas representações alternativas com mesma autocovariâncias. Assim, impomos a
condição de inversibilidade, apenas para unificar os processos de médias móveis
válidos.
a. Achemos a autocovariância de cada uma dessas variáveis.

E ' X t2 ( ! E 'Yt $ 0, 4Yt$1 ( ! E 'Yt 2 ( $ 0,8E 'YtYt$1 ( " 0,16 E 'Yt$2 1 ( ! 1,16$Y '0( $ 0,8$Y '1(;
2

E ' X t X t$1 ( ! E 59'Yt $ 0, 4Yt$1 ('Yt$1 $ 0, 4Yt$2 (6: !


! $Y '1( $ 0, 4$Y '2( $ 0, 4$Y '0( " 0,16$Y '1( ! 1,16$Y '1( $ 0, 4 59 $Y '0( " $Y '2(6: ;
E ' X t X t$2 ( ! E 59'Yt $ 0, 4Yt$1 ('Yt$2 $ 0, 4Yt$3 (6: !
! $Y '2( $ 0, 4$Y '3( $ 0, 4$Y '1( " 0,16$Y '2( ! 1,16$Y '2( $ 0, 4 59 $Y '1( " $Y '3(6: ;
/
E ' X t X t$k ( ! 1,16$Y 'k ( $ 0, 4 59 $Y 'k $1( " $Y 'k " 1(6: .

Agora, a outra série:

71
E ' X t2 ( ! E 'Yt $ 2,5Yt$1 ( ! E 'Yt 2 ( $ 2 E 'YtYt$1 ( " 6, 25 E 'Yt$2 1 ( ! 7, 25$Y '0( $ 2$Y '1(;
2

E ' X t X t$1 ( ! E 59'Yt $ 2,5Yt$1 ('Yt$1 $ 2,5Yt$2 (6: !


! $Y '1( $ 2,5$Y '2( $ 2,5$Y '0( " 6, 25$Y '1( ! 7, 25$Y '1( $ 2,5 59 $Y '0( " $Y '2(6: ;
/
E ' X t X t$k ( ! 7, 25$Y 'k ( $ 2,5 59 $Y 'k $1( " $Y 'k " 1(6: .

b. As funções de autocorrelação de cada uma das variáveis são dadas por:


1,16$Y 'k ( $ 0, 4 59 $Y 'k $1( " $Y 'k " 1(6:
' X 'k ( ! ;
1,16$Y '0( $ 0,8$Y '1(
7, 25$Y 'k ( $ 2,5 59 $Y 'k $1( " $Y ' k " 1(6:
'W 'k ( ! .
7, 25$Y '0( $ 2,5$Y '1(

Para verificar que ambas são iguais, note que multiplicando numerador e denominador da
primeira equação por 6, 25 ! 7, 25 1,16 , obtemos exatamente a segunda equação, pois
0, 4& 6, 25 ! 2,5 e 0,8& 6, 25 ! 5 .
c. Aqui, devemos apenas usar o operador defasagem e fazer as contas.
L
Ut
U t ! % $0, 4 j X t " j - L
! Xt .
j !1
$% 0, 4 L j $j

j !1

Mas,
L
0, 4 L$1 <1$ 0, 4 L$1 =>
$% 0, 4 j L$ j ! $ - X ! $ ?? >U ! U t $ 2,5U t$1 .
j !1 1$ 0, 4 L$1 t
?@ 0, 4 L$1 >>A t

Note que aqui usamos o operador avanço, pelo qual L–1Xt= Xt+1.
11.3 (E) Seja o modelo função de transferência
yt ! 0,5 yt$1 " zt " #t ,
zt ! 0,5 zt$1 " #z ,t .

a. Derive a função de autocorrelação cruzada entre a seqüência filtrada {yt} e a seqüência


e a seqüência E#z ,t F ;

b. Se supusermos
yt ! 0,5 yt$1 " zt " 0,5 zt$1 ,
zt ! 0,5 zt$1 " #z ,t .

72
Derive as autocovariâncias cruzadas entre a seqüência filtrada {yt} e a seqüência e a
seqüência E#z ,t F .

c. Mostre que as primeiras duas autocovariâncias cruzadas são proporcionais aos


coeficientes da função de transferência.
d. Mostre que a covariância cruzada decai a uma taxa de 0,5.
Solução: Este é um exercício simples que introduz o conceito de filtragem de uma
série, servindo para reforçar o conceito de covariância cruzada com alguns modelos
alternativos.
a. A seqüência filtrada só tem o nome difícil. Vamos mostrar como ela é. Primeiro,
substituamos zt:
#z ,t
'1$ 0,5L( zt ! #z ,t - zt ! .
1$ 0,5L
Agora, substituindo:
# z ,t
yt ! 0, 5 yt$1 " " #t - '1$ 0,5 L( yt ! 0,5 '1$ 0,5L ( yt$1 " #z ,t " '1$ 0,5L ( #t .
1$ 0,5L *&&&&&+&&&&&,
y f ,t $serie filtrada

A série filtrada é, portanto yf,t = (1 – 0,5L)yt . Assim temos:


y f ,t ! 0,5 y f ,t$1 " #z ,t " '1$ 0,5L ( #t .

Podemos, encontrar facilmente a correlação cruzada multiplicando a equação acima por #z ,t

e tomar as esperanças, notando que E '#t #z ,t$k ( ! 0, Xk . Então, obtemos:

E ' y f ,t #z ,t ( ! (#2z ;
E ' y f ,t #z ,t$1 ( ! 0,5(#2z ;
E ' y f ,t #z ,t$2 ( ! 0,52 (#2z ;
/
E ' y f ,t #z ,t$k ( ! 0,5k (#2z .

Calculemos agora a variância de yf,t:

73
'1$ 0, 5L( y f ,t ! #z ,t " '1$ 0,5L( #t -
#z ,t
y f ,t ! " #t -
1$ 0, 5L
y f ,t ! '1 " 0,5 L " 0,52 L2 " #( #z ,t " #t -
(#2z 4
Var ' y f ,t ( ! '1 " 0,5 " 0,5 " #( ( " ( !
2 4 2
#z
2
" ( 2 ! (#2z " ( 2 .
1$ 0, 25 3
Com essas informações podemos calcular a correlação cruzada requerida:
0,5k (#z
' yz 'k ( ! .
4 2
(# " ( 2
3 z

b. Procedemos da mesma forma que no item anterior.


1 " 0,5 L
yt ! 0,5 yt$1 " '1 " 0,5L ( zt " #t ! 0,5 yt$1 " #z ,t " #t -
1$ 0,5 L
'*&&&&
1$ 0,5 L( yt ! 0,5 '1$ 0,5 L( yt$1 " '1 " 0,5 L( #z ,t " '1$ 0,5L( #t -
&+&&&&&,
y f ,t $serie filtrada

1 " 0,5 L
y f ,t ! #z ,t " #t ! '1 " 0,5 L " 0,52 L2 " "('1 " 0,5L ( #z ,t " #t !
1$ 0,5 L
! '1 " L " 0,5L2 " 0,52 L3 " "( #z ,t " #t .

Podemos, encontrar facilmente a correlação cruzada multiplicando a equação acima por #z ,t

e tomar as esperanças, notando que E '#t #z ,t$k ( ! 0, Xk . Então, obtemos:

E ' y f ,t #z ,t ( ! (#2z ;
E ' y f ,t #z ,t$1 ( ! (#2z ;
E ' y f ,t #z ,t$2 ( ! 0,5(#2z ;
/
E ' y f ,t #z ,t$k ( ! 0,5k $1 (#2z , k 0 1.

Calculemos agora a variância de yf,t:


y f ,t ! '1 " L " 0,5L2 " 0,52 L3 " "( #z ,t " #t -
Var ' y f ,t ( ! '1 " 1 " 0,52 " 0,54 " "( (#2z " ( 2 !
< 1 >= 2 7 2
! ??1 " > ( " ( ! (#z " ( .
2 2
?@ 1$ 0, 25 >A #z 3

74
Com essas informações podemos calcular a correlação cruzada requerida:
12 ( #z
22 , k /1
22 7 2
22 ( #z " ( 2
2 3
' yz 'k ( ! 223 .
22 0,5k $1 (#z
22 , k 01
22 7 2
22 ( #z " ( 2
24 3
c. Como as duas primeiras covariâncias cruzadas possuem o mesmo coeficiente, igual a
um, então é óbvio que são proporcionais aos coeficientes da função da transferência.
d. Claramente, pode ser ver que para k > 1, a função de covariância cruzada decais a uma
taxa de 0,5.

11.4 Explique por que os modelos de Análise de Intervenção são, em geral, mais flexíveis
que os modelos de regressão que utilizam variáveis dummy.
Solução: O exercício procura averiguar se o estudante entendeu, simultaneamente, os
modelos de análise de intervenção, bem como suas potencialidades.
Os modelos de análise de intervenção são mais flexíveis porque permitem que haja efeito
residual e efeito defasado, o que não ocorre com os modelos que utilizam dummy, onde há
apenas afeito abrupto, temporário ou permanente.
Em resumo os modelos de análise de intervenção são:
i. Início abrupto, com efeito permanente:
121 S 'T ( , t 0 T
Et ! 23 t$b .
22 0, t / T
4
ii. Início abrupto, com efeito temporário:
12 1
2 P' ( , T B t B T2
t

Et ! 231$ % B t 1 .
22
24 0, c.c
iii. Início gradual, efeito permanente:
12 1 S 't (
2 T ,t 0T
Et ! 231$ % B .
22
224 0, t / T
iv. Início gradual, com efeito temporário:

75
12 1
22 P' ( , T1 B t B T1
T

Et ! 31$ %1 B $ %2 B 2 t
.
22
224 0, c.c

v. Início abrupto, com efeito residual:


12 11
22 Pt' ( " 12 St'$b( , t 0 T
t T

Et ! 31$ % B .
22
24 0, t / T
Os modelos com dummy somente admitem início abrupto, com duração temporária ou
permanente, sem considerar o efeito residual e o início gradual.

11.5 Como se faz a identificação do ruído de um modelo de Análise de Intervenção?


Solução: Apenas deseja-se que o aluno tenha segurança quantos aos procedimentos de
identificação nesse tipo de modelo. Por isso, o exercício pede-lhe pense sobre o
assunto.
Existem duas maneiras. Na primeira estima-se o modelo com maior número de observações
possível, antes ou depois da intervenção. Obtêm-se, então, as ordens p e q do modelo
ARMA. Em seguida, estima-se o modelo todo, incluindo a intervenção, de acordo com
essas ordens já estabelecidas. Se a intervenção não alterou o comportamento da série, ou
resultou em mudanças de parâmetros, obter-se-ão resíduos com média zero e variância
constante. Se, porém, houve alguma mudança estrutural, é melhor utilizar o segundo
método, a seguir descrito.
Definem-se as intervenções, estima-se o modelo apenas com as dummy especificadas e
obtém-se o ruído. Identifica-se o ruído e reestima-se o modelo como um todo. Dever-se-á
obter um ruído branco. Caso isso não ocorra, duas alternativas são possíveis:
a. Altera-se o comportamento previsto das intervenções, para se obter um modelo mais
consistente;
b. Verificam-se os resíduos outra vez.

76
12. Testes de Raízes Unitárias e Co-Integração

12.1 Qual é a utilidade dos testes de raízes unitárias quando se trabalha com abordagem de
Box-Jenkins? Pode-se regredir uma série de tempo não estacionária contra outra série
de tempo não estacionária? No caso de se poder regredir, os testes sobre os
coeficientes são válidos?
Solução: O exercício avalia a compreensão do aluno com relação aos modelos de séries
temporais. Leva-o a compará-lo com o caso tradicional, nos quais a série pode ser
qualquer coisa. Alerta para a possibilidade de se estimar modelos, cujas séries são não
estacionárias, evitando-se que se esqueça dessa possibilidade.
A abordagem de Box-Jenkins pressupõe que a série seja estacionária, de tal sorte que
inferências estatísticas sejam válidas de acordo com as distribuições estatísticas
tradicionais. Caso a série não seja estacionária, testes estatísticos tradicionais deixam de ser
válidos. Assim, o teste de raiz unitária permite identificar uma série não estacionária, bem
com descobrir quantas diferenças devem ser empregadas para “estacionarizar” a série, de
modo que se possam fazer inferências sobre os parâmetros estimados.
Pode-se regredir uma série não estacionária contra outra, se tiverem mesma ordem de
integração, de tal sorte que o resíduo obtido seja integrado de ordem zero. Caso contrário, o
que se está a fazer é uma regressão espúria. Os dois gráfico abaixo, mostram a diferença de
uma regressão espúria de outra não espúria.

yt yt

t t
espúria legítima
O primeiro mostra uma regressão espúria, pois a diferença entre as séries, conforme o
tempo passa, cresce. Em regressões espúrias é comum encontrar coeficientes significantes
estatisticamente. Esta é mais uma razão de ser fazer o teste de cointegração, para evitar tais

77
problemas. A segunda série poderia apresentar uma regressão legítima, pois os erros não
crescem com o tempo. Nesse caso, os estimadores são superconsistentes, de modo que os
testes estatísticos continuam válidos.
12.2 Qual a seqüência de testes que deve ser realizada para verificar se uma série de
tempo yt, apresenta uma raiz unitária segundo a metodologia de Dickey e Fuller,
considerando que este teste tem problemas de poder? Por que esses testes não podem
ser aplicados para testar a presença de uma segunda raiz unitária? Como você definiria
a ordem de defasagem q.
Solução: Este é um exercício muito importante, pois avalia se o aluno realmente
entendeu o problema da raiz unitária e se ele sabe, efetivamente, fazer esse teste.
Há várias seqüências possíveis. Para o caso de uma raiz unitária, apresentamos a seguinte
seqüência, inspirada em Enders (1995), sempre imaginando um nível de significância de
5%.
Primeiro, definamos a equação de interesse.
q
yt ! * " $t " ! yt$1 " % % j Zyt$ j " ut , ut ! '0, ( 2 ( -
j !1
q
yt $ yt$1 ! Zyt ! * " $ t $ '1$ ! ( yt$1 " % % j Zyt$ j " ut .
j !1

Portanto, a equação mais geral possível é:


q
( 8 ) Zyt ! * " $ t " ' yt$1 " % % j Zyt$ j " ut .
j !1

Outras duas equações, menos gerais, também poderiam ser estimadas:


q
( 9 ) Zyt ! * " ' yt$1 " % % j Zyt$ j " ut .
j !1

q
( 10 ) Zyt ! ' yt$1 " % % j Zyt$ j " ut .
j !1

A soma dos quadrados dos resíduos dessas três equações são, respectivamente: SQR(1),
SQR(2) e SQR(3).
Dessa forma, testar H 0 : ! ! 0& H1 : ! / 0 é equivalente a testar:

78
H 0 : $'1$ ! ( T ' ! 0& H1 : ' / 0 ,

que é o que procederemos agora.

i. Passo 1 – Usando a equação ( 8 ), testamos inicialmente a seguinte hipótese


H 0 : ' ! 0& H 1 : ' / 0 ,

usando a estatística calculada por Dickey e Fuller: 0 0 .


Se rejeitamos a hipótese nula, neste modelo mais geral, certamente não existe raiz unitária.
No entanto se aceitamos, por problemas no poder desse teste, pode ser que estejamos
cometendo o erro do tipo II, por isso é preciso adotar procedimentos adicionais.
ii. Passo 2 – Admitindo que aceitemos a hipótese nula de existência de raiz unitária,
testamos a seguinte hipótese nula
H 0 : ' ! $ ! 0& H1 : ' / 0 [ $ # 0 .

Para testar essa hipótese, usamos a estatística de Dickey-Fuller: Q3 , onde

5 SQR '2( $ SQR '1(6


9 :
Q3 ! 2 ,
SQR '1(
T $3
onde T é o número de observações. Claro que, se Q3 . Q3D$F , onde Q3D$F é a estatística

deste teste, calculada por Dickey e Fuller sob a hipótese nula, rejeitamos a hipótese nula.
Se rejeitamos a hipótese nula, devemos testar novamente ' , desta vez, entretanto, usando a
própria estatística t. Por que esta estatística? No primeiro passo, havíamos aceito a hipótese
de que ' ! 0 , logo provavelmente rejeitamos a hipótese neste segundo passo porque $
deve ser diferente de zero. Se é este o caso, a estatística de ' , mesmo para o teste de raízes
unitárias, deve convergir para a distribuição padrão t. Assim, testando
H 0 : ' ! 0& H 1 : ' / 0 ,
usando a estatística padrão, se aceitamos a hipótese nula será porque existe raiz unitária, se
rejeitamos será porque não existe e os procedimento acabam-se por aqui. O problema
continua se tivéssemos aceito que ' ! $ ! 0 . Neste caso, há dois procedimentos possíveis.
Procedimento 1
Faça o seguinte teste de hipótese:

79
H 0 : ' ! $ ! * ! 0& H1 : ' / 0 [ $ # 0 [ * # 0 .

Para esse teste, usamos a seguinte estatística de Dickey-Fuller: Q 2 , onde


5 SQR '3( $ SQR '1(6
9 :
Q2 ! 3 .
SQR '1(
T $3
Se rejeitamos a hipótese nula, procedemos o teste t sobre ' . Nesse caso, se rejeitamos a
hipótese nula, não existe raiz unitária; se aceitamos, existe.
Porém, se aceitamos a hipótese nula do Procedimento 1, devemos prosseguir com o passo
3, abaixo descrito, após o procedimento alternativo 2 que passamos a descrever
Procedimento 2
Utilizando a equação ( 9 ), teste:
H 0 : ' ! 0& H 1 : ' / 0 .
Como fazemos isso via equação ( 9 ), devemos utilizar outra estatística de Dickey-Fuller:
0 * . Neste caso, se rejeitamos a hipótese nula, não existe raiz unitária.

Se, porém, aceitamos a hipótese nula, prosseguimos com o seguinte teste:


H 0 : ' ! * ! 0 & H1 : ' / 0 [ * # 0 ,

cuja estatística calculada por Dickey-Fuller é Q1 , assim calculada:


5 SQR '3( $ SQR '2(6
9 :
Q2 ! 2 .
SQR '2(
T $2
Deste ponto há duas possibilidades: Se aceitamos a hipótese nula, prosseguimos ao passo
3, abaixo expecificado. Se, entretanto, rejeitamo-la, devemos proceder o teste t sobre ' ,
como já vínhamos fazendo nos outros casos. Fazendo este último teste, se aceitamos a
hipótese nula, existe raiz unitária; se rejeitamos, não existe.
iii. Passo 3 – Para este passo, basta testar
H 0 : ' ! 0& H 1 : ' / 0 ,
usando a equação ( 10 ). Neste caso, a estatística calculada por Dickey-Fuller é dada por
0 . Se aceitamos, a hipótese nula, existe raiz unitária; se rejeitamos, não existe.

80
A lógica deste teste é partir do modelo mais geral para o mais restrito, haja vista que o
poder do teste é baixo.

Os testes não podem ser aplicados para testar uma segunda raiz unitária, porque foram
construído apenas para o caso de uma única raiz unitária.

Pode-se obter a ordem de defasagem q, basicamente usando-se dois procedimentos.

Procedimento 1
Colocar tantas defasagens quantas necessárias, tal que a regressão estimada produza
resíduos desprovidos de autocorrelação serial. Isto podendo ser testado usando as funções
ACF e PACF , bem como a estatística de Ljung-Box.

Procedimento 2
5 16
7 <? T >=4 8
Usar a fórmula de Shwert: q ! int 712 ; ? > 8.
7 ?@100 >A 8
97 :8

12.3 Explicite as hipóteses nulas, as equações estimadas e os critérios de decisão de cada


passo do teste de Dickey-Pantula pressupondo a existência de, no máximo, 4 raízes
unitárias.
Solução: Trata-se, como no exercício anterior, verificar se o aluno sabe fazer o teste de
raízes unitárias, quando, potencialmente, podem existir várias raízes unitárias na
série.
i. As hipóteses nula e alternativa são:
H40: Existem, no máximo, 4 raízes unitárias
H41: Existem, no máximo, 3 raízes unitárias
A equação a ser estimada é dada por;
Z4 yt ! 20 " 21Z3 yt$1 " ut ,
e testamos
H 0 : 21 ! 0& H1 : 21 / 0 ,

81
usando a estatística, calculada por Dickey e Pantula: 0 * . Claramente, se a estatística

calculada no teste menor é do que o valor teórico (equivalente a ser maior em módulo),
rejeitamos a hipótese nula, caso contrário, aceitamo-la.
Se rejeitamos a hipótese nula, passamos ao próximo teste.
ii. As hipóteses nula e alternativa são:
H30: Existem, no máximo, 3 raízes unitárias
H31: Existem, no máximo, 2 raízes unitárias
A equação a ser estimada é dada por;
Z4 yt ! 20 " 21Z3 yt$1 " 22Z2 yt$1 " ut ,
e testamos
H 0 : 22 ! 0 & H 1 : 22 / 0 ,

usando a estatística, calculada por Dickey e Pantula: 0 * . Claramente, se a estatística

calculada no teste é menor do que o valor teórico, rejeitamos a hipótese nula, caso
contrário, aceitamo-la.
Se rejeitamos a hipótese nula, passamos ao próximo teste.
iii. As hipóteses nula e alternativa são:
H20: Existem, no máximo, 2 raízes unitárias
H21: Existem, no máximo, 1 raízes unitárias
A equação a ser estimada é dada por;
Z4 yt ! 20 " 21Z3 yt$1 " 22Z2 yt$1 " 23Zyt$1 " ut ,
e testamos
H 0 : 23 ! 0& H1 : 23 / 0 ,

usando a estatística, calculada por Dickey e Pantula: 0 * . Claramente, se a estatística

calculada no teste é menor do que o valor teórico, rejeitamos a hipótese nula, caso
contrário, aceitamo-la.
Se rejeitamos a hipótese nula, passamos ao próximo teste.
iv. As hipóteses nula e alternativa são:
H0: Existe, no máximo, 1 raiz unitária
H1: Não existe raiz unitária
A equação a ser estimada é dada por;

82
Z4 yt ! 20 " 21Z3 yt$1 " 22Z2 yt$1 " 23Zyt$1 " 24 yt$1 " ut ,
e testamos
H 0 : 24 ! 0 & H 1 : 24 / 0 ,

usando a estatística, calculada por Dickey e Pantula: 0 * . Claramente, se a estatística

calculada no teste é menor do que o valor teórico, rejeitamos a hipótese nula, caso
contrário, aceitamo-la.
Se rejeitamos a hipótese nula, passamos ao próximo teste.

12.4 (E) Suponha que xt e yt sejam integrados de ordem b e d, respectivamente. Vamos


esquematizar uma prova pela qual qualquer combinação linear de xt e yt é integrado de
ordem 2.
a. Sejam xt e yt passeios aleatórios:
xt ! xt$1 " #t ;
yt ! yt$1 " .t .
i. Dadas as condições iniciais sobre x0 e y0, mostre que a solução para xt e yt têm a
forma
t $1
xt ! x0 " % #t$ j
j !0
t $1
.
yt ! y0 " % .t$ j
j !1

ii. Mostre que a combinação linear " xt " $ yt geralmente conterá uma tendência
estocástica.
iii. Que hipótese é necessária para assegurar que xt e yt são CI(1, 1)?
b. Agora seja yt integrado de ordem 2. Dadas as condições iniciais sobre y0 e y1, encontre
a solução para yt. Existe alguma combinação linear entre xt e yt que contenha apenas
uma tendência estocástica? E determinística? Existe alguma combinação linear entre xt
e yt que não contenha uma tendência estocástica?
c. Dê uma explicação intuitiva para a seguinte afirmação: Se xt e yt são integrados de
ordem b e d, onde d > b, qualquer combinação linear de xt e yt é integrada de ordem d.

83
Solução: O exercício treina o conceito de co-integração, procurando mostrar porque
se diz integrado de ordem 1 ou 2. Procura mostrar quais os problemas de estimar
séries com diferentes ordens de co-integração. Seria interessante lembrar que, com
mais de três séries, digamos, a primeira com ordem de integração 0 e as outras duas
com ordem de integração 1, se estas duas forem co-integradas, então as três séries
podem ser estimadas conjuntamente.
a. Este item não oferece maiores dificuldades.
i. Faça a substituição recursiva, para obter o resultado desejado. Faremos agora
para xt, mas o procedimento é idêntico para yt.
xt ! xt$1 " #t ! ' xt$2 " #t $1 ( " #t ! " !
t $1
! x0 " #1 " #2 " " " #t ! x0 " % #t$ j .
j !0

Como desejávamos demonstrar.


Analogamente, temos:
t $1
yt ! y0 " % .t$ j .
j !0

ii. A combinação linear " xt " $ yt conterá a expressão:


t $1 t $1
" % #t$ j " $ % .t$ j .
j !0 j !0

Ora, a combinação linear de duas tendências estocásticas será uma tendência estocástica,
bastando notar, ainda, que &t ! "#t " $.t , tal que a combinação linear " xt " $ yt conterá a
t $1
tendência estocástica %&
j !0
t$ j .

iii. Suponha que E#t F e E.t F sejam perfeitamente correlacionados, tal que

.t ! !#t , onde ! é uma constante. Agora, selecione valores de " e $ tal que

" " !$ ! 0 . Assim, a combinação linear " xt " $ yt não conterá tendência
estocástica pois:
t $1 t $1
" % #t$ j " !$ % #t$ j ! 0 .
j !0 j !0

84
t $1
b. Há outra maneira de se expressar a tendência estocástica, %#
j !0
t$ j , da seguinte forma

t
xt ! x0 " #1 " #2 " " " #t ! x0 " % # j .
j !1

t
Agora, a tendência estocástica é dada pela expressão %#
j !1
j . Por isso, diz-se integrado de

ordem 1, pois há apenas um somatório. Uma variável integrada de ordem 2 apresentaria


dois somatórios conjuntamente. Vamos entender isso em detalhe, para responder a questão,
inicialmente supondo que uma variável integrada de ordem é um ruído branco.
Formalmente, temos:
Z2 yt ! .t - Z
)yt ! Z
)yt$1 " .t -
! zt ! zt$1

zt ! zt$1 " .t ! ' zt$2 " .t$1 ( " .t ! " !


t
! z1 " .2 " .3 " " " .t ! z1 " % . j .
j !2

Temos que parar em z1, pois, no caso de integração de ordem 2, precisamos conhecer y1 e
y0. Agora, para ver o segundo somatório e a tendência determinística, devemos desenvolver
zt .
t t
zt ! z1 " % . j - yt $ yt$1 ! ' y1 $ y0 ( " % . j -
j !2 j !2
t t t $1
yt ! yt$1 " ' y1 $ y0 ( " % . j ! yt$2 " 2 ' y1 $ y0 ( " % . j " % . j !
j !2 j !2 j !2
t t $1 t $2
! yt$3 " 3' y1 $ y0 ( " % . j " % . j " % . j ! " !
j !2 j !2 j !2
t t $1 2
! y1 " 't $1(' y1 $ y0 ( " % . j " % . j " " " % . j !
j !2 j !2 j !2
t $2 t $s
! y1 " 't $1(' y1 $ y0 ( " % % . j !
s !0 j ! 2
t $2 t $s
! y0 " t ' y1 $ y0 ( " %% . j .
s !0 j ! 2

85
Não existe apenas uma tendência estocástica, como poder ser visto na terceira linha da
expressão acima. Note que há várias tendências estocásticas. Note que, se y1 igual a y0, não
existe tendência determinística; do contrário, haverá também.
Não há combinação entre essas variáveis que não contenha tendência estocástica, mesmo
com correlação perfeita entre os resíduos. Neste caso ainda restarão:
t $1 t $2 t $2 t $s

% . j " % . j " "" .2 ! %% . j ,


j !2 j !2 s!1 j ! 2

que é um somatório duplo, ainda denotando ser um resultado integrado de ordem 2.


c. Se yt ! I 'd ( , sua solução conterá d-uplas somatórios da seqüência E.t F . Entretanto, a

solução para xt conterá apenas b-uplas somatórios. Não há combinação linear dessa
seqüência que reduza a ordem dos somatórios na solução para yt.

86
13. Modelos GARCH

13.1 Seja o processo ARCH ε t = σ t u t , sendo u t ~ i.i.d .(0,1) , onde σ t2 = α + α 1ε t2−1 ,


independente de ut. Mostre que a curtose do modelo é dada por:

 1 − α 12 
K (ε t ) = 3 2 
.
1 − 3α 1 

Depois mostre qual a condição para que #t tenha quarto momento finito. Finalmente,
interprete a expressão do quarto momento.
Solução: O exercício mostra que modelos ARCH captam a curtose.
Tomando a esperança não condicional do resíduo elevado à quarta potência:
E '#t4 ( ! E '(t4 ( E 'ut4 ( ! 3E '(t4 ( .
)
!3

Mas,
( ) [(
E σ t4 = E α 2 + 2αα1ε t2 + α 12 ε t4 . )]
Portanto:
 2α 2α 1  3α 2 (1 + α 1 )
( )
E ε t4 = 3α 2 +
1 − α1
( ) (
+ α 12 E ε t4  ⇒ 1 − 3α 12 E ε t4 =)( )
1 − α1
.
 
Resultando, após algumas poucas manipulações algébricas, em:

5 ! 2 6 5 1$ ! 2 6
( 11 ) E '#t4 ( ! 3 77 87
287
1 8
28
.
79 '1$ !1 ( 8: 9 1 $ 3! 1 :
*&&&+&&&,
!EE'#t2 (F
2

Logo

E '#t4 ( 5 1$ !12 6
( 12 ) K '#t ( ! ! 37 8.
71$ 3!12 8
EE '# (F
2
2
t 9 :

87
Analisando a expressão entre colchetes de ( 12 ), é fácil ver que, se α1 = 0 , a série é
mesocúrtica. O primeiro fator entre colchetes de ( 11 ) é três vezes a variância ao quadrado.
1
Por outro lado, para que a curtose seja finita, é preciso que 3α 12 < 1 ⇒ α 12 < . Além
3
disso, 0 < α 1 < 1 ⇒ 1 − α 12 > 1 − 3α 12 . Portanto, a curtose da série pode se maior do que 3, e o
modelo ARCH é capaz de incorporar esse fato, o que é muito importante em finanças.

13.2 De qual caraterística de #t tratam os modelos da família GARCH?

Solução: Trata-se de verificar se o estudante entendeu o problema que os modelos


GARCH tentam resolver.
Os modelos da família ARCH consideram #t como condicionados a seus valores passados.
Esses modelos são capazes de captar essa condicionalidade. A intuição subjacente é a
seguinte: uma grande perturbação aleatória será seguida de outra, provavelmente em
sentido contrário, por razões compensatórias. Assim, até que se atinja a trajetória anterior,
pode levar algum tempo.
Uma outra maneira de ver isso é por meio do anúncio de medidas governamentais.
Geralmente, os momentos que antecedem a essas notícias são de grande tensão, o que pode
aumentar a volatilidade da série.

13.3 Comente as principais diferenças entre os modelos ARCH, GARCH, ARCH-M,


EGARCH E TARCH.
Solução: Aqui procura-se verificar se o aluno consegue distinguir as diferenças entre
os diferentes modelos, muito importante na hora de se escolher algum para ser usado.
O modelo ARCH de ordem q pressupõe que a variância (t2 é explicada por q defasagens
dos erros ao quadrado da equação da média. O problema básico é a necessidade de se
restringir os parâmetros para garantir estacionaridade da série e variância sempre positiva.
O modelo GARCH supõe a variância condicional aos q erros passados e à própria variância
passada. Esse modelo é, freqüentemente, mais parcimonioso do que o ARCH. Para
entender isso, lembre-se de que, num modelo ARIMA, um MA'L( pode ser

88
reparametrizado como um AR finito. O modelo GARCH permite ainda a introdução de
variáveis explicativas.
O modelo ARCH-M, desenvolvido por Engle, Lillien e Robins supõe que a equação da
média tenha, como variável explicativa, a própria variância. Embora num mesmo instante
haja uma correlação positiva entre risco e retorno, não há provas conclusivas sobre isso ao
longo do tempo. Logo, este modelo pode ser uma maneira de se verificar isso.
O EGARCH apresentado por Nelson não pressupõe que o impacto das informações seja
simétrico e que os coeficientes estimados precisem ser, necessariamente, positivos como
ocorria nos modelos GARCH iniciais. Ou seja, permitem-se assimetrias de resposta para os
choques. De fato, espera-se que choque negativos produzam mais volatilidades que
choques positivos.
Aqui é interessante notar que o ARCH-M pode ser parametrizado segundo qualquer
variante dos modelos GARCH.
Glosten, Jagannathan e Runkle propõem o uso de variáveis dummy na equação da variância
caso o choque seja negativo. Pesquisas indicam que o EGARCH e o TGARCH costumam
ser modelos melhor parametrizados.
13.4 (E) Considere o seguinte modelo risco-média:

yt = µ t + ε t ,

onde

µ t = β + δσ t2

ε t = σ t ut ,

sendo

u t ~ i.i.d .(0,1) ;
q
σ t2 = α + ∑ α i ε t2−i .
i =1

( ) ( )
Considere E ε t2 = E ε t2−1 = " = 1 .

a. Mostre que a seqüência {ε t } é um ruído branco;

89
b. Encontre a média não condicional de yt. Como uma mudança em δ afeta a média?.
Mostre que mudar " e % de (– 3, 3) para (– 1, 1) preserva a média da seqüência {yt};
c. Mostre que a variância não condicional de yt, para q = 1, não depende de β , δ ou α .
Solução: A questão aborda dois aspectos. Um mais intuitivo, relacionado a finanças e
ao “trade-off” entre risco e retorno. O segundo, mais técnico, refere-se aos resultados
que se obtêm com modelos GARCH.
a. Como ut é independente de (t , temos que

E '#t ( ! E '(t ut ( ! E '(t ( E 'ut ( ! 0


)
!0

Além disso,
!
E'#t2 ( ! E '(t2 ( E 'ut2 ( ! (#2 ! ! 1.
1$ !1 $ !2 $...$ !q

Falta apenas as correlações cruzadas:


E'#t #t$k ( ! E '(t ut (t $k ut$k ( ! E '(t (t $k ( E 'ut ut $k ( ! 0 ,
*&&&+&&&,
!0

onde k > 0.
Portanto, concluímos que é um ruído branco.
b. Calculemos:
E ' yt ( ! E '*t " #t ( ! E '" " %(t2 " #t ( !

! E 57 " " % '! " % !i #t2$i ( " #t 68 !


9 :
! " " % '! " % !i (.

Para verificar como uma mudança de % afeta a média, note que:


E'#t2 ( ! E '(t2 ( E 'ut2 ( ! ! " % !i ! 1 .
*&&+&&, )
!! "% !i !1

Logo, a proporção que % afeta a média é de 1:1. Como esta proporção é a mesma para " ,

então, a média não condicional de yt é, para '" , % ( ! '$3,3( :

E ' yt ( ! $3 " 3'! " % !i ( ! $3 " 3;1 ! 0 .

O mesmo ocorre para '" , % ( ! '$1,1( , preservando-se a média não condicional de yt.

c. Calculemos:

90
Var ' yt ( ! Var '*t " #t ( ! Var '*t ( " Var '#t ( " 2Cov '*t , #t ( .
*&&+&&,
!1

Calculemos cada uma das parcelas que faltam:


Cov '*t , #t ( ! E '*t #t ( $ E '*t ( E '#t ( !
)
!0

! E 57'" " %(t2 ( #t 68 ! " E '#t ( " % E 57'! " !1#t2$1 ( #t 68 !


9 : ) 9 :
!0

! %! E '#t ( " %!1 E '# # (.


2
) t $1 t
!0

Como sabemos que #t é um ruído branco, temos:

Cov '*t , #t ( ! %!1 E '#t2$1 ( E '#t ( ! 0 .


*&&+&&, )
!1 !0

Agora, passemos à variância de *t :

Var '*t ( ! Var '" " %(t2 ( ! % 2Var '! " !1#t2$1 ( ! % 2!12Var '#t2$1 ( .

Portanto:
Var ' yt ( ! 1 " % 2!12Var '#t2$1 ( .

Como " não está na equação da variância, Var(yt) depende apenas de % e !1 .


Com isso, concluímos que aumentar o valor de % aumenta a variância de yt. Isso tem
sentido, porque significa aumentar o retorno na equação da média e isso só é possível se
aumentarmos o risco do investimento.

91

Você também pode gostar