Você está na página 1de 448

Econometria Financeira

Joo Nicolau

ISEG/UTL e CEMAPRE

Abril 2011
(Verso preliminar e incompleta)

Notas Prvias
Comentrios so bem vindos (nicolau@iseg.utl.pt). Neste documento abordam-se mtodos
economtricos relevantes para finanas. Veremos algumas aplicaes financeiras, mas a nfase deste documento est na componente economtrica. A leitura deste documento supe
conhecimentos sobre inferncia estatstica e o modelo de regresso linear mltiplo, no que
diz respeito estimao e inferncia estatsticas sob as hipteses clssicas.
Notao e Convenes
Escreve-se f (x) para designar a funo densidade de probabilidade (fdp) de uma varivel
aleatria X. Quando esto em causa duas variveis aleatrias X e Y; escreve-se, geralmente,
fx e fy para designar, respectivamente, as fdp de X e Y (f (x) e f (y) , em princpio,
incorrecto). O uso simultneo das notaes f (x) (fdp de X) e f (x; y) (fdp conjunta de
(X; Y )) conflituoso, pois f ou uma aplicao de R em R+ ou uma aplicao de R2
em R+ (e, portanto, f no poder designar simultaneamente ambas as aplicaes). A rigor
dever escrever-se fx e fx;y : No entanto, se no existir perigo de confuso, opta-se pela
notao mais simples e habitual f (x) e f (x; y). Escreve-se tambm f (yj x) ou fyjx para
designar a fdp condicionada de Y dado X = x: Em suma, nesta verso do documento,
adoptam-se as notaes que se entendem necessrias e convenientes de forma a no causar
confuso. Por exemplo, num certo contexto, pode escrever-se f (x; y) e, noutro diferente,
pode escrever-se fy;x :
O processo estocstico fyt ; t = 1; 2; :::g escreve-se indiferentemente como fyt g ou y:
a := b significa, a igual a b por definio. Por exemplo, se quisermos identificar a letra
como a mdia de X; escrevemos
usam

:= E (X). Para este tipo de relaes, certos autores

E (X) :

Em sries temporais usamos os termos amostra grande (ou amostra pequena) para
identificar sries temporais longas (ou curtas).

Acrnimos e Siglas Frequentemente Usados


An

N - An tem distribuio aproximadamente normal (usamos ! para a convergn-

cia em distribuio).
EE - Estritamente estacionrio.
EDF - Equao s diferenas Finitas.
EQM - Erro Quadrtico Mdio.
ESO - Estacionrio de segunda ordem ou Estacionaridade de Segunda Ordem.
FAC - Funo de Autocorrelao.
FACP - Funo de Autocorrelao Parcial.
fdp - Funo Densidade de Probabilidade.
HC- Heterocedasticidade Condicional.
IC - Intervalo de Confina (ou de previso, consoante o contexto).
i.i.d. - Independente e Identicamente Distribudo.
RB - Rudo Branco.
v.a. - Varivel Aleatria.

Contedo
I

Introduo

13

Objecto e Mtodo da Econometria Financeira

15

Preos e Retornos

17

2.1

Retornos Discretos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

18

2.1.1

Retorno Simples . . . . . . . . . . . . . . . . . . . . . . . . . . .

19

2.1.2

Retorno Multi-Perodos . . . . . . . . . . . . . . . . . . . . . . .

19

2.1.3

Retornos de Portfolios . . . . . . . . . . . . . . . . . . . . . . . .

20

2.1.4

Retornos Ajustados aos Dividendos . . . . . . . . . . . . . . . . .

22

2.1.5

Retornos Ajustados Inflao . . . . . . . . . . . . . . . . . . . .

22

2.1.6

Retornos Anualizados . . . . . . . . . . . . . . . . . . . . . . . .

23

Retornos Contnuos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

24

2.2.1

Retorno Multi-Perodos . . . . . . . . . . . . . . . . . . . . . . .

26

2.2.2

Retornos de Portfolio . . . . . . . . . . . . . . . . . . . . . . . . .

27

2.2.3

Retornos Ajustados aos Dividendos . . . . . . . . . . . . . . . . .

27

2.2.4

Retornos Ajustados Inflao . . . . . . . . . . . . . . . . . . . .

27

2.2.5

Retornos Anualizados . . . . . . . . . . . . . . . . . . . . . . . .

28

Retornos Contnuos vs. Retornos Discretos . . . . . . . . . . . . . . . . .

30

2.A Outra Interpretao de rt . . . . . . . . . . . . . . . . . . . . . . . . . . .

31

2.B Notas Tcnicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

32

2.2

2.3

2.B.1

Retorno Multi-Perodos como Funo dos Retornos Simples . . . .

32

2.B.2

r e R: Srie de Taylor . . . . . . . . . . . . . . . . . . . . . . . .

32

Factos Empricos Estilizados de Sries Temporais Financeiras

33

3.1

Regularidade Empricas relacionadas com a Distribuio Marginal . . . . .

33

3.1.1

34

Prmio de Risco Positivo . . . . . . . . . . . . . . . . . . . . . . .

3.2

3.1.2

Desvios Padro Diferentes Consoante os Activos . . . . . . . . . .

3.1.3

Retornos de Aces e de ndices tendem a Apresentar Assimetria

35

Negativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

35

3.1.4

Retornos Apresentam Distribuies Leptocrticas . . . . . . . . . .

37

3.1.5

Aumento da Frequncia das Observaes Acentua a No Normalidade das Distribuies . . . . . . . . . . . . . . . . . . . . . . . .

43

3.1.6

Efeitos de Calendrio . . . . . . . . . . . . . . . . . . . . . . . . .

44

3.1.7

Distribuies Tericas para os Retornos . . . . . . . . . . . . . . .

47

3.1.8

Estimao No Paramtrica da Funo Densidade de Probabilidade

54

Regularidade Empricas relacionadas com a Distribuio Condicional . . .

55

3.2.1

Autocorrelaes Lineares Baixas entre os Retornos . . . . . . . . .

55

3.2.2

Volatility Clustering . . . . . . . . . . . . . . . . . . . . . . . . .

58

3.2.3

Forte Dependncia Temporal da Volatilidade . . . . . . . . . . . .

60

3.2.4

Efeito Assimtrico . . . . . . . . . . . . . . . . . . . . . . . . . .

62

3.2.5

Aumento da Frequncia das Observaes Acentua a No Linearidade

64

3.2.6

Co-Movimentos de Rendibilidade e Volatilidade . . . . . . . . . .

64

Processos Estocsticos: Revises

67

4.1

Processo Estocstico e Filtrao . . . . . . . . . . . . . . . . . . . . . . .

67

4.2

Valores Esperados Condicionais: Principais Resultados . . . . . . . . . . .

68

4.3

Distribuio Condicional versus Distribuio Marginal . . . . . . . . . . .

72

4.4

Processos Estocsticos Elementares, Estacionaridade e Fraca Dependncia .

77

4.4.1

Processos Estocsticos Elementares . . . . . . . . . . . . . . . . .

77

4.4.2

Estacionaridade . . . . . . . . . . . . . . . . . . . . . . . . . . . .

79

4.4.3

Fraca Dependncia . . . . . . . . . . . . . . . . . . . . . . . . . .

83

Processos Ergdicos e Estritamente Estacionrios . . . . . . . . . . . . . .

87

4.5.1

Definies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

87

4.5.2

Modelos No Lineares do tipo yt = g (yt 1 ; yt 2 ; :::; yt p ) + ut . . .

96

4.5.3

Estabilidade em EDF . . . . . . . . . . . . . . . . . . . . . . . . .

99

4.5.4

Modelos No Lineares do tipo yt = At yt 1 +Bt . . . . . . . . . .

100

4.5.5

Modelos No Lineares do tipo yt = g (yt 1 ; ut ) . . . . . . . . . . .

104

Demonstraes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

106

4.5

4.A

II
5

Modelos

109

O Problema da Especificao

111

5.1

O Axioma da Correcta Especificao do Modelo . . . . . . . . . . . . . . .

111

5.2

Modelao da Mdia Condicional e Modelos Dinamicamente Completos . .

113

5.2.1

Modelos Dinamicamente Completos . . . . . . . . . . . . . . . . .

113

5.2.2

Mdia Condicional No Linear . . . . . . . . . . . . . . . . . . . .

115

5.3

Modelao da Varincia Condicional . . . . . . . . . . . . . . . . . . . . .

116

5.4

Distribuio de Condicional . . . . . . . . . . . . . . . . . . . . . . . . .

116

Modelao da Mdia: Abordagem Linear

119

6.1

Definies Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . .

120

6.1.1

Autocorrelao de Ordem s (FAC) . . . . . . . . . . . . . . . . . .

120

6.1.2

Autocorrelao Parcial de Ordem s (FACP) . . . . . . . . . . . . .

120

6.1.3

Operador de Diferena e de Atraso . . . . . . . . . . . . . . . . . .

122

Processos Lineares Estacionrios . . . . . . . . . . . . . . . . . . . . . . .

123

6.2.1

Processos Mdia Mvel . . . . . . . . . . . . . . . . . . . . . . .

123

6.2.2

Processos Autoregressivos . . . . . . . . . . . . . . . . . . . . . .

127

6.2.3

Processos ARMA . . . . . . . . . . . . . . . . . . . . . . . . . . .

135

Processos Lineares No Estacionrios . . . . . . . . . . . . . . . . . . . .

139

6.3.1

No Estacionaridade na Mdia . . . . . . . . . . . . . . . . . . . .

139

6.3.2

No Estacionaridade na Varincia . . . . . . . . . . . . . . . . . .

146

6.4

Modelao ARMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

150

6.5

Variveis Impulse-Dummy em Modelos de Regresso: Cuidados a Observar

154

6.5.1

Inconsistncia do Estimador . . . . . . . . . . . . . . . . . . . . .

154

6.5.2

Inconsistncia do Teste-t . . . . . . . . . . . . . . . . . . . . . . .

156

6.5.3

Uma Soluo para ensaiar H0 :

=0 . . . . . . . . . . . . . . . .

156

6.5.4

Impulse-dummies e a matriz de White . . . . . . . . . . . . . . . .

157

6.5.5

Concluso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

159

Previso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

160

6.6.1

Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

160

6.6.2

Previso Pontual . . . . . . . . . . . . . . . . . . . . . . . . . . .

162

6.6.3

Intervalos de Previso I . . . . . . . . . . . . . . . . . . . . . . . .

168

6.2

6.3

6.6

6.6.4

ARMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

174

6.6.5

Previso de (muito) Longo Prazo . . . . . . . . . . . . . . . . . .

177

6.6.6

Qualidade da Previso . . . . . . . . . . . . . . . . . . . . . . . .

180

6.6.7

Outros Mtodos de Previso Lineares . . . . . . . . . . . . . . . .

188

6.A Mtodo para Obter a FACP . . . . . . . . . . . . . . . . . . . . . . . . . .

190

6.B Transformao de um Processo MA(1) No Invertvel num Invertvel

. . .

191

6.C Invertibilidade de Processos MA (exemplos) . . . . . . . . . . . . . . . . .

192

6.D Estacionaridade de 2a Ordem do Processo AR(1) . . . . . . . . . . . . . .

195

6.E Estacionaridade de 2a Ordem do Processo AR(p) . . . . . . . . . . . . . .

198

6.F Processos ARMA Sazonais . . . . . . . . . . . . . . . . . . . . . . . . . .

199

6.G Demonstrao da Proposio 6.5.1 . . . . . . . . . . . . . . . . . . . . . .

203

6.H Uma Nota sobre Intervalos de Confiana . . . . . . . . . . . . . . . . . . .

204

UE + UV + UC = 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

206

6.I
7

Intervalos de Previso II - Varincia do Erro de Previso no modelo

Modelao da Mdia: Abordagem No Linear

207

7.1

Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

207

7.2

Estabilidade em Equaes s Diferenas Finitas Determinsticas . . . . . .

210

7.2.1

Pontos Fixos e Estabilidade de Sistemas Lineares . . . . . . . . . .

211

7.2.2

Estabilidade de Sistemas No Lineares . . . . . . . . . . . . . . .

217

7.2.3

Pontos Peridicos . . . . . . . . . . . . . . . . . . . . . . . . . . .

227

7.3

7.4

Modelo Limiar Autoregressivo (Threshold AR - TAR)

. . . . . . . . . . .

234

7.3.1

Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

234

7.3.2

Solues Peridicas . . . . . . . . . . . . . . . . . . . . . . . . .

236

7.3.3

Estacionaridade . . . . . . . . . . . . . . . . . . . . . . . . . . . .

240

7.3.4

Exemplo (Bounded Random Walk) . . . . . . . . . . . . . . . . . .

241

7.3.5

Estimao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

242

7.3.6

Inferncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

245

Modelo Markov-Switching . . . . . . . . . . . . . . . . . . . . . . . . . .

248

7.4.1

Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

248

7.4.2

Cadeias de Markov em tempo discreto com espao de estados dis-

7.4.3

cretos finito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

249

Modelos Markov-Switching . . . . . . . . . . . . . . . . . . . . .

254

7.4.4

Funo densidade de probabilidade de y . . . . . . . . . . . . . . .

255

7.4.5

Probabilidades Associadas aos Regimes . . . . . . . . . . . . . . .

256

7.4.6

Estacionaridade . . . . . . . . . . . . . . . . . . . . . . . . . . . .

260

7.4.7

Estimao e Inferncia . . . . . . . . . . . . . . . . . . . . . . . .

263

7.4.8

Previso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

265

7.4.9

Aplicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

266

Modelao da Heterocedasticidade Condicionada - Caso Univariado

269

8.1

Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

269

8.1.1

Por que razo a volatilidade no constante? . . . . . . . . . . . .

269

8.1.2

Processos Multiplicativos . . . . . . . . . . . . . . . . . . . . . .

272

8.1.3

Distribuies de Caudas Pesada . . . . . . . . . . . . . . . . . . .

273

8.1.4

O papel da Mdia Condicional e o Modelo de Heterocedasticidade


Condicionada . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

274

Vantagens dos modelos de Heterocedasticidade Condicionada . . .

274

Modelo ARCH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

275

8.2.1

Dois Primeiros Momentos de ut . . . . . . . . . . . . . . . . . . .

277

8.2.2

Representao AR de um ARCH . . . . . . . . . . . . . . . . . . .

277

8.2.3

Estacionaridade de Segunda Ordem do ARCH(q) . . . . . . . . . .

278

8.2.4

FAC e FACP de um u2t e Identificao do Processo ARCH(q) . . . .

279

8.2.5

Caractersticas da Distribuio Marginal de ut . . . . . . . . . . . .

280

8.2.6

Momentos e Distribuio de y . . . . . . . . . . . . . . . . . . . .

282

8.2.7

Volatilidade: Definies . . . . . . . . . . . . . . . . . . . . . . .

283

Modelo GARCH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

284

8.3.1

GARCH(p,q) representa um ARCH(1) . . . . . . . . . . . . . . .

284

8.3.2

Representao ARMA de um GARCH . . . . . . . . . . . . . . .

286

Modelo IGARCH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

288

8.4.1

Persistncia na Varincia . . . . . . . . . . . . . . . . . . . . . . .

290

8.4.2

Alteraes de Estrutura e o IGARCH . . . . . . . . . . . . . . . .

293

8.4.3

EWMA (Exponential Weighted Moving Averages) . . . . . . . . .

294

8.5

Modelo CGARCH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

297

8.6

Modelo GJR-GARCH . . . . . . . . . . . . . . . . . . . . . . . . . . . .

298

8.7

Modelo GARCH-M . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

300

8.1.5
8.2

8.3

8.4

8.8

Modelo de Heterocedasticidade Condicionada com Variveis Explicativas .

301

8.9

Estimao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

303

8.9.1

Estimador de Mxima Verosimilhana . . . . . . . . . . . . . . . .

304

8.9.2

Estimador de Pseudo Mxima Verosimilhana . . . . . . . . . . . .

309

8.9.3

Mtodo da Mxima Verosimilhana com Distribuies No Normais 310

8.10 Ensaios Estatsticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

312

8.10.1 Ensaios Pr-Estimao . . . . . . . . . . . . . . . . . . . . . . . .

313

8.10.2 Ensaios Ps-Estimao . . . . . . . . . . . . . . . . . . . . . . . .

316

8.11 Previso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

320

8.11.1 Previso da Varincia Condicional . . . . . . . . . . . . . . . . . .

321

8.11.2 A Previso da Varivel Dependente y . . . . . . . . . . . . . . . .

324

8.11.3 Intervalos de Confiana para y e para a Volatilidade baseados em


Boostrap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

327

8.12 Problema dos Erros de Especificao na Mdia Condicional . . . . . . . .

329

8.13 Modelos No Lineares na Mdia combinados com o GARCH . . . . . . . .

331

8.13.1 Modelo Limiar Autoregressivo com Heterocedasticidade Condicionada331

8.13.2 Modelo Markov-Switching com Heterocedasticidade Condicionada

333

8.A Estabilidade de EDF e a Estacionaridade (Caso modelo ARCH) . . . . . .

335

Modelao da Heterocedasticidade Condicionada - Caso Multivariado

339

9.1

Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

339

9.2

Densidade e Verosimilhana . . . . . . . . . . . . . . . . . . . . . . . . .

341

9.3

Modelo VECH (ou VEC) . . . . . . . . . . . . . . . . . . . . . . . . . . .

342

9.4

Modelo Diagonal VECH . . . . . . . . . . . . . . . . . . . . . . . . . . .

346

9.5

Modelo BEKK . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

348

9.6

Modelo de Correlaes Condicionais Constantes . . . . . . . . . . . . . .

349

9.7

Modelo DCC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

351

9.8

Modelo Triangular . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

352

9.8.1

Introduo e Formalizao do Modelo . . . . . . . . . . . . . . . .

352

9.8.2

Estimao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

357

9.8.3

Testes e Rcios de Varincia . . . . . . . . . . . . . . . . . . . . .

359

9.8.4

Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

360

GARCH Ortogonal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

362

9.9

10

9.10 Testes de Diagnstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . .


10 Regresso No Paramtrica

III

368
371

10.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

371

10.2 Estimao No Paramtrica da Funo Densidade de Probabilidade . . . .

371

10.2.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

371

10.2.2 Propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

373

10.2.3 Escolha de h . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

374

10.2.4 Estimao localmente linear da Mdia Condicional . . . . . . . . .

376

10.2.5 Estimao localmente linear da Varincia Condicional . . . . . . .

382

10.A Demonstraes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

382

Aplicaes

389

11 Eficincia do Mercado de Capitais

391

11.1 Introduo e Definies . . . . . . . . . . . . . . . . . . . . . . . . . . . .

391

11.2 Teste Eficincia Fraca de Mercado . . . . . . . . . . . . . . . . . . . . .

392

11.2.1 Testes de Autocorrelao . . . . . . . . . . . . . . . . . . . . . . .

394

11.2.2 Regras de Compra e Venda e a Anlise Tcnica . . . . . . . . . . .

395

11.3 Teste Eficincia Semi-Forte de Mercado . . . . . . . . . . . . . . . . . .

400

11.3.1 Reaco do Mercado Chegada de Informao . . . . . . . . . . .

401

12 Seleco de Portfolios

405

12.1 Portfolio Baseado em Momentos Marginais . . . . . . . . . . . . . . . . .

405

12.1.1 Todos os Activos Envolvem Risco . . . . . . . . . . . . . . . . . .

406

12.1.2 Modelo com Activo Sem Risco . . . . . . . . . . . . . . . . . . .

411

12.2 Portfolio Baseado em Momentos Condicionais . . . . . . . . . . . . . . .

413

13 Risco de Mercado e o Valor em Risco

417

13.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

417

13.2 Abordagem No Paramtrica . . . . . . . . . . . . . . . . . . . . . . . . .

419

13.3 Abordagem Paramtrica . . . . . . . . . . . . . . . . . . . . . . . . . . .

422

13.3.1 Modelo Gaussiano Simples

. . . . . . . . . . . . . . . . . . . . .

424

13.3.2 Modelo RiskMetrics . . . . . . . . . . . . . . . . . . . . . . . . .

425

11

13.3.3 Modelo ARMA-GARCH . . . . . . . . . . . . . . . . . . . . . . .

426

13.4 Generalizao: Portfolio com m Activos . . . . . . . . . . . . . . . . . . .

431

13.5 Abordagem pela Teoria dos valores Extremos . . . . . . . . . . . . . . . .

432

13.5.1 Introduo Teoria e Estimao. VaR Marginal . . . . . . . . . . .

433

13.5.2 VaR Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . .

437

13.6 Avaliao do VaR (Backtesting) . . . . . . . . . . . . . . . . . . . . . . .

438

12

Parte I
Introduo

13

Pgina em branco

14

Captulo 1
Objecto e Mtodo da Econometria
Financeira
(ltima actualizao: 11/2009)
Entende-se que Financial econometrics is simply the application of econometric tools to
financial data (Engle, 2001). A econometria financeira , portanto, uma disciplina economtrica
(baseada em mtodos estatsticos e matemticos) vocacionada para analisar dados financeiros. Esta anlise serve de suporte a variadssimos estudos como por exemplo,
avaliao do risco (por exemplo, atravs do Value at Risk);
avaliao de obrigaes, opes, etc.;
previso da volatilidade;
gesto de portfolios;
anlise da previsibilidade e eficincia dos mercados, etc.
Sendo a econometria financeira a aplicao de mtodos economtricos adequados a dados financeiros, todos os mtodos estatsticos que de uma forma ou outra se apliquem a dados
financeiros, interessam econometria financeira. De todo o modo, a rea proeminente em
econometria financeira a das sries temporais. Estuda-se, por exemplo, a evoluo temporal das cotaes, taxas de cmbio, taxas de juro, etc. Por esta razo, este documento analisa
essencialmente mtodos economtricos para sries temporais, sobretudo os mtodos que de
alguma forma se adequam s caracterstica prprias das sries financeiras (como sejam, a
no linearidade e a no normalidade).
15

conveniente distinguir sries temporais de natureza macroeconmica das de natureza


financeira. As principais diferenas so as seguintes:
dados de natureza macroeconmica (consumo, produto, taxa de desemprego) podem
ser observados mensalmente, trimestralmente ou anualmente; dados financeiros, como
por exemplo, retornos de aces ou taxas de cmbio podem ser observados com uma
frequncia muito superior; nalguns casos, com intervalos de minutos ou segundos entre
duas observaes consecutivas;
como consequncia do ponto anterior, o nmero de observaes disponveis de dados
financeiros situa-se na ordem das centenas de milhares. Normalmente, prefere-se trabalhar com dados dirios (evitando-se os problemas das microestruturas de mercado);
nestes casos trabalham-se com algumas unidades de milhares de observaes. Com
as sries macroeconmicas raramente se passam das poucas centenas de observaes
(quando, na melhor das hipteses, se tm observaes mensais);
os dados macroeconmicos so menos fiveis, i.e., esto mais sujeitos a erros de
medio. Com efeito, os valores apurados no resultam de valores efectivamente observados no mercado, como sucede com a generalidade das sries financeiras, mas
antes de valores apurados de acordo com certa metodologia e decorrentes de inquritos preliminares;
todavia, a principal diferena qualitativa decorre das propriedades estatsticas dos dois
tipos de sries. Ao contrrio das sries macroeconmicas, as sries financeiras exibem
habitualmente fortes efeitos no lineares e distribuies no normais. As propriedades
estatsticas das sries financeiras sero estudadas no captulo 3.

16

Captulo 2
Preos e Retornos
(ltima actualizao: 2/2011)
O ponto de partida para a anlise estatstica normalmente uma srie de preos (por
exemplo, a srie das cotaes de fecho do Banco XYZ num certo intervalo de tempo). De
uma forma geral, o preo pode ser, por exemplo, o valor a que um intermedirio financeiro
informa estar disposto a pagar pela compra de um determinado activo, opo ou futuro (bid
price), o valor a que um intermedirio financeiro informa estar disposto a receber pela venda
de um determinado activo, opo ou futuro (ask price), o valor final da transaco, o valor
definido num mercado de futuros, entre outros.
O intervalo de tempo entre dois preos consecutivos uma varivel aleatria com valores
em R+ . Isto significa que se poderia considerar uma sucesso de preos fPt1 ; Pt2 ; :::; Ptn g
com

= ti

ti

no constante. No obstante, prefere-se normalmente trabalhar com

uma periodicidade fixa. Por exemplo, se anlise emprica de certo fenmeno aconselha o
tratamento dirio dos preos, a sucesso pertinente passar a ser fP1 ; P2 ; :::; Pn g onde Pt
representa habitualmente o valor de fecho no dia t: O tratamento estatstico do caso em que
i

= ti

ti

encarado como uma varivel aleatria, um pouco mais delicada, e insere-se

na rea dos modelos de muita alta-frequncia.


Depois de coligidos os preos, calculam-se os retornos associados (veremos nos pontos seguintes duas frmulas alternativas de clculo). Na figura 2-1 apresentam-se preos e
retornos da Microsoft no perodo Janeiro de 1988 a Fevereiro de 2006.
Prefere-se geralmente a sucesso dos retornos ou das rendibilidades sucesso dos preos.
Por um lado, a sucesso dos retornos fornece tanta informao sobre a oportunidades de investimento quanto a sucesso dos preos. Deste ponto de vista indiferente trabalhar-se

17

60

Preos Microsoft

50
40
30
20
10

Jan-04

Jan-06
Jan-06

Jan-02

Jan-00

Jan-98

Jan-96

Jan-04

0.2

Jan-94

Jan-92

Jan-90

Jan-88

Retornos Microsoft

0.15
0.1
0.05
0
-0.05
-0.1
-0.15
Jan-02

Jan-00

Jan-98

Jan-96

Jan-94

Jan-92

Jan-90

Jan-88

-0.2

Figura 2-1: Preos e Retornos dirios da Microsoft no perodo Jan 88 a Fev 06


com qualquer das sequncias. H, todavia, uma razo de peso para se preferir a sucesso
dos retornos: esta mais fcil de modelar. Veremos adiante, com mais pormenor, que a
sucesso dos preos quase sempre no estacionria, ao passo que a sucesso dos retornos
tendencialmente estacionria (facilitando, por isso, a aplicao de resultados essenciais,
como sejam, a lei dos grande nmeros e o teorema do limite central)1 .
H duas formas de obtermos o retorno associado ao preo que descreveremos a seguir.

2.1

Retornos Discretos

Seja Pt a cotao de um certo activo no momento t: Suponhamos que P observado nos


momentos t = 1; 2; :::; n (podemos supor que temos n observaes dirias).
1

Taxas de cmbio real e taxas de juro podem ser analisadas nos nveis e no nas primeiras diferenas, se
existir evidncia de estacionaridade.

18

2.1.1

Retorno Simples

O retorno simples em tempo discreto de um certo investimento no momento t (retorno do


dia t

1 para o dia t) definido como


Rt =

Pt

Pt
Pt

Pt
Pt 1

(2.1)

(na literatura anglo-saxnica Rt designado por simple net return e 1 + Rt = Pt =Pt

como

simple gross return). Naturalmente, tambm se tem


P t = Pt

(1 + Rt ) :

Esta ltima expresso mostra que Rt representa, efectivamente, a taxa de rendibilidade de um


certo investimento, adquirido por Pt

e vendido por Pt : Se Pt

representa o preo unitrio

de um activo financeiro e K o nmero de aces adquiridas em t

1, a taxa de rendibilidade

do investimento de valor KPt

tambm, naturalmente, Rt ; pois Pt = Pt

(1 + Rt ) ,

Pt K = Pt 1 K (1 + Rt ).

2.1.2

Retorno Multi-Perodos

Suponha-se que fP1 ; P2 ; :::; Pn g a sucesso de preos dirios. Podemos estar interessados,
por exemplo, no retorno semanal e, para o efeito, basta considerar
Rt (5) =

Pt

Pt
Pt

(admitindo que se observam cinco preos por semana). De uma forma geral,
Rt (m) =

Pt

Pt
Pt

Pt
Pt m

1:

(2.2)

Para calcular Rt (m) basta atender expresso (2.2). Suponhamos, no entanto, que Pt e
Pt

no so conhecidos. A questo , como calcular Rt (m) a partir dos retornos simples

em t = 1; 2; ...? Pode-se provar (ver apndice 2.B.1)

Rt (m) =

Pt

Pt
Pt

t
Y

j=t m+1

19

(1 + Rj )

1:

2.1.3

Retornos de Portfolios

Admita-se que o capital em t

1 igual K (unidades monetrias) e existem dois activos

A e B; cujas taxas de rendibilidade so, respectivamente, RA;t e RB;t : Um certa fraco do


capital, ! A ; investido em A e, a parte restante, ! B = 1

! A ; investido em B: Desta

forma, o valor do investimento no perodo seguinte, t; igual a


K (! A (1 + RA;t ) + ! B (1 + RB;t ))
e o retorno do portfolio
K (! A (1 + RA;t ) + ! B (1 + RB;t ))
K
= ! A (1 + RA;t ) + ! B (1 + RB;t ) 1

Rp;t =

= ! A RA;t + ! B RB;t :
Com m activos, tem-se ! 1 + ::: + ! m = 1 e
Rp;t = ! 1 R1;t + ! 2 R2;t + ::: + ! m Rm;t
m
X
=
! i Ri;t :

(2.3)

i=1

Conclui-se portanto que o retorno de um portfolio igual a uma mdia ponderada dos vrios
retornos do portfolio.
A varincia do retorno de um portfolio tende a ser inferior varincia dos retornos do
portfolio. Para analisar esta questo, considere-se

Var (Rp;t ) = Var

m
X

! i Ri;t

i=1

= ! 2i

m
X

m
X

Var (! i Ri;t ) + 2

i=1

Var (Ri;t ) + 2

i=1

m
X1

m
X1

m
X

Cov (! i Ri;t ; ! i j Ri

j;t )

j=1 i=j+1

m
X

!i!i

Cov (Ri;t ; Ri

j;t ) :

j=1 i=j+1

Simplifique-se esta expresso. Admita-se que os retornos tm varincia igual, Var (Ri;t ) =
2

e que os pesos so iguais, ! i = 1=m (estas hipteses significam que se tomam ttulos com

idntica variabilidade e com o mesmo peso na carteira). Seja

^=

Pm

1
j=1

Pm

i=j+1 Cov (Ri;t ; Ri j;t )


m(m 1)
2

20

a covarincia mdia, isto , a mdia aritmtica dos valores de todas as covarincias distintas
(que so em nmero de m (m

1) =2). Sob estas hipteses, vem


2

Var (Rp;t ) =

+2

1 ^ N (m
m2
2

1)

^ (m 1)
:
m

Nestas circunstncias, fcil verificar que Var (Rp;t ) < Var (Ri;t ) equivalente a

> ^.

Assim, se a variabilidade dos activos (tomados isoladamente) for superior mdia aritmtica
dos valores de todas as covarincias distintas, o retorno do portfolio apresenta menor varin2

cia do que a dos activos que a constituem. A desigualdade

> ^ verifica-se trivialmente

se os retornos forem independentes (^ = 0) ou se as covarincias forem negativas (^ < 0).


A desigualdade

> ^ tende a verificar-se quando as covarincias so baixas e/ou existem

vrias covarincias negativas. Deve notar-se que a hiptese de independncia inverosmil,


pois os activos partilham aspectos comuns relacionados com o comportamento geral do mercado (risco de mercado).
Uma forma mais convincente de sugerir Var (Rp;t ) < Var (Ri;t ) a seguinte. Assumase: (i) os retornos tm varincia igual, Var (Ri;t ) =

; (ii) os pesos so iguais, ! i = 1=m e

(iii) as covarincias so iguais. Resulta por construo que a Var (Rp;t ) < Var (Ri;t ) : Com
efeito, comece-se por observar que Cov (Ri;t ; Ri j;t ) =
P 1 Pm
2
= 2 m (m
Nestas condies vem m
i=j+1
j=1
2

Var (Rp;t ) =

+2

1
m2

( o coeficiente de correlao).

1) =2 e, portanto,

m (m
2

Verifica-se agora que Var (Rp;t ) < Var (Ri;t ) equivalente a

1)

< 1: Como, por definio

menor do que 1, a desigualdade Var (Rp;t ) < Var (Ri;t ) verifica-se sempre, sob as hipteses
assumidas. Claro que, na prtica, nenhuma das hipteses (i), (ii) e (iii) se verifica de forma
exacta, mas seguro dizer-se que, em condies gerais, a diversificao (i.e. m > 1) baixa a
variabilidade do portfolio.

21

2.1.4

Retornos Ajustados aos Dividendos

Se no perodo t (ou se algures entre t

1 e t) h lugar ao pagamento de dividendos, o retorno

deve reflectir esse acrscimo de rendimento. O retorno total vem


Pt + Dt
Pt
P t Pt
=
Pt 1

Pt

Rt =

onde (Pt

Pt 1 ) =Pt

1
1

Dt
Pt 1

, por vezes, referido como capital gain e Dt =Pt

como dividend

yield.

2.1.5

Retornos Ajustados Inflao

At agora considermos retornos nominais. Em certos estudos, sobretudo de carcter macroeconmico, tem interesse analisar o retorno real. Para obtermos este retorno, necessrio
expurgar do ganho de capital o efeito do crescimento geral de preos. Suponhamos que
a inflao foi de 4% e o retorno (anualizado) foi de 3%. Houve ganho real no investimento
realizado? Se atendermos ao efeito crescimento geral de preos a resposta negativa.
tentador dizer que a perda real de 1%. Efectivamente quase 1%, mas no chega, como
se mostra a seguir. Para obtermos o retorno real, Rtreal (ajustado, portanto, da inflao),
considera-se
Rtreal =

Ptreal Ptreal1
;
Ptreal1

Ptreal =

Pt
IP Ct

sendo IP Ct o ndice de preos ao consumidor (ndice construdo pelo INE, Instituto Nacional de Estatstica). Observe-se que Ptreal o preo deflacionado ou simplesmente o preo
real do activo. Simples lgebra, permite concluir que
Rtreal =
onde
t

= (IP Ct

Ptreal Ptreal1
Pt IP Ct 1
=
real
Pt 1 IP Ct
Pt 1

1=

Rt
t

+1

IP Ct 1 ) =IP Ct 1 . Retomemos o exemplo acima, com Rt = 0:03 e

= 0:04; logo,
Rtreal =

0:03 0:04
=
0:04 + 1

0:0096

isto , os retornos reais caiem aproximadamente 1%, para sermos mais exactos, caiem 0.96%.
Quando a inflao relativamente baixa (por exemplo, se Rtreal so retornos reais mensais)

22

vlida a aproximao,
Rtreal ' Rt

t:

Como o IPC est, no mximo, disponvel mensalmente, no possvel calcular-se retornos


reais dirios.

2.1.6

Retornos Anualizados

Para compararmos, por exemplo, o retorno dirio do investimento A com o retorno mensal
do investimento B, necessrio converter as diferentes taxas de rendibilidades a um mesmo
perodo. Toma-se normalmente como perodo de referncia o ano pelo que, as taxas de
rendibilidade depois de convertidas em rendibilidades anuais dizem-se anualizadas. Suponhamos que um certo investimento de valor P0 foi realizado no momento 0. Ao fim de T anos
(T pode ser por exemplo 0.5, isto , 6 meses) o mesmo investimento vale Pn : A questo que
deveremos colocar a seguinte: qual a taxa de rendibilidade anual, RA ; tal que, aplicada
a um investimento P0 permite ao fim de T anos obter o investimento Pn ? Ou seja, qual o
valor RA que resolve a equao
P0 (1 + RA )T = Pn ?
Tomando RA como incgnita, facilmente se obtm

RA =

Pn
P0

1
T

1:

(2.4)

Se os preos P0 ; P1 ; :::Pn so dirios e se admitirmos que num ano se observam 250 preos,
ento T = n=250 (por exemplo, com n = 500 observaes dirias, o perodo de investimento
corresponde a dois anos, T = 500=250 = 2). Nestas condies, a frmula (2.4) pode-se
reescrever na forma
RA =

Pn
P0

250
n

1:

Em termos gerais, se num ano se observam N preos (por exemplo, N = 12 se as observaes so mensais) e dispomos de n observaes sobre os preos, ento T = n=N e

RA =

Pn
P0

23

N
n

1:

(2.5)

Exemplo 2.1.1 Queremos comparar os seguintes investimentos:


O investimento 1 foi adquirido ao preo 1.5. Ao fim de 800 dias (isto , 800=250 = 3:2
anos) valia 1.9.
O investimento 2 foi adquirido ao preo 105. Ao fim de 50 meses (isto , 50=12 = 4:17
anos) valia 121.
Questo: qual dos investimento foi prefervel? Para os investimento 1 e 2, as taxa de
rendibilidade anualizadas foram respectivamente de
250
800

RA;1 =

1:9
1:5

RA;2 =

121
105

1 = 0:0766

e,

12
50

1 = 0:034;

ou seja de 7.66% para o investimento 1 e 3.4% para o investimento 2. O investimento 1 foi,


portanto, prefervel.
Quando o perodo de observao dos preos relativamente curto as taxas de rendibilidade anualizadas podem fornecer valores aberrantes. Por exemplo, se numa semana, devido
variabilidade dos preos, se observar P0 = 1 e P5 = 1:1; a taxa anualizada de 1046.7%.

2.2

Retornos Contnuos

Sejam P0 e P1 ; respectivamente o capital inicial e o capital ao fim de um perodo. Se o


capital se valorizou continuamente nesse perodo, qual a taxa de rendibilidade instantnea
associada? Para discutirmos esta questo, admita-se, para simplificar, que o perodo o ano.
Se a capitalizao fosse anual, a taxa de rendibilidade Ra resultaria da resoluo da equao
P1 = P0 (1 + Ra ) em ordem a Ra : Se a capitalizao fosse semestral, a taxa de rendibilidade
(semestral) Rs resultaria da resoluo da equao
P1 = P 0 1 +

Rs
2

1+

Rs
2

= P0 1 +

Rs
2

em ordem a Rs . De igual forma, numa capitalizao trimestral, ter-se-ia P1 = P0 (1 + Rtr =4)4 :


Se a capitalizao contnua (capitalizao minuto a minuto, segundo a segundo, etc.) ento
24

0.4
0.3
0.2
0.1

R
r

0
-0.1
-0.2
Jul-05

Jan-05

Jul-04

Jan-04

Jul-03

Jan-03

Jul-02

Jan-02

Jul-01

Jan-01

Jul-00

Jan-00

-0.3

Figura 2-2: Retornos mensais da IBM


o capital P1 pode interpretar-se como o limite de
P1 = lim P0 1 +
n!1

Como limn!1 1 +

r n
n

r
n

= er ; a taxa de rendibilidade instantnea r resulta da resoluo da

equao P1 = P0 er em ordem a r (pode-se obter P1 = P0 er resolvendo a equao diferencial


Pt0 = rPt - veja-se o apndice 2.A). Logaritmizando a equao e resolvendo em ordem a r;
obtm-se
r = log P1

log P0 :

Considere-se agora uma sucesso de preos fP1 ; P2 ; :::; Pn g : Define-se a taxa de rendibilidade instantnea ou simplesmente o retorno contnuo de um certo investimento no momento
t como
rt = log Pt

log Pt 1 :

Naturalmente esta expresso equivalente a


rt = log Pt

log Pt

= log

Pt
Pt
= log 1 +
Pt 1
Pt 1

= log (1 + Rt ) :

Para dados dirios, semanais ou mensais pode assumir-se rt ' Rt (ver apndice 2.B.2). Na
figura 2-2 as diferenas entre Rt e rt so relativamente pequenas. Se os dados fossem dirios
as diferenas seriam ainda mais pequenas.

25

2.2.1

Retorno Multi-Perodos

Suponha-se que fP1 ; P2 ; :::; Pn g a sucesso de preos dirios. Podemos estar interessados,
por exemplo, no retorno semanal e, para o efeito, basta considerar
rt (5) = log

Pt
Pt 5

(admitindo que se observam cinco preos por semana). De uma forma geral,
rt (m) = log

Pt
Pt m

= log (Pt )

log (Pt

m) :

Seguindo o mesmo raciocnio que vimos atrs, suponhamos, no entanto, que Pt e Pt

no so conhecidos. A questo , como calcular rt (m) a partir dos retornos contnuos em


t = 1; 2; ...? Para exemplificar, suponha-se que se tm retornos dirios e procura-se o retorno
semanal, i.e., admita-se o seguinte:
retorno 2a feira

r1 = log P1

log P0

retorno 3a feira

r2 = log P2

log P1

retorno 4a feira

r3 = log P3

log P2

retorno 5a feira

r4 = log P4

log P3

retorno 6a feira

r5 = log P5

log P4

retorno da semana log P5

log P0 = r1 + r2 + ::: + r5

A tabela anterior sugere que o retorno da semana igual soma dos retornos da semana.
Com efeito,
log P5

log P0 = log P5 log P4 + log P4 log P3 + log P3 log P2


{z
} |
{z
} |
{z
}
|
r5

r4

r3

+log P2 log P1 + log P1 log P0


|
{z
} |
{z
}
r2

r1

(observe-se que no lado direito da expresso anterior, apenas os termos log P5 e P0 no


cancelam). Em termos gerais,
rt (m) = rt + rt

26

+ ::: + rt

m+1 :

2.2.2

Retornos de Portfolio

Pode imaginar-se o retorno contnuo do portfolio como sendo o valor rp;t tal que, aplicado
ao capital inicial K (i.e., Kerp;t ) permite obter o valor do portfolio calculado atravs dos m
P
P
ri;t
ri;t
retornos (i.e., K m
). Assim, rp;t tal que K m
= Kerp;t : Resolvendo
i=1 ! i e
i=1 ! i e
P
ri;t
esta equao em funo de rp;t obtm-se rp;t = log ( m
) : Tendo em conta que
i=1 ! i e
P
ri;t = log (1 + Ri;t ) e m
i=1 ! i = 1; podemos ainda escrever
rp;t = log

m
X

! i eri;t

i=1

m
X

= log

! i (1 + Ri;t )

i=1

= log 1 +

m
X

! i Ri;t

i=1

= log (1 + Rp;t ) :

Ao contrrio dos retornos discretos, o retorno contnuo do portfolio no igual soma


Pn
ponderada dos retornos contnuos dos vrios activos, i.e., rp;t 6=
i=1 ! i ri;t : Este facto

constitui uma desvantagem da verso contnua dos retornos. No entanto, quando Rp;t no
muito alto, rp;t

2.2.3

Rp;t :

Retornos Ajustados aos Dividendos

O retorno contnuo ajustado aos dividendos definido como


rt = log

Pt + Dt
Pt 1

= log (Pt + Dt )

log (Pt 1 ) :

Note-se tambm:
rt = log (1 + Rt ) ;

2.2.4

Rt =

Pt + Dt
Pt

Pt

Retornos Ajustados Inflao

O retorno contnuo ajustado inflao definido como


rtreal = log

Pt =IP Ct
Pt 1 =IP Ct

onde agora a taxa de inflao

= log
1

Pt
Pt 1

definida como

log

= rt

= log (IP Ct =IP Ct 1 ). Note-se tambm:

rtreal = log 1 + Rtreal :

27

IP Ct
IP Ct 1

2.2.5

Retornos Anualizados

Tal como no caso dos retornos discretos, tambm no caso dos retornos contnuos possvel
obter uma taxa de rendibilidade (agora instantnea) anualizada ou simplesmente retorno anualizado, rA . Pode comear-se por perguntar: qual a taxa de rendibilidade anual, rA ; tal
que, aplicada a um investimento P0 permite ao fim de T anos (de valorizao contnua) obter
o investimento Pn ? Ou seja, qual o valor rA que resolve a equao
P0 erA T = Pn ?
Tomando rA como incgnita, facilmente se obtm
rA =

1
log
T

Pn
P0

(2.6)

Tambm se chega a esta expresso a partir da definio habitual rA = log (1 + RA ) :


Com efeito,

rA = log (1 + RA ) = log 1 +

Pn
P0

1
T

= log

Pn
P0

1
T

1
log
T

Pn
P0

(T representa o nmero de anos do investimento).


Se os preos P0 ; P1 ; :::Pn so dirios e se admitirmos que num ano se observam 250
preos, ento deduz-se a relao T = n=250. Nestas condies, a frmula (2.6) pode-se
reescrever na forma
rA =

250
log
n

Pn
P0

Em termos gerais, se num ano se observam N preos (por exemplo, N = 12 se as observaes so mensais) e dispomos de n observaes sobre os preos, ento T = n=N e
rA =

N
log
n

Pn
P0

Em muitas aplicaes estuda-se uma sucesso de retornos fr1 ; r2 ; :::; rn g e obtm-se de


seguida um conjuntos de estatsticas, como por exemplo a mdia emprica dos retornos,
1X
r=
ri :
n i=1
n

28

Uma questo interessante consiste em obter rA como funo de r: Tendo em conta que
P
log (Pn =P0 ) = ni=1 ri tem-se
N
rA =
log
n

Pn
P0

n
NX
=
ri = N r:
n i=1

Uma forma alternativa de obtermos rA = N r e que tem a vantagem de fornecer tambm


uma medida para o valor da volatilidade anualizada a seguinte. Suponha-se, tal como
anteriormente, que num ano possvel observar N preos. Ento, a varivel aleatria que
representa o retorno anual dado por

X = log PN

log P0 =

N
X

rt :

t=1

Supondo E (r1 ) = E (r2 ) = ::: = E (rN ) ; tem-se que o retorno mdio anual dado por
E (X) = N E (rt ) :
Logo, uma estimativa de E (X) , precisamente, rA = N r : Por outro lado, suponha-se que
a sucesso frt g no autocorrelacionada e que Var (rt ) =

: Nestas condies, a varincia

anual (i.e., a varincia associada a rt (N )) dada por

Var (X) = Var

N
X

rt

t=1

=N

(2.7)

Resulta da equao (2.7) a famosa square root of time rule segundo a qual, a volatilidade
p
anual de um activo, obtm-se a partir da regra N onde o desvio padro associado
a um medida intra anual (assume-se o desvio padro como medida da volatilidade). Por
p
exemplo, se os dados so dirios, a regra estabelece 250 d ( d o desvio padro associado
p
aos dados dirios); se os dados so mensais, vem 12 m ( m o desvio padro associado
aos dados mensais). A informao anualizada pode ser dada em percentagem:
Nr

p
N

100%;

100%:

Com efeito o retorno anual em percentagem X 100 pelo que E (X


p
p
100 e Var (X 100) = N 2 1002 ) Var (X 100) = N 100:

100) = N E (rt )

Note-se, finalmente, que o retorno anualizado na verso discreta uma funo do retorno
29

anualizado na verso contnua, dada pela expresso RA = erA

2.3

1 (veja a equao (2.5)).

Retornos Contnuos vs. Retornos Discretos

Neste documento d-se preferncia anlise dos retornos contnuos. Por vrias razes:
A esmagadora maioria dos investigadores usa rt : Se queremos que os nossos resultados
sejam comparveis devemos usar rt :
Como vimos, os retornos contnuos multi-perodos so aditivos (por exemplo, o retorno contnuo entre o perodo 5 e 0 igual soma dos retornos contnuos entre o
perodo 5 e 0). J os retornos discretos multi-perodos no so. Em certas aplicaes
necessrio modelar retornos multi-perodos a partir do conhecimento das distribuies
de r ou R: Neste caso, prefere-se interpretar o retorno na sua verso contnua, pois a
modelao de uma soma
log Pt

log P0 =

t
X

ri

i=1

bem mais fcil do que a modelao de um produto


Pt

P0
P0

Alm disso, a soma

Pt

i=1 ri

t
Y

(1 + Rj )

1:

j=1

preserva propriedades que podem ser interessantes. Por

exemplo, se fri g uma sucesso de v.a. i.i.d. com distribuio N ( ; 2 ), segue-se


P
imediatamente que log Pt log P0 = ti=1 ri tem ainda distribuio normal N (t ; t 2 ) :
J no caso discreto, se fRi g uma sucesso de v.a. i.i.d. com distribuio normal, a
t
Y
v.a. (Pt P0 ) =P0 =
(1 + Rj ) 1 no tem distribuio normal.
j=1

O facto dos retornos discretos no ser aditivos pode conduzir a concluses erradas.
Considere-se o seguinte exemplo (veja-se a tabela 2.1). No momento t = 0 um certo
activo vale 100, depois em t = 1 vale 110 e, finalmente, em t = 2 volta a valer 100.

Obviamente que o retorno de t = 0 para t = 2 zero, quer se considere a frmula


(P2

P0 )=P0 ou log P2

log P0 : No entanto, a mdia emprica dos retornos discretos

positiva, podendo sugerir, incorrectamente, que o activo se valorizou entre o perodo


t = 0 e t = 2: J a mdia emprica dos retornos contnuos traduz correctamente a
valorizao do activo.
30

Pt

0
1
2
media

100
110
100

Rt =

Pt Pt
Pt 1

rt = log Pt

0.10 (10%)
-0.0909 (-9.09%)
>0

log Pt

0.0953
-0.0953
=0

Tabela 2.1: Retornos discretos no so aditivos - mais um exemplo


O retorno discreto aplicado a um investimento inicial pode sugerir que o investimento
possa vir negativo. Isto uma impossibilidade. Suponha-se P0 = 100: O pior cenrio
no perodo 1 P1 = 0 (perde-se todo o investimento). Mas, aplicando o retorno
discreto pode-se obter P1 < 0 se R1 <
P1 = (1

1: Por exemplo, se R1 =

1:05) P0 =

0:05

100 =

1:05 tem-se

5:

um impossibilidade obter-se P1 < 0 e, este facto, traduz uma fraqueza terica do


modelo de retorno discreto. No caso do retorno contnuo, no h possibilidade de P1
ser negativo, pois, r1 = log (P1 )

log (P0 ) implica P1 = P0 er > 0; por definio.

O retorno discreto conserva, no entanto, uma vantagem aprecivel: o retorno discreto


do portfolio igual soma ponderada dos retornos discretos dos vrios activos e, esta propriedade, no partilhada, como vimos, pelo retorno contnuo do portfolio.

2.A

Outra Interpretao de rt

Seja Pt o valor de um certo capital no momento t (podemos convencionar: t = 1 representa


um ano). Se o capital se valoriza em tempo discreto, a variao do capital Pt num certo
intervalo de tempo

> 0 pode ser traduzida pela igualdade (Pt+

Pt ) =Pt = r

(r a

taxa de retorno) ou seja


Pt+

Pt

= rPt

Se o capital se valoriza continuamente, i.e., se assumirmos

! 0; o lado esquerdo da

equao anterior a derivada de P em ordem a t; i.e., P 0 . Desta forma tem-se a equao


diferencial linear de primeira ordem (determinstica)
Pt0 = rPt

31

(2.8)

que estabelece a forma como Pt evolui em tempo contnuo. Pode-se provar que a soluo
geral de (2.8)
Pt = cert ;

c2R

(c depende do capital inicial). Com o capital inicial P0 ; a soluo particular Pt = P0 ert :


Ao fim de um perodo t = 1 o capital vale P1 = P0 er : Resolvendo esta equao em ordem a
r vem r = log (P1 =P0 ) = log P1

log P0 .

2.B

Notas Tcnicas

2.B.1

Retorno Multi-Perodos como Funo dos Retornos Simples

Como calcular Rt (m) a partir dos retornos simples em t = 1; 2; ...? Basta considerar

Rt (m) =
=
=
=
=

Pt

Pt

Pt m
Pt Pt 1 Pt m+1
:::
1
Pt 1 Pt 2
Pt m
Pt
Pt 1
Pt m+1
1+
1
1+
1 ::: 1 +
Pt 1
Pt 2
Pt m
(1 + Rt ) (1 + Rt 1 ) ::: (1 + Rt m+1 ) 1
t
Y
(1 + Rj ) 1:

j=t m+1

2.B.2

r e R: Srie de Taylor

A srie de Taylor da funo log (1 + Rt ) em torno de Rt = 0 , como se sabe,


rt = log (1 + Rt ) = Rt

1 2 1 3
R + R
2 t 3 t

::: ( 1)n

Rtn
+ :::
n

Este desenvolvimento em srie de potncia de Rt vlido para todo o Rt tal que jRt j <
1. Quando Rt relativamente pequeno, os termos Rt2 ; Rt3 ; etc., so ainda mais pequenos
(por exemplo, Rt = 0:005 implica Rt2 = 2:5

10 5 , Rt3 = 1:25

10 7 ; etc.) pelo que,

nestas circunstncias, Rt2 ' 0; Rt3 ' 0; etc., e, assim, rt ' Rt : Se os dados so dirios,
semanais ou mensais as rendibilidades R so geralmente pequenas (quando comparadas com
as rendibilidades anuais). Assim, para este tipo de rendibilidades, pode assumir-se rt ' Rt :

32

Captulo 3
Factos Empricos Estilizados de Sries
Temporais Financeiras
(ltima actualizao: 2/2011)
Vrios estudos empricos tm documentado que h um conjunto de regularidades empricas que so partilhadas por um leque grande de sries temporais financeiras observadas
com frequncia elevada (diria ou semanal). Essas regularidades tm a ver com caractersticas das distribuies marginais e condicionais que so comuns a muitas sries temporais
financeiras.

3.1

Regularidade Empricas relacionadas com a Distribuio


Marginal

Comece-se por considerar a fdp marginal1 f de um certo retorno rt . Estamos interessados


em saber algo sobre f (que geralmente desconhecida). Obtm-se alguma informao sobre
f calculando vrios momentos da amostra. este o procedimento que comearemos por
seguir. Pelo mtodo dos momentos, os parmetros populacionais desconhecidos,

= E (r) ;

p
E (r
= Var (r); sk =

)3
3

; k=

)4

E (r
4

Para simplificar, admite-se que f homognea com respeito ao tempo, i.e., no depende de t. Desta forma,
f (rt ) = f (rt 1 ) = ::: = f (r1 ). Como consequncia indiferente escrever f (rt ) ou simplesmente f (r) (e,
por um raciocnio similar, indiferente escrever E (rt ) ou simplesmente E (r)).

33

podem ser estimados de forma consistente (sob certas condies de regularidade), respectivamente, pelos estimadores
s

Pn
r)2
r
t
t=1 (rt
t=1
; ^=
;
r =
n
n
Pn
Pn
3
1
1
n
(r
r)
n
t
t=1
t=1 (rt
c =
sk
; k^ =
3
^
^4
Pn

r)4

Os factos empricos estilizados que descreveremos a seguir envolvem explicitamente estes


momentos. Concretamente, mostraremos a seguir que
r tende a ser maior do que o retorno do investimento sem risco;
^ depende da natureza do activo financeiro;
c tende a ser negativo;
sk

k^ tende a ser superior a 3.

3.1.1

Prmio de Risco Positivo

De acordo com a teoria financeira o valor esperado do retorno de um investimento no mercado de capitais deve exceder, no longo prazo, o retorno do investimento sem risco. A essa
diferena designa-se prmio de risco (Equity Risk Premia). Este prmio deve ser positivo
pois, caso contrrio, no haveria motivao para aceitar um investimento com retornos incertos, quando a alternativa um retorno garantido.
A estimao do prmio de risco deve envolver um perodo relativamente longo (o retorno
de um investimento no mercado de capitais estvel no mdio/longo prazo, mas instvel
no curto prazo - pode at ser fortemente negativo em curtos perodos de tempo). Dimson, Marsh e Staunton (2002) fizeram o seguinte exerccio, com base em dados financeiros
norte-americanos: se tivesse sido investido 1 dlar em aces norte americanas (digamos,
num ndice representativo do mercado de aces norte-americano) e 1 dlar em bilhetes do
tesouro (investimento sem risco), ambos no incio do ano 1900, quais seriam os retornos
desses investimentos ao fim de 101 anos (i.e. se fossem levantados no final do ano 2000).
Os resultados apurados mostram que o investimento de 1 dlar em aces seria vendido
por 16797 dlares em 2000 (apesar das inmeras crises econmicas e financeiras durante
o sculo, como por exemplo, as duas guerras mundiais, a grande depresso, os choques
34

rA %

^A%

c
sk

k^

P^ (jrt rj>3^ )
P (jZj>3)

Cotaes de Aces
Microsoft (01-88 a 7-05)
23.9% 36.3% -.097
6.8
3.85
Coca-Cola (11-86 a 12-05) 7.2% 33.2% -0.97 18.1
4.53
PT (6-95 a 12-05)
12.3% 33.2% -0.06 6.39
5.02
ndices Bolsistas
Dax (11-90 a 11-05)
8.4% 22.1% -0.196 6.66
5.79
CAC40 (03-90 a 11-05)
5.7% 20.5% -0.101 5.77
5.61
Nikkei225 (01-84 a 11-05) 1.6% 20.5% -0.116 10.77
3.71
FTSE100 (04-84 a 11-05)
7.3% 15.8% -0.545 11.12
2.44
PSI20 (01-93 a 03-06)
8.6% 15.8% -0.61 10.9
5.99
Taxas de Cmbio
USD/EUR(12-98 a 11-05) 0.1% 7.9% -0.05 4.86
4.55
YEN/USD (1-71 a 7-05)
-3.4% 9.4% -0.78 p
14.2
1.67
Na ltima coluna assume-se que Z N (0; 1) ; ^ A % = 250^ 100%
Tabela 3.1: Estatsticas Descritas de Algumas Aces, ndices e Taxas de Cmbio
petrolferos, etc.), enquanto os bilhetes de tesouro seriam vendidos por 119 dlares. Os
retornos anualizados (usando a frmula RA ) seriam de 10.1% para as aces, i.e.
1

RA 100% = (16797) 101

1 100% = 10:1%

e de 4.8% para os bilhetes do tesouro (valores nominais, i.e. no descontando a inflao).


Ver Taylor (2005) para mais detalhes sobre o prmio de risco.

3.1.2

Desvios Padro Diferentes Consoante os Activos

A tabela 3.1 mostra que os activos com maior variabilidade (e, portanto com maior risco
associado) so os ttulos de empresas, seguidos dos ndices bolsistas e taxas de cmbio (bilhetes do tesouro - resultados no apresentados - apresentam a menor variabilidade). No
mbito dos ttulos de aces, vrios estudos indicam (ver por exemplo, Taylor, 2005) que a
variabilidade dos retornos tende a diminuir medida que a dimenso das empresas aumenta
(ttulos de empresas pequenas apresentam maior variabilidade).

3.1.3

Retornos de Aces e de ndices tendem a Apresentar Assimetria


Negativa

A assimetria de uma distribuio normalmente aferida atravs do coeficiente de assimetria


sk anteriormente definido. Diz-se que a distribuio de r assimtrica negativa (positiva) se
35

sk < 0 (> 0). Se sk = 0 a distribuio simtrica (em relao mdia populacional).


c negativa se as variaes negativas fortes forem mais
Podemos ter uma estimativa sk

acentuadas do que as variaes positivas fortes. Quando assim sucede, os desvios negativos
P
(rt r)3 < 0 tendem a dominar os desvios positivos (rt r)3 > 0 na soma (rt r)3 e,

c negativa. Observe-se ainda que os desvios cbicos so divididos


por isso, a estimativa sk
por ^ 3 ; desta forma, elimina-se a possibilidade do coeficiente depender das unidades em que

a varivel observada (por exemplo, se multiplicarmos r por 100, para termos uma medida
c no sofre alterao).
em percentagem, sk

A tabela 3.1 mostra que as distribuies empricas das rendibilidades de aces e ndice

bolsistas em anlise so assimtricas negativas. Existe, portanto, evidncia emprica de que


as fortes variaes dos preos so maioritariamente de sinal negativo. Estas variaes so
obviamente crashes bolsistas. Sublinhe-se, no entanto, que alguns retornos de ttulos, por
registarem episdios de fortes variaes positivas, apresentam distribuies assimtricas positiva. A assimetria negativa no , portanto, uma caracterstica universal das distribuies de
retornos, embora, geralmente, tendam a apresentar assimetria negativa.
Sob certas hipteses, incluindo frt g uma sucesso de v.a. homocedsticas com distribuio normal, a estatstica de teste

Z1 =

c
p sk
np
6

tem distribuio assimpttica N (0; 1) : A hiptese nula H0 : sk = 0 pode ser testada a partir deste resultado2 . Mas as hipteses de partida, normalidade e homocedasticidade, so
relativamente severas. Na prtica, isto significa que a rejeio de H0 pode dever-se ausncia de normalidade e/ou homocedasticidade e no necessariamente falha de simetria da
distribuio. Desta forma, necessrio ter algum cuidado na interpretao dos resultados
quando H0 rejeitada.
c por vezes criticado por no ser robusto face presena de valores
O estimador sk

extremos. Na verdade, em certos casos, a ocorrncia de apenas uma nica variao negativa

c (os ttulos que incluem na


excepcionalmente forte pode resultar num valor negativo para sk
sua amostra o crash do dia 19 de Outubro de 1987 tendem a apresentar um valor estimado

para sk negativo). Por esta razo, aconselhvel usar-se medidas de assimetria robustas
2

A nica hiptese nula possvel H0 : sk = 0: Por exemplo, no faria sentido testar H0 : sk = 1 porque
a estatstica de teste obtida sob a hiptese de normalidade e sk = 1 claramente incompatvel com essa
hiptese.

36

contra a presena de outliers. Uma medida nestas condies proposta por Groeneveld and
Meeden (1984)
skGM =

E (r) q0:5
E (jr q0:5 j)

onde q0:5 o quantil de ordem 0.5, o que significa que q0:5 a mediana. O parmetro
E (jr

q0:5 j) fornece uma medida de disperso dos dados. Esta medida tem a vantagem

de variar entre -1 e 1, i.e.

1 < skGM < 1: Sob certas condies, skGM pode ser estimado

de forma consistente atravs da estatstica


[
sk
GM =

r m
P
n 1 nt=1 jrt

mj

sendo m a mediana emprica. Outra medida robusta o coeficiente de assimetria de Pearson,


skP =

E (r)

q0:5

Note-se, finalmente, que para as taxas de cmbio no h razo especial para esperar
sk > 0 ou sk < 0: Com efeito, suponha-se que St a taxa de cmbio do Dlar/Euro e
rt = log (St =St 1 ) : Se a distribuio de rt assimtrica negativa ento a distribuio dos
retornos associados taxa de cmbio do Euro/Dlar, 1=St (seja r~t esse retorno) assimtrica
positiva, pois
r~t = log

1=St
1=St 1

log

St
St 1

(note-se: se x tem distribuio com assimetria negativa,

rt

x tem distribuio com assimetria

positiva). Assim a assimetria positiva ou negativa nas taxas de cmbio depende da forma
como a taxa de cmbio est definida (no podendo, portanto, inferir-se qualquer regularidade
emprica).

3.1.4

Retornos Apresentam Distribuies Leptocrticas

O achatamento de uma distribuio normalmente aferida atravs do coeficiente de achatamento k (tambm designado por kurtosis ou curtose). Diz-se que a distribuio f mesocrtica se k = 3; platicrtica se k < 3 e leptocrtica se k > 3: O valor de referncia 3 o
que resulta da distribuio normal (assim, a distribuio normal ou Gaussiana mesocrtica). Valores altos de k^ (acima de 3) indicam que certos valores da amostra se encontram
muitos afastados da mdia, comparativamente aos demais valores da amostra. Observe-se

37

1.5
1.0
0.5
0.0
-0.5
-1.0
-1.5
-2.0
1

5
Y1

Y2

Figura 3-1: Qual das duas sries tem kurtosis estimada mais alta?
que os desvios (rt

r)4 so muito sensveis aos valores extremos da amostra. Por exemplo,

^ Para ilustrar o impacto dos outliers no


a existncia de outliers faz aumentar a estatstica k:
^ considere-se a figura 3-1. Pode-se observar que varincia da srie y1
valor da estatstica k;
menor do que a da srie y2 . No entanto, o valor k^ da srie y2 de apenas 1.5, ao passo
que o da srie y1 de 5.5. Os valores da srie y2 no se encontram, em termos relativos,
muitos afastados da sua mdia. J na srie y1 h um valor que se destaca dos demais e que
^ Para compararmos graficamente duas sries necessrio
responsvel pelo valor alto de k.
estandardiz-las (isto transform-las em sries de mdia zero e varincia 1). Continuando
o exemplo, considere-se agora as mesmas variveis estandardizadas:
z1 =

y1

y1
^ y1

z2 =

y2

y2
^ y2

Na figura 3-2 ambas as sries possuem a mesma varincia, mas agora claro o valor extremo
da srie y1
Observa-se para a generalidade das sries financeiras que os retornos muitos altos e muito
baixos ocorrem com maior frequncia do que seria de esperar se os retornos seguissem uma
distribuio normal. Uma forma de confirmar esta ideia consiste em comparar a estimativa
do coeficiente de kurtosis (curtose) dos retornos com o valor 3, que o valor de kurtosis da
distribuio normal.
Na generalidade dos casos o coeficiente k estimado vem quase sempre (bastante) acima
de 3, o que sugere que a distribuio dos retornos (de cotaes, ndice, taxas de cmbio e
mesmo taxas de juro) leptocrtica. Nas figuras 3-3 e 3-4 (esta ltima uma ampliao
da figura 3-3) mostra-se a diferena entre uma distribuio mesocrtica (k = 3) e uma
38

-1

-2
1

Z1

Z2

Figura 3-2: Sries y1 e y2 estandardizadas (ver figura 3-1)


distribuio leptocrtica (k > 3). A figura 3-4 mostra claramente por que razo a distribuio
leptocrtica tambm designada de distribuio de caudas pesadas. O ensaio H0 : k =
3 [y

N ormal & y i:i:d] pode ser conduzido pela estatstica de teste

Z1 =

^
p k 3
n p
24

! N (0; 1) :

Por exemplo, para a Microsoft (tabela 3.1) e sabendo que no perodo considerado se obser0.5
0.4
0.3

Normal

0.2

Leptoc.

0.1
0
-7

-4.5

-2

0.5

5.5

Figura 3-3: Comparao de duas densidades (normal vs. leptocrtica)


varam 4415 dados dirios (n = 4415) tem-se
z1 =
O valor-p P (jZ1 j > 51:54)

p
(6:8
4415 p

3)
24

= 51:54:

0: Existe forte evidncia contra H0 .


39

0.01
0.008
0.006

Normal

0.004

Leptoc.

0.002
0
-7

-4.5

-2

0.5

5.5

Figura 3-4: Ampliao da figura 3-3


Podemos tambm confirmar a existncia de caudas pesadas calculando o rcio
P^ (jrt rj > 3^ )
:
P (jZj > 3)
Se Z

(3.1)

N (0; 1) ento P (jZj > 3) = 0:0027: Esta , aproximadamente, a probabilidade

associada a eventos extremos quando Z tem distribuio N (0; 1). Se a distribuio de rt


possusse caudas normais deveramos esperar que
E (rt )j = > 3) ' P (jZj > 3)

P (jrt
(observe-se que (rt

r) =^ so os retornos estandardizados) e, portanto, o rcio (3.1) deveria

ser aproximadamente igual a um. No entanto, a tabela 3.1 mostra que esse rcio tende a ser
significativamente superior a um. Isto sugere que os retornos muitos altos e muito baixos
tendem a ocorrer com maior frequncia do que seria de esperar se a varivel seguisse uma
distribuio normal.
Observao 3.1.1 Como estimar a probabilidade P (jrt E (rt )j = > 3)? Primeiro subp
stitumos E (rt ) e = Var (rt ) pelas respectivas estimativas consistentes, r e : Depois,
calculamos a proporo de vezes (na amostra) em que ocorre jrt
assim uma estimativa para P (jrt

rj =

E (rt )j = > 3) : Em termos analticos:


1X
rj = > 3) =
Ifjrt
n t=1
n

P^ (jrt

onde Ifjrt

rj= >3g

= 1 se ocorre jrt

rj= >3g

rj = > 3 e zero no caso contrrio.


40

> 3. Obtm-se

.2

20

.1

10

.0

-.1

-10

-.2

-20

-.3

Bandas (-3,3)

-30
30

40

50

60

70

80

90

00

10

30

40

50

60

70

80

90

00

10

Figura 3-5: Painel Esquerdo: retornos dirios do Dow Jones no perodo 02/10/1928 a
3/02/2011 (20678 observaes). Painel direito retornos estandardizados, zt = (rt r) =^
Apresenta-se a seguir mais um exemplo envolvendo o rcio (3.1). No painel esquerdo
da figura 3-5 apresentam-se os retornos dirios do Dow Jones no perodo 02/10/1928 a
3/02/2011 (20678 observaes). No painel direito da mesma figura apresentam-se os retornos estandardizados juntamente com as rectas -3 e 3. Se os retornos seguissem uma
distribuio normal seria de esperar que zt = (rt

r) =^ excedesse os limiares 3 e

3 em

cerca de 0.27% das vezes, tendo em conta, como j vimos, que P (jZj > 3) = 0:0027;
supondo Z

N (0; 1). Ora, na verdade zt excede os limiares 3 e -3 em cerca de 1:73% das

observaes (zt excede os limiares 359 vezes, em 20678 observaes).


Tem-se assim

P^ (jrt rj > 3^ )
0:017
=
= 6:29
P (jZj > 3)
0:0027

Finalmente, podemos ainda testar a hiptese conjunta H0 : k = 3 & sk = 0 [assumindo


r

N ormal & r i:i:d] atravs da estatstica de Bera-Jarque


0

^
B k
2
2
Z1 + Z2 = n @

3
24

c C d
sk
A !
6

2
(2)

Grfico QQ-Plot
Outra forma de compararmos a distribuio normal com a distribuio dos retornos consiste
em analisar o grfico QQ-plot. O grfico QQ-plot o grfico dos pares ordenados
f(q ; q~ ) ;
41

2 (0; 1)g

Quantis Normal

-4

-8

-12
-12

-8

-4

Quantis retornos PSI20

Figura 3-6: QQ Plot (retornos do PSI20 normalizados)


onde q o quantil de ordem

da distribuio Z

N (0; 1) (eventualmente outra) e q~ o

quantil da distribuio emprica associada varivel estandardizada


xt =

rt

isto
q

: P (Z < q ) = ;

q~

: P~ (xt < q~ ) = ;

xt :

Assim, se xt tem a mesma distribuio de Z; ento q

N (0; 1)

q~ e o grfico f(q ; q~ ) ;

2 (0; 1)g

uma recta de 45o . Se, pelo contrrio, as distribuies de xt e Z so diferentes o grfico afasta-se da recta de 45o (poderamos tambm comparar a distribuio de xt com outra
qualquer). A figura 3-6 permite concluir que a distribuio dos retornos leptocrtica e assimtrica. O grfico sugere, por exemplo, que P (Z <

3:9) ' P (xt <

8). A distribuio

leptocrtica pois o grfico tem a forma de um S sobre a recta de 45o . A distribuio


assimtrica porque o S no simtrico sobre a recta de 45o .

42

r
Retornos Dirios
Frankfurt
Hong Kong
Londres
Nova York
Paris
Tquio
Retornos Semanais
Frankfurt
Hong Kong
Londres
Nova York
Paris
Tquio

0.00035
0.00057
0.00041
0.00049
0.00026
0.00005

c
sk

k^

0.0123 -0.946 15.0


0.0169 -5.0 119.24
0.0092 -1.59
27.4
0.0099 -4.30 99.68
0.0120 -0.53 10.56
0.0136 -0.213 14.798

0.00169 0.0264 -1.06


0.00283 0.0370 -2.19
0.00207 0.0215 -1.478
0.00246 0.0206 -1.37
0.0028 0.0284 -0.995
0.00025 0.0288 -0.398

8.09
18.25
15.54
11.25
9.16
4.897

Tabela 3.2: ndices Bolsistas (6-Jan-86 a 31-Dez-97)

3.1.5

Aumento da Frequncia das Observaes Acentua a No Normalidade das Distribuies

Diz-se que a frequncia das observaes aumenta quando, se passa, por exemplo, de observaes mensais para observaes semanais ou destas para dirias. A tabela 3.2 mostra que o
coeficiente de kurtosis aumenta quando se passa de observaes semanais para observaes
dirias. Assim, a distribuio marginal dos retornos dirios apresenta um maior afastamento
face distribuio normal. possvel fazer um raciocnio inverso: a diminuio da frequncia das observaes (por exemplo, quando se passa de observaes dirias para observaes
semanais ou mensais) atenua o afastamento da distribuio dos retornos relativamente distribuio normal. Uma possvel explicao terica para este facto descrita a seguir.
Sejam P0 ; P1 ; P2 ; ::: os preos dirios. Se a frequncia de observaes baixa, passamos
a observar P0 ; Ph ; P2h ; ::: sendo h um inteiro maior do que 1. Por exemplo, se passarmos
para dados semanais (h = 5) passamos a observar P0 ; P5 ; P10 ; ::: (imagine-se que t = 0
uma segunda-feira; passados 5 dias observa-se a segunda-feira seguinte que corresponde a
t = 5). Neste caso, os retornos semanais so:
log Ph log P0 ; log P2h log Ph ; ::: com h = 5
|
{z
} |
{z
}
retorno 1a semana

retorno 2a semana

Para h geral, o primeiro retorno observado r~1 = log Ph

43

log P0 : Como os retornos contn-

uos so time-additive, resulta

r~1 (h) = log Ph

log P0 = r1 + r2 + ::: + rh =

h
X

ri

i=1

(ri so os retornos dirios). Mesmo que ri no tenha distribuio normal, o retorno associados a uma frequncia de observao mais baixa, r~ (h) ; tender a ter distribuio normal pelo
teorema do limite central. Com efeito, sob certas condies (relacionadas com a varincia
de ri e a memria temporal de r) tem-se
Ph

i=1 ri

Ph

i=1 ri

r
Ph
Var
i=1 ri

! N (0; 1)

quando h ! 13 . Para h suficientemente alto resulta4


h
X

ri

i=1

h
X

ri

i=1

; Var

h
X

ri

i=1

!!

Assim, espera-se que a diminuio da frequncia amostral atenue a no normalidade observada nas sries de retornos de alta frequncia.

3.1.6

Efeitos de Calendrio

Designamos efeitos de calendrio quando a rendibilidade e/ou a volatilidade varia com


o calendrio. Por exemplo, se certo ttulo regista maior rendibilidade e/ou volatilidade s
segundas-feiras, temos um efeito de calendrio (efeito dia da semana). Tem-se estudado a
forma como a rendibilidade e a volatilidade varia com o dia da semana, dia do ms, com o
ms do ano e com a proximidade dos feriados. Certos autores qualificam estes efeitos de
calendrio como anomalias. Com efeito, se o mercado eficiente todas as anomalias
depois de detectadas so rapidamente incorporadas nas decises dos investidores e, tendem,
por isso, a desaparecer. Para ilustrar a ideia, suponha-se, por exemplo, que a rendibilidade
do ttulo ABC tende a aumentar s 14h de todas as teras-feiras. Todos os investidores que
3

Se for possvel garantir que E


p
escrever-se na forma habitual h (r

Ph

i=1 ri

= n E (ri ) e Var
d

Ph

i=1 ri

=h

ento este resultado pode

E (ri )) = ! N (0; 1) (quando h ! 1):


Observe-se: zn ! N (0; 1) se no limite, quando n ! 1; z1 tem distribuio N (0; 1) : Assim, para n
a
razoavelmente alto, zn tem distribuio aproximadamente normal, i.e. zn N (0; 1) :
4

44

detectem essa anomalia vendem o ttulo da empresa ABC s teras-feiras s 14h. Como
resultado o preo da empresa ABC tenderia a cair por volta dessa hora e a anomalia desaparecia. De uma forma geral, se os investidores so racionais e dispem de toda a informao
passada sobre o mercado, as anomalias relacionadas com as rendibilidades dependentes do
calendrio, tendem a desaparecer, logo que sejam detectadas. Na prtica, subsistem certas
anomalias que no desaparecem mas que, em geral, no permitem obter rendibilidades anormais, depois de deduzidos os custos de informao e transaco. Podem assim permanecer
no mercado anomalias ou ineficincias para as quais o benefcio de explorar essas ineficincias no compensa os custos adicionais associados.
Dia da Semana
partida espera-se que os retornos segunda-feira sejam um pouco mais altos face aos
demais dias da semana, pois a posse de ttulos segunda-feira representa um investimento
de 72 horas face ltima sexta-feira, tendo em conta que o mercado fecha aos fins-desemana. Analiticamente observe-se que se o retorno dirio rt tem mdia

ento, para um

investimento de 3 dias (de sexta a segunda-feira) o retorno associado, rt + rt+1 + rt+2 ;


dever ter mdia 3 : Assim, o retorno segunda feira deveria ser, em mdia, trs vezes
superior ao retorno dos demais dias da semana. Taylor (2005) reporta vrios estudos com
concluses contraditrias (para certos ttulos e para determinados perodos possvel que o
retorno segunda-feira seja mais elevado, mas no se pode concluir em geral que o retorno
s segundas seja necessariamente superior ao dos demais dias da semana).
Por outro lado, um investimento a 3 dias deve ser mais voltil do que um investimento
a um dia. Se rt tem varincia

e frt g uma sucesso de v.a. no autocorrelacionadas,

rt + rt+1 + rt+2 ; tem varincia igual a 3 2 : Portanto, espera-se que s segundas feiras o
retorno apresente maior variabilidade. No entanto, argumenta-se que a (verdadeira) varincia
associada aos retornos de segunda-feira no pode ser to alta como o valor 3

sugere, pois

durante o fim-de-semana as notcias que movimentam o mercado (e produzem volatilidade)


so, em geral, escassas e pouco relevantes. De todo o modo, regista-se, para um nmero
considervel de activos, um aumento de volatilidade segunda-feira.
A melhor forma de testar estes efeitos passa pela modelao ARCH (cap. 8). Uma forma
menos eficiente de testar estes efeitos consiste em calcular a mdia e a varincia dos retornos
nos vrios dias da semana. Por exemplo, para analisar se as mdias dos retornos so iguais

45

nos vrios dias da semana, faz-se a regresso,


rt =

1 tert

2 quat

3 quit

4 sext

+ ut

(3.2)

onde ter; qua; etc. so variveis dummy que assumem o valor um se t corresponde, respectivamente, a uma tera-feira, quarta-feira, etc. (note-se que o grupo base a segundafeira). Sendo o grupo base a segunda-feira,
(E (rt j segt = 1) =

). Por outro lado,

i,

a mdia do retorno segunda feira

para i = 1; :::; 4 representam as diferenas da

mdia do retorno dos outros dias face segunda-feira (por exemplo, se


retorno mdio quinta-feira igual a

0:01 e

0:01 ento o

representa a diferena face segunda-

feira).
O ensaio H0 :

= ::: =

= 0 corresponde a testar a no existncia de diferenas

nas mdias dos retornos dos vrios dias da semana. A estatstica habitual para o caso em
anlise (em que H0 estabelece a nulidade de todos os parmetros com excepo do termo
constante)
F =

R2 = (k 1)
(1 R2 ) =(n k)

onde k o nmero de regressores (incluindo o termo constante) e R2 o coeficiente de determinao. Sob H0 (homocedasticidade e ausncia de autocorrelao) a estatstica F tem
distribuio F (k

1; n

k). Na presena de heterocedasticidade, os teste t e F habitu-

ais so invlidos. Uma soluo para este problema consiste na estimao da equao (3.2)
atravs dos modelos da famlia ARCH (veremos este aspecto no captulo 8). Outra soluo
passa pela utilizao de erros padro robustos (ou da estatstica F robusta) contra a presena
de heterocedasticidade5 .
Em Taylor (2005) descrevem-se outras anomalias associadas ao calendrio.
5

d ^
Erros padro (de White) robustos contra heterocedasticidade obtm-se a partir da matrix Var

(X0 X)

X0 WX (X0 X)

onde W uma matriz diagonal com elementos u


^21 ; :::; u
^2n : A estatstica ro-

busta, na verso do teste de Wald, para ensaiar H0 : R = r; R ^


2
(q)

d ^ R0
RVar

R^

r ;e

tem distribuio assimpttica


onde q o numero de restries. Nota sobre o programa EVIEWS (verso 6
e 7): a opo White em Heteroskedasticity consistent coefficient covariance que aparece depois de se seleccionar Quick/Estimate/Options fornece no output erros padro robustos, mas no, infelizmente, a estatstica
F robusta. possvel obter esta estatstica robusta fazendo o seguinte: escolhe-se a opo White em Heteroskedasticity consistent coefficient covariance e estima-se o modelo. Em seguida realiza-se o teste Wald
seleccionando View/Coefficient Tests/Wald, introduzindo-se depois as restries a ensaiar.

46

3.1.7

Distribuies Tericas para os Retornos

Distribuio t-Student
bem conhecida a distribuio t-Student com v graus de liberdade, t (v) : A fdp

f (x) = p
Como se sabe, se X
3 + 6= (v

v+1
2
v
2

v+1
2

x2
1+
v

t (v) ; ento E (X) = 0; Var (X) = v= (v

2), sk = 0 e k =

4) : Como k > 3 conclui-se que a distribuio t (v) tem caudas pesadas. Por

vezes tem interesse trabalhar com uma varivel aleatria " com distribuio t-Student de
mdia zero mas varincia igual a um. Se X
"=X

t (v) a soluo passa pela transformao

p
(v

fcil constatar que Var (") = 1; k" = kx = 3 +

g (x) = p

1
(v

2)

2) =v:
6
:
v 4

v+1
2
v
2

Note-se que a fdp de "

1+

v+1
2

x2
v

Quando mais baixo for o nmero de graus de liberdade mais pesadas so as caudas. No
caso v = 4 o momento de ordem 4 no existe e, portanto, tambm no existe o coeficiente
R
de kurtosis (quer dizer, neste caso, o integral imprprio R x4 g (x) dx no finito porque a
expresso x4 g (x) no tende para zero com suficiente rapidez).

Mistura de Normais
Considere-se uma distribuio mistura de normais:
N ( 2;

2
2) :

100% de N ( 1 ;

2
1)

e (1

) % de

Por exemplo, imagine-se que se faz uma extraco de nmeros aleatrios da

seguinte forma: atira-se uma moeda ao ar. Se cair caras simula-se uma varivel X1 com
distribuio N ( 1 ;

2
1) ;

se cair coroas, simula-se X2 com distribuio N ( 2 ;

2
2) :

De uma

forma geral, a varivel X; que representa a mistura de normais, pode escrever-se da seguinte
forma:
X = U X1 + (1

U ) X2 ;

onde U tem distribuio de Bernoulli. Sejam f; fu e fxju respectivamente a fdp de X; a


funo de probabilidade de U e a fdp condicional de X dado U = u: Para obter a fdp

47

f(x)

0.010
0.009
0.008
0.007
0.006
0.005
0.004
0.003
0.002
0.001

-8

-7

-6

-5

-4

-3

-2

-1

Figura 3-7: Abas da t-Student ( v = 4:1; - - v = 5;


de X usa-se a expresso bem conhecida da estatstica: f (x) =

v = 30)
P1

u=0

fxju (xju) fu (u). A

distribuio de X dado U = u imediata, tendo em conta que uma soma de normais ainda
uma normal:
XjU = u

N (E (XjU = u) ; Var (XjU = u)) ;

onde
E (XjU = u) = u
Var (XjU = u) = u2

+ (1
2
1

+ (1

u)

u)2

2
1

+ 2u (1

u) Cov (X1 ; X2 )

Assim, fxju (xju) a funo de densidade da normal de mdia E (XjU = u) e varincia


Var (XjU = u). Desta forma,
f (x) = fxju (xj0) + (1
sendo fxju (xj0) a fdp da distribuio N ( 1 ;
No exemplo da moeda ao ar,

) fxju (xj1) ; 0
2
1)

e fxju (xj1) a fdp da distribuio N ( 2 ;

2
2 ).

0.5. interessante observar que uma mistura de normais

conduz a uma distribuio no normal. Em particular a mistura pode ser assimtrica e leptocrtica. Com efeito, pode-se mostrar que,
E (X) =
Var (X) =

+ (1
2
1

+ (1

2;

2
2

(1

)(
48

2)

f(x) 1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
-5

-4

-3

-2

-1

Figura 3-8: Mistura de Normais


E (X
k =3+

E (X))
3 (1

)(
2 +(1
1

=
2
1

(1

)(

2)

(1

2 )(

2)

2 2
2
2 2
2

)
> 3 supondo, para simplificar, que
)

Na figura 3-8 representa-se f (x) para

= 0:5;

1;

+ 3(

= 1;

2
1

2
2)

= 0:

= 1=5;

= 5: A

fdp traada assimtrica e leptocrtica.


Distribuio com Caudas de Pareto
A fdp de Pareto
g (y) = c y

( +1)

y > c:

primeira vista pode parecer que esta distribuio no serve pois o nosso objectivo modelar os retornos e o espao de estados desta varivel claramente R (os retornos podem assumir qualquer valor em R). Ora, sucede que g apenas est definida para y > c (e, portanto,
no atribui probabilidades quando y < c). No entanto, o que procuramos neste momento
caracterizar probabilisticamente os eventos extremos, i.e. os eventos que se encontram
bem afastados da mdia. Estamos, portanto, concentrados nas abas da distribuio e, para o
efeito, o que relevante o que se passa para y > c:
Diz-se que uma fdp f (y) tem distribuio com caudas de Pareto (mesmo que no seja
uma distribuio de Pareto) se
f (y)

Cy

( +1)

49

>0

fdp

0.07
0.06
0.05
0.04
0.03
0.02
0.01
0.00
2.0

2.5

3.0

3.5

4.0

4.5

5.0

Figura 3-9: Cauda de Pareto vs. Cauda Gaussiana


(C uma constante). O sinal significa aqui que
lim f (y) =Cy

y!1

( +1)

= 1:

Esta ltima equao diz-nos que para valores grandes de y, f (y) praticamente igual a
Cy

( +1)

(no limite igual). Para valores pequenos de y, f (y) pode ser completamente

diferente de Cy

( +1)

: A similaridade est nas caudas, quando y ! 1 (existem definies

mais gerais, baseadas em funes slowly varying at 1). Pode-se concluir que f (y) tem um
decaimento polinomial para zero (decaimento lento para zero) e, portanto, caudas pesadas. J
a distribuio normal tem um decaimento exponencial (recorde-se que no caso Gaussiano,
f (y) = C exp f y 2 =2g) e a fdp tende para zero muito rapidamente quando y tende para
1. A figura 3-9 compara uma cauda Gaussiana com uma cauda de Pareto.
Uma vez que a fdp com caudas pesadas do tipo f (y)

Cy

( +1)

para zero, certos valores esperados podem no existir. De facto, se

no tende rapidamente

< k ento os momentos

de ordem igual ou superior a k no existem. Com efeito, seja D o espao de estados de yt

50

(valores que y pode assumir). Para um certo c 2 D e c > 0; vem:


k

E jyt j

jyjk f (y) dy

ZD1

Zc 1

= C

jyjk f (y) dy
jyjk Cy
1

1+k >

se

1; ou seja, se

jyj

( +1)

1+k

dy

dy = 1

< k: Por exemplo, Var (yt ) no existe se

Estimador de Hill Suponha-se f (y)

Cy

( +1)

< 2:

: Como estimar ? Antes de propormos

um estimador para ; admita-se um cenrio mais simples: f (y) tem distribuio (exacta) de
Pareto, y

P areto (c; ) ; ou seja


f (y) =

c
+1

y > c:

Assuma-se que fyt ; t = 1; 2; :::; ng uma sucesso de v.a. i.i.d. com distribuio de P areto ( ; c) :
A funo de log-verosimilhana corresponde expresso

log L ( ; c) =

n
X

log f (yt ) = n log ( ) + n log (c)

( + 1)

t=1

n
X

log (yt ) :

t=1

Diferenciando log L com respeito a

e igualando a zero obtm-se


n
:
t=1 log (yt =c)

^ = Pn

^ n maximizante, pois @ 2 log L=@ 2


N 0; I ( )

n=

(3.3)

< 0: Tem-se ainda

n (^ n

onde
I(

0)

@ 2 log f (yt )
@ 2

1
2

O estimador de mxima verosimilhana de c c^ = mint=1;:::;n fyt g6


Retome-se agora a hiptese f (y)

Cy

( +1)

: Se uma distribuio tem caudas de Pareto,

mas no uma distribuio de Pareto, ento o estimador para


6

acima apresentado no pode

Embora a derivada da funo log L (c; ) com respeito a c no se anule (verifique), pode-se concluir que no
intervalo de valores admissveis de c, isto , c mint=1;:::;n fyt g ; a funo log L (fixado ) atinge o mximo
em c^ = mint=1;:::;n fyt g :

51

ser utilizado. Nestas circunstncias, se estamos apenas interessados em estimar o ndice


de cauda

(supondo que y tem distribuio com caudas de Pareto, mas no segue essa dis-

tribuio), devemos aparar a amostra fyt ; t = 1; 2; :::; ng ; por exemplo, considerando apenas
os dados yt tais que yt > q (onde q pode ser interpretado como um quantil de y; geralmente
um quantil de ordem superior a 0.95). Analisa-se, portanto, o comportamento de y apenas
para os valores muitos altos (ou muito baixos) de y.
O estimador de ; designado por estimador de Hill, para a aba direita da distribuio
n (q)
;
t=1 log (yt =q) Ifyt >qg

^ (q) = Pn

n (q) =

n
X
t=1

Ifyt >qg

(3.4)

onde Ifyt >qg = 1 se yt > q e Ifyt >qg = 0 no caso contrrio. Pode-se pensar neste estimador
como se fosse o estimador (3.3), mas aplicado apenas aos valores da amostra que verificam
yt > q:
O estimador de

para a aba esquerda da distribuio o que resulta da equao (3.4) de-

pois de se substituir Ifyt >qg por Ifyt <qg , sendo q agora um quantil de ordem 0.05 ou inferior.
Pode-se mostrar

p
n (q) (^ (q)

(q)) ! N 0;

quando n ! 1, n (q) ! 1 e n (q) =n ! 0: Observe-se Var (^ (q)) =

=n (q) : Como

desconhecido podemos tomar como estimador de Var (^ (q)) a expresso ^ 2 =n (q) : Estes
resultados assimptticos so obtidos num contexto i.i.d. Kearns e Pagan (1997) mostram
todavia que a varincia assimpttica de ^ aumenta consideravelmente na presena de dependncia.
Exemplo 3.1.1 Resulta do quadro seguinte que ^ (0:01) = 3=5:193 = 0:577
yt

Ifyt >0:01g

log (yt =0:01) Ifyt >0:01g

-0.110

0.090

2.197

0.100

2.303

-0.100

0.020

0.693

0.005
P

5.193

Qual o valor do threshold q que devemos escolher? Temos um dilema de enviesamento


52

versus varincia:
se q alto a estimao de ^ (q) baseada em poucas observaes, i.e., n (q) baixo,
pelo que a varincia de ^ (q) alta (observe-se Var (^ (q)) =
se q baixo, perde-se a hiptese f (y)

Cy

( +1)

=n (q));

e, como consequncia, o estimador

^ (q) enviesado e mesmo inconsistente (recorde-se que ^ (q) baseado na hiptese


f (y)

Cy

( +1)

).

Exemplo 3.1.2 Na tabela seguinte apresentam-se estimativas do ndice da cauda de retornos bolsistas sectoriais do mercado norte-americano no perodo 03/1/1994 a 21/01/2011
(4292 observaes).
Aba Esquerda

Aba Direita

^ (q0:0:025 )

^ (q0:975 )

Retorno

Volat.

no obs. efect. usadas:

108

108

Anualiz.

Anualiz.

Petrleo e Gs

2.29

3.16

9.45%

Matrias-Primas

2.81

3.15

Indstria

2.91

Consumo (bens)

Skew.

Kurt.

25.79%

-0.25

13.98

6.77%

25.90%

-0.29

10.32

3.00

7.42%

21.90%

-0.25

8.441

3.37

2.93

2.34%

19.82%

-0.15

9.025

Sade

2.90

3.52

7.12%

17.29%

-0.08

11.44

Comunicaes

3.10

3.26

1.37%

22.31%

0.09

9.962

Utilities

3.06

2.78

1.86%

19.10%

0.04

14.19

Financeiras

2.68

2.37

5.02%

29.02%

-0.10

15.58

Tecnologia

3.77

3.07

9.42%

30.44%

0.16

7.065

Fonte: Datastream

Algumas concluses podem ser retiradas:


Em todos os casos razovel admitir que a varincia existe. Os momentos de ordem
4 podem no existir.
Os ndices de cauda estimados so relativamente baixos o que sugere que existe uma
massa de probabilidade considervel associada a valores extremos na amostra.

53

Figura 3-10: Estimativa da fdp dos retornos do DowJones no perodo Out/1988-Jan/2010 e


fdp normal de mdia e varincia estimadas a partir dos retornos

3.1.8

Estimao No Paramtrica da Funo Densidade de Probabilidade

A forma mais simples de estimar f (x) consiste em obter o histograma das frequncias relativas. Existem, no entanto, estimadores preferveis. Uma estimativa no paramtrica de f (x)
pode ser dada por

1 X
f^ (x) =
K
nh i=1
n

xi
h

onde K (u) uma fdp (ver detalhes no ponto 10.2). Sob certas condies, incluindo h !

p
0; n ! 1; nh ! 1 pode-se provar f^ (x) ! f (x) : Na figura 3-10 apresenta-se uma es-

timativa no paramtrica da fdp marginal dos retornos do Dow Jones no perodo Out/1988Jan/2010 (na verdade, esto representadas vrias estimativas: f (x1 ) ; f (x2 ) ; :::; f (xk ) ;
sendo fxk g uma sucesso de valores igualmente espaado no intervalo ( 0:07; 0:06) - vejase o eixo das abcissas da figura 3-10). Na figura representa-se tambm a fdp da N r; ^ 2

onde r e ^ 2 so as estimativas dos dois primeiros momentos dos retornos do Dow Jones no
perodo considerado.
Comparando f^ com a densidade normal, conclui-se que f^ atribui maior massa de probabilidade na vizinhana da mdia emprica e nos intervalos associados aos valores extremos
da amostra, e atribui reduzida massa de probabilidade no intervalo dos valores moderados da
54

amostra, digamos no intervalo ( 0:03; 0:01) e (0:01; 0:03).

3.2

Regularidade Empricas relacionadas com a Distribuio


Condicional

Neste ponto discutimos regularidades que envolvem especificaes dinmicas relacionadas


com a distribuio condicional dos retornos ou de uma funo dos retornos (por exemplo,
veremos como o retorno depende dos seus valores passados, ou como o quadrado dos retornos depende do quadrado dos retornos passados, entre outras especificaes).

3.2.1

Autocorrelaes Lineares Baixas entre os Retornos

A correlao entre as variveis X e Y dada por


Cov (X; Y )
;
=p
Var (X) Var (Y )

1:

O coeficiente mede o grau de associao linear entre Y e X. Quanto mais alto for j j maior
a relao entre X e Y: Podemos tambm medir a associao linear entre yt e yt
yt e yt

ou entre

etc.
s

Como

Cov (yt ; yt s )
=p
Var (yt ) Var (yt s )

pode ser visto como uma funo de s;

designado por funo de autocorrelao

(FAC) (ou ACF em ingls). Se assumirmos Var (yt ) = Var (yt s ) vem

Cov (yt ; yt s )
Cov (yt ; yt s )
Cov (yt ; yt s )
=p
= q
=
.
Var (yt )
Var (yt ) Var (yt s )
(Var (yt ))2

Pelo mtodo dos momentos, a estimao de


1

^s =
O coeficiente

n s

pode fazer-se atravs do estimador

Pn

y) (yt s
t=s+1 (yt
Pn
1
y)2
t=1 (yt
n

y)

pode ser tambm obtido no contexto do modelo de (auto)regresso


yt = c +

s yt s

55

+ ut

Figura 3-11: Funes de autocorrelao dos retornos dirios (Microsoft 1986-2006)


onde se admite que fut g uma sucesso de v.a. independentes e E (ut j yt s ) = 0. O rcio-t
associado estimativa de

permite ensaiar H0 :

= 0: Em alternativa temos os seguintes

testes standard vlidos sob a hiptese i.i.d.


Teste Kendal e Stuart H0 :
p

=0
d

n (^k + 1=n) ! N (0; 1) ;

^k

1 1
;p
n n

p
Rejeita-se H0 ao n.s. de (aprox.) 5% se j^k j > 2= n (supondo 1=n
Teste Ljung-Box H0 :

= ::: =

0).

=0

Qm = n (n + 2)

m
X
k=1

1
n

^2k !

2
(m)

Em geral os coeficientes de autocorrelao dos retornos so baixos. Na figura 3-11 as


estimativas da FAC dos retornos dirios da Microsoft 1986 a 2006 so relativamente baixas.
Imagine-se uma situao hipottica em que se tem um coeficiente de correlao negativo e alto (em mdulo), por exemplo,

0:9; para dados dirios. Suponha-se ainda,

para simplificar a anlise, que E (rt ) = 0. Se o retorno hoje positivo, amanh o retorno
tender a ser negativo e vice-versa. Nestas circunstncias, se o retorno hoje alto vende-se

56

hoje e compra-se amanh. Existe, portanto, uma forte possibilidade de ganho (arbitragem)
com base na observao passada dos preos. Se outros participantes do mercado compram
e vendem com base neste padro de autocorrelao, o processo de arbitragem reduzir rapidamente a correlao (se o retorno hoje alto e positivo muitos participantes vendem hoje e
compram amanh; como consequncia o preo tender a diminuir hoje e aumentar amanh
e a correlao tender a esbater-se). Portanto, no credvel, supor-se

0:9:

Retome-se a figura 3-11. A coluna Q-Stat fornece os valores de Qm para m = 1; :::; 20:
Fixe-se por exemplo, m = 20: Tem-se Q20 = 36:613: O valor-p associado zero, isto ,
P (Q20 > 36:613) = 0:013: Logo existe evidncia contra a hiptese nula H0 :
20

= ::: =

= 0: Esta concluso parece contraditria com a ideia de baixas autocorrelaes dos

retornos. No entanto, preciso observar o seguinte:


em amostras muito grandes, como aquela que analisamos, qualquer pequeno desvio
face hiptese nula implica a sua rejeio;
os coeficientes estimados embora (paream) estatisticamente significativos esto, ainda
assim, muito perto de zero e no oferecem informao suficiente para realizar maisvalias anormais (depois de deduzidos os custos de transaco e informao);
os testes foram utilizados sob a hiptese irrealista de os retornos serem i.i.d. Esta suposio no vlida sobretudo devido presena de heterocedasticidade condicionada.
Uma forma de mitigar a presena de heterocedasticidade consiste em estandardizar os
retornos,
rt

rt =

r
^t

onde ^ t uma estimativa da volatilidade no momento t (rt pode ser encarado como os retornos expurgados de heterocedasticidade). Como obter ^ t ? Discutiremos esta questo com
alguma profundidade no captulo 8. suficiente agora usar uma especificao relativamente
simples (mas subptima):
^ 2t = (1

) rt2

+ ^ 2t 1 ;

= 0:96

Na figura 3-12 apresentam-se os coeficientes de autocorrelao de rt : Observa-se que os coeficientes de autocorrelao continuam muitos baixos mas agora no existe evidncia contra
a a hiptese

= ::: =

20

= 0:
57

Figura 3-12: Funes de autocorrelao dos retornos dirios estandardizados (Microsoft


1986-2006)
Sries macroeconmicas geralmente exibem moderada ou forte autocorrelao. Veja-se,
por exemplo, a figura 3-13 onde se representa a FAC de yt = log (GN Pt =GN Pt 1 ) sendo
GNP (Gross National Product) o PIB dos EUA (dados trimestrais de 1947 a 2003).

3.2.2

Volatility Clustering

J vimos que valores muitos altos e muito baixos ocorrem frequentemente (com maior frequncia do que seria de esperar se as variveis seguissem uma distribuio normal). Este
valores extremos no ocorrem isoladamente: tendem a ocorrer de forma seguida (volatility
clustering). Na figura 3-14 representam-se os retornos dirios associados ao ndice Dow
Jones (1926-2006). Na figura 3-15 apresentam-se os mesmos retornos mas agora dispostos
por ordem aleatria no tempo. Algumas estatsticas destas duas sucesses so obviamente
iguais (mdia, desvio padro, coeficientes de assimetria e de achatamento). No entanto existem diferenas significativas. S no verdadeiro cronograma (figura 3-14) aparece uma
das propriedades mais importantes dos retornos: fortes (baixas) variaes so normalmente
seguidas de fortes (baixas) variaes em ambos os sentidos (volatility clustering)
Se fortes (baixas) variaes so normalmente seguidas de fortes (baixas) variaes em

58

Figura 3-13: Funes de autocorrelao de yt = log (GN Pt =GN Pt 1 ) onde GNP o PIB
dos EUA (dados trimestrais de 1947 a 2003).

0.2
0.15
0.1
0.05
0
-0.05
-0.1
-0.15
-0.2
-0.25
Jan-04

Jun-00

Apr-93

Nov-96

Sep-89

Jul-82

Feb-86

Dec-78

Oct-71

May-75

Mar-68

Jan-61

Aug-64

Jun-57

Apr-50

Nov-53

Sep-46

Jul-39

Feb-43

Dec-35

Oct-28

May-32

-0.3

Figura 3-14: Retornos dirios do Dow Jones (1928-2006)

0.2
0.15
0.1
0.05
0
-0.05
-0.1
-0.15
-0.2
-0.25
-0.3

Figura 3-15: Retornos dirios do Dow Jones dispostos por ordem aleatria

59

Figura 3-16: Funes de autocorrelao dos quadrados dos retornos (Dow JOnes)
ambos os sentidos, ento rt2 deve estar correlacionado7 com rt2 i (i = 1; 2; :::).
A figura 3-16, onde se apresentam as funes de autocorrelao de rt2 ; onde r o retorno
associado ao ndice Dow Jones, confirma esta ideia.
Nesta seco identifica-se o quadrado do retorno com a volatilidade. No inteiramente
correcta esta analogia, embora seja admissvel associar-se momentos de grande (baixa) volatilidade a valores altos (baixos) de rt2 : De qualquer forma, a principal concluso mantm-se:
fortes (baixas) variaes so normalmente seguidas de fortes (baixas) variaes em ambos
os sentidos e identificamos este fenmeno como volatility clustering.

3.2.3

Forte Dependncia Temporal da Volatilidade

Nos pontos precedentes observmos o seguinte: (1) valores muitos altos e muito baixos
ocorrem frequentemente e (2) estes valores extremos aparecem de forma seguida (volatility
clustering). Neste ponto refora-se a ideia de volatility clustering: no s os valores extremos
tendem a aparecer de forma seguida como tambm h alguma persistncia neste fenmeno.
7

Esta correlao poderia, em princpio, dever-se presena de uma mdia condicional no constante. Por
exemplo, se rt seguisse um MA(1), rt = rt 1 + ut ; onde ut um rudo branco, ento, por construo,
ter-se-ia Corr rt2 ; rt2 1 > 0: Se fosse este o caso, a melhor forma de continuarmos com o nosso argumento
seria centrar rt ; usando a mdia condicional, i.e. tomaramos r~t = rt
~t2 ; r~t2 1 = 0 se
t : Viria agora Corr r
2 2
rt fosse genuinamente um MA(1); no caso contrrio, se Corr r~t ; r~t 1 > 0; teramos evidncia em favor do
nosso argumento. Todavia, a centragem r~t = rt
t desnecessria, pois em sries financeiras de aces ou
de ndices de aces a mdia condicional , geralmente, aproximadamente igual a uma constante.

60

0.2
0.15
0.1
0.05
0
-0.05
-0.1
Oct-28
Apr-31
Oct-33
Apr-36
Oct-38
Apr-41
Oct-43
Apr-46
Oct-48
Apr-51
Oct-53
Apr-56
Oct-58
Apr-61
Oct-63
Apr-66
Oct-68
Apr-71
Oct-73
Apr-76
Oct-78
Apr-81
Oct-83
Apr-86
Oct-88
Apr-91
Oct-93
Apr-96
Oct-98
Apr-01
Oct-03

-0.15

Figura 3-17: Retornos dirios do Dow Jones (Jan-1928 a Fev-2006)


Isto , se a volatilidade alta (baixa), ento razovel esperar que a volatilidade se mantenha
alta (baixa) durante bastante tempo. Na figura 3-17 apresentam-se os retornos dirios do Dow
Jones no perodo Janeiro de 1928 a Fevereiro de 2006. Esto identificados alguns perodos
de grande volatilidade. Estes perodos prolongam-se por vrios anos!
Para confirmarmos a ideia de forte dependncia temporal da volatilidade deveramos
calcular a FAC da volatilidade. Como a estimao da volatilidade cabe num captulo posterior, tomamos agora como proxy da volatilidade o valor absoluto dos retornos jrt j (tambm
poderamos considerar rt2 ; como fizemos no ponto precedente). Calcule-se, assim, a FAC
associado aos valores absolutos dos retornos do Dow Jones no perodo acima considerado.
A figura 3-18 mostra que a FAC de jrt j apresenta um decaimento lento para zero, sugerindo
forte dependncia temporal da volatilidade. interessante observar que a autocorrelao entre, por exemplo, jrt j e jrt

500 j

se situe ainda prximo de 0.1 (observe-se que o desfasamento

corresponde aproximadamente a dois anos).


Para processos ARMA e processos de Markov em geral, o decaimento da FAC do tipo
j kj

Cak ;

0 < C < 1; 0 < a < 1.

Tem-se, portanto, um decaimento exponencial8 . A figura 3-18 no sugere um decaimento


exponencial; sugere antes um decaimento hiperblico da FAC que uma caracterstica de
Pode parecer estranho dizer-se que a funo Cak apresenta um decaimento exponencial para 0 < C < 1 e
k
0 < a < 1: Mas observe-se, para C = 1 (simplificando), que ak = elog a = ek log a e tem-se assim um
decaimento exponencial, em funo de k; dado que log a < 0:
8

61

0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
1

76

151

226

301

376

451

526

601

676

751

826

901

976

Figura 3-18: FAC de jrt j onde rt o retorno dirio do Dow Jones (Jan. 1928 a Fev. 2006)

Rho

1.0
0.8
0.6
0.4
0.2
0.0
0

10

20

30

40

50

60

70

80

90

Figura 3-19: Decaimento Exponencial (0:9k ) vs. Hiperblico (k

100

0:5

processos de memria longa. Concretamente, um decaimento hiperblico da FAC do tipo


j kj
Por exemplo, com

= 1=k (

C jkj

>0

= 1) tem-se um decaimento hiperblico (veja-se a figura

3-19).

3.2.4

Efeito Assimtrico

Tem-se observado existir alguma correlao entre a volatilidade e a ocorrncia de perdas


significativas nos mercados de capitais. Designa-se esta relao por efeito assimtrico (ou
leverage effect).
Concretamente, quando rt

< 0 espera-se, em mdia, um aumento de volatilidade para

o perodo seguinte. Se tomarmos como proxy da volatilidade a varivel jrt j ou rt2 devemos
62

d (rt 1 ; rt2 )
Corr
-0.049
-0.095
-0.081
-0.199

ndices Bolsistas
Amesterdo
Frankfurt
Hong Kong
Nova York
Taxas de Cmbio
Libra Britnica
Dlar Canadiano
Yen
Franco Suo

0.074
0.041
-0.008
0.014

Tabela 3.3: Efeito Assimtrico


esperar que Corr (rt 1 ; jrt j) < 0 ou Corr (rt 1 ; rt2 ) < 0: A tabela 3.3 parece confirmar a
existncia de um efeito assimtrico apenas para ndices bolsistas (e, por extenso, tambm
para cotaes de aces) mas no para taxas de cmbio (a justificao pode ver-se no ponto
3.1.3).
Veremos no captulo 8 uma forma bastante mais eficiente de estimar o efeito assimtrico
e de testar se os coeficientes so ou no estatisticamente significativos. No obstante, uma
forma expedita de verificar se os coeficientes so estatisticamente significativos consiste em
fazer a regresso de rt2 sobre rt 1 ,
rt2 =
e depois ensaiar H0 :
representa

= 0 contra H1 :

1 rt 1

+ ut

(3.5)

< 0. Com efeito, na equao anterior,

= Cov (rt 1 ; rt2 ) = Var (rt 1 ) : Desta forma,

< 0 implica Corr (rt 1 ; rt2 ) <

0.
Como a heterocedasticidade est invariavelmente presente nas sries temporais financeiras, convm empregar erros padro robustos contra heterocedasticidade (uma possibilidade neste sentido a utilizao da matriz de White). Recorda-se que, sob condies gerais,
a heterocedasticidade no afecta a consistncia do estimador OLS (afecta sim, como vimos,
os erros padro).
O efeito assimtrico , por vezes identificado como leverage effect depois de Black em
1976 ter notado que a volatilidade aumenta quando o mercado cai e o rcio de endividamento
(leverage ratio) aumenta. No entanto, vrios autores tm salientado que o leverage muito
reduzido quando comparado com o efeito assimtrico. Vrias explicaes tm sido propostas
para o efeito assimtrico.

63

Uma explicao designada por volatility feedback effect baseia-se na seguinte ideia.
Quando a volatilidade de uma activo aumenta, o risco agrava-se, e a rendibilidade
exigida para esse activo aumenta. Isto significa que o activo menos atractivo e,
portanto, a sua procura diminui, fazendo cair o respectivo preo. Esta explicao pressupe que o aumento da volatilidade precede a queda do preo (isto , esquematicamente, "

2
t 1

)# Pt , podendo t aqui ter uma interpretao intra-diria). Contudo, o

facto estilizado envolve a implicao contrria, # Pt

)"

2
t

(a diminuio do preo

que precede o aumento da volatilidade).


Outra explicao sustenta que o efeito assimtrico deve-se existncia de investidores
naives (uninformed traders) que vendem os seus ttulos quando o mercado est cair.
Este comportamento conduz no s a uma queda mais acentuada do preo como tambm a um aumento de volatilidade.
Outra possibilidade a seguinte. A diminuio do preo aumenta o risco de mercado
(dado que o centro de gravidade da distribuio condicional dos retornos de desloca
para a esquerda). O aumento do risco obriga a ajustamentos imediatos no portfolio
(atravs de compras e vendas de activos que faam a cobertura do risco perdido). Este
acrscimo da actividade nos mercados financeiros aumenta a volatilidade. J variaes
positivas nos preos no tm o mesmo impacto sobre o risco e, como tal, ajustamentos
no portfolio no so prementes.

3.2.5

Aumento da Frequncia das Observaes Acentua a No Linearidade

Vrios estudos indicam que os coeficientes de autocorrelaes de rt2 e de jrt j tendem a aumentar com o aumento da frequncia das observaes.

3.2.6

Co-Movimentos de Rendibilidade e Volatilidade

Ao se analisarem duas ou mais sries financeiras de retornos ao longo do tempo, geralmente


observam-se co-movimentos de rendibilidade e volatilidade, isto , quando a rendibilidade
e a volatilidade de uma srie aumenta (diminui), a rendibilidade e a volatilidade das outras
tende, em geral, a aumentar (diminuir). Estas caractersticas so relativamente evidentes nas
figuras 3-20 e 3-21. A figura 3-20 mostra que os ndices sobem e descem em sintonia (co64

CAC

DAX

7000

9000
8000

6000

7000
5000

6000

4000

5000
4000

3000

3000
2000

2000

1000

1000
1990 1992 1994 1996 1998 2000 2002 2004 2006

1990 1992 1994 1996 1998 2000 2002 2004 2006

DJ EURO STOXX 50

FTSE 100

6000

7000

5000

6000

4000

5000

3000

4000

2000

3000

1000

2000

1000
1990 1992 1994 1996 1998 2000 2002 2004 2006

1990 1992 1994 1996 1998 2000 2002 2004 2006

PSI20

S&P 500

16000

1600

14000

1400

12000

1200

10000

1000

8000

800

6000

600

4000

400

2000

200
1990 1992 1994 1996 1998 2000 2002 2004 2006

1990 1992 1994 1996 1998 2000 2002 2004 2006

Figura 3-20: ndices Bolsistas


CAC
CAC
1
DAX
0.78
DJ EURO 50 0.92
FTSE 100
0.79
PSI 20
0.52
S&P 500
0.43

DAX

DJ EURO 50

FTSE 100

PSI 20

S&P 500

1
0.89
0.70
0.50
0.47

1
0.81
0.57
0.46

1
0.47
0.41

1
0.25

Tabela 3.4: Matriz de correlaes dos retornos dirios (Jan 90-Nov 06)
movimento de rendibilidade). A tabela 3.4, onde se apresentam os coeficientes de correlao
(marginal) dos retornos dirios, corrobora o co-movimento de rendibilidade. A figura 3-21
mostra que os perodos de alta e baixa volatilidade so aproximadamente coincidentes (comovimento de volatilidade). A tabela 3.5, onde se apresentam os coeficientes de correlao
(marginal) dos retornos ao quadrado, corrobora o co-movimento de volatilidade.

65

CAC

DAX

.08

.08

.04

.04

.00
.00
-.04
-.04

-.08

-.12

-.08
1990 1992 1994 1996 1998 2000 2002 2004 2006

1990 1992 1994 1996 1998 2000 2002 2004 2006

DJ EURO STOXX 50

FTSE 100

.08

.06
.04

.04
.02
.00

.00
-.02

-.04
-.04
-.06

-.08
1990 1992 1994 1996 1998 2000 2002 2004 2006

1990 1992 1994 1996 1998 2000 2002 2004 2006

PSI20

S&P 500

.08

.06
.04

.04
.02
.00

.00
-.02

-.04

-.04
-.08
-.06
-.12

-.08
1990 1992 1994 1996 1998 2000 2002 2004 2006

1990 1992 1994 1996 1998 2000 2002 2004 2006

Figura 3-21: Retornos de ndices

CAC
CAC
1
DAX
0.74
DJ EURO 50 0.91
FTSE 100
0.77
PSI 20
0.39
S&P 500
0.38

DAX

DJ EURO 50

FTSE 100

PSI 20

S&P 500

1
0.85
0.66
0.39
0.44

1
0.78
0.43
0.41

1
0.30
0.35

1
0.21

Tabela 3.5: Matriz de correlaes dos retornos dirios ao quadrado (Jan 90-Nov 06)

66

Captulo 4
Processos Estocsticos: Revises
(ltima actualizao: 04/2010)

4.1

Processo Estocstico e Filtrao

Um processo estocstico um modelo matemtico para descrever, em cada momento, depois de um instante inicial, um fenmeno aleatrio. Este fenmeno definido num espao de probabilidade ( ; F; P ), onde,

o conjunto de todos os estados da natureza

(ou cenrios de mercado), F uma -lgebra de subconjuntos de

e P uma proba-

bilidade sobre F. Um processo estocstico ento uma coleco de variveis aleatrias


y = fyt (!) ; t 2 Z; ! 2 g ; definidas sobre um espao de probabilidade ( ; F; P ) : Para
cada t; yt ( ) uma varivel aleatria. Para cada ! 2

(cenrio) fixo, y (!) uma tra-

jectria ou realizao do processo. Para simplificar escreve-se yt em lugar de yt (!). A


observao de um fenmeno ao longo do tempo conduz normalmente observao de uma
particular trajectria do processo. Uma sucesso cronolgica apenas uma trajectria entre
as infinitas possveis.
F tem estrutura de -lgebra no seguinte sentido: (i) se A 2 F ) Ac 2 F; (ii) se
S
Ai 2 F ) A 2 F; (iii) ; ; 2 F: O estudo dos processos estocsticos faz-se, usuali

mente, incluindo o conceito de -lgebra: Por um lado, as probabilidades so definidas so-

bre -lgebras e as variveis aleatrias, assume-se, so mensurveis com respeito a essas


-lgebras:
Existe, no entanto, uma razo no tcnica para incluir o estudo das -lgebras no estudo
dos processos estocsticos: os processos estocsticos, ao descreverem a evoluo estocstica
de um fenmeno ao longo do tempo, sugerem que, em cada momento t = 0, possvel
67

falar de um passado, presente e futuro. Um observador do fenmeno, pode falar da


histria do processo, daquilo que observa no presente e daquilo que poder observar no
futuro. Com vista, a caracterizar o quanto se sabe sobre o processo, usual, equipar o
espao ( ; F; P ) com uma filtrao, i.e., uma famlia fFt ; t = 0g de sub -lgebras de F:
Fs

Ft
Ft =

F para 0 5 s < t < 1:

(ys ; s

t) pode ser identificado como a histria do processo y at ao momento

t: Certos autores, para simplificar, escrevem


Ft = fyt ; yt 1 ; :::; y1 g ou Ft = fyt ; yt 1 ; :::g :

4.2

Valores Esperados Condicionais: Principais Resultados

Comeamos com um resultado trivial: E (yt j Ft ) = yt : Com efeito, yt pertence ao conjunto


Ft 1 (tambm se diz, yt mensurvel com respeito a Ft ), logo yt pode ser tratado como uma
constante dado Ft .
Proposio 4.2.1 Suponha-se que Y uma v.a. tal que E (jY j) < 1; Z uma v.a. mensurvel com respeito a G e E (jZY j) < 1 ento com probabilidade um tem-se
E (ZY j G) = Z E (Y j G) :
Exemplo 4.2.1 Considere-se yt = xt yt
nula. Suponha-se Ft =

(xs ; ys ; s

1 +ut ;

onde fut g uma sucesso v.a. i.i.d. de mdia

t) : Ento

E (yt j Ft 1 ) = E (xt yt 1 j Ft 1 ) = yt
Note-se que yt

mensurvel com respeito a Ft

E (xt j Ft 1 ) :

mas xt no (Ft

desconhece os

acontecimentos ocorridos em t).


Exemplo 4.2.2 No mbito da estatstica clssica tambm se sabe que
E (XY j X = x) = x E (Y j X = x) .
1

Em termos tcnicos, o evento (ou cenrio de mercado) ! 2 que determinou yt que pertence a Ft .
Para simplificar, assume-se Ft = fyt ; yt 1 ; :::; y1 g ou Ft = fyt ; yt 1 ; :::g e, neste caso, j pode-se dizer yt
pertence a Ft :

68

Com efeito,
E (XY j X = x) =

xyfyjx (yj x) dy = x

yfyjx (yj x) dy = x E (Y j X = x) :

Proposio 4.2.2 Seja g : R ! R uma funo convexa num intervalo B

R e Y uma v.a.

tal que P (Y 2 B) = 1: Se E (jY j) < 1 e E (jg (Y )j) < 1 ento


E (g (y)j G)

g (E (yj G)) :

E (g (Y )j G)

g (E (Y j G)) :

Se g cncava ento

Dem. (esboo) Prove-se E (g (y))

(4.1)

g (E (y)) e suponha-se (para simplificar) que g 0

continua em B. Como g convexa e g 0 continua, tem-se


g (x)

g (a) + g 0 (a) (x

8x; a 2 B:

a) ;

Escolha-se para a a constante E (Y ) ; onde Y uma v.a. tal que P (Y 2 B) = 1: Resulta,


g (x)

g (E (Y )) + g 0 (E (Y )) (x

E (Y ))

g (Y )

g (E (Y )) + g 0 (E (Y )) (Y

E (Y )) :

ou

Como o lado direito da desigualdade uma funo linear em Y (g (E (Y )), g 0 (E (Y )) e


E (Y ) so constantes), tem-se, aplicando o operador de valor esperado a ambos os termos da
desigualdade,
E (g (Y ))

0
E (g (E (Y )) + g (E (Y )) (Y

E (Y ))) = g (E (Y )) :

Observao 4.2.1 Nas condies da proposio 4.2.2 tem-se:


g convexa ) E (g (Y ))

g (E (Y )) ;

g cncava ) E (g (Y ))

g (E (Y )) :

Exemplo 4.2.3 Atendendo observao anterior conclui-se:

69

g (x)

Conc./Conv.

Desigualdade

x2

convexa

E (Y 2 )

1
x

,x>0

convexa

log x, x > 0

cncava

Tambm se conclui E (Y 2 )

(E (Y ))2

1
Y

E (log (Y ))

1
E(Y )

log (E (Y ))

(E (Y ))2 a partir da igualdade Var (Y ) = E (Y 2 )

(E (Y ))2 pois, por definio, Var (Y )

0:

Proposio 4.2.3 (Lei do Valor Esperado Iterado I) Suponha-se E (jY j) < 1. Ento
E (Y ) = E (E (Y j G)) :
Tambm se tem
E (Y ) = E (E (Y j X)) .
Com efeito, identificando fx ; fy ; fyjx e fy;x como as funes de densidade de probabilidade,
respectivamente de X; Y , Y jX e (Y; X) ; tem-se,
E (E (Y j X)) =

yfyjx (yj x) dy fx (x) dx


Z
Z
=
y
fyjx (yj x) fx (x) dx dy
Z
Z
=
y
fy;x (y; x) dx dy
Z
=
yfy (y) dy
= E (Y ) .

Exemplo 4.2.4 Suponha-se que Y dado X tem distribuio condicional de Poisson de parmetro
= X: Suponha-se ainda que X tem distribuio do Qui-Quadrado com um grau de liberdade. Logo, pela proposio 4.2.3, vem
E (Y ) = E (E (Y j X)) = E ( X) = :
Exemplo 4.2.5 Considere-se o modelo yt = xt + ut : Seja FtX = fxt ; xt 1 ; :::g : Suponha-

70

se E ut j FtX = 0. Como se sabe E yt j FtX = xt : Logo


xt + ut j FtX

E (yt ) = E E

xt j FtX

= E E
=

+ E E ut j FtX

E (xt ) :

Neste exemplo, tambm se obtm esta expresso considerando E (yt ) = E ( xt + ut ) =


E (xt ) :
Exemplo 4.2.6 Considere-se yt = a + xt yt
E (xt j Ft 1 ) =

+ ut . Suponha-se que E (ut j Ft 1 ) = 0;

e E (yt ) = E (yt 1 ) : Obtenha-se E (yt ). Tem-se, pela lei do valor esper-

ado iterado,
E (yt ) = E (E (yt j Ft 1 ))

Logo E (yt ) = a +

+ ut j Ft 1 ))

E (E (a + xt yt

E (a + E (xt yt 1 j Ft 1 ) + E (ut j Ft 1 ))

E (a + yt

E (a + yt

1 x)

a+

E (xt j Ft 1 ) + 0)

E (yt 1 ) = a +

E (yt ) ) E (yt ) = a= (1

E (yt )

x) :

Um resultado mais geral dado pela proposio seguinte.


Proposio 4.2.4 (Lei do Valor Esperado Iterado II) Suponha-se E (jY j) < 1 e G

H.

Ento
E (Y j G) = E ( E (Y j H)j G) :
Exemplo 4.2.7 Considere-se yt = a + yt

+ ut ; j j < 1 onde fut g uma sucesso v.a.

71

i.i.d. de mdia nula. Obtenha-se E (yt j Ft 2 ) : Como Ft

Ft

; tem-se

E (yt j Ft 2 ) = E ( E (yt j Ft 1 )j Ft 2 )
=

E (a + yt 1 j Ft 2 )

a + E (yt 1 j Ft 2 ) (note-se agora yt

a + E (a + yt

a + (a + E (yt 2 j Ft 2 ))

a + (a + yt 2 )

= a+ a+

yt

= a + yt

+ ut 1 )

+ ut 1 j Ft 2 )

Facilmente se conclui serem vlidas relaes do tipo


E (yt j Ft 3 ) = E ( E (yt j Ft 2 )j Ft 3 )
= E ( E ( E (yt j Ft 1 )j Ft 2 )j Ft 3 )
E (yt j F

4.3

1)

= E (E ( E ( E (yt j Ft 1 )j Ft 2 )j Ft 3 ) :::) :

Distribuio Condicional versus Distribuio Marginal

Seja f (yt j Ft 1 ) a fdp condicionada2 de yt dada toda informao at ao momento t

1:

Comparativamente fdp marginal (ou no condicional), f (yt ), a fdp f (yt j Ft 1 ) bastante


mais informativa, pois esta ltima usa toda a informao disponvel Ft 1 ; ao passo que a
distribuio marginal, por definio, ignora a informao Ft 1 . A fdp f (yt j Ft 1 ) pode ser
entendida como uma reavaliao de f (yt ) perante a evidncia Ft 1 :
Considere-se a amostra fy1 ; :::; yn g : Um elemento da amostra escolhido ao acaso tem
fdp f (y) : Mas observando Ft 1 ; a v.a. yt tem fdp f (yt j Ft 1 ) :
Na figura 4-1 traam-se duas hipotticas fdp condicionadas. Para se discutir a figura,
suponha-se que y governado genericamente por dois atributos: (1) yt
t; tendem a estar prximos; por exemplo, se yt

e yt ; para todo o

alto, yt tender tambm a ser alto

(trata-se de uma forma de dependncia temporal) e (2) yt reverte para zero, E (yt ) = 0.
Suponha-se ainda que y estacionrio. A fdp marginal constante ao longo do tempo.
No entanto, as densidades condicionais variam. Considere-se a fdp f (y2 j F1 ) traada na
2

Certos autores identificam f ( yt j Ft

1)

como f ( yt j yt

72

1 ; yt 2 ; :::; y1 ).

f (y 6 F5 )

8
f (y 2 F1 )

6
4
2
0
1

-2

-4
-6

Figura 4-1: A fdp f (yt j Ft 1 ) varia ao longo do tempo


figura 4-1. Esta funo atribui probabilidades associadas varivel y2 dado F1 : Perante a
observao y1 (e ainda sem se conhecer a realizao y2 ), a fdp f (y2 j F1 ) tem moda aproximadamente igual a y1 : natural esperar que o valor de y2 venha prximo de y1 - dada
a hiptese (1); a fdp f (y6 j F5 ) usa a informao disponvel no momento t = 5: Como,
y5 > 0; a densidade desloca-se um pouco na direco de y5 ; pois y6 tender a estar prximo de y5 : Todavia, como y reverte para zero, mais provvel o evento fy6 < y5 j y5 g do
que fy6 > y5 j y5 g ; i.e., y6 dever em princpio aproximar-se do valor para o qual y reverte,
E (yt ) = 0: Nestas condies, a fdp f (y6 j F5 ) embora se desloque na direco de y5 ; continua a atribuir massa de probabilidade significativa a intervalos prximos de zero.
Dois parmetros fundamentais de f (yt j Ft 1 ) so
t
2
t

= E (yt j Ft 1 ) =

yt f (yt j Ft 1 ) dyt
Z
2
= Var ( yt j Ft 1 ) =
(yt
t ) f (yt j Ft 1 ) dyt :

Valem as seguintes propriedades.


Proposio 4.3.1 A melhor previso de yn+1 dado Fn ; de acordo com Erro Quadrtico
Mdio, E (yn+1 j Fn ) ; i.e.
E (yn

E (yn+1 j Fn ))

E (yn

g (Fn ))2

onde g (Fn ) um qualquer outro previsor Fn mensurvel (i.e. que usa tambm toda a
informao disponvel at ao momento n).

73

Dem. Tem-se
E (yn

g (Fn ))2

= E (yn

E (yn+1 j Fn ) + E (yn+1 j Fn )

= E (yn

E (yn+1 j Fn ))

+ E [(yn

g (Fn ))2
g (Fn ))2

+ E (E (yn+1 j Fn )

E (yn+1 j Fn )) (E (yn+1 j Fn )

g (Fn ))]

Como o terceiro termo zero (deixa-se como exerccio essa demonstrao) vem
E (yn

g (Fn ))2

+ E (E (yn+1 j Fn )

= E (yn

E (yn+1 j Fn ))

E (yn

E (yn+1 j Fn ))

g (Fn ))2

O valor E (yn+1 ) tambm um previsor no enviesado de yn+1 mas, como no usa a informao disponvel Ft 1 ; pode demonstrar-se que bastante menos preciso do que o previsor
E (yn+1 j Fn ).
Pode-se tambm provar
E (yn+h

E (yn+h j G))

E (yn+h

E (yn+h j H))

G.

Esta desigualdade resulta do facto de em G existir mais informao. natural esperar que
um previsor que use mais informao face a um outro, tenha um EQM inferior. Tm-se ainda
os seguintes casos limites quando o previsor um valor esperado condicionado.

G = F = F 1 ) E (yn+h

E (yn+h j G))

= E (yn+h

yn+h )2 = 0

H =? ) E (yn+h

E (yn+h j H))

= E (yn+h

E (yn+h ))

Exemplo 4.3.1 Considere: A) Tem-se uma sucesso de retornos do PSI20 e retira-se aleatoriamente um elemento da sucesso. Suponha-se que a mdia e a varincia desse retorno so
conhecidas. B) Suponha que os retornos do PSI20 registaram hoje uma forte quebra e
uma forte volatilidade. Q1: Qual a informao mais relevante se o objectivo prever os
retornos do PSI20 e a volatilidade para o dia de amanh? A ou B? Q2: Neste caso, qual
a fdp que interessa estudar? f (yt j Ft 1 ) ou f (yt )? Q3: Qual a informao relevante se o
objectivo conhecer as caractersticas gerais da srie dos retornos (ou prever os retornos e
74

a volatilidade para um horizonte de vrios anos)? Q4: Neste caso, qual a fdp que interessa
estudar? f (yt j Ft 1 ) ou f (yt )?
Considere o modelo de sries temporais,
yt = c + yt

j j<1

+ ut ;

onde fut g uma sucesso de v.a. i.i.d. com distribuio N (0;


tribuio de yt j Ft 1 : Dado Ft 1 ; yt

) : Determine-se a dis-

pode ser tratado como uma constante. Logo yt j Ft

tem distribuio normal,


yt j Ft

N (E (yt j Ft 1 ) ; Var ( yt j Ft 1 ))

onde
E (yt j Ft 1 ) =

c + yt

Var (yt j Ft 1 ) =

E (yt

1
2
E (yt j Ft 1 )) Ft

= E u2t Ft

Assim,
yt j Ft

N c + yt 1 ;

(4.2)

Determine-se a distribuio marginal. No modelo em anlise verifica-se E (yt ) = E (yt 1 ) :


Logo
E (yt ) = c + E (yt ) ) E (yt ) =

c
1

e, seguindo um raciocnio similar,


2

Var (yt ) =

2:

Atendendo representao MA(1) do processo AR(1)3 ,


yt =

c
1

+ ut + ut

ut

+ :::

imediatamente se conclui que y tem distribuio marginal normal (uma soma de v.a. normais tem distribuio normal). Tambm se conclui, a partir da representao MA(1), que
3

A forma mais intuitiva de obter este resultado, consiste em aplicar o mtodo recursivo (iterando yt ad
infinitum). Por exemplo, yt = c + yt 1 + ut = c + (c + yt 2 + ut 1 ) + ut ; e assim sucessivamente.

75

E (yt ) = c= (1

) e Var (yt ) =
yt

Exemplo 4.3.2 Considere-se yt = 0:9yt


perodo t

1 se observou yt

= 1

: Assim, a distribuio marginal de y


2

(4.3)

+ ut ; onde ut

N (0; 1) : Sabendo que no

1
1

2 e tendo em conta (4.2) e (4.3) tem-se


yt

yt j Ft

N (0; 5:26)
N ( 1:8; 1) :

Procura-se avaliar a probabilidade de yt assumir um valor positivo. Assim,


P (yt > 0) = 0:5
P (yt > 0j Ft 1 ) = P (yt > 0j yt

2) = 0:0359.

As probabilidade so bem diferentes. Com efeito, no perodo t

1 registou-se yt

2:

Como a autocorrelao forte ( alto) natural esperar que no perodo t o valor de yt


ainda se encontre abaixo de zero. Por esta razo, a probabilidade condicional confere pouca
evidncia ao evento fyt > 0g : Pelo contrrio, a probabilidade marginal, ignora o acontecimento fyt

2g e, por isso, atribui uma probabilidade razovel ao evento fyt > 0g :

Exemplo 4.3.3 Retome-se o exemplo 4.3.2 e suponha-se que se tm n observaes e se pretende obter uma previso para o perodo n + 1: Podemos usar uma infinidade de previsores,
mas analisem-se apenas os seguintes:
E (yn+1 j Fn ) = 0:9yn
E (yn+1 ) = 0:
De acordo com a discusso anterior, o previsor E (yn+1 j Fn ) mais preciso do que
E (yn+1 ) : A preciso aqui aferida atravs do erro quadrtico mdio (EQM) e, com efeito,
observa-se que
E (yn+1

E (yn+1 j Fn ))

= 1 < E (yn+1

76

E (yn+1 ))

= 5:263

B
5

40
30
20
10
0
-10
-20
-30
-40
-50

3
1
-1
-3
-5
1

26

51

76

101 126 151 176

26

51

76

101 126 151 176


D

30

15

25

10

20

15

10
5

-5

-10

-5

-15
1

26

51

76

101 126 151 176

26

51

76

101 126 151 176

Figura 4-2: Qual a trajectria do processo rudo branco?

4.4

Processos Estocsticos Elementares, Estacionaridade e


Fraca Dependncia

4.4.1

Processos Estocsticos Elementares

Definio 4.4.1 u um processo4 rudo branco (RB) se


E (ut ) = 0
Var (ut ) = E u2t =

E (ut us ) = 0; 8s 6= t
Procure identificar o processo rudo branco na figura 4-2.
4

Recorde-se a notao u = fut g = fut ; t = 1; 2; :::g :

77

Definio 4.4.2 u um processo rudo branco independente se


E (ut ) = 0;
2
E ut =

ut e us so independentes 8s 6= t
Se adicionalmente ut

N (0;

) ento ut um rudo branco Gaussiano.

O processo fut g pode ser no autocorrelacionado, i.e., Corr (ut ; us ) = 0; 8s 6= t e,


mesmo assim, ut e us no serem independentes. Por exemplo, pode suceder Corr (u2t ; u2s ) 6=
0 e, neste caso, existe uma bvia ligao entre os valores u2t e u2s . Contudo, existe um caso
notvel onde E (ut us ) = 0; 8s 6= t implica independncia. o caso de rudos brancos com
distribuio Gaussiana.
Definio 4.4.3 u um processo diferena de martingala se
E (jut j) < 1;
E (ut j Ft 1 ) = 0:
Proposio 4.4.1 Se u uma diferena de martingala, ento E (ut ) = 0 e E (ut us ) = 0;
8s 6= t:
Dem. Deixa-se como exerccio concluir que E (ut ) = 0: Suponha-se, sem perda de
generalidade que s < t: Tem-se
E (ut us ) = E (E (ut us j Fs )) (pela proposio 4.2.3)
= E (us E (ut j Fs ))
= E (us E ( E (ut j Ft 1 )j Fs )) (pela proposio 4.2.4)
= E (us E (0j Fs )) = 0:
Definio 4.4.4 u um processo passeio aleatrio (random walk ou RW) se
yt = yt

+ ut

e ut um RB. yt diz-se um processo passeio aleatrio com deriva (random walk with drift)
78

120

1200

100

1000

80
800

60
40

RW

600

20

Var

400

0
-20

101

201

301

401

501

601

701

801

901

-40

d (yt ) = Pt (yi
Figura 4-3: Processo RW e Var
i=1

se

200

yt = yt

yt )2 =t

6= 0:

+ + ut ;

Pode-se provar (veja o apndice 6.D) que um random walk verifica:


E (yt j Ft 1 ) = yt 1 ;
2
2
E yt = E y0 +

E (yt ) = E (y0 ) ;

t;

E (yt yt k ) =

d (yt ) = Pt (yi
Na figura 4-3 apresenta-se um processo RW e Var
i=1

4.4.2

(t

k) :

yt )2 =t:

Estacionaridade

Definio 4.4.5 y um processo estacionrio de segunda ordem (ESO) se


E (yt ) =

Var (yt ) =

Cov (yt ; yt

h)

(no depende de t)
;

(no depende de t)

(h)

(no depende de t):

Na definio de processo ESO est implcito no s que os momentos no dependem de


t como tambm so finitos. Por exemplo, se Var (yt ) = 1; ento yt no ESO. Um RB,
RB independente ou um RB Gaussiano so processos estacionrios de segunda ordem. Uma
diferena de martingala pode ser ou no um processo ESO. um processo ESO se o segundo
momento for finito e no depender de t: Identifique na figura 4-2 as trajectrias de processos
79

f(x) 0.3

0.2

0.1

-4

-3

-2

-1

Figura 4-4: Funo densidade de probabilidade de Cauchy


aparentemente no estacionrios.
Naturalmente o processo passeio aleatrio no ESO.
Geralmente entende-se que um processo no ESO quando a mdia, a varincia ou as
covarincias dependem de t: Mas a estacionaridade de segunda ordem (ESO) pode tambm
falhar se no existir a mdia e/ou a varincia. Por exemplo, considere o processo yt = 10+ut ,
onde fut g uma sucesso de v.a. i.i.d. com distribuio de Chauchy. A funo densidade
de probabilidade (fdp) de Cauchy
f (x) =

1
.
(1 + x2 )

y no um processo ESO porque E (jut j) no existe. Com efeito,


E (jut j) =

jxj f (x) dx =

jxj

1
dx
(1 + x2 )

no converge e, portanto, E (jut j) no est definido (i.e. no existe). Na figura 4-4 traa-se
a funo f (x) : Como a fdp tem abas muitos pesadas atribui uma massa de probabilidade
considervel para valores muito afastados da mdia. Isto significa que embora o centro de
gravidade da fdp seja zero, valores muito afastados de zero podem ocorrer com probabilidade
no nula (veja-se a figura 4-5).
Definio 4.4.6 y um processo estritamente estacionrio (EE) se a distribuio conjunta
de (y1 ; y2 ; :::; ys ) igual distribuio conjunta de (yk+1 ; yk+2 ; :::; yk+s ) ; para qualquer
s 2 N e k 2 Z.
80

800
600
400
200
0
-200
-400
-600
-800
-1000
-1200
-1400
1

101

201

301

401

501

601

701

801

901 1001 1101 1201 1301 1401

Figura 4-5: Uma trajectria simulada do processo yt = 10 + ut , onde fut g uma sucesso
de v.a. i.i.d. com distribuio de Chauchy
Na seco 4.5 discute-se com maior profundidade este conceito.
Observao 4.4.1 Um processo estritamente estacionrio deve verificar, em particular, a
seguinte condio:
fy1 (x) = fy2 (x) = ::: = fyn (x) = f (x)

(4.4)

(as densidade marginais de y1 ; y2 ,..., yn so iguais para todo o t). Esta condio decorre da
aplicao da definio anterior para s = 1. Resulta de (4.4) que se E (jg (yt )j) < 1; ento
E (jg (yt )j) constante e no depende de t; pois
E (jg (yt )j) =

jg (x)j fyt (x) dx =

jg (x)j f (x) dx;

8t:

Ambas as definies de estacionaridade basicamente exigem que a estrutura probabilstica se mantenha constante ao longo do tempo. No entanto, enquanto a estacionaridade estrita
exige que toda a estrutura probabilstica se mantenha constante ao longo do tempo, a ESO
apenas faz essa exigncia para os dois primeiros momentos e para a autocovarincia.
Exemplo 4.4.1 Considere-se o processo,
yt = 0:2yt
onde
ut =

8
<
:

j j<1

+ ut ;

se t

t
k 2
t
k

81

2000

se t > 2000

(4.5)

(4.6)

sendo

iid

independentes para todo o t e s e

N (0; 1) e

iid
s

t(k) . Para t

2000

tem-se
E (ut ) = E ( t ) = 0;
Var (ut ) = Var ( t ) = 1
e para t > 2000;

E (ut ) = E
Var (ut ) = Var

2
k

2
k

!
t

= 0;
!

2
k

k
k

= 1:

Como a autocovarincia de ut no depende de t (na verdade zero, para qualquer t) e E (ut )


e Var (ut ) so constantes, para todo o t; conclui-se que fut g um processo ESO. No entanto,
no EE, pois a distribuio marginal de ut para t

2000 no coincide com a distribuio

marginal de ut para t > 2000 (no primeiro caso normal; no segundo t-Student). No se
cumpre assim a condio (4.4). A mesma concluso se aplica a y: ESO mas no EE. Na
figura 4-6 representa-se uma trajectria simulada a partir das equaes (4.5) e (4.6), com
k = 3 (graus de liberdade). Observe-se que a partir de t = 2000 comeam a aparecem
valores muito altos e muitos baixos (outliers) j que os erros passam a ter distribuio
t-Student com 3 graus de liberdade (embora a varincia dos erros se mantenha sempre igual
a 1). Observa-se, portanto, uma alterao da estrutura probabilstica do processo a partir
de t > 2000 que implica a no estacionaridade estrita do processo.
Alguns factos:
Se E (yt2 ) < 1 e y estritamente estacionrio (EE), ento y ESO.
Com efeito, tem-se fyt (y) = f (y) ; 8t (por hiptese) e, portanto,
E (yt ) =
Var (yt ) =

xfyt (x) dx =
(x

xf (x) dx = E (y) ;
Z
2
2
E (yt )) fyt (x) dx = (x E (y)) f (x) dx = Var (y) :

Por outro lado, fyt ;yt+h (x; y) = fys ;ys+h (x; y) ; 8t; s (por hiptese) e, portanto, a ex-

82

Figura 4-6: Uma trajectria simulada a partir de um processo estacionrio de segunda


ordem mas no estritamente estacionrio - confiram-se as equaes (4.5) e (4.6)
presso
E (yt yt+h ) =
=

Z Z

Z Z

xyfyt ;yt+h (x; y) dxdy


xyfys ;ys+h (x; y) dxdy = E (ys ys+h ) :

no depende de t (nem de s).


Se y ESO e tem distribuio normal, ento y EE.
A estacionaridade estrita geralmente uma condio mais forte do que a ESO, mas
no implica necessariamente ESO. Por exemplo, se yt = 10 + ut onde fut g uma
sucesso de v.a. com distribuio de Cauchy, y no , como vimos, ESO; no entanto,
pode-se provar que y EE: a estrutura probabilstica mantm-se imutvel ao longo do
tempo.

4.4.3

Fraca Dependncia

A propriedade fraca dependncia crucial para se invocar resultados limites como sejam
a lei dos grandes nmeros e o teorema do limite central. Considere-se, por exemplo, a mdia
P
emprica yn = n 1 nt=1 yt : Sob certas condies, a lei fraca dos grandes nmeros estabelece
p

yn ! E (y) : Este resultado pode ser provado da seguinte forma: se limn E (yn ) = E (y) e
83

! E (y) : Exigir que a varincia de yn convirja para zero (no

limn Var (yn ) = 0 ento yn

limite yn reduz-se a uma constante) envolve a suposio de que a sucesso fyt g fracamente
dependente num sentido que precisaremos a seguir. Com efeito,
n
X
1
Var (yn ) =
Var
yt
n2
t=1
n
X

1
=
n2

Var (yt ) + 2

t=1

n 1 X
n
X

Cov (yi ; yi j ) :

j=1 i=j+1

Sem hipteses adicionais no garantido que estas duas somas convirjam. Comece-se por
assumir que fyt g ESO. Nestas condies a covarincia Cov (yi ; yi j ) s depende de j =
i (i

j) e no de i (veja a definio 4.4.5). Assim, pode-se escrever, Cov (yi ; yi j ) =

(j).

Vem,
1
Var (yn ) =
n2

2X
+
(j) 1
n
n j=1
2

O primeiro termo

(j)

n 1
n
X
2 X
(j)
1 ( (j) no depende de i)
n2 j=1
i=j+1

n 1
2 X
+ 2
(j) (n
n
n j=1
2

+2

j=1 i=j+1

n 1 X
n
X

n 1

j)
j
n

=n converge para zero, mas o segundo termo pode convergir ou no.

necessrio no s que (j) convirja para zero, mas tambm que essa convergncia seja relativamente rpida. Note-se de passagem que a estacionaridade no garante fraca dependncia.
As condies de aplicao do teorema do limite central so ainda mais exigentes. Sob
p
d
certas condies tem-se, como se sabe, n (yn E (y)) ! N (0; 2 ) ; onde 2 uma conp
p
stante finita, definida como 2 = limn Var ( n (yn E (y))) = limn Var ( nyn ) : Se fyt g
estacionrio, tem-se

Var

nyn =

+2

n 1
X
j=1

(j) 1

j
n

e, agora, comparativamente ao caso anterior, (j) tem de convergir ainda mais rapidamente
P
para zero para que a soma Sn = nj=11 (j) 1 nj convirja. Por exemplo, uma funo de
84

autocorrelao do tipo (j) = 1=j resulta numa soma Sn divergente. A soma converge se a
funo de autocorrelao for, por exemplo, do tipo (j) = aj ; com jaj < 1.
Existem vrias definies de processos fracamente dependentes envolvendo os chamados mixing coefficients ( -mixing, -mixing, -mixing entre outros) que permitem avaliar
e medir o grau de dependncia recorrendo a diferentes interpretaes do conceito de independncia. Vamos adoptar uma definio alternativa para caracterizarmos um processo
fracamente dependente baseada na definio de Wooldridge (1994):
p
Definio 4.4.7 y um processo fracamente dependente se limn Var ( nyn ) = c > 0:
Infelizmente esta definio tem a seguinte desvantagem: se y fracamente dependente
no sentido da definio 4.4.7, e g uma funo com boas propriedades, no possvel
concluir, em termos gerais, que zt = g (yt ) ainda um processo fracamente dependente. J
se yt -mixing possvel inferir, sob certas condies gerais, que zt = g (yt ) ainda
-mixing (digamos, a transformao g preserva a propriedade de fraca dependncia do
processo quando baseada no conceito dos mixing coefficients).
Comentrios Finais
Por que razo importante o estudo da estacionaridade e da fraca dependncia (em sries
temporais)? Apontam-se algumas razes:
A aplicao do teorema central e a lei dos grandes nmeros so dois pilares da inferncia estatstica. Considere-se, por exemplo,
1X
yn =
yt :
n t=1
n

Sob certas condies, a aplicao da lei dos grandes nmeros e do teorema do limite
central, permite obter, respectivamente
p

yn ! E (y) ,

y
E (y) d
pn
! N (0; 1) :
Var (yn )

No entanto, se y no estacionrio e fracamente dependente no possvel invocar


estes resultados clssicos (e a inferncia assimpttica habitual no pode ser utilizada).
De uma forma geral, se a estrutura probabilstica se altera ao longo do tempo (i.e., se y
no estacionrio), todas as concluses que se retirem para um certo perodo no so
extrapolveis para o futuro.
85

A estacionaridade tambm relevante no mbito da previso: processos estacionrios


so limitados em probabilidade e a amplitude dos intervalos de previso no diverge
quando o horizonte de previso tende para mais infinito. Pelo contrrio, processos no
estacionrios, por exemplo, I (1) ; so extremamente difceis de prever no longo prazo,
dado que a amplitude dos intervalos de previso aumenta com o horizonte de previso.
Em termos de poltica econmica tambm relevante saber se um processo estacionrio ou no. Medidas de poltica econmica que tenham como objectivo alterar
a trajectria de processos estacionrios, esto em geral condenadas ao fracasso, pelo
menos no mdio/longo prazo, pois choques induzidos em processos dessa natureza
tendem a se autocorrigir ao longo do tempo (e a reverterem para a uma medida de
tendncia central).
Convm sublinhar o seguinte. Embora muitas sries temporais sejam no estacionrias,
possvel, na maior parte dos casos, estacionariz-las, mediante transformaes apropriadas
do processo.

***

Para terminar esta seco, tecem-se algumas consideraes crticas aos modelos de sries
temporais baseados em pressupostos estacionrios.
Sero as sries temporais financeiras e econmicas verdadeiramente estacionrias? Como
j argumentmos, a estacionaridade envolve uma determinada hiptese de estabilidade da
estrutura probabilstica do processo. Esta estrutura depende de uma mirade de factores,
como por exemplo, dos agentes econmicos (privados e pblicos) e das suas relaes, da
tecnologia, da informao, do puro acaso (entre outros factores). Apenas o puro acaso
pode ser considerado imutvel ao longo do tempo; tudo o resto evolui ao longo do tempo,
pelo que um mito supor-se que a estrutura probabilstica de uma srie temporal financeira ou econmica permanece constante ou aproximadamente constante ao longo do(s)
tempo(s). Suponha-se que se estuda a taxa de variao relativa anual do PIB portugus
(yt = log (P IBt )

log (P IBt 1 )). Aparentemente, y estacionrio se o perodo de refern-

cia forem alguns dezenas de anos (isto , praticamente todos os testes estatsticos disponveis,
apontariam nessa direco). Mas, se alargarmos a amostra para vrias centenas de anos
(supondo que tal era possvel), extremamente implausvel y ser estacionrio (a histria
86

diz-nos que as condies e os factores de produo evoluem ou sofrem rupturas ao longo


do tempo). Sob esta perspectiva, no existem processos de natureza econmica e financeira
estacionrios. Poderemos ento concluir que a anlise da estacionaridade acaba por ser intil? Embora, em termos rigorosos, o conceito de estacionaridade envolva o passado e o
futuro distante (o 1 e o +1), normalmente limitamos o perodo de anlise. Para esse
perodo, assume-se que a srie apresenta caractersticas estacionrias e a previso relevante
que estabelecemos aplica-se, supostamente, a um futuro prximo, governado, no essencial,
pelas mesmas leis que determinaram o processo no perodo amostral. Com esta ressalva, a
estacionaridade importante, porque assegura uma forma de estabilidade probabilstica que
essencial na inferncia estatstica.

4.5

Processos Ergdicos e Estritamente Estacionrios

Nesta seco, retomam-se alguns conceitos j abordados, relacionados com a estacionaridade, e exploram-se novas definies que sero teis no estudo dos processos no lineares. Concretamente, objectivo deste ponto estabelecer condies suficientes para que
um processo de Markov no linear seja ergdico e EE.

4.5.1

Definies

O ponto de partida baseia-se na definio de processo de Markov: se y um processo de


Markov ento, para estabelecer, no momento s; probabilidades sobre a evoluo futura do
processo, toda a informao anterior a s desnecessria se o estado do processo no momento
s for conhecido5 . Formalmente,
Definio 4.5.1 y um processo de Markov se
P (yt < j Ft 1 ) = P (yt < j yt 1 )
onde Ft

= fy1 ; :::; yt 1 g :

Considere-se, por exemplo, uma partcula suspensa num meio homogneo. Se no momento s, a posio
e a velocidade da partcula forem conhecidas, torna-se desnecessrio considerar toda a trajectria anterior da
partcula com vista a estabelecer a sua evoluo provvel a partir do momento s. Observe-se que no basta
conhecer s a posio ou s a velocidade. Por vezes sucede que determinado processo no de Markov, mas
esse processo juntamente com outro pode definir um processo de Markov. O exemplo que se apresenta a seguir
(AR(2)) tambm mostra que possvel obter a propriedade Markoviana atravs da expanso do espao de
estados.

87

(O caso multivariado y adapta-se facilmente). O processo AR(2), yt =

1 yt 1 + 2 yt 2 +

ut ; no de Markov pois
P (yt < j y1 ; :::; yt 1 ) = P (yt < j yt 2 ; yt 1 ) 6= P (yt < j yt 1 ) :
No entanto, possvel represent-lo na forma Markoviana. Considerem-se as mudanas de
varivel
y1;t = yt ;

y2;t = yt 1 :

Assim,
y1;t =

1 y1;t 1

y2;t = y1;t

2 y2;t 1

+ ut

y1;t

ou ainda
0
@

y1;t

A = @

y2;t
| {z }
yt

yt =

yt

{z

10
A@

A+@

y2;t 1
}|
{z
}
yt

+ ut :

ut

A;
0
| {z }
ut

O processo vectorial fyt g agora de Markov. Este procedimento generaliza-se facilmente para o caso AR(p).
Tambm o processo no linear do tipo
yt = g (yt 1 ; yt 2 ; :::; yt p ) + ut
onde fut g uma sucesso de v.a. i.i.d. e independentes de yt k ; k

1; admite uma repre-

sentao Markoviana. Com efeito, defina-se


yt = (yt ; yt 1 ; :::; yt

0
p+1 )

ut = (ut ; 0; :::; 0)0

e
x = (x1 ; x2 ; :::; xp )0 ;

g (x) = (g (x) ; x1 ; :::; xp 1 )0 :

88

Segue-se que fyg um processo de Markov definido por


yt = g (yt 1 ) + ut :
Por exemplo, seja
yt =
Tem-se

cos (yt 1 ) + sen (yt 2 ) + ut :


0

0
@

y1;t

A=@

y2;t
| {z }
yt

yt = @

yt
yt

A := @

y1;t
y2;t

1
A

cos (y1;t 1 ) + sen (y2;t 1 )


y1;t 1
{z

g(yt

1)

A+@
}

ut

A:
0
| {z }
ut

Para simplificar, na discusso que se segue trabalha-se com processos estocsticos univariados Markovianos; contudo, est subjacente que se o processo y no de Markov ser
sempre possvel represent-lo na forma multivariada como um processo de Markov.
A funo de distribuio condicional a n passos de um processo de Markov
P (yn+k < yj yk )
(observe-se que desnecessrio escrever P (yn+k < yj Fk ) ; pois y um processo de Markov).
Por seu lado, a funo densidade condicional (tambm designada por densidade de transio), caso exista, dada por
fn (yj x) =

@P (yn+k < yj yk )
:
@y

Definio 4.5.2 y um processo homogneo se


P (yn+k < j yk = x) = P (yn+s < j ys = x) ;

(n 2 N)

para todo o k e s 2 Z:
Se y um processo homogneo, para avaliar probabilidades condicionadas do processo,
no interessa o momento em que essas probabilidades so calculadas. Por exemplo, no caso
P (yn+k < j yk = x) as probabilidades so calculadas no momento no k (ou com base na
89

informao do momento k) e dizem respeito ao intervalo de valores que y pode assumir no


momento n + k: Se y homogneo, o momento ou instante k irrelevante; apenas interessa
conhecer o hiato de tempo n + k

k = n (para processos estacionrios de segunda ordem,

exige-se a mesma propriedade para a covarincia: Cov (yn+k ; yk ) =


depender de n = n + k

(n) apenas dever

k). Nestas circunstncias, tem-se por exemplo,

P (y10 < j y0 = x) = P (y100 < j y90 = x) = P (y1250 < j y1240 = x) :


Se o processo y homogneo, toma-se para a funo de distribuio condicional a n passos
a expresso6
Fn (yj x) := P (yn+k < yj yk = x) :
O exemplo 4.5.2 ilustra o conceito de homogeneidade. Convm, no entanto, comear
com o
Exemplo 4.5.1 Considere-se
yt = yt
onde ut um rudo branco N (0;

+ ut ;

j j<1

) : Vamos obter ft (yj x) (funo de densidade condi-

cional a t passos) e Ft (yj x) (funo de distribuio condicional a t passos). Comece-se


por obter f1 (yj x) (esta funo habitualmente escrita simplesmente na forma f (yj x)) e
F1 (yj x). Tem-se,
E (yt j yt 1 ) = E ( yt

Var (yt j yt 1 ) = E (yt


Como yt j yt

N ( yt 1 ;

+ ut j yt 1 ) = yt
yt 1 )2 yt

= E u2t yt

) resulta

1
1
f1 (yj yt 1 ) = p
(y
exp
2
2 2
2
Z y
F1 (yj yt 1 ) =
f1 (uj yt 1 ) du:

yt 1 )2 ;

A notao usada para Fn ( yj x) ; sublinha que se tem uma funo de transio a n passo (da o ndice n),
que a condio inicial apenas depende de x; e que o processo homogneo (caso contrrio Fn ( yj x) deveria
depender tambm do momento em que calculada).

90

Para obter E (yt j y0 ) ; Var (yt j y0 ) e ft (yj y0 ) necessrio representar yt como funo de
y0 . Tem-se
yt =
=

yt

+ ut

( yt

+ ut 1 ) + ut =

yt

+ ut

+ ut

= :::
=

y0 +

t 1

t 2

u1 +

u2 + ::: + ut

+ ut :

Tendo em conta as propriedades de u; conclui-se que yt , dada a condio y0 , tem distribuio


condicional normal de parmetros
t

E (yt j y0 ) =

y0

e
Var (yt j y0 ) = E
= E
=

yt
t 1

1+
1
1

y0

t 2

u1 +
2

y0

+ ::: +

u2 + ::: + ut
2(t 1)

+ ut

y0

(soma geomtrica)

2t

Isto ,
yt j y0

y0 ;

1
ft (yj y0 ) = p
exp
2 Var ( yt j y0 )
Z
Ft (yj y0 ) =

1
1

2t
2

1
(y
2 Var (yt j y0 )

E (yt j y0 ))

ft (uj y0 ) du:
1

Para processos no lineares, conhece-se geralmente f1 (yj y0 ) (uma vez especificada a


distribuio dos erros), mas no ft (yj y0 ), para t > 1:

91

Exemplo 4.5.2 Retome-se o exemplo 4.5.1. Facilmente se constata que


yn+k j yk = x

yn+s j ys = x

x;

x;

1
1
1
1

2n
2
2n
2

e, assim, o processo y homogneo.


Um processo em que pelo menos um dos momentos condicionais depende do momento
em que calculado (por exemplo, E (yt j yt 1 ) = yt 1 =t) no pode ser certamente um
processo homogneo. A homogeneidade uma condio necessria, mas no suficiente
para garantir estacionaridade (estrita ou de segunda ordem). O exemplo seguinte esclarece
este ponto.
Exemplo 4.5.3 Seja yt = yt

+ ut ; onde ut um rudo branco N (0;


n+k
X

yn+k = yk +

ui yk = x

N x;

ui y s = x

N x;

) : Tem-se,

i=k+1

yt+s = ys +

n+s
X

n :

i=s+1

Logo o processo passeio aleatrio homogneo. No entanto, sabe-se que no estacionrio.


Para processos de Markov homogneos, a equao de Chapman-Kolmogorov (numa das
suas vrias verses)
Fn (yj x) =

F1 (yj u) Fn

(duj x) :

Caso exista a fdp condicionada, a equao de Chapman-Kolmogorov pode tambm ser escrita na forma
fn (yj x) =

f1 (yj u) fn

(uj x) du:

(4.7)

A definio de ergodicidade ( Harris)7 que se apresenta a seguir envolve um conceito de


proximidade entre duas funes de distribuio, H e G; baseada na norma de variao total
k:k que, caso existam as funes densidades associadas a H e G; dada por
kH

Gk =

jh (x)

g (x)j dx:

A definio de ergodicidade varia bastante na literatura. Usaremos a definio que se designa por ergodicidade Harris. Veja-se, por exemplo, Fan e Yao (2005).

92

Exemplo 4.5.4 Seja g a fdp associada distribuio N (0; 1) e hn a fdp associada distribuio t (n) (t-Student, com n graus de liberdade). Para n fixo, a variao total kHn
positiva, mas kHn

Gk

Gk ! 0 quando n ! 1: A demonstrao a seguinte. Em primeiro

lugar, faa-se
n

(x) = jhn (x)

g (x)j :

Como hn (x) converge uniformemente em R para g (x), i.e., limn!1 supx2R

(x) = 0 (este

resultado bem conhecido da estatstica e, normalmente, apresentado numa forma mais


fraca, limn!1 hn (x) = g (x) ; para cada x 2 R), ento

(x) converge uniformemente

em R para zero, pelo que, o operador de limite pode trocar com o operador de integrao.
Assim,
lim kH

n!1

Gn k =

lim

n!1

jhn (x)

g (x)j dx

sup jhn (x)


lim
x
Z
=
lim sup jhn (x)
n!1

n!1

g (x)j dx
g (x)j dx

= 0:

Considere-se o processo estocstico y com funo de distribuio condicional a n passos


dada por Fn (yj x).
Definio 4.5.3 Se existir uma funo de distribuio F e uma constante
n

kFn (yj x)

para todo o y e o x; ento y ergdico se

2 (0; 1) tal que

F (y)k ! 0

= 1 e geometricamente ergdico se

(4.8)
< 1: F

a funo de distribuio estacionria.


Se a densidade fn (yj x) existe, a definio acima pode ser apresentada da seguinte forma:
se existir uma funo de densidade f e uma constante
n

jfn (yj x)

para todo o x; ento y ergdico se

2 (0; 1) tal que

f (y)j dy ! 0

= 1 e geometricamente ergdico se

funo de densidade estacionria.

93

(4.9)
< 1: f a

A definio adoptada de ergodicidade Harris, permite efectivamente relacionar a ergodicidade com estacionaridade estrita (Chan 1990, 1993), tal como consta da
Proposio 4.5.1 Suponha-se que y ergdico. Ento existe uma distribuio estacionria
F tal que o processo y; inicializado com a distribuio F; EE.
Dem. Apndice 4.A.
Para processos nas condies da proposio anterior, a lei forte dos grandes nmeros
verifica-se sempre:
Proposio 4.5.2 Suponha-se E (jh (y)j) < 1: Nas condies da proposio 4.5.1 verificase

1X
qc
h (yt ) ! E (h (y)) ;
n t=1
n

(qc: convergncia quase certa ou com probabilidade 1) qualquer que seja o valor inicial do
processo y.
Por exemplo, se y ergdico e EE e se E (eyt ) < 1; ento
1 X yt qc
e
! E (ey )
n t=1
n

(naturalmente tambm se tem convergncia em probabilidade). Note-se que o processo pode


no ser fracamente dependente no sentido da definio 4.4.7 - i.e., verificando-se a lei dos
grandes nmeros de acordo com a proposio anterior, pode no se garantir, ainda assim, a
aplicao do teorema do limite central.
Outra propriedade interessante para processos estritamente estacionrios a seguinte:
Proposio 4.5.3 Seja g uma funo com domnio no espao de estados de y: Se fyt g EE
ento fzt g ; definido por zt = g (yt ; yt 1 ; :::) ; tambm EE.
A proposio anterior permite concluir, por exemplo, que se fyt g EE, ento os processos fyt2 g ; fyt + eyt 1 g ; etc., so tambm estritamente estacionrios. A proposio anterior no se aplica naturalmente a processos estacionrios de segunda ordem. Para ilustrar,
suponha-se que y um processo ESO sem 4o momento. Resulta que fzt g ; onde z definido
por zt = yt2 ; no um processo ESO, pois Var (zt ) no existe.
Em geral, difcil verificar directamente as equaes (4.8) e (4.9), a no ser para casos
relativamente simples, como o do exemplo que se apresenta a seguir. Iremos ver, no entanto,
94

que possvel, em certas circunstncias, provar-se (4.8) ou (4.9) de forma indirecta, atravs
de resultados auxiliares. Antes de entramos nesta questo no ponto seguinte, veja-se um caso
em que a aplicao directa de (4.9) relativamente simples.
Exemplo 4.5.5 Retome-se o exemplo 4.5.1, mas use-se agora a densidade condicional a n
passos (poderia ser tambm a t passos). Conclumos que
yn j y0 = x

x;

1
fn (yj x) = p
exp
2 Var (yn j x)

Note-se que

lim E (yn j x) =

n!1

lim Var ( yn j x) =

n!1

lim

lim

n!1

2
2

(yn E (yn j x))


2 Var (yn j x)

x = 0;
1
1

n!1

lim fn (yj x) = r
n!1
2

2n

1
1

2n

2
2

razovel admitir que f (y) verifica o limite

exp
1

8
<

2;

1
y

: 2

2
2

jfn (yj x)

9
=
;

= f (y) :

f (y)j dy ! 0: Efectiva-

mente, pode mostrar-se esse resultado e, nessas condies, y um processo EE, com distribuio estacionria dada por f (y) e momentos estacionrios E (y) = 0 e Var (y) =
2

= 1

Para exemplificar, considere-se x = 2;

= 0:7 e

= 0:8: A distribuio estacionria

dada por
y

0;

0:7
1 0:82

= N (0; 1:944) :

Se o processo for inicializado no valor x = 2, ao fim de alguns perodos (digamos n = 10),


yt comporta-se como um processo y

N (0; 1:944) : Por outras palavras, um elemento re-

tirado ao acaso da sucesso fy10 ; y11 ; :::g ; por exemplo y100 ; tem distribuio estacionria
N (0; 1:944) : Naturalmente, se o valor anterior y99 for observado e usarmos essa informao para prever y100 ; a distribuio pertinente passa a ser a distribuio condicional
habitual (a um passo). Na figura 4-7 mostra-se a convergncia da sucesso de funes
ffn (yj x = 2) ; n = 1; 2; 3; 8g para a distribuio estacionria f (y) : A distribuio estacionria, que coincide com a distribuio marginal do processo, relevante porque mostra
95

0.6
0.5
0.4
0.3
0.2
0.1
0
-5.0

-4.0

-3.0

-2.0

Dist. Est

-1.0

0.0

n=1

1.0

2.0

n=2

3.0

n=3

4.0

5.0

n=8

Figura 4-7: Sucesso de funes ffn (yj x = 2) ; n = 1; 2; 3; 8g e distribuio estacionria


f (y)
o comportamento geral do processo. D ainda uma medida do tempo de permanncia do
processo em cada um dos subintervalos do espao de estados. Para os valores fixados para
e ; ficamos a saber a partir da inspeco da distribuio estacionria que, por exemplo,
y dificilmente sair do intervalo ( 5; 5) e que, durante a maior parte do tempo, estar no
intervalo (digamos) ( 2; 2) :
Termina-se esta seco notando que a densidade estacionria (caso exista) coincide com
a densidade marginal (quando o processo inicializado em condies estacionrias).

4.5.2

Modelos No Lineares do tipo yt = g (yt 1 ; yt 2 ; :::; yt p ) + ut

Proposio 4.5.4 Considere-se o processo fyg definido por


yt = g (yt 1 ; :::; yt p ) + ut
onde g : Rp ! R; fut g uma sucesso de v.a. i.i.d. e independentes de yt k ; k

1; com

funo de densidade positiva e E (ut ) = 0: O processo fyg geometricamente ergdico se


qualquer uma das seguintes condies se verificar:
(a) g uma funo limitada em conjuntos limitados,
lim

kxk!1

e as razes do polinmio 1

b1 z

jg (x)
:::

(b1 x1 + ::: + bp xp )j
=0
kxk
bp z p esto fora do circulo unitrio.
96

(b) Existe uma constante

2 (0; 1) e c tal que

jg (x)j
(c) Existe uma constante

max fjx1 j ; :::; jxp jg + c:

2 (0; 1) ; c e ai

jg (x)j

0 e a1 + ::: + ap = 1 tal que

(a1 jx1 j + ::: + ap jxp j) + c:

Exemplo 4.5.6 Considere-se o processo AR(2),


yt =

1 yt 1

2 yt 2

+ ut

onde u um rudo branco Gaussiano. A funo g naturalmente


g (x1 ; x2 ) =

1 x1

2 x2 :

A condio (a) da proposio 4.5.4 verifica-se se, com b1 =

e b2 =

2;

as razes de

1 b1 z b2 z 2 estiverem fora do circulo unitrio. Esta , como se sabe, a condio necessria


e suficiente para que o processo AR(2) seja ESO. A proposio anterior vai mais longe: sob
as condies estabelecidas, y EE.
Exemplo 4.5.7 Considere-se o processo
yt2 1
yt =
1 + yt2

+ ut
1

onde u um rudo branco Gaussiano. Tem-se


g (x) =

x2
1 + x2

Como g (x) uma funo limitada em R; mais concretamente, jg (x)j

< ~ < 1;

conclui-se
jxj + ~

jg (x)j
para

2 (0; 1) : Verificam-se as condies (b) e (c) e, assim, y um processo ergdico.

97

Exemplo 4.5.8 Considere-se o processo

yt =

8
<

0:5yt

: 0:5y
t

1
1

+ ut

+ ut

se yt

<0

se yt

0:

onde u um rudo branco Gaussiano. Este modelo pode ser reescrito na forma:
yt =
onde

0:5Ifyt

1 <0g

+ 0:5Ifyt

0g

t yt 1

+ "t ;

: Tem-se g (x) =

0:5Ifx<0g + 0:5Ifx

0g

x:

Vem
jg (x)j

0:5Ifx<0g + 0:5Ifx

jxj

0g

jxj
com

= 0:5 2 (0; 1) : Assim, y um processo ergdico. Neste caso muito particular, y

pode tambm escreve-se na forma yt = 0:5 jyt 1 j + "t e a aplicao da proposio 4.5.4
imediata.
Exemplo 4.5.9 Considere-se o processo
8
< 1 + 0:5y + u
t 1
t
yt =
: 1 0:5y + u
t 1

yt

yt

<0
0:

onde u um rudo branco Gaussiano. A funo g


g (x) = Ifx<0g + 0:5xIfx<0g
= Ifx<0g

Ifx

0g

Ifx

0g

+ 0:5Ifx<0g

0:5xIfx
0:5Ifx

0g

0g

x:

Assim,
jg (x)j

1 + 0:5Ifx<0g

0:5Ifx

0g

jxj

1 + 0:5 jxj
e a proposio 4.5.4 aplica-se imediatamente com c = 1 e
um processo ergdico.
98

= 0:5 (ou

= 0:5), pelo que y

4.5.3

Estabilidade em EDF

Chamamos equao s diferenas finitas (no estocsticas) EDF (de primeira ordem, para
simplificar) equao
yt = g (yt 1 ) ;

y0 =

(condio inicial).

(4.10)

A soluo desta equao no tem componente aleatria e a sua dinmica completamente


determinada pela condio inicial e pela funo g: Tong (1990) chama a g o esqueleto do
processo estocstico. O estudo qualitativo da EDF envolve, por exemplo, a anlise do comportamento assimpttico de yt :
Seja
g (t) (x) = g(:::g(g (x)))
| {z }
t vezes

(por exemplo, g (2) (x) = g (g (x))). O estudo da funo g (t) (x) essencial na anlise qualitativa das solues. Concretamente, yt = g (t) (y0 ) fornece o valor de y no momento t como
funo do valor inicial y0 : Sabendo g (t) podemos, por exemplo, estudar a sensibilidade da
soluo face aos valores iniciais; permite tambm estudar o comportamento assimpttico
da soluo quando t ! 1: Em certos casos, a estacionaridade e ergodicidade podem ser
deduzidas a partir da anlise qualitativa das equaes s diferenas finitas determinsticas
(EDFs). Por exemplo, considere-se a proposio 4.5.4 condio (c), no caso univariado
(g : R ! R), posta na forma jg (x)j < jxj (com c = 0). Resulta,
jg (y0 )j
g (2) (y0 )

jy0 j
= jg (g (y0 ))j

jg (y0 )j

jy0 j

:::
g (t) (y0 )

jy0 j

e, portanto, yt = g (t) (y0 ) ! 0 quando t ! 1; independentemente do valor inicial. Dizse nestes casos que o valor 0 um ponto assimptoticamente estvel8 . Observe-se que a
mesma condio que assegura a estacionaridade estrita no mbito dos processos estocsticos,
assegura tambm a estabilidade assimpttica do ponto zero no mbito das EDF (veja-se o
8

um

Na verdade, a definio menos exigente: o valor zero um ponto fixo assimptoticamente estvel se existir
(t)
(y0 ) ! 0 quando t ! +1:
0 > 0 tal que a desigualdade jy0 j
0 implica g

99

ponto 7.2).

Modelos No Lineares do tipo yt = At yt 1 +Bt

4.5.4

Suponha-se que se analisa o modelo AR com coeficiente aleatrio,


yt =
onde

( t ) yt

+ ut

(4.11)

uma varivel aleatria. Os principais resultados apresentados na seco anterior

no se aplicam, pois a equao (4.11) no pode ser representada na forma yt = g (yt 1 ; yt 2 ; :::; yt p )+
ut . A teoria assimpttica est especialmente desenvolvida para a seguinte classe de modelos
AR com coeficientes aleatrios:
Definio 4.5.4 Uma equao vectorial autoregressiva de dimenso d com coeficientes aleatrios
i.i.d. no negativos uma equao da forma
y t = At y t

+ Bt

(4.12)

onde f(At ; Bt ) ; t 2 Zg uma sucesso i.i.d. com valores em M+


d
Observe-se que M+
d

(R+ ) :

o espao das matrizes quadradas de ordem d de elementos todos

positivos.
Inmeros processos no lineares podem ser representados na forma (4.12), como mostra
o
Exemplo 4.5.10 Considere-se o processo ut com heterocedasticidade condicionada de ordem (2; 1) ; (GARCH(2,1))
ut =
2
t

t "t

= !+

2
1 ut 1

2
2 ut 2

2
1 t 1

2
2 t 2;

!;

i;

> 0:

Procure-se representar este processo na forma (4.12). Para o efeito, observe-se que
2
t

= !+
= !+

2
2
1 t 1 "t 1
2
1 "t 1

+
1

2
2
2 t 2 "t 2
2
t 1

100

2
2 ut 2

2
1 t 1

2
2 t 2

2
2 t 2:

Tem-se

0
B
B
B
@

2
t
2
t 1

C B
C B
C=B
A @

u2t 1
| {z }
yt

0
|

2
1 "t 1

1
"2t

{z

2
t 1

CB
CB
0 CB 2t 2
A@
u2t 2
0
}| {z

0
1

10

yt

At

!
C B C
C B C
C + B 0 C:
A @ A
0
} | {z }
Bt

A matriz aleatria At e o vector Bt esto nas condies da definio 4.5.4.

A estacionaridade do processo (4.12) est discutida, por exemplo, em Basrak et al.


(2002). O resultado principal dado pela
Proposio 4.5.5 Assuma-se, no mbito da definio 4.5.4, E (log kA1 k) < 0 e E log+ kB1 k <
1 (log+ x = max (log x; 0)). Ento o processo definido por (4.12) converge (com probabilidade um) e a sua soluo estritamente estacionria.
Na proposio anterior, as condies de estacionaridade apenas envolvem A1 e B1 ; e
no toda a sucesso fAt g e fBt g ; porque se admite que fAt g e fBt g so sequncias i.i.d.
e, portanto, a avaliao de um elemento qualquer da sucesso suficiente para estabelecer o
resultado desejado.
Uma verso (ligeiramente) mais geral da proposio anterior apresentada Basrak et al.
(2002). Como habitualmente, kAk a norma da matriz ou vector A:
Corolrio 4.5.1 No caso escalar, d = 1;
yt = At yt
assuma-se

+ Bt ;

+
E (log jA1 j) < 0 e E log jB1 j < 1: Ento y converge (com probabili-

dade um) e a sua soluo estritamente estacionria.


Exemplo 4.5.11 Discuta-se a estacionaridade do processo
yt = j j yt

+ jut j ;

onde u rudo branco Gaussiano. No contexto do corolrio 4.5.1 tem-se


At = j j ;

Bt = jut j :

101

A condio E log+ jB1 j < 1 verifica-se imediatamente, tendo em conta a distribuio


assumida para u:9 Relativamente outra condio, vem
E (log jA1 j) = E (log j j) = log j j :
Se log j j < 0; i.e., j j < 1 o processo EE.
Exemplo 4.5.12 Discuta-se a estacionaridade do processo
yt = e

+et

yt

+ jut j

(4.13)

uma constante e et e ut so rudos brancos Gaussianos com varincia igual a 1, e

onde

independentes entre si. No contexto do corolrio 4.5.1 tem-se


At = e

+et

Bt = jut j :

Como fAt g uma sucesso positiva de v.a. i.i.d., a equao (4.13) respeita a definio

4.5.4 (e, assim, o corolrio 4.5.1 aplicvel). A condio E log+ jB1 j < 1 verificase imediatamente, tendo em conta a distribuio assumida para u: Relativamente outra
condio, vem
E (log jA1 j) = E log e

+e1

= E ( + e1 ) = :

< 0 ento o processo y EE.

Se

Exemplo 4.5.13 Considere-se o processo ut com heterocedasticidade condicionada de ordem (1; 1) ; (GARCH(1,1))
ut =
2
t

t "t

= !+

2
1 ut 1

2
1 t 1

!;

1;

> 0:

onde " um rudo branco EE e independente de ut k ; k 2 N. O processo

2
t

pode escrever-se

na forma
2
t
9

Se u

idade 2e

=!+

2
2
1 t 1 "t 1

N (0; 1) ; ento E (log juj) =


p
+y
= 2 :

e2y
2

2
1 t 1

=!+

2
1 "t 1

2
t 1:

0:635: Pode mostrar-se que log juj funo densidade de probabil-

102

Tem-se assim
2
1 "t 1

At =

Bt

B = !:

Verifica-se que (At ; B) uma sucesso de v.a. positivas i.i.d. Para que

2
t

admita uma

soluo estritamente estacionria suficiente (pode mostrar-se que tambm necessrio)


+
E (log jA1 j) < 0 e E log jB1 j <

que se verifiquem as condies do corolrio 4.5.1, 1

1: A segunda condio verifica-se imediatamente; a primeira estabelece


2
1 "0

E (log jA1 j) = E log

< 0:

(4.14)

Nelson (1990) obteve esta condio10 , mas sem recorrer proposio 4.5.5. Tem-se assim
2
t

que

um processo EE. E quanto a ut ? Felizmente, no necessrio estudar directamente

ut ; pois sabe-se que se o processo f(


1t

2t

1t ; 2t )g

EE, uma qualquer funo (mensurvel) de

ainda estritamente estacionria. Assim, se f( 2t ; "t )g EE, ento o processo u

definido por ut =

t "t

tambm EE.

Exemplo 4.5.14 Retome-se o exemplo 4.5.10. Suponha-se que " um rudo branco com
distribuio N (0; 1) : Considerando a norma

kAk = max

1 i n

n
X

jaij j ;

j=1

tem-se
0 0

B
B
log kA1 k = log B
@

B
B
B
@

= log max

= max log
O valor esperado E log 1 "20 +
programa Mathematica permite obter
10

E log

2
1 "0

2
1 "0 +

"20

2
1 "0

2
1 "0

+j

+j

C
C
0 C
A
0

2j

+j

2j

+j

1
1

C
C
C
A

2
2 j ; 1; j"0 j
2j

; 0; log j"0 j2

tem expresso conhecida, por exemplo, quando "0

er

+ log

EulerGamma

HypergeometricPFQ f1; 1g ;
A explicao destas funes pode ver-se no programa Mathematica.

103

3
2; 2

;2

N (0; 1) : O

Como E log j"0 j2

1:27036 < 0 e todos os parmetros so positivos, a condio

E (log kA1 k) < 0 resume-se a


E log
No caso

4.5.5

2
1 "0

< 0:

= 0; obtm-se a condio j estabelecida (4.14).

Modelos No Lineares do tipo yt = g (yt 1 ; ut )

Os modelos mais gerais so do tipo yt = g (yt 1 ; ut ) : No ponto anterior, a funo g


decompe-se na forma At yt

(fixando At ; g linear no seu argumento) e no caso yt =

g (yt 1 )+ut , anteriormente tratado, g; dado yt 1 ; no depende de uma componente aleatria.


O prximo resultado envolve os conceitos de aperiodicidade e irredutibilidade. Suponhase que o espao de estados de y f1; 2; 3g. Imagine-se que o processo tem incio no estado
1. Se y retorna ao estado 1 sempre em dois passos (por exemplo, visita 2 e volta a 1, ou visita
3 e volta a 1) o processo no aperidico. Irredutibilidade significa, grosso modo, que um
processo pode visitar qualquer estado qualquer que seja o estado em que se encontre.
Para processos com espao de estados contnuo, a seguinte proposio assegura a irredutibilidade (Mokkadem, 1985):
Proposio 4.5.6 Suponha-se que para qualquer conjunto A

RN com medida de Lebesgue

no nulo e qualquer conjunto compacto B; existe um inteiro t > 0 tal que


inf P (yt 2 Aj y0 = x) > 0:

x2B

(4.15)

Ento o processo y irredutvel.


1

Defina-se kyt kq := E (kyt kq ) q :


Proposio 4.5.7 Considere-se o processo multivariado fyg definido por
yt = g (yt 1 ; ut )
onde fut g uma sucesso de vectores i.i.d.. Suponha-se que y um processo aperidico e
irredutvel. Suponha que existem escalares K > 0,

104

2 (0; 1) e q > 0 tal que g est bem

definida e contnua com respeito ao primeiro argumento e


kg (x; u1 )kq < kxk ;

kxk > K:

Ento fyt g geometricamente ergdico e EE.


Exemplo 4.5.15 Retome-se o exemplo 4.5.13,
2
t

=!+

2
1 "t 1

2
t 1

supondo " um rudo branco Gaussiano com varincia igual a 1. A proposio 4.5.5
a mais adequada para tratar este caso. No entanto, tambm 4.5.7 pode ser invocada. O
processo obviamente aperidico, tendo em conta a distribuio de ": No fcil verificarse (4.15), pois as probabilidades de transio a n passos no so conhecidas. no entanto
pacfico assumir-se que

2
t;

para algum t > 0; pode atingir qualquer conjunto A; qualquer


2
t

que seja a condio inicial. Assuma-se, assim, que


2
1 "1

g (x; u1 ) = ! +

irredutvel. Tem-se,

e escolha-se, no contexto da proposio 4.5.7, q = 1: Assim,


kg (x;"1 )k1 = E ! +

2
1 "1

x :

Em que circunstncias se verifica


2
1 "1

E !+

< jxj ;

jxj > K ?

Para jxj suficientemente grande, tal que jxj > K; o valor de ! irrelevante11 . Assuma-se
assim ! = 0: Vem
2
1 "1

E
se e s se E (j

2
1 "1

1 j)

<

=E

2
1 "1

x < jxj ;

jxj > K

2 (0; 1) : A condio de estacionaridade estrita est encon-

11
Considere-se, por exemplo, j! + 0:98xj < 0:99 jxj : Esta desigualdade no se verifica para todo o x 2 R.
No entanto, para qualquer valor de !; existe certamente um K tal que jxj > K ) j! + 0:98xj < 0:99 jxj :

105

trada:
2
1 "1

E
2
1 "1

Atendendo a

< 1:

> 0 e E ("21 ) = 1; a condio pode reescrever-se na forma


2
1 "1

< 1:

(4.16)

Esta condio no equivalente obtida no exemplo 4.5.13, E (log (

2
1 "0

1 ))

< 0 (as

proposies 4.5.5 e 4.5.7, em geral, conduzem a condies suficientes, mas no necessrias).


Estas duas condies so discutidas no ponto 8.4.

4.A

Demonstraes

Demonstrao da proposio 4.5.1


Para simplificar, suponha-se que existe a densidade fn (yj x) =
se n ! 1 em ambos os lados da equao (4.7). Como fn (yj x)

@
F
@y n

(yj x) : Considere-

f (y) converge para zero

na norma kk, a equao (4.7) com n ! 1


f (y) =

f1 (yj u) f (u) du:

(4.17)

Por hiptese, y0 (valor inicial) tem densidade estacionria fy0 = f: Resulta de (4.17) que y1
tambm tem densidade estacionria f; pois
fy1 (y) =

f1 (yj u) fy0 (u) du =

f1 (yj u) f (u) du = f (y) :

Por induo, conclui-se que fyt (y) = f (y) qualquer que seja t. Por outro lado, devido
homogeneidade e propriedade de Markov, a densidade conjunta de (yn ; yn 1 ; :::; y1 ; y0 )
fyn ;yn

1 ;:::;y1 ;y0

(xn ; xn 1 ; :::; x1 ; x0 ) = f1 (xt j xt 1 ) f1 (xt 1 j xt 2 ) :::fy0 (x0 )

igual densidade conjunta de (yn+k ; yn+k 1 ; :::; yk+1 ; yk )


fyn+k ;yn+k

1 ;:::;yk+1 ;yk

(xn ; xn 1 ; :::; x1 ; x0 ) = f1 (xt j xt 1 ) f1 (xt 1 j xt 2 ) :::fyk (x0 ) ;

pois f1 (yj x) no depende do momento em que calculada (apenas depende dos argumentos

106

y e x) e fy0 (x0 ) = fyk (x0 ) = f (x0 ).

107

Pgina em branco

108

Parte II
Modelos

109

Pgina em branco

110

Captulo 5
O Problema da Especificao
(ltima actualizao: 1/2010)

5.1

O Axioma da Correcta Especificao do Modelo

Seja yt o valor de uma varivel econmica no momento t: Em termos abstractos temos


a sucesso (ou coleco) de variveis aleatrias fyt ; t 2 Zg ou fyt ; t 2 N0 g : Uma srie
econmica apenas uma subsucesso de fyt ; t 2 N0 g : A srie econmica depende de inmeros factores: leis econmicas, choques externos, puro acaso, etc.
O verdadeiro comportamento de yt desconhecido. Pode ser caracterizado por aquilo
a que se chama data generation process (DGP) e definido como a lei de probabilidade
conjunta de fyt ; yt 1 ; :::g:
Ft0 (yt ; yt 1 ; :::) ou ft0 (yt ; yt 1 ; :::) :
A distribuio conjunta ou a densidade conjunta (que se admite existir) descrevem completamente a sucesso em termos probabilsticos (incorpora tudo o que influencia yt ). Note-se
que as funes Ft0 ou ft0 so desconhecidas. Alm disso, dependem de t; porque se admite
a possibilidade de y ser no estacionrio. O DGP pode ser equivalentemente descrito pelas
densidades condicionais (supondo que existem)
ft0 (yt j Ft 1 ) ;

t = :::; 1; 0; 1; :::

111

Com efeito (usando a propriedade P (A \ B) = P (Aj B) P (B));


ft0 (yt ; yt 1 ; :::) = ft0 (yt j yt 1 ; :::) ft0 1 (yt 1 ; yt 2 :::)

(5.1)

= ft0 (yt j yt 1 ; :::) ft0 1 (yt 1 j yt 2 ; :::) ft0 2 (yt 2 ; yt 3 :::)


= ...
= ft0 (yt j yt 1 ; :::) ft0 1 (yt 1 j yt 2 ; :::) :::f10 (y1 j y0 ; :::) :::
Logo a sucesso fft0 (yt j Ft 1 )g fornece a mesma informao que f 0 (yt ; yt 1 ; :::). Por exemplo, suponha-se que se simula o seguinte modelo:
y1

N (0; 1)

yt = 0:5yt

+ "t ;

"t um rudo branco N (0; 1) ;

t = 2; 3

Logo, o DGP da simulao


f 0 (y3 ; y2 ; y1 ) = f 0 (y3 j y2 ; y1 ) f 0 (y2 ; y1 )
= f 0 (y3 j y2 ; y1 ) f 0 (y2 j y1 ) f 0 (y1 )
= f 0 (y3 j F2 ) f 0 (y2 j F1 ) f 0 (y1 ) ;
e, portanto, pode ser completamente caracterizado pela distribuio condicional yt j Ft

N (0:5yt 1 ; 1) e pela distribuio do valor inicial (se o processo fosse iniciado em t =

o DGP seria caracterizado apenas pela distribuio condicional).


Um modelo economtrico definido pelo investigador e procura aproximar o melhor
possvel o DGP atravs de um modelo
M (yt ; yt 1 ; :::; dt ; )
onde

um vector de parmetros e dt inclui variveis no aleatrias que procuram modelar

alteraes no DGP ao longo do tempo (como por exemplo, variveis artificiais determinsticas, tendncias, etc.).
Este modelo encerra uma hiptese quanto fdp condicional, ft (yt j dt ; Ft 1 ; ) e, portanto, quanto aos momentos condicionais, como por exemplo E (yt j dt ; Ft 1 ; ) e Var (yt j dt ; Ft 1 ; ) :
O axioma da correcta especificao do modelo M traduz-se da seguinte forma: existe um

112

tal que
ft (yt j dt ; Ft 1 ;

0)

= ft0 (yt j Ft 1 ) :

De forma anloga, os dois primeiros momentos condicionais esto correctamente especificados se existir um

tal que

E (yt j dt ; Ft 1 ; ) =
Var (yt j dt ; Ft 1 ; ) =

Z
Z

yft0 (yj Ft 1 ) dy
y 2 ft0

(yj Ft 1 ) dy

yft0

(yj Ft 1 ) dy

Na prtica, a hiptese da correcta especificao implausvel, embora seja geralmente


conveniente invoc-la como forma de estruturar e interpretar os resultados estatsticos. De
todo o modo, o objectivo claro: devemos procurar uma fdp ft (yt j dt ; Ft 1 ;

0)

que esteja

o mais prximo possvel da verdadeira mas desconhecida densidade f 0 (yt j Ft 1 ).

5.2

Modelao da Mdia Condicional e Modelos Dinamicamente Completos

5.2.1

Modelos Dinamicamente Completos

Generalize-se a anlise e admita-se que a yt depende dos valores correntes e passados de


xt . Seja It = Ft

[ FtX onde FtX o conjunto de informao contendo todas as variveis

explicativas at ao perodo t: Assim, It = fyt 1 ; yt 2 ; :::; xt ; xt 1 ; :::g. O primeiro passo na


construo do modelo M o da definio da mdia condicional, o que significa que devemos
identificar todas as variveis explicativas de yt . Por exemplo, suponha-se que as variveis
relevantes para explicar um certo fenmeno yt so xt e yt 1 : Normalmente expressamos esta
nossa convico sobre o poder explicativo xt e yt

escrevendo yt =

1+

2 xt +

yt

1 + ut ;

sendo ut o termo de erro. importante sublinhar que nada de relevante dito sobre
o modelo se no adiantarmos uma hiptese sobre o comportamento de ut : Se dissermos
que E (ut ) = 0 apenas podemos concluir que E (yt ) =

E (xt ) +

E (yt 1 ) : Se

adicionalmente dissermos que Cov (ut ; xt ) = Cov (ut ; yt 1 ) = 0 ento (pode-se provar que)
1

2 xt

+ yt

o melhor previsor linear de yt : Se a nossa hiptese E (ut j It ) = 0

acrescentamos bastante mais informao: de facto, reclamamos que a mdia condicional


E (yt j It ) =

2 xt

+ yt 1 : Todavia, nenhuma suposio feita quanto a distribuio

113

condicional de yt :
Seja xt o vector das variveis explicativas. No exemplo anterior tem-se xt = (xt ; yt 1 ) ;
e pode-se verificar que E (yt j xt ) = E (yt j It ) : De uma forma geral, quando vlida a
igualdade E (yt j xt ) = E (yt j It ) diz-se que o modelo dinamicamente completo. Veja um
caso onde o modelo no dinamicamente completo. Considere-se,
yt =

2 xt

3 yt 1

+ ut ;

ut =

2 ut 2

+ "t

(5.2)

sendo f"t g um RB. Este modelo no dinamicamente completo, pois


E (yt j It ) =

2 xt

3 yt 1

+ ut

2 xt

3 yt 1 :

no coincide com
E (yt j xt ) = E (yt j xt ; yt 1 ) =

No entanto, fcil obter um modelo dinamicamente completo a partir de (5.2). Como


ut = yt
ut

= yt

(
2

2 xt

3 yt 1 )

2 xt 2

3 yt 3 )

tem-se, a partir da representao (5.2),


yt =

2 xt

3 yt 1

+ ut

2 xt

3 yt 1

2 ut 2

2 xt

3 yt 1

1 2

2 xt

(yt

3 yt 1

+ "t
2

2 yt 2

2 xt 2

3 yt 3 ))

2 2 xt 2

+ "t

3 2 yt 3

+ "t :

A equao anterior pode ainda escrever-se na forma


yt =

2 xt

3 yt 1

4 yt 2

5 xt 2

6 yt 3

+ "t :

(5.3)

O vector xt passa agora a ser xt = (xt ; yt 1 ; yt 2 ; xt 2 ; yt 3 ) e o modelo (5.3) dinamica-

114

mente completo pois


E (yt j It ) = E (yt j xt ) =

2 xt

3 yt 1

4 yt 2

5 xt 2

6 yt 3 :

Num modelo dinamicamente completo, o conjunto das variveis explicativas xt capta toda
a dinmica do processo, de tal forma que os erros no so autocorrelacionados (vale a pena
acrescentar que um modelo dinamicamente completo no pode ter erros autocorrelacionados).
Que diferenas existem entre os modelos (5.2) e (5.3)? O estimador OLS aplicado a
(5.3) consistente; mas aplicado a (5.2) inconsistente, pois o regressor yt

est correla-

cionado com os erros ut (E (ut j xt ) 6= 0). Claro que no modelo (5.2) deve usar-se um
mtodo de estimao consistente, como por exemplo, o mtodo FGLS ou o mtodo da mxima verosimilhana. Quando so usados mtodos de estimao apropriados, do ponto de
vista estatstico - por exemplo, previso ou ajustamento - os modelos acima discutidos so
(quase) equivalentes (e, portanto, indiferente usar-se um ou o outro). Do ponto de vista da
interpretao econmica o modelo (5.3) pode ser prefervel, pois identifica claramente todos
os regressores influentes na explicao das variaes de y: Mas, tambm pode suceder
o contrrio! Suponha-se que a teoria econmica postula para certo fenmeno a relao
yt =

2 xt

+ ut : esta a relao que queremos estimar, mesmo que ut possa exibir

autocorrelao.

5.2.2

Mdia Condicional No Linear

Suponha-se que a mdia condicional dada por


E (yt j Ft 1 ) = g (yt 1 ; yt 2 ; ::; yt p ; ut 1 ; ut 2 ; :::ut q )
(no estando presente a varivel explicativa xt ; a -algebra relevante Ft e no It ; como no
exemplo anterior). Diz-se que o modelo yt = g (yt 1 ; yt 2 ; ::; yt p ; ut 1 ; ut 2 ; :::ut q ) + ut
no linear na mdia se g uma funo no linear dos seus argumentos. Vejamos alguns
exemplos. No caso
yt = yt

+ log 1 + yt2

+ ut ;

115

E (ut j Ft 1 ) = 0;

tem-se um modelo no linear na mdia, pois, E (yt j Ft 1 ) = yt

+ log 1 + yt2

uma

funo no linear de yt 1 : Tambm


y t = u t 1 ut

E (ut j Ft 1 ) = 0

+ ut ;

um modelo no linear, pois E (yt j Ft 1 ) = ut 1 ut

no linear nos valores passados de

ut : Outro exemplo Modelo Threshold

yt =

8
<
:

1 yt 1

+ ut

se yt

>k

2 yt 1

+ ut se yt

k:

com E (ut j Ft 1 ) = 0: Desenvolveremos modelos no lineares com algum detalhe no ponto


7.

5.3

Modelao da Varincia Condicional

Definida a mdia condicional, pode haver interesse em explicar a variabilidade de yt ao longo


do tempo. No modelo clssico de sries temporais assume-se que a varincia condicional
constante ao longo do tempo. Essa hiptese no credvel em sries temporais financeiras.
No ponto 8 discutiremos esta questo em detalhe. Uma forma de introduzir um modelo
de varincia condicional no constante consiste em definir o termo de erro da equao yt =
E (yt j Ft 1 ) + ut da seguinte forma ut =

t "t ;

onde "t um rudo branco de varincia igual a

1 ou, mais geralmente, uma diferena de martingala (com varincia finita igual a 1). Resulta
Var (yt j Ft 1 ) = Var (ut j Ft 1 ) = Var ( t "t j Ft 1 ) =
A tarefa do investigador a de definir uma funo adequada para

2
t:

2
t:

No ponto 8 aborda-se

de forma detalhada esta questo.

5.4

Distribuio de Condicional

Definida a mdia condicional e a varincia condicional e, eventualmente, outros momentos


condicionais de ordem superior, pode haver interesse em modelar toda a estrutura probabilstica do processo. Para o efeito necessrio no contexto da equao yt = E (yt j Ft 1 ) + ut
116

com ut =

t "t ;

gador "t

especificar uma distribuio para "t : Por exemplo, se a proposta do investi-

N (0; 1) ; resulta que distribuio condicional de yt


yt j Ft

N (E (yt j Ft 1 ) ; Var ( yt j Ft 1 )) ;

e toda a estrutura probabilstica fica definida. No contexto do ponto 5.1, a densidade definida
para yt j Ft

representa a funo ft (yt j dt ; Ft 1 ; ).

117

Pgina em branco

118

Captulo 6
Modelao da Mdia: Abordagem Linear
(ltima actualizao: 3/2006)
Neste captulo vamos focar modelos lineares na mdia. Considere-se o modelo
yt =
onde ut so os erros e

+ ut

(6.1)

= g (yt 1 ; yt 2 ; ::; yt p ; ut 1 ; ut 2 ; :::ut q ) a mdia condicional.

De acordo com a regra adoptada adiante, entende-se que o modelo (6.1) linear na mdia se
a funo g linear nos seus argumentos. Por exemplo, a especificao
linear (a funo g g (x1 ; x2 ) = x1 + x2 ) ao passo que

= yt

+ ut

= yt2 1 (g (x) = x2 ) no

linear.
Toma-se como varivel dependente y (pode ser um retorno de um ttulo, a variao
da taxa de cmbio, uma taxa de juro, etc.). Comearemos por admitir que a nica informao que dispomos sobre y a prpria srie. Como explicar yt a partir da informao
Ft

= fyt 1 ; yt 2 ; :::g? Se yt no est correlacionado de alguma forma com os seus valores

passados yt 1 ; yt 2 ; ::: a abordagem de sries temporais intil. Pelo contrrio, se existe evidncia de autocorrelao, ento os valores passados da srie podem explicar parcialmente o
movimento de y e um modelo linear na mdia pode ser apropriado. Na prtica, teremos de escolher um modelo concreto. Por exemplo, yt = c+ yt 1 +ut ou yt = c+
ou yt = c +

1 ut 1

1 yt 1 + 2 yt 2 +ut

+ ut entre muitos outros. Como seleccionar o modelo apropriado? A au-

tocorrelao (total) e autocorrelao parcial so dois conceitos chave na fase da identificao


do modelo. Iremos analis-los de seguida.

119

6.1
6.1.1

Definies Preliminares
Autocorrelao de Ordem s (FAC)

Suponha-se que y um processo ESO. Para medir a associao linear entre yt e yt

j vimos

que se toma o coeficiente de autocorrelao de ordem s;

onde

Cov(yt ; yt s )
=p
Var (yt ) Var (yt s )

Cov(yt ; yt s ) = E ((yt

E (yt )) (yt

= E (yt yt s )
Convencione-se chamar

a Cov (yt ; yt s ) e

E (yt s )))

E (yt ) E (yt s ) :

a Var (yt ) 1 : Como Var (yt ) = Var (yt s )

vem
s

Cov(yt ; yt s )
=p
= ps 2 =
Var (yt ) Var (yt s )
0

Naturalmente, devido desigualdade de Chaucy-Schwarz2 , tem-se


j sj

6.1.2

1.

Autocorrelao Parcial de Ordem s (FACP)

Quando se calcula a correlao entre, por exemplo, yt e yt 2 ; por vezes sucede que a correlao detectada se deve ao facto de yt estar correlacionado com yt 1 ; e yt 1 ; por sua vez,
estar correlacionado com yt 2 : Com a autocorrelao parcial procura-se medir a correlao
entre yt e yt

eliminando o efeito das variveis intermdias, yt 1 ; :::; yt

s+1 :

A anlise desta

forma de autocorrelao importante na medida em que permite, juntamente com a FAC,


identificar o processo linear subjacente.
No mbito do modelo de regresso linear, sabe-se que uma forma de medir a associao
parcial ceteris paribus entre, por exemplo, y e x1 consiste em considerar a regresso y =
0 + 1 x1 + 2 x2 +:::+ k xk +u: Com este procedimento
1

Na verdade, adoptando a conveno s = E ((yt


E ((yt E (yt )) (yt E (yt ))) = Var (yt ) :
2

Suponha-se que E jXj

< 1 e E jY j

E (yt )) (yt

representa o efeito ceteris paribus


E (yt

< 1: Ento E (jXY j)

120

s ))) resulta,
2

E jXj

1=2

por definio,
2

E jY j

1=2

de uma variao unitria de x1 sobre y: Mede-se, portanto, o impacto de x1 sobre y depois


do efeito das variveis x2 ; :::; xk ter sido removido ou fixo. Para obtermos as autocorrelaes
parciais seguimos um procedimento similar.
Considere-se:
yt = c +

11 yt 1

yt = c +

21 yt 1

22 yt 2

yt = c +

31 yt 1

32 yt 2

33 yt 3

s1 yt 1

s2 yt 2

+ ::: +

:::
yt = c +

ss yt s

A autocorrelao parcial de ordem i dada pelo coeficiente


lao parcial de ordem 2 dada pelo coeficiente
yt = c +

21 yt 1

22

ii :

Por exemplo, a autocorre-

na regresso

22 yt 2

+ t:

(6.2)

Podemos usar o OLS para obter ^ 22 : Este coeficiente mede a relao entre yt e yt
do efeito de yt

ter sido removido.

kk

onde rt;k o resduo da regresso linear de yt

sobre um termo constante e (yt 1 ; :::; yt

Os resduos rt;k podem ser interpretados como a varivel yt


k+1 )

depois

tambm pode ser estimado atravs da expresso

P
^ kk = Pt rt;k yt
2
t rt;k

(yt 1 ; :::; yt

k+1 ) :

depois dos efeitos das variveis

terem sido removidos. Donde ^ kk mede o efeito entre yt e yt

depois do

efeito das variveis intermdias ter sido removido.


Uma outra forma alternativa de obter
6.A. Sob H0 :

kk

ii

(como funo dos 0 s) est descrita no apndice

=0
Z=

p
d
n ^ kk ! N (0; 1) :

121

6.1.3

Operador de Diferena e de Atraso

O operador diferena

bem conhecido:

yt = yt
2

yt =

yt 1 ;
( yt ) =

= yt

yt

(yt
(yt

yt 1 ) =

yt

yt 2 ) = yt

yt
2yt

+ yt 2 :

O operador de atraso ou de desfasamento L (lag) define-se como


Lyt = yt 1 :
Resulta da definio,
L2 y t =

L (Lyt ) = Lyt

Lp yt =

yt p ;

Lp ut =

ut p :

= yt 2 ;

Naturalmente, podemos combinar os operadores. Por exemplo,


L yt = L (yt

yt 1 ) = yt

yt 2 :

Com o operador L podemos escrever, por exemplo,


yt

1 yt 1

2 yt 2

1 ut 1

+ ut

1 Lut

+ ut

na forma,
yt
1

2
2 L yt

1 Lyt

2
2L

1L

Obs.:

(L) = 1

1L

2
2L

yt =

(L) yt =

(L) = 1 +

+ (1 +
+
1L

1 L) ut

(L) ut :

so polinmios em L: Certos autores,

sobretudo da rea das sucesses cronolgicas, preferem a letra B (backshift) para designar o
mesmo operador de atraso.
122

6.2

Processos Lineares Estacionrios

A decomposio de Wold fornece uma motivao para os modelos de mdias mveis (ver a
seguir). Wold mostrou que um processo y ESO pode escrever-se na forma
yt = Vt + ut +

1 ut 1

onde ut um RB, Vt um processo determinstico e

2 ut 2

P1

i=1

+ :::
2
i

(6.3)

< 1:

A decomposio destaca que qualquer processo ESO (linear ou no linear) tem uma
representao linear nos erros de regresso (podemos tambm dizer, nos erros de previso)
ocorridos no passado. No entanto, o modelo (6.3) no pode ser implementado porque existem infinitos parmetros para estimar.
Vamos procurar representaes lineares parcimoniosas, inspiradas em (6.3).
Exemplos:
y t = ut +

1 ut 1

y t = ut +

1 ut 1

(
+

2 ut 2

1;

1;

= ::: = 0)
2

2;

= ::: = 0)

Veremos que os processos do tipo


yt = c + yt

+ ut

podem tambm escrever-se na forma (6.3) (com restries sobre os

i ).

Veremos tam-

bm que a melhor aproximao linear parcimoniosa que podemos efectuar estrutura (6.3),
supondo Vt = 0; baseia-se no chamado modelo ARMA.

6.2.1

Processos Mdia Mvel

Processo M A (1)
O processo MA(1) dado por

yt =

+ ut

+ ut =

+ (1 + L) ut

onde ut um rudo branco. Este modelo representa yt como uma combinao linear de
choques aleatrios (ut

e ut ). Outra forma de interpretarmos o modelo consiste em imaginar


123

que yt resulta de um mecanismo de correco: podemos utilizar o erro cometido no perodo


anterior, ut 1 ; como regressor (i.e., como varivel explicativa) do modelo (por exemplo,
veremos que a previso de y baseia-se, em parte, no erro de previso cometido no perodo
anterior). Este modelo indicado para modelar fenmenos de memria muito curta pois a
autocorrelao de y extingue-se muito rapidamente, como veremos a seguir.
Momentos Marginais
Os primeiros momentos marginais (ou no condicionais) so
E (yt ) = E ( + ut

Var (yt ) = Var ( + ut

+ ut ) =
1

2 2

+ ut ) =

Covarincias e Autocorrelaes

= Cov (yt ; yt 1 ) = E ((yt


= E (( ut
= E

+ ut ) ( u t

+ ut 1 ))

+ u2t

+ u t ut

ut 1 ut
2

= 0+

) (yt

))

+ ut ut

+0+0

Pode-se provar
= 0 para s > 1:

O processo yt ESO pois E (yt ) e Var (yt ) so constantes e

se agora que as autocorrelaes so dadas por

2 2

+
0 para s > 1:
0

Relativamente s autocorrelaes parciais tem-se

11

+1

e (pode-se provar)
s
ss

Momentos Condicionais
124

2
2(s+1)

+1

no depende de t. Conclui-

Os momentos condicionais so imediatos:


E (yt j Ft 1 ) =

E ( + ut

+ ut j Ft 1 ) =

2
E (yt j Ft 1 )) Ft

Var (yt j Ft 1 ) = E (yt

+ ut 1 :
= E u2t Ft

Se ut um rudo branco Gaussiano ento


yt j Ft

+ ut 1 ;

Invertibilidade
Considere-se um processo MA(1) (sem perda de generalidade) de mdia nula, yt =
ut

+ ut ; onde ut um rudo branco. Naturalmente, y pode escrever-se na forma


yt = (1 + L) ut ou yt (1 + L)

= ut

Atendendo ao desenvolvimento em srie de potncia de (1 + L) 1 ,


1
=1
1+ L

L+

L2

:::;

= ut

j j<1

tem-se, para j j < 1,


yt (1 + L)
yt 1
yt = yt

L+
1

L2

yt

::: = ut
2

+ ::: + ut :

(6.4)

Diz-se neste caso, com j j < 1 que yt invertvel, isto , tem representao autoregressiva3 .
O facto do processo MA(1) (e, mais geralmente, o processo MA(q)) ter representao do
tipo (6.4) explica por que razo a funo de autocorrelao parcial

ii

no nula para todo o

i (porqu?).
A invertibilidade uma propriedade exigvel na previso: garante que a informao remota sobre o processo irrelevante. Imagine-se o caso contrrio, i.e. o processo no invertvel. Isto significa que j j > 1 e, pela equao (6.4), a informao mais atrasada tem
mais peso na previso y (a rigor a representao (6.4) no est bem definida no caso j j > 1;
3

No caso yt = + ut

1 +ut , j

j < 1; a representao autoregressiva yt =

125

1+

+ yt

yt

2 +:::+ut :

no entanto, a ideia essencial mantm-se).


Um processo no invertvel pode transformar-se num processo invertvel com funes de
autocorrelao e autocorrelaes parciais iguais (ver apndice 6.B).
Processo M A (q)
O processo MA(q) dado por

yt =

1 ut 1

+ (1 +

2 ut 2

+ ::: +

1L

+ ::: +

q ut q

+ ut ;

q
q L ) ut

(L) ut .

O processo yt continua a representar-se como uma combinao linear de choques aleatrios,


desta vez, em funo de ut q ; ::: ut . Pode-se provar:
E (yt ) =
2

Var (yt ) =
k

Pode-se provar ainda:

kk

1+

2
1

+ ::: +

2
q

8
< =
6 0 se k = 1; 2; :::; q
=
: 0
se k = q + 1; q + 2; :::

6= 0, mas

kk

! 0;

Proposio 6.2.1 yt invertvel se as razes de

quando k ! 1:
q

(L) (i.e. as solues de

(L) = 0) so em

mdulo superiores a um (ou fora do circulo unitrio no plano complexo). Equivalentemente,


yt invertvel se as razes inversas de

(L) (i.e. 1=L onde L so as solues de

(L) = 0)

so em mdulo inferiores a um (ou dentro do circulo unitrio no plano complexo).


No caso MA(1) a proposio 6.2.1 equivalente a exigir j 1 j < 1 (ou j1= 1 j > 1).
Observe-se que

1=
yt =

soluo de 1 +
+

1 ut 1

2 ut 2

1L

= 0: No caso MA(2)

+ ut =

126

+ 1+

1L

2
2L

ut

a proposio 6.2.1 traduz-se da seguinte forma: yt invertvel se

>

1;

< 1;

1<

No caso MA(q), q > 2 necessrio calcular as razes de

< 1:

(L) :

O apndice 6.C fornece alguns exemplos e refere-se ao programa EVIEWS.

6.2.2

Processos Autoregressivos

Processo AR(1)
O processo AR(1) dado por
yt = c + yt

+ ut

(6.5)

onde ut rudo branco independente de yt 1 . Este modelo muito importante porque reproduz razoavelmente a dinmica de muitas sries econmicas e financeiras.
Momentos Marginais
Comece-se por calcular a mdia marginal
E (yt ) = E (c + yt

+ ut ) = c + E (yt 1 ) :

(temos uma equao recorrente em E (yt ): este valor esperado depende de E (yt 1 ) que, por
sua vez, depende de E (yt 2 ) e assim sucessivamente). Se assumirmos partida a condio
de ESO (implicando E (yt ) = E (yt 1 ) = E (y)) vem
E (y) = c + E (y) ) E (y) =

c
1

Seguindo um raciocnio idntico vem:


Var (yt ) = Var (c + yt
=

+ ut ) =

Var (yt 1 ) +

Var (yt 1 ) + Var (ut )

Sob a hiptese de ESO, tem-se Var (yt ) = Var (yt 1 ) = Var (y) e, portanto,
Var (yt ) =

Var (y) +

127

) Var (y) =

2:

Covarincias e Autocorrelaes
Calcule-se agora as covarincias. Como estas no dependem da mdia de yt , simplifiquese fazendo c = 0: Suponha-se j j < 1: A covarincia

dada por

= Cov (yt ; yt 1 ) = E (yt yt 1 )

= E (E (yt yt
= E (yt

jFt

E ( yt

1 ))

= E (yt

+ ut jFt

1 ))

E (yt jFt
yt2

=E

1 ))
1

2:

A covarincia de ordem k

= E (yt yt k ) = E (E (yt yt

jFt

k ))

= E (yt

E (yt jFt

k ))

Para desenvolvermos a expresso precisamos de calcular primeiro E (yt jFt


yt =

yt

Ora

+ ut

( yt

yt

k):

= ::: = yt

+ ut 1 ) + ut

+ ut
k

+ ut

+ ut

k+1

k 1

+ ut

k+2

k 2

+ ::: + ut

+ ut

pelo que
E (yt j Ft 1 ) = yt

(todos os outros termos so nulos). Tem-se assim,

= E yt k yt

2
E yt

0:

Uma forma alternativa de obter este valor a seguinte. Multiplique-se ambos os termos da
equao (6.5) por yt

(sem perda de generalidade, considere-se c = 0). Resulta


yt yt

= yt 1 yt

128

+ ut yt k :

Tomando o valor esperado e tendo em conta que E (ut yt k ) = 0; obtm-se

k 1:

Logo,

0;

:::
k

0:

Finalmente,
k
k

Tendo em conta a definio de autocorrelao parcial, tem-se:


)

yt = c +

11 yt 1

yt = c +

21 yt 1

22 yt 2

Assim,
kk

8
<

: 0

11

22

=0

se k = 1
se k > 1

Os dois primeiros momentos condicionais so


E (yt j Ft 1 ) = E (yt j yt 1 ) = E ( yt
Var (yt j Ft 1 ) = E (yt

yt 1 )2 yt

+ ut j yt 1 ) = yt 1 ,
= E u2t yt

Se ut um rudo branco Gaussiano ento


yt j Ft

yt 1 ;

Pode-se provar que a condio de estacionaridade do processo AR(1) (ver apndice


6.D)
j j < 1:

129

Invertibilidade
O processo AR sempre invertvel (por definio j tem representao autoregressiva).
Reverso para a Mdia
Processos estacionrios com mdia finita so, por vezes, designados por processos com
reverso para a mdia. Exemplifique-se com o processo AR(1)
yt = c + yt
Como

c
1

)c=

(1

j j < 1.

+ ut ;

) (note-se que

a mdia de y; E (yt )) podemos reescrever

o AR(1) na seguinte forma:


yt =

(1

) + yt

yt =

(1

)+(

= (

1) (yt

+ ut

1) yt

+ ut

) + ut

Esta ltima equao permite estabelecer as seguintes relaes:


(yt

) > 0 ) E ( yt j Ft 1 ) < 0

(yt

) < 0 ) E ( yt j Ft 1 ) > 0:

Por exemplo, se num certo perodo (digamos t


de longo prazo

1) o valor de y est acima da sua mdia

(i.e. y est relativamente alto) no perodo seguinte y tender a diminuir de

valor pois E ( yt j Ft 1 ) < 0. Quando positivo (esta a situao habitual em aplicaes),


possvel concluir que quanto mais alto for

(sem, contudo ultrapassar o valor 1) mais

lenta a velocidade de ajustamento de y em direco sua mdia de longo prazo. Suponha


que o processo y sofre um choque aleatrio considervel (ou que inicializado num valor
afastado da sua mdia de longo prazo). Como que y evolui nos perodos seguintes? Tende a
aproximar-se rapidamente ou lentamente de ? (pode mesmo suceder que no haja qualquer
efeito de reverso para uma medida de tendncia central se, no limite,

= 1). Na figura 6-1

esto representados quatro processos AR(1) simulados de acordo com o modelo


yt = 100 (1

) + yt

+ ut ;

ut rudo branco Gaussiano

=1

Em todos os casos, o valor de inicializao y0 = 0 e usam-se os mesmos erros u. Quanto


130

120
100
80

fhi=0.1

60

fhi=0.8

y
40

fhi=0.98

20

fhi=1

0
-20
1

26

51

76

101

126

151

176

Figura 6-1: Simulao de quatro processos AR(1) (choques aleatrios ut iguais e valor de
inicializao y0 = 0)
mais lento o ajustamento de y face mdia de longo prazo y: No caso

mais alto o valor

= 1 no existe reverso para ; embora o processo possa cruzar

= 100 (assim como

qualquer outro valor do espao de estado de y) algures no tempo.


Representao MA(1)
Um processo AR(1) (ou mais geralmente um AR(p)) estacionrio pode representar-se
como um MA(1). J vimos
yt =

yt
t

+ ut
t 1

y0 +

t 2

u1 +

u2 + ::: + ut

+ ut

Podemos continuar o procedimento recursivo:


yt =
=

( y

t+1

= ::: 2 ut

t 1

+ u0 ) +

t 1

u0 +

+ ut

u1 +
u1 +

t 2

u2 + ::: + ut

t 2

u2 + ::: + ut

+ ut

+ ut

+ ut :

Para obtermos este resultado podemos tomar um caminho alternativo. Considere-se


yt = yt

+ ut , yt (1

L) = ut , yt =

131

1
1

ut .

Supondo j j < 1 tem-se

1
1

=1+ L+

L2 + :::

Logo
1

ut = 1 + L + 2 L2 + ::: ut
1
L
= ut + ut 1 + 2 ut 2 + :::

yt =

Processo AR(p)
Um processo AR(p) uma simples generalizao do AR(1):
yt = c +

1 yt 1

+ ::: +

p yt p

+ ut :

Este modelo pode ainda representar-se nas seguintes formas alternativas:


1

1L

p
pL

:::
p

yt = c + ut ; ou

(L) yt = c + ut :

Momentos Marginais (ou no condicionais)


Assumindo a condio de ESO, vem

E (yt ) = E c +

1 yt 1

E (y) = c +

+ ::: +

p yt p

E (y) + ::: +

+ ut = c +

E (yt 1 ) + ::: +

E (y) ) E (y) =

E (yt p )

c
1

:::

.
p

Para obtermos a varincia til considerar (sem perda de generalidade faa-se c = 0 )


E (y) = 0):
yt =

1 yt 1

+ ::: +

yt2 =

1 yt 1 yt

p yt p

+ ::: +

+ ut

p yt p yt

2
E yt

2
E yt

+ ::: +

p p

1 1

+ ::: +

p p

1 1

E (yt 1 yt ) + ::: +

132

+ ut yt

E (yt p yt ) + E (ut yt )

As covarincias so obtidas de forma similar (sem perda de generalidade faa-se c = 0 )


E (y) = 0):
yt =
yt yt

1 yt 1

1 yt 1 yt k

E (yt yt k ) =
k
k

+ ::: +

p yt p

+ ::: +

p yt p yt k

E (yt 1 yt k ) + ::: +

1 k 1

+ ::: +

p k p

+ ::: +

k 1

+ ut yt

E (yt p yt k ) + E (ut yt k )

k p

+ ut

1 k 1

+ ::: +

p k p

1:

Pode-se provar que a soluo geral da equao s diferenas finitas (determinstica)4 da


forma
k

= c1 r1k + ::: + cp rpk ;

onde ci constante arbitrrias e ri = 1=zi e zi so razes do polinmio


que sob a condio de ESO os coeficientes de autocorrelao

(L). Pode-se provar

no se anulam mas tendem

para zero quando k ! 0:


Estacionaridade
Proposio 6.2.2 O processo AR(p) estacionrio sse as razes da equao

(L) = 0 so

em mdulo superiores a um (ou fora do circulo unitrio no plano complexo) (apndice 6.E).
No caso AR(1) a raiz de (L) = 0 fcil de obter:
L) = 0 ) L =

(1

Devemos exigir
1

> 1 ) j j < 1:

No caso AR(2) pode-se provar que a condio de ESO :

< 1;

< 1;

1<

<1

Quase diramos que esta equao um processo AR(p) no fosse o facto de no possuir termo aleatrio.
De forma rigorosa, podemos dizer que uma equao (linear) s diferenas finitas, de ordem p (de coeficientes
constantes). Esta terminologia usada na rea dos sistemas dinmicos em tempo discreto.

133

FAC

0.5

FACP

0.5
0

0
1

11

13

15

17

19

-0.5

-0.5

-1

-1

FAC

0.5

11

13

15

17

19

13

15

17

19

13

15

17

19

13

15

17

19

FACP

0.5

0
1

11

13

15

17

19

-0.5

-0.5

-1

-1

FAC

0.5

11

FACP

0.5

0
1

11

13

15

17

19

-0.5

-0.5

-1

-1

FAC

0.5

11

FACP

0.5

0
1

11

13

15

17

19

-0.5

-0.5

-1

-1

11

Figura 6-2: FAC e FACP tericas associadas aos seguintes cenrios (de cima para baixo): (a)
1 > 0; 2 > 0; (b) 1 < 0; 2 > 0; (c) 1 > 0; 2 < 0; (d) 1 < 0; 2 < 0:
(estas condies baseiam-se evidentemente na proposio anterior).
No caso AR(p) com p > 2 no temos outra alternativa seno calcular (por exemplo,
atravs do programa Mathematica) as razes de

(L) = 0:

Suponha-se que y ESO. Nestas condies, pode-se provar:

=
k

bvio que

kk

1 k 1

2 k 2

+ ::: +

p k p;

no se anulam mas k ! 0 quando k ! 1.


8
< 6= 0 se k = 1; 2; :::; p
kk =
: 0
se k = p + 1; p + 2; :::

= 0 se k > p: Por exemplo


yt =

1 yt 1

+ ::: +

p+1;p+1

p yt p

134

= 0 porque

+ 0yt

p 1

+ ut

6.2.3

Processos ARMA

Por que no combinar os dois processos AR e MA? isso que se prope com o modelo
ARMA. No caso geral ARMA(p,q) (i.e. AR(p) + MA(q)) o modelo representa-se em qualquer uma das seguintes formas alternativas:
yt =
yt
1

1 yt 1
1 yt 1
1L

+ ::: +
:::
:::

p yt p
p yt p

p
pL
p

1 ut 1

= ut +

yt = (1 +

(L) yt =
yt =

+ ::: +

1 ut 1
1L

q ut q

+ ::: +

+ ::: +

+ ut

q ut q

qL

) ut

(L) ut

(L)
ut :
p (L)

Ainda outra alternativa baseia-se no desenvolvimento em srie de potncias de L da funo


racional

(L) =

(L). Obtm-se
yt = ut +

1 ut 1

2 ut 2

+ :::

Esta expresso no corresponde decomposio de Wold (porque estes

s esto sujeitos

a restries), mas constitui a melhor aproximao linear decomposio, baseada numa


estrutura linear (a qualidade da aproximao aumenta quando p e q aumentam).
A estacionaridade depende da estrutura AR. Concretamente, o processo ARMA(p,q)
estacionrio sse as razes da equao

(L) = 0 esto todas fora do crculo unitrio no plano

complexo. A invertibilidade depende da estrutura MA. Concretamente, o processo ARMA


invertvel sse as razes de

(L) esto todas fora do circulo unitrio no plano complexo. Na

tabela 6.1 apresenta-se um quadro resumo das principais propriedades do modelos AR, MA
e ARMA.
Nas figuras 6-3 e 6-4 encontram-se as FAC e FACP de vrios processos lineares simulados (n = 50000). Procure identific-los5 .
A tabela 6.2 identifica os processos simulados nas figuras 6-3 e 6-4.
5

Observe que as FAC e FACP so obtidas a partir dos processos simulados e, portanto, no correspondem
s funes tericas; por esta razo, embora alguns coeficientes populacionais sejam zero, os respectivos coeficientes estimados podem no ser iguais a zero (de facto, uma impossibilidade virem exactamente iguais a
zero). Assuma que os coeficientes estimados muito baixos no so estatisticamente significativos.

135

AR(p)
Modelo
p (L) yt = ut
em yt
Srie finita em yt
Modelo yt = p 1 (L) ut
em ut
Srie infinita em ut
Estac.
Razes p (L) = 0
fora do crc. unitr.
Invertib. Sempre
invertveis
FAC
Decaimento exponencial e/ou sinusoidal para zero
FACP
Decaimento brusco
para zero a partir de
k =p+1

MA(q)
1
p (L) yt = ut
Srie infinita em yt
yt = p (L) ut
Srie finita em ut
Sempre
estacionrios
Razes p (L) = 0
fora do crc. unitr.
Decaimento brusco
para zero a partir de
k =q+1
Decaimento exponencial e/ou sinusoidal para zero

ARMA(p,q)
1
p (L) p (L) yt = ut
Srie infinita em yt
yt = p 1 (L) p (L) ut
Srie infinita em ut
Razes p (L) = 0
fora do crc. unitr.
Razes p (L) = 0
fora do crc. unitr.
Decaimento exponencial e/ou sinusoidal para zero
Decaimento exponencial e/ou sinusoidal para zero

Fonte: Murteira et al. (1993), pg. 69

Tabela 6.1: Resumo das principais propriedades dos modelos AR, MA e ARMA

MA
Figura 6-3
1
2
3
4
5
6
7
Figura 6-4
1
2
3
4
5
6

AR

:4
0
:4
0
0
1
0

:4
0
0
0
0
0
0

0
:8
0
0
0
:5

0
0
0
0
0
0

Modelo

:1
0
:4
0
0
0
:5

0
0
0
0
0
0
0

0
:4
0
:4
1
0
0

0
:2
0
:2
0
0
0

0
0
0
:2
0
0
0

0
0
0
0
0
0
0

MA(3)
AR(2)
MA(3)
AR(3)
AR(1)
MA(1)
MA(3)

0
0
0
0
0
0

0
0
:8
0
0
0

0
:8
0
:4
0
:5

0
0
0
:2
0
0

0
0
0
:1
0
0

:9
0
:8
:1
0
0

AR(4)
ARMA(1,1)
ARMA(4,4)
AR(4)
RBranco
RBranco

Tabela 6.2: Solues das questes colocadas nas duas figuras anteriores

136

0.1

0.1

FAC

FACP

0
1

10

-0.1

10

10

10

10

10

10

10

-0.1
-0.2
-0.2

-0.3

-0.3

-0.4

0.6

0.6

FAC

0.5

FACP

0.5

0.4

0.4

0.3

0.3

0.2

0.2

0.1

0.1

0
1

0.2

10

0.1

FAC

0.1

-0.1

FACP

0
1

-0.1

10

-0.1

-0.2

-0.2
-0.3

-0.3

-0.4

-0.4

0.5

0.6

FAC

0.4

FACP

0.4

0.3

0.2

0.2
0

0.1

-0.2

0
1

-0.1

10

FACP

1
0.8

0.9994

0.6

0.9992

0.4

0.999

0.2

0.9988

0
1

0.6

10

-0.2

0.6

FAC

0.5

FACP

0.4

0.4

0.2

0.3
0.2

0.1

-0.2

0
1

0.5

10

-0.4

10

0.5
0.4
0.3
0.2
0.1
0
-0.1
-0.2
-0.3

FAC

0.4
0.3
0.2
0.1
0
-0.1

-0.4

0.9996

-0.1

1.2

FAC

0.9998

FACP

Figura 6-3: FAC e FACP de 7 processos simulados a partir de n = 50000 observaes. Qual
a ordem p e q dos processos? (A resposta a esta questo encontra-se na tabela 6.2)

137

FAC

0.8
0.6

0.6

0.4

0.4

0.2

0.2

0
-0.2

FACP

0.8

0
1

10

-0.2

FAC

0.8

10

10

10

10

10

10

FACP

0.5

0.6

0.4

0.2

-0.5

0
1

10

-1
1

FAC

0.8

FACP

0.5

0.6

0.4

0.2

-0.5

0
1

0.7
0.6
0.5
0.4
0.3
0.2
0.1
0

10

-1
0.8

FAC

FACP

0.6
0.4
0.2
0
1

0.4

10

-0.2

0.4

FAC

0.2

FACP

0.2

0
1

10

-0.2

-0.2

-0.4

-0.4

0.4

0.4

FAC

0.2

FACP

0.2

0
1

10

-0.2

-0.2

-0.4

-0.4

Figura 6-4: Continuao da figura anterior

138

6.3

Processos Lineares No Estacionrios

No mbito dos processos lineares usual identificar dois tipos de no estacionaridade:


no estacionaridade na mdia: E (yt ) no constante ou E (yt ) = 1;
no estacionaridade na varincia: Var (yt ) no constante ou Var (yt ) = 1:

6.3.1

No Estacionaridade na Mdia

Seja yt um processo no estacionrio linear. A estacionarizao da mdia faz-se usualmente


a partir do operador diferena
d

yt = | {z::: }yt
d vezes

onde d um inteiro positivo.


Este procedimento sugere que:

se o logaritmo do PIB no estacionrio (na mdia) ento a taxa de variao do PIB


(d = 1) poder ser estacionria;
se a taxa de desemprego no estacionria ento a variao da taxa de desemprego
(d = 1) poder ser estacionria;
se o logaritmo do IPC (dados anuais, para simplificar) no estacionrio e se a inflao
no estacionria (d = 1) ento a variao da inflao (d = 2) poder ser estacionria.
Normalmente uma diferenciao (d = 1) suficiente e raramente se considera d = 2 (a
no ser para certos ndices de preos).
Definio 6.3.1 Um processo yt diz-se um ARIMA(p,d,q) se

(L)

yt = c +

(L) ut

onde p; d e q so inteiros positivos.


Assim, se yt

ARIMA(p,d,q), ento yt um processo no estacionrio que depois de

diferenciado d vezes um processo ARMA(p,q), isto ,


d

yt

ARM A (p; q) :
139

A letra I em ARIMA designa integrated. Diz-se que um processo y integrado de ordem


d se o polinmio autoregressivo de y possui d razes (mltiplas) iguais a um. Por exemplo, o
polinmio autoregressivo associado ao processo passeio aleatrio, yt = yt
1

L; possui uma raiz unitria, pois a soluo de 1

+ ut ;

(L) =

L = 0 obviamente L = 1:

Exemplo 6.3.1 Considere-se


yt = (1 + ) yt
=

yt

1+ ;

+ ut

0<

<1

No se tem um processo ESO pois uma das condies seguintes no satisfeita

Considere-se

yt = yt

< 1;

< 1;

<1

yt 1 : Tem-se
yt = (1 + ) yt
yt

yt

yt

yt =
Logo

1<

yt

yt

yt

1
2

+ ut

+ ut

+ ut :

yt um processo estacionrio (AR(1) com j j < 1). De forma equivalente, yt um

ARIMA(1,1,0).
Este exemplo indica o caminho a seguir quando y no estacionrio. Em lugar de se analisar y; analisa-se

yt . Esta transformao envolve a perda de uma observao na amostra,

mas vrios resultados para y (como por exemplo a previso) podem ser facilmente recuperados a partir da especificao e estimao do modelo para

yt .

Exemplo 6.3.2 No caso,


yt = 2yt

yt

+ ut ;

ut RB

y no estacionrio. Porqu? Uma diferenciao produz:


yt =

yt

140

+ ut :

Logo

yt um processo AR(1) com

= 1: Assim d = 1 no suficiente para estacionarizar

o processo. Uma nova diferenciao produz:


yt

yt
2

Assim
2yt

= ut

yt = ut :

yt um processo estacionrio (neste caso um RB). (Recorde-se:

+ yt

yt = yt

). De forma equivalente, yt um ARIMA(0,2,0).

Exemplo 6.3.3 O processo ARIMA(1,1,1) escreve-se nas seguintes formas equivalentes:


(1

L) (1 L)yt = c + (1 + L) ut
| {z }

(1
yt

L) (yt

y t 1 ) = c + ut + u t

yt

yt

+ yt

= c + ut + ut

yt = yt

+ yt

yt

+ c + ut + u t 1 :

Processos com tendncia determinstica


Considere-se, por exemplo,
yt =

+ t + ut ;

Este processo no estacionrio pois E (yt ) =

ut rudo branco.
+ t depende de t: A no estacionari-

dade nestes casos no to grave como no caso anterior (por exemplo, a varincia de y
constante). A literatura por vezes designa estes processos como estacionrios em tendncia,
pois removendo a tendncia o processo resulta estacionrio. O operador diferena tambm
estacionariza o processo. Com efeito,
yt =

+ t + ut

( + (t

1) + ut 1 ) =

+ ut

ut 1 .

Esta transformao envolve um custo: cria-se artificialmente um erro MA(1) no invertvel.


A soluo prefervel foi j sugerida no pargrafo anterior: basta remover a tendncia e, para
o efeito, estima-se o modelo pelo mtodo dos mnimos quadrados. Claro que a estimao
no feita no quadro clssico (porque falha a hiptese de estacionaridade) mas, neste caso

141

20
10
0
-10
-20
-30
-40
500

1000

1500

2000

Figura 6-5: Passeio Aleatrio


muito concreto, pode-se provar que o estimador dos mnimos quadrados consistente6 .
Na prtica, como detectamos a existncia de um processo no estacionrio na mdia?7
O grfico da srie pode sugerir a presena de um processo no estacionrio. Na
figura 6-5 traa-se uma trajectria de um processo passeio aleatrio. Observe-se que o
processo parece vaguear sem rumo no intervalo ( 40; 20) : No ntido a existncia
de um efeito de reverso para qualquer medida de tendncia central. Alm disso, a
ocorrncia de choques mais fortes parece fazer deslocar o processo para outro nvel
(os choques so persistentes).
Como se sabe a FAC do processo yt = yt

t;k

+ ut

=1

k
' 1:
t

Assim, se FAC (estimada) de um certo processo, apresentar, nos primeiros lags, val6

Na verdade mais do que isso: o estimador superconsistente (converge para o verdadeiro parmetro a
uma taxa mais alta do que o habitual). Por exemplo, o estimador OLS para verifica
n ^

! 0;

n3=2 ^

! N ormal:

Enquanto a varincia do estimador OLS habitual proporcional a 1=n a do estimador superconsistente acima
referido, proporcional a 1=n3 :
7
Por que no estimar logo o modelo e verificar depois se as razes do polinmio (L) = 0 satisfazem a
proposio 6.2.2? Este procedimento no aconselhvel. Como as razes so estimativas, devemos ensaiar a
hiptese subjacente proposio 6.2.2 (as razes devem ser em modulo maiores do que um para o processo
ser estacionrio). Todavia, sob H0 o processo no estacionrio e as distribuies assimptticas habituais no
so vlidas. Felizmente, existem testes adequados como, por exemplo, o teste Dickey-Fuller. Para concluir:
prefervel, na fase da estimao, termos um processo j estacionrio (ou, por outras palavras, a anlise da
estacionaridade precede a estimao do modelo).

142

Figura 6-6: FAC (e FACP) estimada do processo passeio aleatrio representado na figura
6-5.
ores muito altos (prximos de um), poderemos suspeitar que o processo no estacionrio. A figura 6-20 ilustra a ideia: apresenta-se a FAC estimada associada ao
passeio aleatrio representado na figura 6-5
Faz-se um teste de raiz unitria (por exemplo o teste ADF).

Teste ADF (Augmented Dickey-Fuller)


Faz-se um breve resumo dos principais procedimentos.
(1) Teste DF for random walk without drift
Considere-se yt = yt

+ ut onde ut um RB. J se sabe que este processo (passeio

aleatrio) no estacionrio. Assim faria sentido testar H0 :


especificao yt = yt

= 1 vs. H1 : j j < 1 na

+ ut (se existisse evidncia a favor de H0 concluiramos, ao nvel

de significncia fixado, que o processo no estacionrio). Como yt = yt

+ ut se pode

escrever na forma
yt = y t
com

1; ensaiar H0 :

+ ut

= 1 equivalente a ensaiar H0 :

= 0: Observe-se ainda

que, sob H0 ; o processo y possui uma raiz unitria. Isso bvio, tendo em conta que a raiz
do polinmio AR, (L) = 1

L; igual a 1.

143

Parece bvio a construo do teste estatstico: calcula-se o rcio-t ^ =^ e depois consultase a tabela da t-Student. Este procedimento incorrecto. Com efeito, sob H0, y no
estacionrio pelo que o rcio-t ^ =^ no tem distribuio t-Student nem mesmo distribuio
assimptoticamente normal. A hiptese de estacionaridade aqui crucial. Se o processo no
estacionrio as distribuies assimptticas habituais no so vlidas8 .
Como devemos proceder? Temos de consultar os valores crticos nas tabelas apropriadas
(so construdas a partir da distribuio da estatstica de teste sob H0 que, por ser desconhecida para n finito, tem de ser obtida atravs de simulaes de Monte Carlo9 ). A maioria das
tabelas est preparada para fornecer o valor crtico da distribuio de ^ =^ (da trabalhar-se
sobretudo com a especificao

yt = y t

+ ut e no com yt = yt

+ ut ). A maioria

dos programas de estatstica calcula o valor-p aproximado associado hiptese nula (y no


estacionrio). Assim, se o valor-p for superior ao nvel de significncia previamente estabelecido (normalmente 0.05) no se rejeita H0 e conclui-se que o processo no estacionrio.
Existem outras variantes:
(2) Teste DF for random walk with drift H0 :
yt =

=0

+ yt

+ ut :

(3) Teste DF for random walk with drift and trend H0 :


yt =

+ t + yt

=0

+ ut :

Na prtica, s muito raramente ut um RB. Quando ut exibe autocorrelao os testes DF


no so vlidos. Nestes casos deve-se branquear ut , adicionando regresso, a componente
yt

1 +:::+

yt p ; com valor p adequado de forma que ut se apresente como um rudo

branco. Assim,
(1) Teste ADF for random walk without drift H0 :
yt = y t
8

yt

+ ::: +

=0

yt

+ ut :

De facto, pode-se provar que, sob H0 ; n^ tem distribuio assimpttica igual distribuio da varivel
2

(1=2) W (1)
1
;
R1
2
W (u) du
0

onde W um processo de Wiener padro ou movimento Browniano.


9
Para n infinito, a distribuio conhecida. Ver o p-de-pgina anterior.

144

(2) Teste ADF for random walk with drift H0 :


yt =

+ yt

yt

=0
+ ::: +

yt

(3) Teste ADF for random walk with drift and trend H0 :
yt =

+ t + yt

yt

+ ::: +

+ ut :

=0
yt

+ ut :

Sobre a escolha do parmetro p veja o exemplo 6.3.5.


Exemplo 6.3.4 Seja
yt = 0:1
H0 :

= 0 vs. H1 :

0:01 yt 1 ;

n = 50

(0:004)

< 0. Uma tabela apropriada dever fornecer como valor crtico ao

n.s. de 5% aproximadamente o valor -2.92. Como ^ =^ =

0:01=0:004 =

2:5 > vc =

2:92 no se rejeita H0 ao n.s. de 5%.


Exemplo 6.3.5 Seja lnp = log P onde P o ndice PSI20. Neste exemplo recorre-se ao
programa EVIEWS (verso 5) para analisar a estacionaridade de lnp. Os resultados esto
apresentados na figura 6-7. Tendo em conta a regresso efectuada
log pt =

+ log pt

log pt

+ ut ;

(p = 1)

pode-se concluir que se escolheu a opo (2) Teste ADF for random walk with drift H0 :
= 0
yt =

+ yt

yt

+ ut ;

(p = 1)

(note-se que a regresso envolve a constante C; equivalente ao nosso ). Deixmos o programa escolher a ordem p: Esta ordem escolhida automaticamente e baseia-se no valor
do critrio de informao SIC seguindo o princpio general-to-specific. O programa escolheu p = 1: Interessa o valor-p associado hiptese nula que 0.3078. Sendo este valor
superior a 0.05, no se pode rejeitar a hiptese

= 0; ao nvel de significncia de 5%.

Existe, portanto, forte evidncia emprica a favor da hiptese nula (no estacionaridade).
aconselhvel diferenciar-se o processo. A diferenciao conduz ao processo frt g ; onde
rt = log Pt
145

log Pt 1 :

Null Hypothesis: LNP has a unit root


Exogenous: Constant
Lag Length: 1 (Automatic based on SIC, MAXLAG=27)

Augmented Dickey-Fuller test statistic


Test critical values:
1% level
5% level
10% level

t-Statistic

Prob.*

-1.953504
-3.432388
-2.862326
-2.567233

0.3078

*MacKinnon (1996) one-sided p-values.

Augmented Dickey-Fuller Test Equation


Dependent Variable: D(LNP)
Method: Least Squares
Sample (adjusted): 3 2936
Included observations: 2934 after adjustments
Variable

Coefficient

Std. Error

t-Statistic

Prob.

LNP(-1)
D(LNP(-1))
C

-0.000919
0.156283
0.008356

0.000470
0.018227
0.004143

-1.953504
8.574451
2.016704

0.0509
0.0000
0.0438

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.025826
0.025161
0.010559
0.326764
9190.406
1.991441

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

0.000320
0.010694
-6.262717
-6.256598
38.85062
0.000000

Figura 6-7: Anlise da estacionaridade do logaritmo do PSI20

6.3.2

No Estacionaridade na Varincia

Se yt um processo passeio aleatrio ento Var (yt ) proporcional a t (veja-se o apndice


6.D). A diferenciao de yt produz um processo estacionrio com varincia constante, e o
problema da no estacionaridade fica resolvido com a referida transformao. A diferenciao normalmente resolve o problema da no estacionaridade na mdia e, em certos casos,
tambm da no estacionaridade da varincia. Supomos agora que a diferenciao apenas
resolve a no estacionaridade da mdia; supomos, assim, que a varincia, mesmo depois da
diferenciao, continua a ser uma funo de t. Admita-se:
yt no estacionrio na mdia, i.e.,

= E (yt ) varia ao longo do tempo;

Var (yt ) = h ( t ) (a varincia uma funo da mdia).

146

Var (yt ) _
Var (yt ) _
Var (yt ) _

t
2
t
4
t

h (x)
x
x2
x4

T (x)
R 1
p
p dx = 2 x
x
R 1
R x1dx = log 1x
dx = x
x2

Tabela 6.3: Algumas transformaes habituais


O objectivo consiste em encontrar uma transformao sobre yt ; T (yt ) tal que Var (T (yt ))
seja constante. Pode-se provar que a transformao apropriada10
T (x) =

Alguns exemplos so fornecidos na tabela 6.3

1
p
dx.
h (x)

Para concretizar, suponha-se que Var (yt ) proporcional ao quadrado da mdia (e escrevese neste caso, Var (yt ) _

2
t ).

A transformao que permite tornar (aproximadamente) con-

stante a varincia T (x) = log x e, assim, os dados devem ser logaritmizados. Como a
transformao s est definida, em geral, para certos valores de x (por exemplo, no caso
log x tem de se assumir x > 0) preciso primeiro aplicar T (x) e s depois se verifica
se necessrio diferenciar (j que uma prvia diferenciao impossibilitaria a aplicao da
transformao (veja-se o exemplo a seguir).
Na figura 6-8 representa-se a srie de preos do Dow Jones de 1969 a 2004. A varincia
(assim como a mdia) no constante.
Se se comeasse por diferenciar P; a varincia continuaria a ser uma funo de t: Vejase, com efeito, o grfico de f Pt g ( Pt = Pt

Pt 1 ) representado na figura 6-9. A figura

mostra claramente que a varincia aumenta com t: Assim, antes de se diferenciar o processo,
10

T ( t ) + T 0 ( t ) (yt

Pela frmula de Taylor, tem-se T (yt )


T (yt )
(T (yt )

T 0 ( t ) (yt

T ( t)
2

T ( t ))

Assim,

t)

t ).

2
t)

(T ( t )) (yt
2

(T 0 ( t )) Var (yt ) = (T 0 ( t )) h ( t )

Var (T (yt ))
2

Imponha-se Var (T (yt )) = c, i.e, (T 0 ( t )) h ( t ) = c ou


T 0 ( t) = p

c
h ( t)

Esta equao diferencial tem soluo imediata:


Z
1
p
T (x) =
dx
h (x)

147

(c = 1):

P (preos)

14005
12005
10005
8005
6005
4005
2005
5
Sep-69

Sep-74

Sep-79

Sep-84

Sep-89

Sep-94

Sep-99

Sep-04

Figura 6-8: Srie de Preos do Dow Jones (1969-2004)

600

Preos Diferenciados

400
200
0
-200
-400
-600
-800
Jan-69

May-73

Sep-77

Jan-82

May-86

Sep-90

Jan-95

Figura 6-9: Srie de preos diferenciados, f Pt g ; onde


(1969-2004)

148

May-99

Sep-03

Pt = Pt

Pt 1 ; do Dow Jones

4000

1.40E+07

3500

1.20E+07

3000

1.00E+07

2500

8.00E+06

media(t)

6.00E+06

var(t)

2000
1500

4.00E+06

1000

2.00E+06

500
0
Sep-69

0.00E+00
Aug-77

Jul-85

Jun-93

May-01

Figura 6-10: Mdia e Varincia estimada ao longo do tempo da sries diria do Dow Jones
(1969 a 2004)
log(P)

10
9.5
9
8.5
8
7.5
7
6.5
6
5.5
5
Sep-69

Sep-74

Sep-79

Sep-84

Sep-89

Sep-94

Sep-99

Sep-04

Figura 6-11: Srie de log-Preos do Dow Jones (1969-2004)


estacionarize-se primeiro a varincia. Na figura 6-10 apresenta-se
X
1X
d (yt ) = 1
Pi ; Var
Pi
t i=1
t i=1
t

b (yt ) =
E

b (yt )
E

d (yt ) so estimativas para a mdia e a varincia de y no


b (yt ) e Var
ao longo do tempo, onde E
momento t: A figura sugere que a varincia de yt proporcional ao quadrado da mdia, i.e.,
Var (yt ) _

2
t:

De acordo com a tabela 6.3 deve-se usar a transformao logartmica para

estacionarizar a varincia.
A figura 6-11 sugere que a varincia constante ao longo do tempo, mas no a mdia.
Faa-se ento a diferenciao da varivel log Pt :
rt = log (Pt )

log (Pt 1 )

cuja representao grfica dada na figura 6-12. interessante verificar que a srie dos
retornos deve ser estudada no s devido s razes invocadas no ponto 2.3 mas tambm
149

0.15
0.1
0.05
0
-0.05
-0.1
-0.15
-0.2
-0.25
-0.3
Sep-69

Sep-74

Sep-79

Sep-84

Sep-89

Sep-94

Sep-99

Sep-04

Figura 6-12: Srie dos retornos do Dow Jones

Etapa 1: Identificao

Etapa 2: Estimao

Escolha de um
modelo

Estimao dos
parmetros
NO

Etapa 3: Avaliao do
diagnstico

Utilizao do
modelo

Adequao do
modelo escolhido

Modelo
satisfatrio

SIM

Figura 6-13: Metodologia de Box-Jenkins


porque as transformaes estacionarizantes discutidas neste ponto conduzem precisamente
varivel rt = log (Pt )

6.4

log (Pt 1 ) :

Modelao ARMA

O objectivo fundamental da modelao ARMA o de definir um modelo parcimonioso (em


termos de parmetros) que exiba boas propriedades estatsticas e descreva bem a srie em
estudo. Para alcanarmos esse objectivo podemos seguir a metodologia de Box-Jenkins.
Prope trs etapas: identificao, estimao e avaliao do diagnstico (veja-se a figura 613).

150

Etapa 1: Identificao
Estacionarizao da srie;
Identificao da ordem p e q atravs da FAC e FACP.
Etapa 2: Estimao
Uma vez seleccionado, na primeira etapa, o modelo ARMA(p,q), necessrio estimar os
parmetros desconhecidos (pelo mtodo da mxima verosimilhana11 ).
Etapa 3: Avaliao do Diagnstico
necessrio analisar os seguintes aspectos:
significncia estatstica dos parmetros;
invertibilidade e estacionaridade (dispensa-se este ltimo aspecto se y for um processo
estacionrio);
anlise da matriz de correlao dos estimadores;
redundncia entre as estimativas;
branqueamento dos resduos;
se existir mais do que um modelo que cumpra as condies anteriores necessrio
seleccionar o melhor ( luz de determinado critrio).
Remete-se a questo da anlise da matriz de correlao dos estimadores para Murteira et
al. (1993). A significncia estatstica dos parmetros bvia e a questo da invertibilidade
foi j tratada.
(L) e (L) partilham razes comuns. Por

O problema da redundncia ocorre quando


exemplo, no caso
(1

0:8L) yt = (1

0:8L) ut

(6.6)

ambos os polinmio possuem a mesma raiz (1/0.8). Observe-se que os polinmios cancelam
um com o outro:
(1
11

0:8L) yt = (1

0:8L) ut , yt = ut

Veja-se, no ponto 8.9, a aplicao do mtodo a um modelo mais geral.

151

e, portanto, o processo y definido por (6.6) , de facto, um rudo branco e no um ARMA(1,1),


como se poderia pensar. Na presena de redundncia pode provar-se que a matriz de informao de Fisher singular. Em aplicaes, uma impossibilidade as razes dos polinmios
AR e MA estimados (respectivamente, ^ (L) e ^ (L)) virem exactamente iguais. De qualquer
forma, se existirem razes do polinmio AR aproximadamente iguais s do polinmio MA,
surge um problema de quase redundncia, e a matriz de Fisher embora invertvel, apresenta
um determinante prximo de zero. Como consequncia, os erros padro das estimativas
vm muitos baixos, as estatsticas-t muito altas e o determinante da matriz de varinciascovarincias (estimada) aproximadamente de zero. fcil cair-se em problemas de (quase)
redundncia que, naturalmente, devem ser evitados.
Veja-se agora a questo do branqueamento dos resduos. Considere-se o ARMA(1,1)
yt = yt

1 ut 1

+ ut :

Suponha-se que se estima (por engano) o AR(1)


yt = yt
onde
t

representa o erro da equao anterior. Como detectar o erro de especificao? Como

1 ut 1

+ ut natural esperar que os resduos ^t venham autocorrelacionados.

muito importante que os resduos venham branqueados, i.e. no exibam autocorrelaes; caso contrrio, parte da mdia condicional no foi modelada.
Apresentam-se de seguida, sem comentrios, os ensaios habituais os testes de significncia dos coeficientes de autocorrelao dos resduos:
Teste Kendal e Stuart H0 :
p

(^
u) = 0
d

n (^k (^
u) + 1=n) ! N (0; 1) ;

^k (^
u)

1 1
;p
n n

p
Rejeita-se H0 ao n.s. de (aprox.) 5% se j^k (^
u)j > 2= n (supondo 1=n
Teste Ljung-Box H0 :

(^
u) = ::: =

Q = n (n + 2)

m
X
k=1

(^
u) = 0
1

^2k (^
u) !

152

2
(m p q) :

0)

Teste Jenkis e Daniels H0 :

kk

(^
u) = 0

p
d
n ^ kk (^
u) ! N (0; 1) ;

kk

(^
u)

1
0; p
n

p
u) > 2= n
Rejeita-se H0 ao n.s. de (aprox.) 5% se ^ kk (^
Finalmente, discuta-se a ltima questo. Pode suceder que dois ou mais modelos cumpram
as condies anteriores. Como seleccionar o melhor? Se o objectivo da modelao
a previso, pode-se avaliar a qualidade preditiva dos vrios modelos concorrentes e depois selecciona-se o que apresentar melhores resultados (discutiremos esta questo no ponto
6.6.6). Outra abordagem consiste em escolher o modelo mais preciso (melhor ajustamento)
com o menor no de parmetros (parcimnia). H certamente um trade-off a resolver: maior
preciso implica menor parcimnia.
O coeficiente de determinao ajustado , provavelmente, o indicador mais utilizado.
um bom indicador no mbito do modelo de regresso linear clssico, com distribuio normal. Mais gerais so os critrios de informao de Akaike e de Schwarz porque se baseiam
no valor da funo de verosimilhana.
Seja

n
X

log Ln =

log f (yt j Ft 1 )

o valor (mximo) da funo log-verosimilhana e k o nmero de parmetros estimados. O


critrio de informao de Akaike (AIC) dado pela expresso
AIC =

log Ln 2k
+ :
n
n

O critrio de Schwarz dado pela expresso


SC =

log Ln k
+ log n:
n
n

Tendo em conta que o modelo tanto mais preciso quanto mais alto for log Ln ; e tanto
mais parcimonioso quanto menor for o nmero de parmetros, k; conclui-se que deve dar-se
preferncia ao modelo que minimiza as estatsticas AIC e SC (note que os modelos s so
comparveis se as variveis se encontrarem na mesma unidade - por exemplo, no devemos
comparar um modelo em y e outro em log y).
Em certos casos, um modelo pode minimizar apenas um dos critrios (por exemplo, um

153

modelo A minimiza o AIC e o modelo B minimiza o SC). Como proceder nestes casos?
Vrios estudos tm revelado o seguinte:
o critrio SC, em grandes amostras tende a escolher o modelo correcto; em pequenas/mdias amostras pode seleccionar um modelo muito afastado do modelo correcto;
o critrio AIC, mesmo em grandes amostras tende a seleccionar o modelo errado,
embora no seleccione modelos muito afastados do correcto.
Como consequncia, para grandes amostras o SC pode ser prefervel.
Naturalmente, estes critrios podem clarificar a identificao da ordem p e q do modelo
ARMA. Por exemplo, suponha-se que os modelos ARMA(1,1) e AR(3) so bons luz de
vrios critrios. Os critrios de informao, podem contudo sugerir o ARMA(1,1) e, desta
forma, p = 1; q = 1:

6.5

Variveis Impulse-Dummy em Modelos de Regresso:


Cuidados a Observar

As variveis dummy ou variveis artificiais so, como temos visto, bastante teis pois permitem estimar o impacto de certas variveis qualitativas ou de eventos sobre a varivel dependente. No entanto, h cuidados a ter no uso destas variveis.
Num modelo de previso o uso de variveis artificiais (VA) estocsticas associados a
eventos que podem ocorrer no futuro deve ser evitado se as probabilidades condicionais da
VA forem desconhecidas. Com efeito, que sentido faz especificar yt =

+ dt + ut (d

uma VA) se depois, no perodo de previso, o comportamento probabilstico da varivel d


completamente desconhecido?
Um caso especialmente delicado ocorre com as chamadas impulse-dummies no mbito
da inferncia estatstica12 .
12

Algumas das concluses que seguem foram-me transmitidas pelo Prof. Joo Santos Silva em comunicao
privada. Veja-se tambm Hendry e Santos (2005).

154

6.5.1

Inconsistncia do Estimador

Impulse-dummies so VAs que assumem o valor 1 apenas uma vez na amostra. Para ilustrar
a situao considere-se o modelo
yt =
onde ut

i:i:d:

N (0;

Seja

6
6
6
6
6
6
6
6
6
6
6
X =6
6
6
6
6
6
6
6
6
6
4

+ dt + ut ;

t = 1; 2; :::; n

) e dt uma impulse-dummy

1 0
1
..
.

0
..
.

1 0
1 1
1
..
.

0
..
.

1 0
1 0

8
< 1 t=t
dt =
: 0 t=
6 t:

7
7
7
7
7
7
7
7
7
7
7
7;
7
7
7
7
7
7
7
7
7
5

X0 X = 4

n 1
1 1

3
2 P
n
t=1 yt 5
X0 y = 4
yt

5;

fcil observar que o estimador OLS


2

^ = 4
2

= 4
Tem-se

^
^

5=4

1 1

Pn

yt
n 1
Pn
1
t=1 yt
n 1

(X X)

yt
n 1

t=1

h i
h
^
= E (X0 X)
E

h i
Var ^ =

n 1

n
n

3 2
2 P
n
y
4 t=1 t 5 = 4
yt
3 2 Pn

n 1

1
n 1

1
n 1

n
n 1

t=1;t6=t

y
1 t

5=4

X y = E (X X)
3
2
2

1
n 1

1
n 1

1
n 1

n 1

n 1

(y
1

yt )

5:

i
X (X + u) =

5:

155

yt

3
32 P
n
y
5 4 t=1 t 5
yt
(6.7)

h
0
E (X X)

Xu =

No se verifica ^ !

porque
lim Var [^ ] = lim

n!1

n!1

ou seja, ^ centrado mas no consistente (a preciso de ^ no melhora quando n aumenta


e depende da varincia do rudo). Este resultado deve-se ao facto de ser usada apenas uma
observao para estimar . A propriedades do estimador para ^ no so afectadas.

6.5.2

Inconsistncia do Teste-t

O rcio-t associado a ^ (supondo

conhecido)
n
n 1

(y yt )
p n
=
= p
Var [^ ]
n 1
r
yt
y
n yt
y
=
'
:
n 1
^

Ora a distribuio de

yt

depende da distribuio dos erros. No caso do modelo de re-

gresso habitual, mesmo que os erros no tenham distribuio normal, o rcio-t para grandes
amostras tem distribuio aproximadamente normal, pelo teorema do limite central, e a inferncia habitual pode fazer-se sem problemas. No entanto, o rcio-t associado a variveis
impulse-dummies depende da distribuio dos erros. Assim, se a distribuio dos erros
desconhecida no possvel usar-se os testes t habituais. Mesmo que se possa usar o rcio-t
(por exemplo, se houver garantias que ut

i:i:d:

N (0;

)) o teste-t inconsistente no seguinte

sentido: para qualquer valor crtico com nvel de significncia ;


P (j ^ j > c j H1 :

6= 0) no tende para 1

quando n ! 1: A situao habitual (por exemplo, no mbito do modelo de regresso linear


clssico) a seguinte: quando n ! 1 a probabilidade de rejeitar H0 quando H1 verdadeira
tende para 1 (se H1 verdadeira, um teste consistente acaba sempre, para amostras suficientemente grandes, por decidir correctamente a favor de H1 ). Mas, com impulse-dummies isto
no sucede.

156

6.5.3

Uma Soluo para ensaiar H0 :

Uma forma de testar H0 :

=0

= 0 no caso em que a distribuio dos erros desconhecida

envolve a aplicao de procedimentos bootstrap. Quando a amostra grande o ensaio H0 :


= 0 vs. por exemplo H1 :

> 0 pode ser conduzido da seguinte forma, muito simples

(equivalente ao bootstrap): estima-se o modelo de regresso


yt = x0t + "t
(onde x0t um vector linha das variveis explicativas) sem dummy e obtm-se o resduo ^"t
associado ao momento t = t : Se este resduo elevado (em mdulo) ento provvel que
no momento t tenha ocorrido uma quebra de estrutura; neste caso a varivel dummy d
ser, em princpio, importante na explicao de y (no momento t ). Para grandes amostras
no s a estimativa ^ associada ao modelo
yt = x0t + dt + ut
(aproximadamente) igual ^"t como tambm, sob H0 :

= 0; a distribuio do estimador

^ (aproximadamente) igual distribuio de "t ; assim, a avaliao da significncia de


ao nvel de 100%; equivale a verificar se ^"t est acima do quantil de ordem 1
distribuio de "t (recorde-se que H1 :

da

> 0): Como a distribuio de "t desconhecida usa-

se a distribuio emprica dos resduos ^"t - este o princpio do bootstrap. Concretamente,


rejeita-se H0 :

= 0 em favor de H1 :

maior do que o quantil de ordem 1

> 0 ao nvel de significncia de 100% se ^"t for


da distribuio emprica dos resduos. A proposio

seguinte fundamenta o procedimento.


Proposio 6.5.1 Considerem-se os modelo de regresso em notao matricial
y=X

+ d + u;

y=X

+"

onde d = (dt ) ; dt = 1; dt = 0 para t 6= t e X a matriz das variveis explicativas


fortemente exgena. Suponha-se
X0 X p
! Q (definida positiva).
n
p

Ento a) ^ !

+ ut e b) ^ =^"t

! 1:
157

Dem. Apndice 6.G.

6.5.4

Impulse-dummies e a matriz de White

Um caso que conduz a concluses incorrectas ocorre quando se usa simultaneamente impulsedummies com a matriz de White.
Para simplificar considere-se novamente o modelo
yt =
onde ut

i:i:d:

N (0;

+ dt + ut ;

t = 1; 2; :::; n

) e dt uma impulse-dummy
8
< 1 t=t
dt =
: 0 t=
6 t:

Se razovel assumir normalidade e ausncia mas no heterocedasticidade pode argumentarse que a significncia estatstica de

pode ser avaliada usando o rcio-t baseado na matriz

de White. Esta suposio incorrecta e traduz provavelmente o caso mais grave dos vrios
que analismos. Como se sabe a matriz de White tem a forma
h i
d ^ = (X0 X)
Var

X0 WX (X0 X)

onde W uma matriz diagonal com elementos f^


u21 ; :::; u^2n g : No caso mais simples que
analisamos a matriz de White correspondente a ^
Pn

2
d [^ ] = Pt=1 di d u^t :
Var
2
n
d
t=1 di

Deixa-se como exerccio verificar que

Pn
n
X
d u^2t
1
t=1 di
d
Var [^ ] = Pn
u^2t :
2 =
n
(n
1)
d
t=1
t=1 di

Assim, atendendo a (6.7) o rcio-t associado a ^

n
(yt
y)
^
n 1
q
q
=
=
=
P
n
1
2
d [^ ]
u
^
Var
t
t=1
n(n 1)
n p yt
y p yt
y
=
n
' n
:
n 1
^
^

158

n
n 1

(yt
q

y)
^2
n

Embora (yt
y) =^ possa ter distribuio aproximadamente N (0; 1) para amostras grandes
p
n (yt
y) =^ no tm certamente distribuio N (0; 1) : Se (yt
y) =^ tem distribuio
p
aproximadamente normal ento n (yt
y) =^ ter distribuio N (0; n) : Este resultado
sugere que se for usada a matriz de White numa amostra razoavelmente grande, qualquer
impulse-dummy sempre interpretada como significativa luz da distribuio habitual do
p
rcio-t (observe-se n (yt
y) =^ ! 1 quando n ! 1).

6.5.5

Concluso

O uso de impulse-dummies envolve vrios problemas (inconsistncia do estimador, inconsistncia do teste t, e quando usado simultaneamente com a matriz de White, os rcio-t so
inflacionados). Quer isto dizer que o uso de impulse-dummies inapropriado? A resposta
negativa. Vimos que o estimador OLS do parmetro da impulse-dummy centrado. Por
outro lado, existem procedimentos vlidos que podero ser usados para testar a significncia do parmetro da impulse-dummy. Finalmente, o uso impulse-dummy em modelos de
regresso importante quando se pretende estimar o efeito de um acontecimento isolado,
mantendo todas as demais variveis explicativas constantes.
Exemplo 6.5.1 Suponha-se que se pretende analisar o efeito de um anncio pblico no dia
t sobre as cotaes da empresa ABC. Suspeita-se que o efeito positivo sobre a empresa
ABC e nulo ou irrelevante para o mercado. Pretende-se, assim, verificar se o valor esperado
do retorno da empresa ABC no dia t positivo. Suponha-se ainda que, nesse dia t , o
mercado em geral observou uma forte queda. Para testar esse efeito uma possibilidade
consiste em considerar a regresso
rt =

+ d t + ut

onde rt o retorno da empresa ABC e dt uma impulse-dummy


8
< 1 t=t
dt =
: 0 t=
6 t:

Contudo, poder suceder, atendendo quebra do mercado, que

venha negativo ou no

significativo. Concluir-se-a que o anncio teve um impacto negativo ou nulo sobre o retorno
da empresa ABC. Mas esta concluso pode ser errnea porque o efeito do mercado no
159

levado em conta. Assim, necessrio controlar ou fixar o efeito do mercado atravs da


regresso
rt =

1 rt;m

+ d t + ut

onde rt;m o retorno do mercado (retorno associado a um ndice abrangente de cotaes do


mercado).

6.6
6.6.1

Previso
Introduo

Temos um modelo M (yt ; yt 1 ; :::; ) para y baseado em n observaes fy1 ; y2 ; :::; yn g : O


objectivo agora :
prever y para n + 1; n + 2; :::;
estabelecer intervalos de confiana para as previses.
Que propriedades devemos exigir a um previsor para yn+h ? Seja ~ n+h;n um previsor para
yn+h . Devemos exigir:
E ~ n+h;n = E (yn+h ) (propriedade do no enviesamento).
Var ~ n+h;n = Var (yn+h ) (~ n+h;n deve reproduzir a variabilidade de yn+h );
forte correlao entre ~ n+h;n e yn+h .
Para no haver batota o previsor ~ n+h;n para yn+h deve ser Fn -mensurvel, isto , se
prevemos y para o instante n+h e o momento em que efectuamos a previso n; s podemos
utilizar informao at n.
Em certos casos podemos permitir algum enviesamento do estimador desde que outras
propriedades mais do que compensem esse enviesamento. Na figura 6-14, qual o previsor
prefervel? O previsor 1 enviesado; o previsor 2 no . No entanto, o previsor 1 parece
prefervel pois os erros de previso so, na maior parte das vezes, inferiores.
Seja e~ (h) = yn+h

~ n+h;n o erro de previso. O erro quadrtico mdio (EQM) de

previso E e~ (h)2 pondera os trs aspectos acima expostos: enviesamento, variabilidade e

160

12
10
8
Observado
Previsor 1

Previsor 2

4
2
0
1

10 11 12 13 14

Figura 6-14: Qual dos dois previsores prefervel?


correlao. Com efeito, prova-se a seguinte decomposio do EQM de previso E e~ (h)2 =
yn+h

~ n+h;n

2
E e~ (h) = E (yn+h )

E ~ n+h;n

+(

2
~)

+2

y;~

(6.8)

O primeiro termo do lado direito mede o enviesamento, o segundo, compara a variabilidade entre y e ~ e o terceiro mede a correlao entre yn+h e ~ n+h;n (quanto mais baixa a
correlao maior o EQM). Na figura 6-14, o previsor 1, embora apresente um enviesamento elevado (i.e., E (yn+h )
2

2
~)

e2

alto), os valores dos termos (

2
~)

so relativamente baixos. O previsor 2 apresenta um valor baixo na com-

y;~

ponente E (yn+h )
(

E ~ n+h;n

E ~ n+h;n
1

y;~

(enviesamento reduzido ou nulo) mas valores altos em

: Graficamente parece que o estimador 1 prefervel, isto ,

ponderando todos os aspectos, o grfico sugere que o EQM do previsor 1 inferior ao EQM
do previsor 2.
Ser possvel definir um previsor ptimo, luz do EQM, qualquer que seja o modelo em
anlise? A resposta afirmativa.
Proposio 6.6.1 O previsor com EQM mnimo
E (yn+h j Fn )
i.e., verifica-se
E (yn+h

E (yn+h j Fn ))

161

yn+h

~ n+h;n

onde ~ n+h;n 2 Fn um outro qualquer previsor Fn -mensurvel.


(A demonstrao similar da proposio 4.3.1). Usaremos tambm a notao

n+h;n

para E (yn+h j Fn ) : A proposio 6.6.1 permite concluir que o previsor E (yn+h j Fn ) minimiza os trs termos do lado direito da equao (6.8), no conjunto de todos os previsores
Fn -mensurveis; em particular, o primeiro termo zero.
Recorda-se do captulo 4 que
E (yn+h

E (yn+h j G))

E (yn+h j H))

E (yn+h

G.

Como referimos, esta desigualdade resulta do facto de em G existir mais informao.


natural esperar que um previsor que use mais informao face a um outro, tenha um EQM
inferior.

6.6.2

Previso Pontual

Tendo em conta a proposio 6.6.1, vamos utilizar como previsor para yn+h a expresso
E (yn+h j Fn ) : O procedimento geral para obter a previso pontual de yn+h :
1. Definir o modelo yn+h (com base no modelo especificado).
2. Calcular E (yn+h j Fn ) :
Vamos ver alguns exemplos.
MA(2)
Previso a um passo h = 1
yn+1 =

1 un

2 un 1

1 un

+ un+1

Tem-se
E (yn+1 j Fn ) =

2 un 1

Previso a dois passos h = 2


yn+2 =

1 un+1

162

2 un

+ un+2

Tem-se
E (yn+2 j Fn ) =

2 un :

Previso a h passos (h > 2)


yn+h =

1 un+h 1

2 un+h 2

+ un+h

Tem-se
E (yn+h j Fn ) =
MA(q)
Deixa-se como exerccio verificar:

E (yn+h j Fn ) =

8
<
:

Pq

i un+h i

i=h

para h = 1; :::; q
para h = q + 1; :::

Sugesto: comece por verificar que, para h = q + 1; q + 2; ::: tem-se E (yn+h j Fn ) = :


AR(1)
Na previso dos processos AR, til considerar-se a previso j realizada nos passos
intermdios. Considere-se novamente a notao

n+h;n

(igual por definio a E (yn+h j Fn )):

Previso a um passo h = 1
yn+1 = c +

n+1;n

1 yn

= E (yn+1 j Fn ) = E (c +

+ un+1

1 yn

+ un+1 j Fn ) = c +

1 yn :

Previso a dois passos h = 2


yn+2 = c +

n+2;n

= E (yn+2 j Fn ) = E (c +
=

c+

1 yn+1

1 yn+1

+ un+2

+ un+2 j Fn ) = c +

1 n+1;n

Previso a h passos
yn+h = c +

1 yn+h 1

163

+ un+h

E (yn+1 j Fn )

n+h;n

= E (yn+h j Fn )
= E (c +

1 yn+h 1

+ un+2 j Fn ) = c +

1 n+h 1;n

Conclui-se que o modelo de previso no modelo AR(1) (h > 1)

n+h;n

=c+

(6.9)

1 n+h 1;n

Observao 6.6.1 Podemos reescrever a equao (6.9) como funo do valor observado em
n: Por exemplo, a previso a dois passos (h = 2)

n+2;n

=c+

1 n+1;n :

Como, por sua vez, a previso a um passo


substituir

n+1;n

= c+

1 yn

(6.10)

= c+

n+1;n

1 n;n

= c+

1 yn

podemos

na equao (6.10). Assim a previso a dois passos pode ser

escrita na forma

n+2;n

= c+

1 n+1;n

= c+

= c+c

(c +
1

1 yn )
2
1 yn :

De igual forma, a previso a trs passos

n+3;n

= c+

1 n+2;n

= c+

= c+c

c+c
+c

2
1

2
1 yn
2
1 yn :

Seguindo este raciocnio conclui-se que

n+h;n

=c+c

+c

2
1

+ ::: + c

h 1
1

h
1 yn :

(6.11)

Do ponto de vista prtico irrelevante prever o modelo com base no modelo (6.9) ou com
base em (6.11), pois as expresses so equivalentes. No mbito dos modelos dinmicos,
a equao (6.9) designa-se por equao s diferenas finitas linear de primeira ordem (a
equao de juros compostos tambm uma equao do tipo) cuja soluo, dada a condio

164

inicial

n;n

1+

= yn ; precisamente a equao (6.11). Atendendo a que

1+

2
1

h 1
1

+ ::: +

1
1

(soma de uma progresso geomtrica)

podemos dar um novo aspecto s equao (6.11):


= c 1+

n+h;n

n+h;n

2
1

+ ::: +

h 1
1

h
1 yn

1
= c
1
Em suma, para obter

h
1 yn :

(6.12)

indiferente considerar (6.9), (6.11) ou (6.12).

AR(2)
Previso a um passo h = 1
yn+1 = c +

n+1;n

1 yn

2 yn 1

+ un+1

= E (yn+1 j Fn )
= E (c +

1 yn

2 yn 1

+ un+1 j Fn ) = c +

1 yn

2 yn 1

Previso a dois passos h = 2


yn+2 = c +

n+2;n

1 yn+1

2 yn

+ un+2

= E (yn+2 j Fn )
= E (c +
= c+

1 yn+1

1 n+1;n

2 yn

+ un+2 j Fn ) = c +

E (yn+1 j Fn ) +

2 yn

Previso a h passos (h > 2)


yn+h = c +

1 yn+h 1

165

2 yn+h 2

+ un+h

2 yn

Dependent Variable: Y
Sample: 3 1000
Included observations: 998
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
Y(-1)
Y(-2)

10.81186
0.469309
0.314900

1.196611
0.030095
0.030098

9.035402
15.59406
10.46238

0.0000
0.0000
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.521901
0.520940
0.499762
248.5130
-722.3618
2.010668

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

50.10264
0.722051
1.453631
1.468378
543.0800
0.000000

Figura 6-15: Estimao de um AR(2)


n+h;n

= E (yn+h j Fn )
= E (c +
=

c+

1 yn+h 1

1 n+h 1;n

2 yn+h 2

+ un+2 j Fn )

2 n+h 2;n

Conclui-se que o modelo de previso no modelo AR(2) (para h > 2)

n+h;n

=c+

1 n+h 1;n

2 yn+h 2;n :

Exemplo 6.6.1 Estimou-se um processo AR(2), cujos resultados esto apresentados na figura
6-15.
Tem-se n = 1000 e sabe-se que yn

=50.4360, yn =50.0207. Pretende-se obter uma

previso para y para os perodo 1001, 1002 e 1003 (previso a um passo, a dois passos e a
trs passos).
Previso a um passo:

n+1;n

= c+

1 yn

2 yn 1

^ n+1;n = 10:81186 + 0:469309

50:0207 + 0:3149

50:436 = 50:169:

50:169 + 0:3149

50:0207 = 50:108:

Previso a dois passos:

n+2;n

= c+

1 n+1;n

2 yn

^ n+2;n = 10:81186 + 0:469309

166

Previso a trs passos:


= c+

n+3;n

1 n+2;n

2 n+1;n

^ n+2;n = 10:81186 + 0:469309

50:108 + 0:3149

50:169 = 50:126:

AR(p)
Previso a um passo h = 1
yn+1 = c +

1 yn

+ ::: +

E (yn+1 j Fn ) = E c +
=

c+

1 yn

1 yn

p yn+1 p

+ ::: +

+ ::: +

+ un+1

p yn+1 p

+ un+1 Fn

p yn+1 p

Previso a dois passos h = 2


yn+2 = c +

1 yn+1

E (yn+1 j Fn ) = E c +

+ ::: +

1 yn+1

p yn+2 p

+ ::: +

+ un+2

p yn+1 p

E (yn+1 j Fn ) + ::: +

c+

c+

1 n+1;n :::

+ un+2 Fn

p yn+1 p

p yn+1 p

Previso a h passos (h > p)


yn+h = c +

n+h;n

1 yn+h 1

+ ::: +

p yn+h p

+ un+h

= E (yn+h j Fn )
=

E c+

= c+

1 yn+h 1

1 n+h 1;n

+ ::: +

p yn+h p

2 yn+h 2;n

ARMA(1; 1)

167

+ un+h Fn

+ ::: +

p n+h p;n

Previso a um passo h = 1
yn+1 = c +

1 yn

+ un+1 +

1 un

= E (yn+1 j Fn )

n+1;n

E (c +

1 yn

+ un+1 +

c+

1 un

1 yn

1 un j Fn )

Previso a dois passos h = 2


yn+2 = c +

n+2;n

1 yn+1

+ un+2 +

1 un+1

= E (yn+2 j Fn )
=

E (c +

= c+

1 yn+1

+ un+2 +

1 un+1 j Fn )

1 n+1;n

Previso a h passos (h > 1)


yn+h = c +

n+h;n

6.6.3

1 yn+h 1

+ un+h +

1 un+h 1

= E (yn+h j Fn )
=

E (c +

c+

1 yn+h 1

+ un+h +

1 un+h 1 j Fn )

1 n+h 1;n

Intervalos de Previso I

Vimos at agora a chamada previso pontual. Vamos agora estabelecer um intervalo de


confiana, IC, (ou de previso) para yn+h : Um IC para yn+h a 95% baseia-se na probabilidade
P (l1 < yn+h < l2 j Fn ) = 0:95:

168

O intervalo de confiana portanto (l1 ; l2 ) ; ou seja, yn+h estar no intervalo (l1 ; l2 ) com 0.95
de probabilidade dado Fn . Como determinar l1 e l2 ? Assuma-se que
yn+n j Fn

N (E (yn+h j Fn ) ; Var ( yn+h j Fn ))

ou seja,
Z=
Tem-se assim,

yn+h E (yn+h j Fn )
p
Fn
Var (yn+h j Fn )

N (0; 1) :

P (l1 < yn+h < l2 j Fn ) = 0:95


,P

yn+h E (yn+h j Fn )
l2 E (yn+h j Fn )
l1 E (yn+h j Fn )
p
< p
< p
Fn
Var ( yn+h j Fn )
Var ( yn+h j Fn )
Var ( yn+h j Fn )

= 0:95

e, portanto,

p
l1 E (yn+h j Fn )
p
=
1:96 ) l1 = E (yn+h j Fn ) 1:96 Var (yn+h j Fn )
Var (yn+h j Fn )
p
l2 E (yn+h j Fn )
p
= 1:96 ) l2 = E (yn+h j Fn ) + 1:96 Var ( yn+h j Fn )
Var (yn+h j Fn )

Assim, um IC a 95% para yn+h

E (yn+h j Fn )
Em termos gerais, um IC a (1

) 100%

E (yn+h j Fn )
onde z1

=2

tal que P Z

p
1:96 Var ( yn+h j Fn ):

z1

=2

z1

=2

= 1

Var (yn+h j Fn )
=2 e Z

N (0; 1) : tambm habit-

ual apresentar-se o IC a partir da varivel erro de previso a h passos, en (h) = yn+h


E (yn+h j Fn ). Como Var (en (h)) = Var (yn+h j Fn ) e usando a notao

n+h;n

= E (yn+h j Fn ) ;

o IC a 95% para yn+h pode apresentar-se tambm na forma

n+h;n

p
1:96 Var (e (h)):

169

(6.13)

Na prtica
n+h;n

desconhecido, pois envolve parmetros desconhecidos. Em lugar de

devemos usar ^ n+h;n (por exemplo, na previso a um passo do modelo AR(1), em

lugar de
n+h;n

n+h;n

n+1;n

= c+

1 yn

deve-se considerar ^ n+1;n = c^ + ^ 1 yn ): A substituio de

por ^ n+h;n aumenta a varincia do erro de previso numa quantidade proporcional

a 1=n (no apndice 6.H discute-se esta questo). Para amostra grandes pode-se assumir
1=n ' 0 e, assim, podemos continuar a usar a expresso (6.13), substituindo os parmetros
desconhecidos pela respectivas estimativas consistentes. Vamos ver alguns exemplos.
MA(2)
Previso a um passo h = 1
yn+1 =

1 un

2 un 1

1 un

+ un+1

Tem-se
E (yn+1 j Fn ) =

2 un 1

E (yn+1 j Fn ) = un+1

en (1) = yn+1
Logo Var (en (1)) =

N 0;

e, assim, um IC a 95%
+

1 un

2 un 1

1 un

2 un 1

p
1:96 Var (en (1)) i.e.,

1:96

Previso a dois passos h = 2


yn+2 =

1 un+1

2 un

+ un+2

Tem-se
E (yn+2 j Fn ) =
yn+2
Logo Var (en (2)) =

E (yn+2 j Fn ) =
2
1

+1

2 un

1 un+1

+ un+2

N 0;

e, assim, um IC a 95%

2 un

q
1:96
170

2
1

+1

2
1

+1

Dependent Variable: Y
Method: Least Squares
Sample(adjusted): 1950:04 2005:05
Included observations: 662 after adjusting endpoints
Variable
Coefficient
Std. Error
t-Statistic
C
MA(1)
MA(2)

10.01857
0.373267
-0.231256

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.162759
0.160218
0.955072
601.1155
-907.4029
2.002569

Inverted MA Roots

.33

0.042397
0.037900
0.037917

Prob.

236.3054
9.848702
-6.099047

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

0.0000
0.0000
0.0000
10.01838
1.042205
2.750462
2.770833
64.05464
0.000000

-.70

Figura 6-16: Estimao de um MA(2)


Exemplo 6.6.2 Estimou-se um MA(2) (dados mensais), cujos resultados esto apresentados
na figura 6-16. A ltima observao, yn ; reporta-se ao perodo 2005:05 (Maio de 2005, na
notao do EVIEWS). Tem-se ainda a seguinte informao: u^n

0:655 e u^n = 0:055:

As estimativas dos parmetros so13 :


^1 = 0:37326;

^2 =

0:231256:

Pretende-se um intervalo de previso para 2005:6 (yn+1 ) e 2005:7 (yn+2 ) a 95%, supondo
inovaes (erros) normais. Previso a um passo:

n+1;n

^ n+1;n =

1 un

2 un 1

^ + ^1 u^n + ^2 u^n

= 10:01857 + 0:37326

0:055

0:231256

( 0:655)

= 10:191
13

O output do EVIEWS apresenta as razes invertidas do polinmio MA. Desta forma, o modelo invertvel
sse as razes invertidas so em mdulo inferiores a um. Como as razes so em mdulo inferiores a um concluise que o processo invertvel. Outra forma de chegarmos a esta concluso consiste em verificar se as seguintes
condies so vlidas:
1;
1 < 2 < 1:
1+ 2 >
1
2 < 1;
Tambm por aqui se conclui que o modelo invertvel verificando as desigualdades:
^1 + ^2

0:37326

^1

^2

0:37326 + 0:231256 < 1;

<

0:231256 >

0:231256 < 1:

171

1;

13
12
11
10
9
8
7
2005:06

2005:07
YF

2 S.E.

Figura 6-17: Previso do modelo MA(2) fornecida pelo EVIEWS


IC para yn+1 a 95%:
+
10:191

1:96

1 un

2 un 1

1:96

0:955072 ou (8:32; 12:06) :

Previso a dois passos:

n+2;n

2 un

^ n+2;n = ^ + ^2 un
= 10:01857

0:231256

0:055

= 10:005
IC para yn+2 a 95%:
q
2
2
+ 2 un 1:96
1+1
p
10:005 1:96 (0:373262 + 1)

0:9550722 ou (8:01; 12:00) :

No EVIEWS o grfico da previso a dois passos dada pela figura 6-17 (h uma ligeira
diferena entre os IC acima calculados e os IC fornecidos pelo EVIEWS. Porqu?)

MA(q)

172

Deixa-se como exerccio verificar:

E (yn+h j Fn ) =

8
<

Pq

i un+h i

i=h

para h = q + 1; :::

E (yn+h j Fn ) =

en (h) = yn+h

h 1
X

(h) =

i un+h i

= 1)

i=0

Tem-se
e2n

para h = 1; :::; q

h 1
X

2
i

(6.14)

i=0

e, assumindo normalidade, o IC a 95%

q
X

v
u
u
1:96t

i un+h i

i=h

h 1
X

2
i

i=0

AR(1)
A determinao dos intervalos de previso no imediata nos processos AR e ARMA
em geral.
Previso a um passo h = 1
yn+1 = c +

n+1;n

1 yn

+ un+1

= E (yn+1 j Fn )
= E (c +

1 yn

+ un+1 j Fn ) = c +

1 yn

en (1) = un+1
Previso a dois passos h = 2
yn+2 = c +

n+2;n

1 yn+1

+ un+2

= E (yn+2 j Fn )
= E (c +
= c+

1 yn+1

+ un+2 j Fn ) = c +

1 n+1;n

173

E (yn+1 j Fn )

en (2) =?
Para determinar en (h) e consequentemente os IC a ideia consiste em representar yn+h
na forma MA. Precisamos, portanto, de uma frmula geral que fornea en (h) e Var (en (h))
(veremos isso a seguir).

6.6.4

Intervalos de Previso II - Varincia do Erro de Previso no modelo ARMA

Para determinarmos en (h) considere-se o ARMA(p; q)


(L) yn+h =

yn+h =
=

(L) un+h

1
p
1
X

(L)

(L) un+h

j un+h j

(6.15)

= 1).

j=0

A expresso E (yn+h j Fn ) pode ser obtida recursivamente como vimos no caso AR(p) com
h = 2 : Agora interessa-nos representar E (yn+h j Fn ) numa outra forma equivalente para
que possamos obter en (h) :
Como
yn+h =

1
X

j un+h j

j=0

tem-se
E (yn+h j Fn )
1
X
= E
j un+h

j=0

= E
=

0 un+h

h un

Fn

1 un+h 1

h+1 un 1

+ ::: +

h 1 un+1

+ :: :

174

h un

h+1 un 1

+ ::: Fn

Logo
E (yn+h j Fn )

en (h) = yn+h
=

0 un+h

h un

=
=

0 un+h
h 1
X

1 un+h 1

+ ::: +

h+1 un 1

:::

1 un+h 1

+ ::: +

h 1 un+1

h un

h+1 un 1

+ :::

h 1 un+1

j un+h j :

j=0

Portanto,
E (en (h)) = 0
Var (en (h)) = E e2n (h) =

h 1
X

2
j;

=1

(6.16)

j=0

No processo MA(q) tem-se

e, com esta igualdade, confirma-se a equao (6.14).

Exemplo 6.6.3 Retome-se o exemplo 6.6.1:


Dependent Variable: Y
Sample: 3 1000
Included observations: 998
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
Y(-1)
Y(-2)

10.81186
0.469309
0.314900

1.196611
0.030095
0.030098

9.035402
15.59406
10.46238

0.0000
0.0000
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.521901
0.520940
0.499762
248.5130
-722.3618
2.010668

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

50.10264
0.722051
1.453631
1.468378
543.0800
0.000000

Vimos:
^ n+1;n = 50:169; ^ n+2;n = 50:108; ^ n+3;n = 50:126:
Sabendo que

1
0:469309L

0:31490L2

= 1 + 0:469L + 0:535L2 + 0:399L3 + :::

determine um IC a 95% para as previses em n + 1; n + 2 e n + 3: Vimos que a expresso


175

geral do IC a 95% (com erros Gaussianos) dada pela expresso


p
1:96 Var (en (h))

E (yn+h j Fn )
ou

p
1:96 Var (en (h))

n+h;n

ou

q
d (en (h))
1:96 Var

^ n+h;n

No caso dos modelos MA a expresso Var (en (h)) determina-se facilmente, como vimos
atrs. No caso dos modelos AR (ou ARMA) temos de usar a expresso (6.16)

Var (en (h)) =

h 1
X

2
j

j=0

d (en (h)) = ^ 2
ou Var

h 1
X

^2
j

j=0

Um IC a 95% para a previso yn+1 (h = 1)


q
d (en (1))
1:96 Var

^ n+1;n
Ora ^ n+1;n = 50:169 e
d (en (1)) = ^ 2
Var

1 1
X

^ 2 = ^2
j

0
X

^ 2 = ^2 ^ 2 = ^2:
0
j

j=0

j=0

Assim
^ n+1;n
50:169

p
1:96 ^ 2
1:96

0:499762:

Um IC a 95% para a previso yn+2 (h = 2)


^ n+2;n

q
d (en (2)):
1:96 Var

176

Ora ^ n+2;n = 50:108 e


d (en (2)) =
Var

2 1
X

^ 2 = ^2 1 + ^ 2
1
j

j=0

0:4997622

1 + 0:4692 = 0:30470:

Assim
^ n+2;n
50:108

q
d (en (2))
1:96 Var
p
1:96 0:30470:

Um IC a 95% para a previso yn+3 (h = 3)


q
d (en (3)):
1:96 Var

^ n+3;n
Ora ^ n+2;n = 50:126 e
d (en (2)) =
Var

^2

3 1
X

^ 2 = ^2 1 + ^ 2 + ^ 2
2
1
j

j=0

0:4997622

1 + 0:4692 + 0:5352

= 0:37619:
Assim
^ n+3;n
50:126

6.6.5

q
d (en (3))
1:96 Var
p
1:96 0:37619:

Previso de (muito) Longo Prazo

Previso de longo prazo significa tomar h muito alto. Qual a previso de yn+h quando
h ! 1? Isto , qual o valor de
lim E (yn+h j Fn )?

h!1

Quando n + h muito alto, quando comparado com n, a informao Fn praticamente


irrelevante ( qualquer coisa como prever o retorno do PSI20 para daqui a 20 anos, tendo
177

disponvel apenas a informao do retorno de hoje). Assim, nestas condies, E (yn+h j Fn )


praticamente igual a E (yn+h ) (quer dizer, podemos dispensar Fn ). Tudo isto verdade se,
obviamente, o processo for estacionrio.
Assim, se o processo for estacionrio tem-se
lim E (yn+h j Fn ) = E (yn+h ) = E (y) :

h!1

Outra questo tem a ver com os intervalos de previso. Vimos que os intervalos de previso
dependem da varincia do erro de previso
h 1
X

Var (en (h)) =

2
j

j=0

onde

so os coeficientes que se obtm da relao

yt =

1
p

(L)

(L) ut =

(L)

p
1
X

(L) ; Recorde-se,

j ut j :

j=0

Qual o valor da expresso Var (en (h)) =


avaliar
2

lim

h!1

1
j=0

h 1
X

2
j

quando h tende para 1? Temos de

2
j:

j=0

Se o processo y ESO pode-se provar que


14

Ph

P1

2
j

j=0

finito14 e, portanto, Var (en (1))

Vimos em que condies se estabelece a estacionaridade. Outra forma alternativa consiste em considerar
a representao MA(1) do ARMA. Vimos
yt =

1
p

(L)

(L) ut =

1
X

j ut j :

j=0

Tem-se
E (yt )

Var (yt )

0
1
X
Var @

j ut

j=0

A=
j

1
X

2
j

j=0

P1
P1
Assim se y E2O devemos ter Var (yt ) = 2 j=0 2j < 1: Logo devemos exigir j=0
P1 2
j=0 j < 1 condio necessria para que y seja estacionrio. Nestas condies
Var (en (h)) = E e2n (h) =

h
X1
j=0

178

2
j

! Var (yt ) :

2
j

< 1 e, portanto,

finito. Para que valor tende? Pode-se provar (veja-se o ltimo p-de-pgina) que
Var (en (1)) = Var (y) :
Assim, se y estacionrio e Gaussiano, um intervalo de confiana a 95% para yn+h com h
muito alto (ou h ! 1)

p
1:96 Var (y)

E (y)

O que acontece se y no estacionrio?

Exemplo 6.6.4 Considere-se o ARIMA(0; 1; 1)


yt = yt

+ ut +

1 ut 1 :

A previso a um passo

n+1;n

= E (yn+1 j Fn ) = yn +

1 un :

A dois passos

n+2;n

= E (yn+2 j Fn ) = E (yn+1 + un+2 +


= E (yn+1 j Fn ) = yn +

1 un+1 j Fn )

1 un

A h passos
n+h;n

= yn +

1 un :

Calcule-se agora a varincia do erro de previso Var (en (h)) =


calcular os

Ph

1
j=0

e, para o efeito, comeamos por reescrever o processo na forma


(1

L) yt = (1 + 1 L) ut ou
(1 + 1 L)
yt =
ut
1 L

179

2
j:

Temos de

Para determinar

i:

(1 + 1 L)
= 1 + 1 L + 2 L2 + :::
1 L
1 + 1 L = 1 + 1 L + 2 L2 + ::: (1
= 1

L+

= 1+(
Resulta:

8
>
>
>
>
>
>
<

0=

1L

1) L + (

1
2

>
>
0= 3
>
>
>
>
:
:::

1L

8
>
>
>
>
>
>
<
>
>
>
>
>
>
:

L)

2L

1) L

2L
2

=1+

=1+

=1+

+ :::

+ :::

:::

(alternativa: srie de Taylor ou melhor frmula de Taylor...).


Logo
(1 + 1 L)
= 1 + (1 + 1 )L + (1 + 1 )L2 + :::
| {z }
| {z }
1 L
1

e, portanto,

Var (en (h)) =

h 1
X

2
j

j=0

1 + (1 +
1 + (h

2
1)

+ ::: + (1 +

1) (1 +

2
1)

2
1)

Quando h ! 1 ) Var (en (h)) ! 1 (a amplitude dos IC aumenta com h).

6.6.6

Qualidade da Previso

Podemos comparar a qualidade de previso de dois modelos diferentes (por exemplo um AR


versus um MA) comparando a varincia do erro de previso Var (en (h)) dos dois modelos.
Esta a abordagem paramtrica. Temos uma outra forma, mais eficaz, de avaliarmos a
previso de um (ou mais) modelo(s) e que descrita a seguir.
O perodo de observao da srie dividido em dois sub-perodos: o primeiro designado por in-sample estimation period e o segundo por out-of sample forecast. Fixe-se o
perodo de estimao, por exemplo, de 1 a t1 (veja-se a figura 6-18). Embora as observaes

180

Out-of sample
forecast
evaluation period

In-sample estimation period

t1

Figura 6-18: In-Samples Estimation Period vs. Out-of Sample Forecast Period
disponveis sejam y1 ; :::; yt1 ; :::; yn o modelo estimado apenas para o perodo de 1 a t1 :
Com base no modelo estimado no perodo in-sample estimation, geram-se depois as previses para o perodo out-of sample forecast e, finalmente comparam-se as previses com
os valores observados mas no utilizados na estimao. O esforo de previso no perodo
ps-estimao equivalente ao de uma previso verdadeira15 .
Seja
e (h) = et1 (h) = yt1 +h

E (yt1 +h j Ft1 )

yhp = E (yt1 +h j Ft1 )


yho = yt1 +h

(com t1 + h = n).
Avaliao da Previso I
Tendo-se calculado os erros e (1) ; e (2) ; :::; e (h) ; podemos agora avali-los atravs das
seguintes medidas:
Erro Mdio de Previso
1X o
(y
EM P =
h i=1 i
h

1X
=
e (h)
h i=1
h

yip )

15
Tambm se definem as previses in-sample forecast. Tratam-se de previses geradas no perodo de estimao do modelo. Por exemplo, previses a h-passos

E ( yt+h j Ft ) ;

t+h

t1 :

O esforo de previso baixo porque o modelo de previso usa estimativas ^ baseadas nas observaes
y1 ; :::; yt1 (a qualidade da previso a um passo, h = 1; pode ser avaliada atravs dos critrios habituais de
ajustamento R2 ; ^ ; etc.).
A avaliao da qualidade da previso deve basear-se nas previses out-of-sample.

181

Raiz do Erro Quadrtico Mdio (REQM ou RMSE)


v
u h
u1 X
REQM = t
(y o
h i=1 i

v
u h
u1 X
p 2
e (h)2
yi ) = t
h i=1

Erro Absoluto Mdio (EAM ou MAE)


1X o
jy
h i=1 i
h

EAM =

1X
je (h)j
h i=1
h

yip j =

Erro Percentual Absoluto Mdio (EPAM ou MAPE)


1 X yio yip
1 X e (h)
=
o
h i=1
yi
h i=1 yio
h

EP AM =

Coeficiente de Theil
REQM
q P
;
h
p 2
1
o 2
(y
)
+
(y
)
i
i
i=1
i=1
h

U=q P
h
1
h

EQM penaliza fortemente os erros maiores. A grande maioria das previses pode ser excelente mas o EQM pode ser alto se existir uma previso m ou muito m. O EAM no
to severo neste aspecto. Se a grande maioria das previses for boa ento o EAM vem
relativamente baixo.
Relativamente ao coeficiente de Theil, quanto mais baixo U melhor a previso. O
caso U = 1 o pior cenrio (por exemplo, prever sistematicamente zero quando os valores
observados so diferentes de zero, ou prever sempre valores positivos quando os valores
observados so sempre negativos, etc.).
As estatsticas anteriores avaliam a magnitude do erro de previso e, com excepo do
EMP, no levam em conta se o erro de previso positivo ou negativo. Em certos casos, o
sinal do erro de previso importante. Para ilustrar esta situao, considere-se o seguinte
exemplo. Seja y a hora de partida do avio, y p a previso da hora de chegada ao aeroporto
(para embarcar) e e = y

y p o erro de previso. Se e > 0; ele ou ela chega adiantado; se

e < 0 chega atrasado e perde o avio. Como poderemos avaliar o erro de previso? Funo
quadrtica do tipo EQM? (penalizar de igual forma chegar cedo ou tarde?). Uma funo de

182

avaliao poderia ser

8
< 999 e < 0
L (e) =
: ke e > 0;

(6.17)
k > 0:

Assim, chegar atrasado envolveria uma perca de 999 (valor que supomos muito alto), ao
passo que chegar adiantado e unidades de tempo, envolveria uma perca proporcional a e
(supondo 999 > ke). Uma estatstica de avaliao da qualidade da previso baseada em
(6.17)
1X
999Ife(i)<0g + ke (i) Ife(i)>0g :
h i=1
h

(6.18)

Escolhe-se o modelo que minimiza (6.18).


Outro caso em que a funo perca L (e) no simtrica aplica-se a modelos de previso
que visam definir regras de compra e venda. Seja yhp a previso do retorno a h passos e yho o
correspondente valor observado. Considera-se uma previso correcta quando yhp apresenta o
mesmo sinal que yho : A funo perca
8
< 1 yp yo < 0
h h
L (e) =
: 0 y p y o > 0:
h h

(6.19)

Observe-se: se a previso correcta yhp e yho apresentam o mesmo sinal e, portanto, o produto
yhp yho positivo. Uma estatstica de avaliao da qualidade da previso baseada em (6.19)
1X
I p o :
h i=1 fyi yi <0g
h

(6.20)

A equao (6.20) representa a proporo de previses com sinal incorrecto. Pode-se preferir,
todavia, trabalhar com a proporo de previses com sinal correcto:
1X
P P SC =
I p o :
h i=1 fyi yi >0g
h

Avaliao da Previso II
Os erros de previso podem devem-se, basicamente, s seguinte razes:
As previses esto quase sempre acima ou abaixo dos valores observados (exemplo:
valores observado: 10, 11, 9, 12; previses: 15, 16, 13, 16);
A variabilidade das previses diferente da variabilidade dos valores previstos (exem183

plo: valores observados: 10, 11, 9, 12; previses: 2, 18, 5, 20).


As previses esto pouco correlacionadas com os valores observados.
Na metodologia que se segue procura-se identificar estas vrias fontes de erro.
Considere-se
1X o
=
(y
h i=1 i
h

s2o

r=

1X p
=
(y
h i=1 i
h

o 2

s2p

y ) ;

1
h

Ph

i=1

(yio

y o ) (yip
s0 sp

y p )2

yp)

e defina-se
UE =

(y o y p )2
;
EQM

UV =

(so sp )2
;
EQM

UC =

2 (1 r) s0 sp
;
EQM

respectivamente a proporo do enviesamento, da varincia e da covarincia. Note-se EQM =


Ph
1
o
yip )2 : A estatstica U E mede o erro sistemtico, U V mede a capacidade de y p
i=1 (yi
h

reproduzir a variabilidade de y o e U C mede o erro no sistemtico. A situao ideal (yio 6= yip )

U V = U E = 0 e U C = 1: Note-se que U V + U E + U C = 1 (demonstrao no apndice


6.I).
Ao contrrio do EMP, da REQM e do EAM as estatsticas EPAM, U de Theil, U V ; U E e
U C no dependem da escala da varivel. Por exemplo, se a varivel em estudo for entrada de
turistas na fronteira (unidade: no de indivduos) e depois resolvermos passar para entrada
de turistas na fronteira (unidade: milhares de indivduos), as estatsticas EPAM, U de Theil,
U V ; U E e U C no sofrem alterao (porque no dependem da escala da varivel).
Exemplo 6.6.5 Na figura seguinte apresentam-se estatsticas referentes a trs modelos de
previso. Analise a qualidade das previses com base nas estatsticas REQM, U de Theil,
U E , U V ; U C e Corr (entre os valores observados e previstos).

Recursive Forecasting vs. Rolling Window


Suponha-se que estamos incumbidos de criar um modelo de previso a 5 passos. Por
exemplo, podemos estar a trabalhar com dados dirios e o nosso objectivo definir um
modelo de previso semanal. A qualidade da previso a h passos, com h 6= 5 no nos
interessa (s nos interessa a qualidade da previso a 5 passos). A avaliao da previso
184

h
1
2
3
4
5
6
7
8
9
10
Mdia
Varincia
corr(y,ypi)
UE
UV
UC
U

Observado
y
1
2
3
2
4
5
6
7
5
9
4.4
5.64

Modelos de Previso
yp1
yp2
yp3
2
2
1
3
3
3
2
3
4
4
4
4
4
5
7
5
6
2
5
7
9
7
8
3
4
9
9
10
10
11
4.6
5.7
5.3
5.24
6.81
10.61
0.9124
0.9230
0.6567
0.0400
0.6259
0.1174
0.0074
0.0204
0.1129
0.9526
0.3537
0.7698
0.0986
0.1458
0.2341

erro quadrticos de previso


modelo1 modelo2 modelo3
1
1
0
1
1
1
1
0
1
4
4
4
0
1
9
0
1
9
1
1
9
0
1
16
1
16
16
1
1
4
1
2.7
6.9
1.2
20.61
31.29

12
10
8

y
yp1
yp2
yp3

6
4
2
0
1

10

Figura 6-19: Trs modelos em confronto


feita nos pontos anteriores no serve porque as estatsticas REQM, Coeficiente de Theil,
etc., avaliam a qualidade da previso a vrios passos, ponderando de igual forma esses erros.
Como fazer? Para avaliar a qualidade da previso a 5 passos fazemos variar t1 (veja-se a
figura 6-18). Podemos ainda ter a chamada previso recursiva (recursive forecasting) ou a
janela mvel (rolling window). Exemplifica-se a seguir.
Recursive forecasting
Estima-se o modelo entre as observaes 1 a 1000 e prev-se para 1005;
Estima-se o modelo entre as observaes 1 a 1001 e prev-se para 1006;
Estima-se o modelo entre as observaes 1 a 1002 e prev-se para 1007; etc.
Rolling window
Estima-se o modelo entre as observaes 1 a 1000 e prev-se para 1005;
Estima-se o modelo entre as observaes 2 a 1001 e prev-se para 1006;
Estima-se o modelo entre as observaes 3 a 1002 e prev-se para 1007; etc.

185

Em ambos os casos, em cada iterao, faz-se sempre uma previso a 5 passos. Todavia,
com o mtodo rolling window, o perodo de estimao contm sempre 1000 observaes (o
esforo de estimao constante). Na primeira hiptese o esforo de estimao vai diminuindo media que se acrescentam mais observaes no perodo da estimao. Ao fim de
vrias iteraes temos uma amostra de valores observados e valores previstos a 5 passos,
que podemos comparar usando as estatsticas j estudadas (EQM, EAM, etc.). Em termos
re
:= E (yi+h j Y1i ) a previso a h passos usando o
formais, seja,Yki = fyk ; yk+1 ; :::; yi g ; yh;i
ro
:= E yi+h j Yii
mtodo recursive forecasting, yh;i

; i > k; a previso a h passos usando

o mtodo rolling window e yio := yi+h os valores observados. Com base em s previses
out-of-sample, podemos calcular, por exemplo,
1X o
EQM (h) =
y
s i=1 i

1X o
EAM (h) =
y
s i=1 i

EAM re (h) =

re

1X o
y
s i=1 i

re 2
yh;i

EQM ro (h) =

re

1X o
y
s i=1 i

re
yh;i

ro
yh;i

ro
yh;i
:

Em geral, devemos esperar


REQM re (1)
EAM re (1)

REQM re (2)
EAM re (2)

:::
:::

REQM re (h)
EAM re (h)

Previso no EVIEWS
A previso no EVIEWS definida na janela forecast. Para obter previses out-ofsample necessrio, em primeiro lugar, encurtar a amostra na fase da estimao. Para
concretizar, suponha-se que esto disponveis 1100 observaes da srie y. Se o perodo
out-of-sample forecast for 1001-1100, o perodo de estimao obviamente 1-1000. Assim,
na opo de estimao deve-se escrever na caixa sample 1 1000 (veja-se a figura 6.6.6).
Depois de estimado o modelo, escolhe-se a opo forecast e na caixa Forecast sample
escreve-se 1001 1100 (veja-se a figura 6-20).
A opo Dynamic forecast faz a previso de y ignorando os valores observados de y no
perodo 1001-1100 (segue a metodologia exposta em Avaliao da Previso I). Por exemplo, no caso da previso AR(1) usa-se a frmula ^ n+h;n = c^ + ^ 1 ^ n+h

1;n .

A opo Static

forecast segue o esprito da metodologia Recursive Forecasting vs. Rolling Window para
h = 1 com a seguinte diferena: o perodo de estimao mantm sempre fixo. No exem186

Figura 6-20: Previso no EVIEWS

187

plo em anlise o perodo de estimao sempre 1-1000. A previso AR(1) para o perodo
1001 c^ + ^ 1 y1000 ; para o perodo 1002 c^ + ^ 1 y1001 ; etc. Os parmetros estimados c^ e ^ 1
baseiam-se sempre na amostra 1-1000. Em qualquer destas opes o EVIEWS calcula vrias
estatsticas a partir dos erros de previso e (i) ; i = 1; 2; ::: Por razes bvias a previso para
alm do perodo de observao da varivel (no exemplo em estudo, 1101-) s pode fazer-se
usando a opo Dynamic forecast.

6.6.7

Outros Mtodos de Previso Lineares

Mdias Mveis
Para tendncias localmente constantes a previso de y; para o perodo n + 1; n + 2; :::,
baseada na informao fy1 ; :::; yn g
p
yn+h
=

yn + yn

+ ::: + yn
N

N +1

h = 1; 2; :::

onde N o no de obs. includas em cada mdia (perodo da mdia mvel). A previso


constante.
Para tendncia localmente lineares pode-se usar o mtodo das mdias mveis duplas
(mdias mveis de mdias mveis usadas depois numa estrutura linear ...). Estes mtodos
podem ser replicados atravs dos mtodos de alisamento exponencial.
Alisamento Exponencial
Para tendncias localmente constantes a previso de y; para o perodo n + 1; n + 2; :::
, baseada na informao fy1 ; :::; yn g
p
yn+h
= Sn ;

Sn =

h = 1; 2; :::

yn + (1

) Sn 1 ;

188

0<

<1

Pode-se provar que o alisamento exponencial uma mdia ponderada de y1 ; :::; yn e S0 16 :


Sn = yn + (1

) yn

1+

)2 yn

(1

2 + ::: +

)n

(1

)n S0 : (6.21)

y1 + (1

Para tendncias localmente lineares pode-se usar o mtodo de Holt.


Estes mtodos podem ser encarados como casos particulares dos modelos ARIMA. Por
exemplo, a previso do modelo ARIMA(0,1,1) equivalente previso do modelo
Sn = yn + (1

) Sn 1 :

Dem. Uma forma de provar esta afirmao consiste em mostrar que, se yt segue um
ARIMA(0,1,1)
yt = yt

ut

+ ut ;

= yt

ut

ento, a previso para yn+1 pode-se escrever na forma da equao (6.21)17 . Uma demonstrao alternativa a seguinte. No modelo ARIMA(0,1,1) a previso para yn+1 E (yn+1 j Fn ) =
16

Com efeito,
Sn

yn + (1

) Sn

yn + (1

) ( yn

1
1

+ (1

yn + (1

) yn

yn + (1

) yn

1 + (1

=
=
=

yn + (1

) Sn

+ (1

) yn

+ (1

) yn

2)

) Sn

) ( yn
2

yn

2
2

+ (1

) Sn

3)

+ (1

) Sn

:::
yn +

(1

(1

) yn

+ ::: +

(1

n 1

y1 + (1

) S0 :

O alisamento exponencial uma mdia ponderada de y1 ; :::; yn e S0 .


17
Com efeito, a previso para yn+1 ; n+1;n ;
n+1;n

= yn

un

= yn

(yn

n)

= yn

yn +

) yn + (yn

(1

un

2)

un

(yn

(1

) yn + yn

(1

) yn + yn

(1

) yn + (1

) yn

+ un

) yn + (1

) yn

+ (1

1
1

un

3)

= :::
=

(1

yn

+ ::: + (1

n 1

y1 +

y0 :

Para verificar que a previso do modelo ARIMA(0,1,1) equivalente previso do modelo Sn = yn +


) Sn 1 basta comparar a expresso obtida para n+1;n com (6.21). Estas expresses so iguais para
= (1
) (admitindo que S0 = y0 ). fcil observar que a previso para yn+h ; h
1; em ambos os
modelos, Sn = n+1;n :
(1

189

n+1;n :

Verifique-se agora que

= yt

= yt

ut

= (1

yt

t 1

t 1:

) yt

Logo, no modelo ARIMA(0,1,1), tem-se

n+1;n

ou, redefinindo, Sn =

n+1;n

= (1

=1

) yn +

; vem

Sn = yn + (1

) Sn 1 ;

que precisamente a expresso do alisamento exponencial.


Como concluso: os modelos ARIMA so (muito) mais gerais do que modelos concorrentes vistos neste ponto.

6.A

Mtodo para Obter a FACP

Considere a regresso linear


yt+s =

s1 yt+s 1

s2 yt+s 2

+ ::: +

ss yt

t+s

e suponha-se que Var (yt ) = 1 e E (yt ) = 0 (a correlao parcial e total independente da


origem e da escala das variveis). Multiplicando ambos os termos por yt+s j ; j = 1; 2; :::; s;
tomando os valores esperados e dividindo por

Para obter

11

s1 j 1

+ ::: +

obtm-se o sistema,
j = 1; 2; :::; s:

ss j s

considera-se a equao (6.22) para s = 1;

11 0

190

= 1).

(6.22)

Donde,
11

Para obter

22

1:

considera-se o sistema (6.22) com s = 2;


8
<

e resolve-se em ordem a

22

21

21 1

(e em ordem a

21 ).

22 1

22

Aplicando, por exemplo, a regra de Cramer

obtm-se

22

2
1
:
2
1

Utilizando o mesmo procedimento pode-se concluir que

33

6.B

2 1
2 21

2
2

3
1
2
2

2
1 2
2 21 +

2
1 3

Transformao de um Processo MA(1) No Invertvel


num Invertvel

Mostra-se a seguir que um processo no invertvel pode transformar-se num processo invertvel com funes de autocorrelao e autocorrelaes parciais iguais.
Associado a um processo MA(1) no invertvel existe sempre um outro processo MA(1)
invertvel com a mesma FAC e FACP. Por exemplo, considere-se o processo MA(1) no
invertvel.
yt = 4ut

+ ut ;

= 4:

(6.23)

Este modelo no serve para previso pois a representao autoregressiva no est bem definida.

191

O processo (6.23) verifica:


=

42

+1
= 0 para s > 1

4
4
=
+1
17

e
=

11

ss

+1

4
17

2(s+1)

= 15

4s
1 42s+2

Ora o processo
1
y~t = u~t
4

~= 1
4

+ u~t ;

tem a mesma FAC e FACP do processo y: Com efeito,


~1 = ~ 11 =
1 s

ss

=
1

~
2

~ +1
1

1 2

+1

1 2

1 2(s+1)

= 15

+1

4
17

4s
:
1 42s+2

Na prtica, qual o alcance deste resultado? Se no ocorrer invertibilidade na fase da estimao devemos definir outros valores iniciais para os parmetros. Por exemplo, se o programa fornece como estimativa ^ = 4 devemos definir outros valores iniciais at que o
software encontre a estimativa 1=4 para o parmetro do processo MA. Convm lembrar que
a estimao de processos MA envolve problemas de optimizao no linear. Por vezes, a
soluo do problema de optimizao um extremante local (e no global, como desejvel). Podero existir outros extremantes que sero detectados se definirmos outros valores
de inicializao.

6.C

Invertibilidade de Processos MA (exemplos)

Observao 6.C.1 Se uma raiz r complexa, i.e. r = a + bi; o mdulo jrj =


Exemplo 6.C.1 yt = (1

0:5L + 0:1L2

(L) = 1

0:5L3 ) ut invertvel?
0:5L + 0:1L2
192

0:5L3 :

p
a2 + b 2 :

Resolvendo

(L) = 0 em ordem a L (atravs de um qualquer software) obtm-se as

seguintes razes
0:42 + 1:3i;

0:42

1:3i;

1:05

Como
j 0:42 + 1:3ij =

:422 + 1:32 > 1 ,

0:5L + 0:1L2

conclui-se que o processo yt = (1

j1:05j > 1

0:5L3 ) ut invertvel. O mtodo dos

coeficientes indeterminados permite determinar os parmetros

que figuram do lado direito

da expresso
1

1
0:5L + 0:1L2

Multiplicando ambos os termos por (1

1L

0:5L + 0:1L2

0:5L + 0:1L2

1= 1

=1+

0:5L3

0:5L3

2L

+ :::

0:5L3 ) tem-se

1+

1L

2
2L

+ ::: :

Depois de se multiplicarem e reordenarem todos os termos do lado direito da expresso


anterior vem,
1=1+(
Desta equao resulta:

8
>
>
>
<

Da primeira equao sai


1

0:5) L + (0:1

>
>
>
:

2
2) L

0:5

=0

:::

= 0:5; da primeira e da segunda sai,

0:5L + 0:1L2

+ :::

0:5 = 0

0:1

0:5

0:5L3

= 0:15; etc. Em suma

= 1 + 0:5L + 0:15L2 + 0:52 L3


+0:49L4 + 0:27L5 + :::

e, portanto,
yt =

0:5yt

0:15yt

0:52yt

0:49yt

0:27yt

:::

Nota final: o programa Mathematica (entre outros) calcula facilmente os parmetros


instruo
Series[

1
0:5L + 0:1L2
193

0:5L3

,{L,0,5}].

i:

O programa EVIEWS apresenta as razes invertidas do polinmio


o processo y invertvel se as razes invertidas

(L). Nestas condies,

(L) forem em mdulo inferiores a um (ou

dentro do circulo unitrio no plano complexo). Segue-se a explicao. Suponha-se que o


0:2L + 0:4L2 ) : As razes de (L):

polinmio MA (L) = (1

(L) = 0 ) L1 = 0:25

1:56i; L2 = 0:25 + 1:56i

As razes esto fora do crculo unitrio, pois


q
jL1 j = 0:252 + ( 1:56)2 = 1:58 > 1; jL2 j = ::: = 1:58 > 1:
Logo o processo yt = (L) ut invertvel. O programa EVIEWS apresenta as razes inver0:2L + 0:4L2 ) ; o EVIEWS no apresenta L1 e

(L) = (1

tidas. No exemplo em anlise,


L2 mas sim

1
1
e
:
L1 L2
Quando as razes so reais bvio que jLj > 1 implica j1=Lj < 1: Quando as razes so
complexas pode-se provar que jLj > 1 , j1=Lj < 1: Com efeito, suponha-se que uma raiz
p
de (L) a + bi: Esta raiz est fora do crculo unitrio se ja + bij = a2 + b2 > 1: Se a
raiz a + bi invertida, tem-se
1
a
= 2
a + bi
a + b2
e
1
=
a + bi

a
2
a + b2

a2

b
i
+ b2

b
2
a + b2

=p

1
:
+ b2

a2

Conclui-se, portanto, que


ja + bij =

a2 + b 2 > 1 ,

Retomando o exemplo (L) = (1

0:2L + 0:4L2 ) o EVIEWS apresenta

1
0:25

1
1
=p
< 1:
2
a + bi
a + b2

1:56i

= 0:100 16 + 0:624 97i

1
= 0:100 16
0:25 + 1:56i

194

0:624 97i:

Como

0:100 162 + 0:624 972 = 0:632 95 < 1 o processo yt =

suma, no programa EVIEWS as razes invertidas

(L) ut invertvel. Em

(L) devem ser em mdulo inferiores a

um (ou dentro do circulo unitrio no plano complexo). Veremos ainda que as razes invertidas
do polinmio AR (L) devem tambm ser em mdulo inferiores a um (ou dentro do circulo
unitrio no plano complexo) para que o processo seja ESO.
Exemplo 6.C.2 Retome-se o exemplo 6.C.1. O programa EVIEWS em lugar de fornecer as
razes
0:42 + 1:3i;

0:42

1:3i;

1:05

fornece as razes invertidas, i.e., o lado direito das seguintes expresses:


1
=
0:42 + 1:3i
1
=
0:42 1:3i

0:225

0:696i;
1
= 0:952:
1:05

0:225 + 0:696i;

Assim, no programa EVIEWS as razes invertidas de

(L) devem ser em mdulo inferiores

a um (ou dentro do circulo unitrio no plano complexo). Verifique que j 0:225

0:696ij <

1; j 0:225 + 0:696ij < 1; j0:952j < 1:

6.D

Estacionaridade de 2a Ordem do Processo AR(1)

A ESO pode ser discutida a partir de vrios conceitos. Para processos lineares relativamente
fcil estudar a ESO. Considere-se (com c = 0) o processo AR(1)
yt = yt

+ ut =

y0 +

t 1

u1 +

t 2

u2 + ::: + ut

+ ut

(6.24)

(tendo-se admitido que o processo teve incio em t0 ). Questo: para que valores de
mdia, a varincia e a covarincia no dependem de t? A mdia
E (yt ) = E (E (yt j F0 )) =

E (y0 ) :

Claramente, se j j > 1 ento E (yt ) ! 1 e o processo no ESO. Se


E (yt ) =

E (y0 ) = E (y0 ) :

195

= 1 vem

Nada se pode dizer, por enquanto. Se j j < 1 vem E (yt ) =

E (y0 ) ! 0 quando t ! 1:

Para simplificar admite-se que o processo y inicializado em condies estacionrias i.e.,


admite-se E (y0 ) = 0: Nestas condies
t

E (yt ) =

E (y0 ) = 0:

Por outro lado, o segundo momento


2
E yt

= E E yt2 F0
= E E

= E E

2t 2
y0

2t 2
y0

= E
2t

=
Se

t 1

y0 +

2(t 1) 2
u1

2(t 1) 2

2
E y0 +

2(t 1)

= 1 vem E (yt2 ) = E (y02 )+


2t

1: Se j j < 1 vem E (yt2 ) =

t 2

u1 +

u2 + ::: + ut
2(t 2) 2
u2

2(t 2) 2

+ ut

2 2
2

+ ::: +

21
1

E (y02 ) +

Teoricamente pode-se definir E (y02 ) 6=

2
2

F0
+ u2t + :::

F0

2t

21
1

+1 :

t ! 1: Se j j > 1 vem E (yt2 ) =


2t

2 2
ut 1

+ ::: +

+ ::: +

2(t 2)

E (y02 )+

2t
2

e, neste caso, com j j < 1; o processo

apenas ESO assimptoticamente. Se o processo inicializado em condies estacionrias


i.e. E (y02 ) =

, ento, no caso j j < 1; resulta imediato que

2
E yt =

2t

21

2t

(constante 8t).

Relativamente s covarincias. Suponha-se y0 = 0 (para simplificar). No caso j j < 1 j


vimos que

: Suponha-se agora

yt = u1 + u2 + ::: + ut

196

= 1. Tem-se, a partir de (6.24),

+ ut

e, assim,
E (yt yt k ) = E (E (yt yt

jFt

k ))

= E (yt

E (yt jFt

= E ((u1 + u2 + ::: + ut k ) E (yt jFt

k ))

k ))

= E ((u1 + u2 + ::: + ut k ) (u1 + u2 + ::: + ut k ))


= E u21 + u22 + ::: + u2t
=

t;k

(t

+ E (termos cruzados)

k) (depende de t)

= 1):

Correlaes (ainda o caso


t;k
0;k

(t

k)
2t

k
t

=1

k
=
t

t;k

(depende de t). Coligindo todos resultados conclui-se que a mdia, a varincia e a covarincia no dependem de t se j j < 1: Em suma,
j j < 1 , yt ESO
(supondo que a condio inicial tem distribuio estacionria ou que o processo foi iniciado
num passado remoto).
Outra forma de analisar a questo em estudo a seguinte18 . Considere-se novamente o
AR(1)
yt = c + yt

+ ut

O esqueleto da equao anterior a equao s diferenas finitas


y~t = f (~
yt 1 ) = c + y~t 1 ;

f (x) = c + x

Satisfeitas outras condies (ver Tong, 1990) o processo y EE se o ponto fixo y da EDF
y~t = c + y~t

assimptoticamente estvel. O ponto fixo y da equao s diferenas finitas

18

Apenas para o leitor que tenha estudado o problema da estabilidade no mbito das equaes s diferenas
finitas determinsticas.

197

(determinstica) o que resulta de


y = f (y)
y = c+ y )y =

c
1

Como se sabe, a condio jf 0 (y)j < 1 implica que y assimptoticamente estvel. Ora
f 0 (x) = : Portanto, se j j < 1; y assimptoticamente estvel e y EE.
Pode-se tambm recorrer s proposies 4.5.1 e 4.5.4 notando que, no caso AR(1) a
funo g g (x) =

x e imediatamente se verifica que jg (x)j < jxj se j j < 1: Nas

condies das proposies referidas, o processo EE. ESO se o momento de segunda


ordem existir. Facilmente se verifica que existe. Nestas condies, o processo AR(1), com
j j < 1; EE e ESO.

6.E

Estacionaridade de 2a Ordem do Processo AR(p)

A ESO pode ser analisada convertendo a equao yt =

1 yt 1 +:::+ p yt p +ut

de equaes lineares mediante as seguintes mudanas de variveis:


y1;t = yt ;

y2;t = yt 1 ; :::; yp;t = yt

p+1 :

Tem-se
y1;t = c +
y2;t = y1;t
..
.
yp;t = yp

1 yt 1

+ ::: +

1;t:

198

p yt p

+ ut

num sistema

De forma compacta, tem-se uma estrutura de um processo vectorial AR(1), habitualmente


designado por VAR(1) (vector AR), yt = c + Ayt 1 +gt , i.e.
0
B
B
B
B
B
B
@

y1;t

C B
C B
y2;t C B
C B
.. C = B
. C B
A @
yp;t
| {z } |
yt

n 1

1
..
.

0
..
.

...
{z

0
..
.

0
..
.

10

y
CB 1;t 1
CB
CB y2;t 1
CB
CB ..
CB .
A@
yp;t 1
}|
{z
yt

C B
C B
C B
C+B
C B
C B
A @
}

ut
0
..
.

1
C
C
C
C
C
C
A

0
| {z }
gt

Resolvendo recursivamente o sistema yt = Ayt 1 +gt (dada a condio inicial Y0 ) obtm-se


yt = At y0 +At 1 g1 +At 2 g2 +::: + Agt 1 +gt :
relativamente bvio que devemos exigir At ! O (matriz nula) quando t ! 1: Por
exemplo se At ! O quando t ! 1 ento
t
E (yt j F0 ) = A y0 ! 0 (vector nulo)

(isto E (yt j F0 ) converge para a sua mdia marginal, se At ! O). Seja

= diag ( 1 ; :::;

n)

a matriz dos valores prprios de A e P a matriz dos vectores prprios associados (admitemse linearmente independentes). Como se sabe da lgebra linear, verifica-se a igualdade
At = P

P 1 . Logo devemos exigir que todos os valores prprios de A sejam em m-

dulo menores do que um. S nestas condies se tem At ! O: Pode-se provar que esta
condio equivalente seguinte: o processo AR(p) estacionrio sse as razes da equao
p

(L) = 0 esto todas fora do crculo unitrio no plano complexo.

6.F

Processos ARMA Sazonais

Neste apndice faz-se uma breve anlise dos processos ARMA sazonais ou SARMA.
Muitas sucesses envolvem uma componente sazonal ou peridica de perodo S (nmero
de observaes por perodo). Exemplos:

199

yt

Frequncia S

Entrada de Turistas

Mensal

12

Entrada de Turistas

Trimestral

Retornos de um Ttulo

Dirios

Crdito Total ao Consumo EUA


0.04
0.03
0.02
0.01
0.00
-0.01
-0.02
1980

1981

1982

1983

1984

1985

Considere-se, yt - entrada de turistas na fronteira, dados mensais. natural esperar:


yt
yt

12

12

alto) yt alto

baixo) yt baixo

Se s existisse a componente sazonal teramos:


yt =

1 yt 12

+ ut ; ou

yt =

1 yt 12

1 yt 24

+ ut :

Processo AR(P)S
AR(1)S

yt =

1 yt S

+ ut

AR(2)S

yt =

1 yt S

AR(P)S

yt =

1 yt 12

S
1L

ut rudo branco

2 yt 2S
2 yt 2s

+ ut
+ ::: +

2S
2L

:::

P yt P s

PL
P

200

+ ut ou,

PS

yt = ut

LS yt = ut :

Para um AR(1)S , yt =

1 yt S

yt =

+ ut , deixa-se como exerccio verificar que

1
X

j
1 ut jS ;

E (yt ) = 0;

j=0
2

Var (yt ) =

1
X

2j
1

j=0

2
1

= Var (ut ) ),

Relativamente covarincia pode-se concluir:

Cov (yt ; yt+1 ) =

1 X
1
X

j
1

i
1

E (ut

iS ut+1 jS )

=0

i=0 j=0

Cov (yt ; yt+2 ) = Cov (yt ; yt+3 ) = Cov (yt ; yt+S 1 ) = 0


1 X
1
1
X
X
2
i j+1
Cov (yt ; yt+S ) =
E (ut iS ut jS ) =
1 1
i=0 j=0

Donde
k

Tambm se pode concluir

8
<

j
1

j+1
1

i=0

m
1

2
1

k = mS; m = 0; 1; 2; :::

: 0
kk

k 6= mS; m = 0; 1; 2; :::

8
<

: 0

k=S
k 6= S:

Na figura seguinte apresenta-se a FAC e FACP (tericas) de um processo AR(1)S=12 com


1

= 0:5:
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0

FAC

12

24

36

48

36

48

FACP

12

24

O processo AR(P)S tem o mesmo comportamento bsico do processo AR(P).


Processo MA(Q)S
MA(1)S

yt =

1 ut S

+ ut ;

ut rudo branco;
201

MA(2)S

yt =

1 ut S

MA(Q)S

yt =

2 ut 2S

1 ut S

yt =

Para um MA(1)S , yt =

2 ut 2S

:::

S
1L

yt =

+ ut ;
Q ut QS

2S
2L

:::

+ ut ou,
QL

Qs

ut

LS ut

1 ut S

+ ut , deixa-se como exerccio verificar que

E (yt ) = 0;
Var (yt ) =
Tambm se pode concluir:
k

e
kk

8
<

1+

8
<
:

2
1

1+

= Var (ut ) ).

k=S

2
1

k 6= S

0
1

1+
m 1
1 (
1

2
1

k=S
)

2
1
2(m+1)
1

k 6= S:

Na figura seguinte apresenta-se a FAC e FACP (tericas) de um processo MA(1)S=12 com


1

0:5
1

FAC

0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
1

12

24

36

48

36

48

FACP

0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0

12

24

O processo MA(Q)S tem o mesmo comportamento bsico do processo MA(Q).


Processos Multiplicativos ARMA(p,q)(P,Q)S
Componentes no sazonal e sazonal (modelo ARMA(p,q)(P,Q)S ):

(L)

LS y t =
202

(L)

LS ut

Exemplo 6.F.1 Modelo ARMA(2,1)(1,0)12


1
1

1L

yt =

1 yt 1

2
2L

1L
2
2L

2 yt 2

12
1L

1
+

1L

12

13
1L

1 yt 12

yt = (1 +

14
1L

1 yt 13

1 L) ut

yt = ut +
1 yt 14

1 ut 1

+ ut +

1 ut 1

Corresponde a um modelo ARMA(14,1) com restries (no lineares) entre os parmetros


(incluindo restries de nulidade).

6.G

Demonstrao da Proposio 6.5.1

Dem. a) Dado o modelo y = X

+ d + u; o estimador OLS de

^ = (d0 Md)

d0 My;

= (d0 Md)

d0 M (X

+ (d0 Md)

X (X0 X)

M=I

+ d + u)

d0 Mu:

Analise-se a convergncia em probabilidade dos termos (d0 Md)


p
^ !

e^ !

implica ^^ !

X0

e d0 M u (note-se que

). Tem-se

d0 Md = d0 I

X (X 0 X)

= 1

x0t (X0 X)

= 1

x0t
n

X0 X
n

X0 X
n
p

!Q
p

d0 Md ! 1:

203

X0 d

d0 X (X 0 X)

= d0 d

Tendo em conta que x0t =n ! 0 e

X0 d

xt
1

xt :

facilmente se conclui que


(6.25)

Por outro lado,


1

X (X0 X)

d0 Mu = d0 I
= d0 u

d0 X (X0 X)

= ut

d0 X

X0 u

X0 u
1

X0 X
n

X0 u
n

e, usando um raciocnio idntico, conclui-se que


p

d0 Md ! ut :

(6.26)

Devido a (6.25) e (6.26) resulta:


^ = + (d0 Md)

d0 Mu !

+ ut :

b) Considere-se
y=X

^"t = d0 My:

+ ";

Tem-se

^ =

XX
n

x0t
n

X0 X
n

x0t
n

xt

xt

e,
^
=
^"t
Resulta

6.H

^
^
"t

x0t
n

X0 X
n

xt

d0 My
1

^"t

!1

Uma Nota sobre Intervalos de Confiana

Considere-se novamente a equao (6.13). Argumentmos que a substituio de

n+h;n

por

^ n+h;n aumenta a varincia do erro de previso numa quantidade proporcional a 1=n. Veja-se
esta questo mais em pormenor.

204

Quando

n+h;n

desconhecido, a varivel yn+h definida em


P (l1 < yn+h < l2 j Fn ) = 0:95;

deve ser centrada usando-se ^ n+h;n (e no

n+h;n )

Observe-se que a varivel yn+h

^ n+1;n

continua a possuir distribuio normal de mdia zero. No entanto, a varincia de yn+h


^ n+1;n agora,
Var yn+h

^ n+h;n Fn

= Var yn+h

n+h;n

= Var yn+h

n+h;n

+ ^ n+h;n

n+h;n

Fn

Fn + Var ^ n+h;n

= Var (e (h)) + Var ^ n+h;n


(observe-se que yn+h

n+h;n

independente de ^ n+h;n

n+h;n

n+h;n ;

apenas erros aleatrios posteriores a n; enquanto ^ n+h;n

Fn

Fn

pois yn+h

n+h;n

n+h;n

n+h;n

envolve

envolve variveis at ao

perodo n). Como consequncia, o IC a 95% construdo a partir de ^ n+h;n


^ n+h;n

q
1:96 Var (e (h)) + Var ^ n+h;n

Pode-se provar que Var ^ n+h;n


para amostra grandes, Var ^ n+h;n

n+h;n

n+h;n

Fn :

Fn uma quantidade de ordem O (1=n); assim,

n+h;n

Fn uma quantidade pequena quando com-

parada com Var (e (h)) e pode ser negligenciada. A quantidade Var ^ n+h;n

n+h;n

Fn

pode ser estimada a partir de uma equao auxiliar. Para exemplificar considere-se a previso
a um passo de um AR(1). A estimativa de c da equao
yt = c +
fornece uma estimativa para

n+1;h

(yt

yn ) + ut

(i.e., fornece ^ n+1;n ) pois y^n+1 = c^ + ^ 1 (yn

Por outro lado, o erro padro de c^ = ^ n+1;n uma estimativa para


Var ^ n+1;n

n+1;n

Fn = Var ^ n+1;n Fn :

205

yn ) = c^:

6.I

UE + UV + UC = 1

Veja-se em primeiro lugar que o EQM pode-se decompor em vrias parcelas. Considere-se:
1X o
EQM =
(y
h i=1 i
h

1X o
(y
=
h i=1 i

yip )2

1X o
=
((yi
h i=1

yip + y p

yo + yo

y p )2

1X o
(y
=
h i=1 i
|
{z
h

2
o

y p ))2

y p ) + (y o

1X p
y ) +
(y
h i=1 i
} |
{z
h

y p )2

o 2

2
p

1X o
(y
y o ) (yip
h i=1 i
{z
|
h

y p )2

+ (y o

(yip

yo)

yp)
}

0 p

2
o

2
p

y p )2

+ (y o

0 p

= (

2
p)

+ (y o

y p )2 + 2 (1

0 p

EQM = (

2
p)

+ (y o

y p )2 + 2 (1

0 p

Assim

e, portanto, dividindo ambos os termos pelo EQM, obtm-se


EQM
EQM
2
( o
(y o y p )2 2 (1
)
p)
=
+
+
EQM
EQM
EQM
| {z } | {z } |
{z

1 =

UV

UE

206

UC

0 p

Captulo 7
Modelao da Mdia: Abordagem No
Linear
(ltima actualizao: 04/2010)

7.1

Introduo

Ao longo das ltimas dcadas os modelos ARMA tm dominado a abordagem de sries temporais (os primeiros trabalhados datam de 1927 com os modelos autoregressivos estudados
por Yule). Existem razes para o sucesso dos modelos ARMA Gaussianos:
simplicidade: as equaes s diferenas finitas so fceis de tratar;
o modelo ARMA Gaussiano completamente caracterizado pela mdia, varincia e
pelas autocorrelaes;
so fceis de aplicar e implementar (a maioria dos programas de estatsticas possui um
mdulo para tratar os modelos ARMA);
a teoria est completamente desenvolvida: as principais questes, relacionadas com a
estimao, inferncia e previso esto resolvidas;
apesar da simplicidade so relativamente flexveis e teis na previso.
Todavia, os modelos ARMA apresentam limitaes:
no so apropriados para dados que exibam sbitas alteraes em perodos irregulares;

207

no so apropriados para dados que exibam forte assimetria e achatamento;


os coeficiente de autocorrelao e autocorrelao parcial de ordem k so apenas um
dos aspectos da distribuio conjunta de (yt ; yt k ) : Pode suceder

baixos, mas existir uma forte relao no linear entre yt e yt k : Por exemplo
Corr yt2 ; yt2

kk

serem

(y 2 ) =

pode ser alto;

no modelam dados que exibam solues peridicas estveis. Retomaremos este


tema mais frente.
Discuta-se um pouco mais em detalhe a primeira limitao mencionada. Um modelo
ARMA Gaussiano estacionrio possui momentos de todas as ordens, i.e., E jyt jk

< 1

para qualquer k 2 N: Este facto implica que a probabilidade de y assumir (transitoriamente)


valores muito altos ou muito baixos praticamente nula e, neste sentido, os modelos ARMA
no so apropriados para dados que exibam sbitas alteraes em perodos irregulares. Para
esclarecer este ponto, assuma-se que E (y) = 0 e recorde-se que se y possui o momento de
ordem k; ento (pela desigualdade de Markov) vem, para c > 0
P (jyj > c)

O c

A expresso anterior estabelece que P (jyj > c) proporcional (ou menos do que proporcional) a c k . Como c

tende para zero quando c ! 1; P (jyj > c) tende tambm para

zero nas mesmas condies, e relativamente depressa se k uma valor alto. Logo, a possibilidade de jyj assumir um valor arbitrariamente grande praticamente nula. Se y possuir
apenas o primeiro ou segundo momento, P (jyj > c) continua a tender para zero, mas a uma
taxa muito mais baixa, e y pode assumir valores moderadamente altos. A existncia de
todos os momento como no caso do modelo ARMA Gaussiano, pode, em certos casos, no
ser uma propriedade desejvel, pois em ltima anlise impede que o modelo capte dados que
exibam sbitas alteraes, excluindo portanto, os casos em que y assume transitoriamente
valores muito altos ou muito baixos.
Enquanto os modelos lineares so definidos apenas pela representao ARMA, o nmero
de especificaes no lineares virtualmente infinito. Embora a literatura dos modelos no
lineares esteja ainda na sua infncia, existem j muitos modelos no lineares propostos na
literatura. Vamos apenas focar alguns modelos no lineares mais utilizados. Mas afinal, o
que um modelo no linear?
208

Uma forma simples (mas no geral) de introduzir modelos no lineares consiste em apresentar a no linearidade atravs dos momentos condicionais. Considere-se o modelo
yt =
onde "t um rudo branco,
cional de yt e

2
t

+ ut ;

ut =

t "t

= g (yt 1 ; yt 2 ; ::; yt p ; ut 1 ; ut 2 ; :::ut q ) a mdia condi-

= h (yt 1 ; yt 2 ; :::; yt p~; ut 1 ; ut 2 ; :::; ut q~) > 0 a varincia condicional

de yt . O modelo no linear na mdia se g uma funo no linear dos seus argumentos1 .


O modelo no linear na varincia se
o processo fut g, definido por ut =

t "t ,

no constante ao longo do tempo pois, neste caso,


no linear, por ser um processo multiplicativo.

Vejamos alguns exemplos. No caso


yt = yt

+ log 1 + yt2

tem-se um processo no linear na mdia, pois,

= yt

+ ut

+ ut

+ log 1 + yt2

uma funo

no linear de yt 1 : Tambm
y t = u t 1 ut
um processo no linear, pois

= ut 1 ut

no linear nos valores passados de ut :

Os modelos no lineares na varincia mais conhecidos so os modelos do tipo ARCH;


sero discutidos no captulo 8.
Uma classe importante de processos no lineares na mdia baseiam-se na ideia de regimeswitching. Podem ser usados em duas circunstncias gerais:
existem alteraes bruscas e inesperadas nas trajectrias dos processos (e.g., ataques
especulativos, crashes bolsistas, anncios pblicos de medidas do governo, eventos
polticos e, em geral, eventos extraordinrios no antecipados).
existem alteraes da dinmica do processo sem alteraes bruscas nas trajectrias.
Por exemplo, a taxa de juro no perodo 1993 a 2006 exibe dois perodos com comportamento bem diferenciado: no primeiro, as taxas de juro e a volatilidade so relativamente altas e o processo evidencia uma tendncia de reverso para uma mdia,
seguindo-se, depois de 1995, um perodo de baixas taxas de juro, baixa volatilidade e
1

Dizemos que uma funo no linear se no for uma funo linear afim, i.e., se no verificar a relao
f (x1 ; :::; xn ) = a0 + a1 x1 + ::: + an xn , onde ai 2 R:

209

ausncia de reverso para uma mdia. Outro exemplo a taxa de inflao no perodo
1974-2006 (basta verificar os nveis de inflao e volatilidade nos anos 70/80 e nos
anos 90).
Para este tipo de fenmenos, os modelos com alteraes (estocsticas) de regime (ou
regime-switching) podem ser, no essencial, de dois tipos:
a mudana de regime funo de uma varivel observvel; so exemplos, modelos
com variveis impulso (dummy), os modelos limiares ou threshold AR (TAR), os modelos onde os coeficientes associados s componentes AR so funes no lineares dos
valores passados y (STAR, smoothed transition AR), entre outros;
a mudana de regime no observada, incluindo-se, nesta classe, os modelos onde os
regimes so independentes entre si (como, por exemplo, os modelos simple switching
ou de Bernoulli) e os modelos onde existe dependncia entre os regimes (como por
exemplo, os modelos MS, Markov-Switching).
Antes de entrarmos nos processos estocsticos no lineares, faz-se, na prxima seco,
uma breve incurso sobre os sistemas autnomos do tipo
yt = g (yt 1 )
(determinsticos). O estudo da estabilidade deste tipo de sistemas relevante para um estudo
mais aprofundado dos processos estocsticos do tipo yt = g (yt 1 )+ut (ou, mais geralmente,
yt = g (yt 1 ; yt 2 ; :::; yt p ) + ut ), pois parte da dinmica subjacente ao processo estocstico
depende da funo g (ou g no caso multivariado).

7.2

Estabilidade em Equaes s Diferenas Finitas Determinsticas

Nesta seco vamos analisa-se o sistema autnomo yt = g (yt 1 ) onde y um vector de


tipo m

1 e g uma funo real2 g : Rm ! Rm : O modelo determinstico (a condio

inicial determinstica - i.e. conhecida).


O domnio de g poder ser S Rm mas neste caso devemos exigir que S g (S) (suponha-se que esta
condio no se verifica - ento poderia suceder que 2 S e y1 = g ( ) 2
= S e no seria possvel agora
continuar com y2 = g (y1 ) = g (g ( )) pois g ( ) 2
= S).
2

210

7.2.1

Pontos Fixos e Estabilidade de Sistemas Lineares

Definio 7.2.1 (Ponto Fixo de f ) Um vector y designado por ponto fixo de g se g (t; y) =
y; para todo o t.
No ponto fixo o sistema dinmico discreto no varia (est em equilbrio). Com efeito,
se yt

= y e y um ponto fixo, a variao da soluo,

yt 1 = g (yt 1 )

yt 1 = y

yt ; nula, i.e.,

y t = yt

y = 0:

Por exemplo, considere-se y0 = 2 e a equao s diferenas finitas (EDF)3 yt = (1=2) yt 1 +


1 (note-se m = 1). Iterando a equao fcil verificar que y1 = 2; y2 = 2; ::: Logo y = 2
o ponto fixo de g (x) = (1=2) x + 1: Para calcular o ponto fixo de g basta resolver a equao
(1=2) y + 1 = y em ordem a y:
Exemplo 7.2.1 Considere-se yt = 2yt

(1

yt 1 ) : Tem-se g (x) = 2x (1

fixos (de g) calculam-se a partir da relao g (y) = y; i.e., 2y (1

x) : Os pontos

y) = y: Os pontos fixos

so portanto y = 0 e y = 1=2:
Exemplo 7.2.2 Considere-se o sistema no linear
0
@
Tem-se, portanto

com domnio

y1t

A=@

y2t

00

g @@

x1
x2

y2t

11

y2t
y1t

AA = @

1
1
1

A:

x2
x2
x1

1
A

80
9
1
< x
=
@ 1 A 2 R2 : x1 6= 0 :
: x
;
2

Determinem-se os pontos fixos de g: Para o efeito, resolve-se g (x) = x, i.e.,


0
@

x2
x2
x1

A=@

x1
x2

A:

3
O ramo da matemtica que estuda a dinmica de sistemas determsticos usa, por vezes, uma linguagem um
pouco diferente da que estamos habituados. Por exemplo, a equao yt = yt 1 designada por equao s
diferenas finitas homognas de primeira ordem linear. Mantemos a designao equao s diferenas finitas
ou sistema de equaes s diferenas finitas (consoante o caso) para identificar a equao yt = g (yt 1 ) :

211

yt

Linha 45

2
e

f(x)

d
a

-4

-2

yt-1

-2

-4

Figura 7-1: Grfico Teia de Aranha do PVI yt = 0:5yt 1 ; y0 = 4


fcil verificar que o nico ponto fixo
0
@

1
1

A:

Proposio 7.2.1 Seja S um intervalo fechado e g : S ! R uma funo contnua. Se


S

g (S) ento g tem um ponto fixo em S:


Dem. Nicolau (2004).
Quando m = 1 e a EDF autnoma muito til o grfico teia de aranha no estudo da

estabilidade. Para ilustrar a interpretao do grfico representa-se na figura 7-1 o grfico


teia de aranha associado equao yt = 0:5yt 1 , com valor inicial y0 = 4 (ponto a). No
momento 1 tem-se y1 = 0:5

4 = 2 (ponto b ou c). Este valor, y1 = 2; pode ser interpretado

como o valor inicial com respeito a y2 ; assim, poderamos colocar y1 = 2 no eixo das
abcissas. Em alternativa, o valor y1 parte da linha de 450 (ponto c) e o procedimento
repetido iterativamente. Assim, no momento 2 tem-se y2 = 0:5

2 = 1 (ponto e) e assim

sucessivamente. O grfico mostra que limt!1 yt = 0:


Na figura 7-2 representa-se o grfico teia de aranha da EDF yt = yt2

(o que sucede

quando o valor inicial se encontra no intervalo (1; 1) ? E no intervalo (0; 1)? E ainda no
intervalo( 1; 0)?)

212

Figura 7-2: Grfico Teia de Aranha da Aplicao f (x) = x2 (esto traadas duas rbitas
com valores inicias -1.1 e 0.9)
Seja yt = yt (y0 ) a soluo da EDF (ou do sistema de EDF) yt = g (t; yt 1 ) ; dada a
condio inicial y0 (para simplificar admite-se, sem perda de generalidade, que t0 = 0). A
expresso yt (y0 ) define a soluo como uma funo explcita da condio inicial y0 . No
caso da EDF autnomas usual considerar-se a notao yt = g t (y0 ) em lugar de yt = yt (y0 )
onde
g t (x) := g(:::g(g (x))):
| {z }
t vezes

Exemplo 7.2.3 Se g (x) =

1
;
1+x

ento

g 2 (x) = g (g (x)) = g

1
1+x

g 3 (x) = g (g (g (x))) = g g

Dada a EDF yt =

1
1+yt

1
1 ;
1 + 1+x

1
1+x

=g

1
1
1 + 1+x

1
1+

1
1
1+ 1+x

; o valor y3 dado y0 = 1
g 3 (1) =

1
1+

1
1
1+ 1+1

3
= :
5

Naturalmente, podemos obter este valor considerando o procedimento iterativo,


y1 =

1
1
= ;
1+1
2

y2 =

1
1+

1
2

2
= ;
3

y3 =

1
1+

2
3

3
= :
5

A expresso g t (y0 ) representa o valor de yt dada a condio y0 :


Definio 7.2.2 (Estabilidade - Caso g : R ! R) O ponto fixo y diz-se estvel se para cada
" > 0 existe um

(t0 ; ") tal que, para cada qualquer soluo yt (y0 ) a desigualdade
213

jy0

yj

implica jyt (y0 )

yj < " para todo o t

icamente estvel se estvel e se existe um

t0 : O ponto fixo y diz-se assimptot-

> 0 tal que a desigualdade jy0

yj

0
4

implica jyt (y0 )

yj ! 0 quando t ! 1: O ponto fixo y diz-se instvel se no estvel.

(A definio adapta-se facilmente ao caso multivariado - basta trocar j j por k k e ajustar


as notaes). Grosso modo, um ponto fixo y estvel se yt = yt (y0 ) permanecer perto de
y para todo o t sempre que y0 se encontrar perto de y: O ponto fixo y assimptoticamente
estvel se for estvel e toda a soluo inicializada perto de y converge para y:
Exemplo 7.2.4 Considere-se yt = yt

1 +c,

com c 6= 0: Tem-se g (x) = x+c. Resolvendo

g (y) = y; i.e., y + c = y conclui-se que o (nico) ponto fixo y = c= (1


caso

). No

= 1 no existe ponto fixo (a equao x + c = x impossvel, com c 6= 0). A

estabilidade do ponto fixo y pode, no caso presente, ser discutida directamente a partir g t
(na generalidade dos casos no lineares no possvel obter g t ). Tem-se, com a condio
inicial y0 ; yt = g t (y0 ) = y0
g t (y0 )
g t (y0 )
Impondo jg t (y0 )
considerar um

+ c 11

y = y0

. Assim

+c

= j jt y0

1
1
c

= j jt jy0

y0

c
1

yj :

yj < ". Se j j < 1 ento y estvel. Basta

< ": Nestas condies tem-se jg t (y0 )

yj

todo o t > 0: Se j j > 1 o termo jg t (y0 )


um

yj < " vem j jt jy0

tal que jy0

yj < " para

yj tende para 1 o que significa que no existe

> 0 nos termos da definio de ponto fixo estvel; logo y instvel. Analise-se a

estabilidade assimpttica. Tem-se para

lim g (y0 ) = lim

t!1

t!1

y0

6= 1

1
+c
1

8
<

c
1

= y se j j < 1
1

se j j > 1

Assim, se j j < 1 o ponto fixo y assimptoticamente estvel; se j j > 1; y instvel.


Exemplo 7.2.5 Retome-se o exemplo 7.2.1 (yt = 2yt

(1

yt 1 )): Vimos que os pontos

fixos so y = 0 e y = 21 . Discute-se agora a estabilidade a partir do grfico teia de aranha


- ver a figura 7-3. Esto representados trs valores iniciais. fcil concluir que qualquer
ponto que se encontre numa vizinhana do ponto fixo 1/2 (por exemplo ponto A ou B) no
4

Se a EDF autnoma leia-se g t (y0 ) em lugar de yt (y0 ) :

214

0.6

0.4

0.2
C

-0.5

-0.25

0.25

0.5

0.75

-0.2

-0.4

Figura 7-3: Grfico Teia de Aranha da equao yt = 2yt


valores iniciais).

(1

yt 1 ) (representados trs

s no se afasta de 1/2 como tambm converge para y = 1=2. Este ponto fixo portanto
assimptoticamente estvel. O ponto fixo zero instvel. Basta observar o que sucede quando
y inicializado no ponto C.
Considere-se um sistema de m equaes lineares yt = Ayt

com a condio inicial y0

e seja
r = max fj i j :

um valor prprio de A (i = 1; :::; m)g :

(7.1)

A estabilidade de um sistema de equaes lineares estabelecida na seguinte


Proposio 7.2.2 (a) Se r <

< 1 ento existe uma constante C > 0 tal que


kyt k

para t

ky0 k

0, para qualquer y0 2 R: Alm disso verifica-se limt!1 kyt k = 0:(b) Se r > 1

ento algumas solues do sistema tendem para 1. (c) Se r

1 e se a multiplicidade

algbrica de todos os valores prprios que verificam j j = 1 for igual a um ento existe uma
constante C > 0 tal que kyt k

C ky0 k para t

0:

Dem. Nicolau (2004).


Notar que se

nmero complexo ento j j = j + ij =

Resulta da proposio anterior que o ponto fixo y = 0 , assimptoticamente estvel se


r < 1; instvel se r > 1; e estvel se r

1 e se a multiplicidade algbrica de todos os


215

12
10
8
6

y1

y2
2
0
0

10

11

-2
-4

Figura 7-4: Trajectrias y1t e y2t


valores prprios que verificam j j = 1 for igual a um.
Exemplo 7.2.6 Estude-se a estabilidade do sistema
0
@
Os valores prprios so

y1t
y2t

1
i:
2

A=@

0:25

10
A@

y1t

y2t

A:

Logo r = 12 . Como r < 1 conclui-se que o ponto fixo y = 0

assimptoticamente estvel. Nas figuras seguintes analisa-se graficamente a dinmica do


sistema admitindo y0 = (10; 1)T : Na figura 7-4 apresentam-se as trajectrias y1t e y2t : A
figura 7-4 elucidativa quanto estabilidade do sistema. Em ambos os casos se observa
y1t ! 0, y2t ! 0 quanto t ! 0.
Exemplo 7.2.7 Considere-se o sistema de EDF
0

yt = @
Os valores prprios so

= cos

cos

sen

sen

i sin e jcos

cos

A yt 1 :
i sin j = jcos + i sin j =

cos2 + sin2 =

1: Como a multiplicidade algbrica de todos os valores prprios que verificam j j = 1


igual a um conclui-se que o ponto fixo y = 0 estvel.

216

7.2.2

Estabilidade de Sistemas No Lineares

Linearizao
A proposio seguinte fornece um mtodo para analisar a estabilidade assimpttica no caso
escalar (EDF autnomas).
Proposio 7.2.3 Suponha-se que g : R!R tem derivada de primeira ordem contnua num
intervalo aberto contendo o ponto fixo y: Ento (a) se jg 0 (y)j < 1; y assimptoticamente
estvel; (b) se jg 0 (y)j > 1; y instvel.
Dem. (a) Dado que, por definio,
jg (x)
x!y
jx
lim

jg (x) yj
g (y)j
= lim
= jg 0 (y)j
x!y
yj
jx yj

ento existe uma vizinhana V" (y) de raio " > 0; tal que, para jg 0 (y)j <
jg (x)

yj <

jx

yj ;

< 1;

x 2 V" (y) :

Resulta que x 2 V" (y) ) g (x) 2 V" (y) (pela desigualdade anterior, constata-se que g (x)
est mais "perto"de y do que x est de y; por um factor de ordem

< 1). imediato verificar

que g (x) 2 V" (y) ) g 2 (x) 2 V" (y) : Repetindo o argumento conclui-se g t (x) 2 V" (y) :
Logo,
g 2 (x)

y = jg (g (x))

Por induo, conclui-se jg t (x)

yj <

yj <
t

jx

jg (x)

yj. Como

yj <
t

jx

yj :

! 0 segue-se que y assimp-

toticamente estvel. (b) Utilizando argumentos idnticos conclui-se que g t (x) se afasta cada
vez mais de y medida que t ! 1:
Exemplo 7.2.8 Retome-se os exemplos 7.2.1 e 7.2.5. Com g (x) = 2x (1
2

x) tem-se g 0 (x) =

4x e, portanto, pela proposio 7.2.3, o ponto fixo 0 instvel pois jg 0 (0)j = 2 > 1 e o

ponto 1/2 assimptoticamente estvel pois jg 0 (1=2)j = 0 < 1:


Analise-se agora a estabilidade de sistemas de EDF. Uma forma de abordar a estabilidade
de sistemas de EDF consiste em linearizar g (x) em torno do ponto fixo y (o caso escalar apresentado atrs baseia-se tambm no mtodo da linearizao). Suponha-se que g (x) possui
derivadas de segunda ordem contnuas. Ento, pela frmula de Taylor vem
217

@gi (y)
gi (x) = gi (y) +
(x
@xT

1
y) + (x
2

@gi2 (z)
y)
(x
@x@xT
T

y) ;

i = 1; :::; m

ou, mais compactamente,


g (x) = g (y) + g0 (y) (x

y) + h (x)

(7.2)

Note-se que g0 (y) o Jacobiano de g no ponto y ( uma matriz de constantes). Reescreva-se


a equao (7.2) na forma
g (x) = Ax + h (x)
onde
0

B
B
A = g (y) = B
@
0

h (x) = g (y)

@g1 (y)
@x1

@g1 (y)
@xm

..
.

..

@gm (y)
@x1

1B
B
0
g (y) y + B
2@

..
.

@gm (y)
@xm

(x

C
C
C;
A

(7.3)

@g12 (z)
y)T @x@x
T

(x

y)

2 (z)
@gm
@x@xT

(x

y)

..
.

(x

y)T

1
C
C
C
A

(note-se que z varia com x). Tem-se agora:


Proposio 7.2.4 Suponha-se que g : Rm !Rm tem derivadas de segunda ordem contnuas
num conjunto aberto contendo o ponto fixo y: Dado
r = max fj i j :

um valor prprio de A (i = 1; :::; m)g

e A dada pela equao (7.3) tem-se, (a) se r < 1 ento y assimptoticamente estvel; (b)
se r > 1 ento y instvel.
Dem. Kelley e Peterson, (1991), p. 180.
Obviamente esta proposio generaliza a proposio 7.2.3.

218

Exemplo 7.2.9 Considere-se o seguinte modelo presa-predador,


y1t 1 y2t 1
1 + 0:0001y1t 1
y1t 1 y2t 1
1 + 0:00003
1 + 0:0001y1t

y1t = (1 + ) y1t
y2t = (1

0:001

) y2t

onde y1t e y2t representa, respectivamente, o nmero de presas e o nmero de predadores no


momento t;

a diferena entre a taxa de nascimento e a taxa de mortalidade das presas e


= 0:1 e = 0:01: Tem-se

a taxa de mortalidade dos predadores. Suponha-se que


0

g (x1 ; x2 ) := @

g1 (x1 ; x2 )

A=@

g2 (x1 ; x2 )

1:1x1
0:99x2 +

x1 x2
0:001 1+0:0001x
1
x1 x2
0:00003 1+0:0001x
1

A:

Os pontos fixos resultam da resoluo do sistema g (x1 ; x2 ) = (x1 ; x2 ) : Obtm-se dois


pontos fixos,

y1 = @

0
0

y2 = @

A;

344:828
103:448

A:

Estude-se a estabilidade do ponto fixo y2 ; recorrendo-se proposio 7.2.4. Para o efeito


determina-se

A = g0 (y2 ) = @

@g1 (y2 )
@x1
@gm (y2 )
@x1

@g1 (y2 )
@xm
@gm (y2 )
@xm

Depois de alguns clculos obtm-se

A=@
Os valores prprios so

1;

1:003
0:0029

= 1:00167

0:3333
1

A:

A:

0:0310466i: Donde

p
1:001672 + 0:03104662 = 1: 002;
p
0:0310466ij = 1:001672 + 0:03104662 = 1: 002;

j 1 j = j1:00167 + 0:0310466ij =
j 1 j = j1:00167

pelo que r = 1:002 > 1 e, portanto, o ponto fixo y2 instvel. A figura 7-5 ilustra o
comportamento dinmico do sistema.

219

550

450

350

y1

250

y2
150

50
-50 0

100

200

300

400

500

600

700

Figura 7-5: Trajectrias y1t e y2t (t = 0; 1; :::; 800)


Mtodo Directo de Liapunov
Veja-se agora o chamado Mtodo Directo de Liapunov. Considere-se um sistema de EDF
yt = g (yt 1 ) com a condio inicial y0 e seja y um ponto fixo de g. Considere-se uma
funo real V de m variveis nas seguintes condies: V contnua numa vizinhana V" (y) ;
V (x) > 0 se x 6= y em V" (y) e V (y) = 0. Uma funo nestas condies designa-se por
funo Liapunov. Defina-se
V (x) := V (g (x))

V (x)

em V" (y) (no confundir a funo V com a vizinhana de z de raio "; V" (z)).
Proposio 7.2.5 (Mtodo Directo de Liapunov) Seja y um ponto fixo de g e assuma-se
que g contnua numa certa vizinhana de y. Se (a)
ento a soluo y estvel; se (b)

V (x)

0 para todo o x 2 V" (y)

V (x) < 0 para todo o x 2 V" (y) e x 6= y ento a

soluo y assimptoticamente estvel; se (c)

V (x) > 0 para todo o " > 0 e x 2 V" (y) e

x 6= y ento a soluo y instvel.


Apresenta-se uma explicao heurstica do resultado (no caso escalar). Imagine-se a
funo V (x) como uma distncia entre x e y com x 2 V" (y) : Considere-se 0 <
Por hiptese y0 2 V (y) e, como, V (g (y0 ))

< ":

V (y0 ) o ponto y1 = g (y0 ) no se afasta

de y (y1 no est mais distante de y do que y0 est de y). Logo y1 2 V (y) : Seguindo o
mesmo raciocnio tem-se que V (g (y1 ))
se que yt 2 V (y)

V (y1 ) implica y2 2 V (y) : Iterando, conclui-

V" (y) : Logo a soluo y estvel. Suponha-se agora a desigual-

dade estrita V (g (x)) < V (x) : Por hiptese y0 2 V" (y) e V (g (y0 )) < V (y0 ) implica
220

jg (y0 )

yj <

plica jy2
t

jg (y0 )

jy0

yj, 0 <

yj = jg (y1 )

< 1: Por seu lado, a desigualdade V (g (y1 )) < V (y1 ) im-

yj <

jg (y0 )

yj <

jy0

yj : Iterando, conclui-se jyt

yj <

yj ! 0 quando t ! 1:

Exemplo 7.2.10 Considere-se yt = yt

yt3 1 : O nico ponto fixo y = 0: A proposio

x3 ; tem-se jg 0 (0)j = 1. Considere-se a funo

7.2.3 inconclusivo, pois com g (x) = x


V (x) = x2 : Vem
V (x) = x
no conjunto x : jxj <

x3

2x4 = x4 x2

x2 = x 6

2 <0

= Vp2 (y) : Logo o ponto fixo y = 0 assimptoticamente

estvel.
Exemplo 7.2.11 Retome-se o exemplo 7.2.7,
0

yt = @

cos

sen

sen

com ponto fixo,

Defina-se

00

V @@

y=@
x1
x2

cos

0
0

11

A yt

A:

AA = x21 + x22 :

Facilmente se verifica V (y) = 0 e V (x) > 0 para x 6= y: Tem-se


00

V (x) = V @@

x1 cos + x2 sen
x1 sen + x2 cos

11
AA

00

V @@

x1
x2

= (x1 cos + x2 sen )2 + ( x1 sen + x2 cos )2

11
AA

x21

x22

= 0:
Consequentemente o ponto fixo estvel.
Bacia do Escoadouro
Na literatura usual designar-se um ponto fixo assimptoticamente estvel como um escoadouro (sink) e um ponto fixo instvel como fonte (source). A designao escoadouro sugere
221

que o sistema dinmico inicializado numa vizinhana do escoadouro converge para o escoadouro. Utiliza-se tambm a designao bacia do escoadouro (basin of the skin) para definir
o conjunto de pontos W tal que se y0 2 W ento yt = gt (y0 ) ! y (onde y um escoadouro). Analiticamente escreve-se: W (y) = fy0 2 Rm : gt (y0 ) ! yg5 : No exemplo
7.2.5, onde g (x) = 2x (1

x) ; vimos que o ponto 1/2 um escoadouro: qualquer ponto

na vizinhana de 1/2 converge para 1/2. Uma inspeco da figura 7-3 sugere que a bacia do
escoadouro o conjunto (0; 1) ; i.e., W (1=2) = (0; 1) :
A proposio seguinte tem aplicao no caso de EDF autnomas (no lineares).
Proposio 7.2.6 Seja E = fx : jg (x)
tal que V"1 (y)

yj

jx

yj ; 0 <

< 1g : Se existe um "1 > 0

E ento
yt = g t (y0 ) ! y

para todo o y0 2 V"1 (y) :


Dem. Nicolau (2004).
A proposio 7.2.6 no fornece toda a bacia do escoadouro. Na figura 7-6 a funo g (x) ;
com ponto fixo y = 1; est definida na regio V para x < 1 e na regio III para x > 1. Apenas
os pontos x pertencentes ao intervalo (A; 1) verificam jg (x)

yj < jx

yj : Concretamente,

E = fx : jg (x)

yj < jx

V" (y) = V" (1)

E e, portanto, a proposio 7.2.6 no aplicvel. Tambm a proposio

yj ; 0 <

< 1g = (A; 1) mas no existe um " > 0 tal que

7.2.3 no aplicvel, pois jg 0 (1)j = 1 (admitindo que g 0 (x) existe numa vizinhana de
1). Verifica-se, no entanto, por simples inspeco grfica, que o sistema dinmico definido
por g (x) converge para y = 1 se o valor inicial pertencer a (A; 1) : Alm disso, qualquer
ponto do intervalo (1; B) tem como aplicao um ponto de (A; 1) : Ou seja, embora no se
verifique jg (x)

yj < jx

onde aqui se tem jg (x)

yj quando x 2 (1; B) ; os ponto de (1; B) movem-se para (A; 1)


yj < jx

yj para x 2 (A; 1) : Assim, a bacia do escoadouro

(A; 1) [ (1; B) [ f1g = (A; B) :


A discusso precedente sugere uma forma de se determinar a bacia do escoadouro.
Suponha-se que E1 um conjunto de pontos y0 tais que gt (y0 ) ! y e y0 2 E1 (este
conjunto pode determinar-se atravs da proposio 7.2.6). Num segundo passo determina-se
o conjunto E2 = fx : g (x) 2 E1 g e, por recorrncia, Ei+1 = fx : g (x) 2 Ei g : Se em dado
momento Ek+1 = Ek ento a bacia do escoadouro dado pela unio dos conjuntos Ei0 s.
5

No caso no autnomo deve ler-se W (y) = fy0 2 Rn : yt (y0 ) ! yg :

222

2.5

VI

1.5

II

0.5
A
0.5

-0.5

IV

III
1

B
1.5

f(x)

2.5

-0.5

Figura 7-6: Bacia do Escoadouro


x3 ) =2 (figura 7-7). Os pontos fixos so 1; 0; 1:
p
Analise-se o ponto 1: fcil verificar que E1 = (0; b) = 0; 1=2 1 + 17
W (1) (a
Exemplo 7.2.12 Considere-se g (x) = (3x

proposio 7.2.6 aplicvel: numa vizinhana do ponto 1, a funo g (x) encontra-se nas
regies II e V; no entanto, a proposio fornece um primeiro conjunto contido em E1 ). Temse agora
E2 = fx : g (x) 2 E1 g = fx : 0 < g (x) < bg = (e; c) [ (b; d)
onde e =

2; 11569; c =

3; d =

W (1)

3: Este procedimento pode ser continuado com

E3 = fx : g (x) 2 E2 g, E4 ; etc.
Exemplo 7.2.13 Considere-se g (x) = tan x;

=2 < x < =2: O ponto fixo y = 0 (pois

g (0) = 0). Na figura 7-8 verifica-se que a funo g (x) no se encontra nem na regio II
nem na regio V (neste caso concreto, qualquer que seja o valor inicial, o sistema dinmico
afasta-se cada vez mais de y = 0). Assim, y = 0 no escoadouro.
Exemplo 7.2.14 Considere-se g (x) = 3x (1

x) : Verifica-se que os pontos fixo so 0 e

2=3. Na figura 7-9 analisa-se o ponto fixo 2=3 (tendo-se representado para o efeito as
curvas x e

x + 2y =

x + 4=3). A proposio 7.2.3 no esclarece a natureza do ponto

fixo y = 2=3 pois jg 0 (2=3)j = 1: Tambm a proposio 7.2.6 no aplicvel pois embora
E = fx : jg (x)

2=3j < jx

2=3jg = (0; 2=3) no existe um " > 0 tal que V" (2=3)

E: Tambm no se pode concluir imediatamente que o intervalo (0; 2=3) pertence bacia
223

VI

V
II

a e c

b
d

III
IV

Figura 7-7: Bacia do Escoadouro da Aplicao f (x) = (3x

1.5

VI
1
0.5

V
-1

II
-0.5

0.5
-0.5
-1

III

IV

-1.5

Figura 7-8: g (x) = tg x

224

x3 ) =2

1.5

VI
1

V
II
0.5

IV
0.2

0.4

III

0.6

0.8

-0.5

Figura 7-9: g (x) = 3x (1

Figura 7-10: Trajectria de yt = 3yt

(1

x)

yt 1 ), y0 = 0:5 (t = 1; :::; 50)

do escoadouro (verifique-se isso atravs de inspeco grfica). Este exemplo mostra as


limitaes das proposies 7.2.3 e 7.2.6. Pode-se provar que o ponto 2=3 no de facto
um escoadouro6 (i.e. um ponto fixo assimptoticamente estvel) pelo que no h lugar
determinao da bacia do escoadouro. Na figura representa-se a trajectria yt com t =
1; :::; 50:
Um resultado que ultrapassa, em certas circunstncias, as limitaes apontadas s proposies
7.2.3 e 7.2.6 e, alm disso, directamente aplicvel a sistemas de equaes s diferenas
consiste no seguinte.
6

Prova-se que no existe um " > 0 tal que f (2=3

")

225

2=3 > 2=3

f 2 (2=3

") :

Proposio 7.2.7 Admitam-se as condies da proposio 7.2.5 e suponha-se

V (x) < 0

para todo o x 2 V" (y) e x 6= y. Se y0 2 V" (y) ento gt (y0 ) ! y quando t ! 1:


Logo V" (y)

W (y) :

Exemplo 7.2.15 Considere-se


y1t = y2t

y2t

2
y1t

2
+ y2t

y2t = y1t

y1t

2
y1t

2
+ y2t

Estude-se a estabilidade do ponto fixo y = (0; 0)T e determine-se a respectiva bacia do


escoadouro. Para o efeito tome-se a funo V (x1 ; x2 ) = x21 + x22 : Vem
V (x) =

x2

x2 x21 + x22

x1 x21 + x22

+ x1

x21 + x22

= :::
x21 + x22

2 + x21 + x22

< 0
n
p
p o
no conjunto (x1 ; x2 ) : x21 + x22 < 2 = Vp2 (y)

Exemplo 7.2.16 Retome-se o exemplo 7.2.10, yt = yt

W (y) :
yt3 1 : Resulta bvio que Vp2 (y)

W (y) :
Exemplo 7.2.17 Retome-se o exemplo 7.2.12, yt = 3yt

yt2

=2: Analise-se a bacia

do escoadouro do ponto y = 1 e, para o efeito, considere-se V (x) = (x


V (x) =

3x

9 2
x
4
1
=
(x
4
=

A funo
fx : jx

x2 =2 1
(x
3 3 1 4
x
x + x
2
4
4) (x

1)2 : Tem-se

1)2

1)2 x:

V (x) est representada na figura 7-11, a qual permite concluir que V1 (1) =
1j < 1g

W (1) : No exemplo 7.2.12 foi-se um pouco mais longe. De facto,

observou-se que V1 (1)

W (1).

A terminar esta seco mostra-se que se um ponto pertence a uma certa bacia de escoadouro ento esse ponto no pode pertencer a outra bacia de escoadouro. Assim;
226

0
-0.5

0.0

0.5

1.0

1.5

2.0

2.5

3.0

3.5

4.0

-1

-2

-3

-4

Figura 7-11: Grfico da funo

V (x) = 14 (x

4) (x

1)2 x

Proposio 7.2.8 Se y1 e y2 so escoadouros e y1 6= y2 ento W (y1 ) \ W (y2 ) = ;:


Dem. Mostra-se que W (y1 ) \ W (y2 ) 6= ; ) y1 = y2 : Seja y0 2 W (y1 ) \ W (y2 ) :
Ento para cada " > 0 existe um n1 2 N tal que t
existe um n2 2 N tal que t

n2 implica kgt (y0 )

n1 implica kgt (y0 )

y1 k < "=2 e

y2 k < "=2: Logo as duas desigual-

dades verificam-se simultaneamente para o maior dos n0 s; i.e. definindo n3 = max fn1 ; n2 g
tem-se que t

n3 implica kgt (y0 )

desigualdade triangular para t


ky1

y1 k < "=2 e kgt (y0 )

y2 k < "=2: Utilizando a

n3 vem

y2 k =

y1

gt (y0 )

y2

y1 gt (y0 ) + y2
" "
<
+ = ":
2 2

gt (y0 )
gt (y0 )

Como a distncia entre y1 e y2 menor do que " para cada " > 0; dever ter-se y1 = y2 :

7.2.3

Pontos Peridicos

Definies
Definio 7.2.3 Um vector p 2 Rm um ponto peridico de perodo k se
gk (p) = p

(7.4)

e k o menor inteiro positivo tal que (7.4) se verifica (i.e., gs (p) 6= p para s = 1; 2; :::; k
1). A rbita de valor inicial p diz-se uma rbita peridica de perodo k:

227

Note-se que se p um ponto peridico de perodo 2 ento p um ponto fixo de g2 : O


recproco no verdade. Por exemplo, um ponto fixo de g2 pode ser tambm um ponto fixo
de g e, neste caso, de acordo com a definio, este ponto tem perodo 1:
Considere-se uma rbita de valor inicial p; i.e., fp; g (p) ; g2 (p) ; :::g : Se p um ponto
peridico de perodo 3, p deve repetir-se de trs em trs iteraes. Por exemplo, fp; g (p) ; g2 (p) ; p; :::g :

Mas g (p) e g2 (p) tambm se repetem de trs em trs iteraes, f::; p; g (p) ; g 2 (p) ; p; g (p) ; g 2 (p) ; p:::g :
Neste exemplo, suficiente identificar a rbita de perodo 3 atravs dos trs elementos
fp; g (p) ; g 2 (p)g (se p ponto fixo de g e, portanto, ponto peridico de perodo 1, ento a rbita peridica de perodo 1 constituda apenas pelo elemento fpg). Naturalmente,
b = g (p) e c = g 2 (p) so tambm pontos peridicos de perodo 3. A proposio seguinte
estabelece este resultado.
Proposio 7.2.9 Seja p um ponto peridico de g de perodo k: Ento
g (p) ; g2 (p) ; :::; gk

(p)

so tambm pontos peridicos de perodo k:


Dem. Considere-se um ponto genrico do conjunto g (p) ; g2 (p) ; :::; gk
gi (p) ; com i = 1; 2; :::; k

(p) , pi =

1: Mostra-se em primeiro lugar que pi no um ponto fixo de

gs com s < k; caso contrrio pi no poderia ser candidato a ponto peridico de perodo k
(definio 7.2.3): Suponha-se no entanto que pi ponto fixo de gs : Viria
gs (pi ) = pi , gs gi (p) = gi (p) , gs+i (p) = gi (p)
o que significa que p repete de s em s iteraes, ou seja que p ponto fixo de gs : Esta
concluso contradiz a hiptese de p ser ponto peridico de perodo k > s (i.e., a primeira
vez que p se repete aps k iteraes). Basta agora ver que pi = gi (p) ponto fixo de gk :
Vem
gk (pi ) = gk gi (p) = gi gk (p) = gi (p) = pi :
Exemplo 7.2.18 Considere-se a equao yt = ayt
ax (1

(1

yt 1 ) : Tem-se portanto g (x) =

x) : Investigue-se se existem pontos peridicos de perodo 2. Determine-se g 2 (x)


g 2 (x) = g (g (x)) = a (g (x)) (1

g (x)) = a (ax (1
228

x)) (1

ax (1

x)) :

Poderamos tambm obter g 2 (x) considerando


yt = ayt

(1

= a (ayt

yt 1 )
(1

yt 2 )) (1

o que permitiria deduzir g 2 (x) = a (ax (1

x)) (1

(ayt

(1

ax (1

yt 2 )))
x)) : Para determinar eventu-

ais pontos peridicos resolve-se a equao g 2 (x) = x em ordem a x: Factorizando g 2 (x) x


obtm-se
x (1

a + a x) 1 + a

ax

a2 x + a2 x2 = 0

pelo que se conclui que os pontos fixos de g 2 so

x1 = 0; x2 =
x4 =

1
2

+ 21 a

1
+ 1a +
1+a
; x3 = 2 2
a
p
1
( 3 2a + a2 )
2
:
a

1
2

( 3
a

2a + a2 )

(7.5)
(7.6)

Estes valores sero pontos peridicos de perodo 2 se no forem pontos fixos de g. Ora
resolvendo
g (x) = x
sai y = 0 e y =

1+a
:
a

Retome-se os pontos fixos apresentados em (7.5) e (7.6). Conclui-se

que os pontos 0 e ( 1 + a) =a no so pontos peridicos de perodo 2 pois eles so pontos


fixos de g (e, portanto so pontos peridicos de perodo 1). Relativamente a x3 conclui-se
que
1
2

+ 12 a +

1
2

p
( 3
a

se a = 1; e
1
2

se a =

+ 12 a +

1
2

2a + a2 )

p
( 3
a

2a + a2 )

1+a
a

=0

1: Logo x3 ponto peridico de perodo 2 se a 6= 1 e a 6=

1: Seguindo o

mesmo raciocnio conclui-se que x4 ponto peridico de perodo 2 se a 6= 3 e a 6=


Para concretizar suponha-se que a = 3:3: Tem-se y = 0, y =

1+a
a

1:

= : 696 97; x3 = :

823 6 e x4 = : 479 43: Na figura 7-12 evidente que f0: 823 6; 0:47943g forma uma rbita
de perodo 2.
Outra forma (embora pouco eficiente) de confirmarmos as concluses emergentes da
figura 7-12 consiste em se calcular iterativamente a trajectria y: A tabela seguinte fornece
229

y
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2

0.1
0
1

15

22

29

Figura 7-12: Trajectria de yt = 3:3yt

(1

36

43

yt 1 ) ; y0 = 0:1

t:
0
1
2
3
4
5
6
7
8
9
10
11
12
13
yt: 0.1000 0.2970 0.6890 0.7071 0.6835 0.7139 0.6740 0.7251 0.6577 0.7429 0.6303 0.7690 0.5863 0.8004
t:
14
15
16
17
18
19
20
21
22
23
24
25
26
27
yt: 0.5271 0.8226 0.4816 0.8239 0.4788 0.8235 0.4796 0.8236 0.4794 0.8236 0.4794 0.8236 0.4794 0.8236
t:
28
29
30
31
32
33
34
35
36
37
38
39
40
41
yt: 0.4794 0.8236 0.4794 0.8236 0.4794 0.8236 0.4794 0.8236 0.4794 0.8236 0.4794 0.8236 0.4794 0.8236

Figura 7-13: Sucesso yt = 3:3yt

(1

yt 1 ) ; y0 = 0:1; t = 1; :::; 41

os valores de yt ao longo do tempo, com y0 = 0:1: bvio, a partir de certo valor de t


(digamos, a partir de t = 20) yt repete os valores .8236 e .4794 de duas em duas iteraes.
tambm interessante confirmarmos que :823 6 e :47943 so pontos peridico de perodo
2 a partir do grfico teia de aranha, figura 7-14.
Exemplo 7.2.19 Retome-se o exemplo 7.2.2. Tem-se
0 00

x1

0 0 00

x1

g2 (x) = g @g @@

x2

111

00

AAA = g @@

x2
x2
x1

11

AA = @

x2
x1
x2
x1

x2

A=@

x2
x1
1
x1

1
A

g3 (x) = g @g @g @@

x2

1111

00

AAAA = g @@

x2
x1
1
x1

11

AA = @

1
x1
1
x1
x2
x1

1
x1

A=@

1
x2

A:

Deixa-se como exrcito verificar que no existem ponto peridicos de perodo 2 e existem
trs pontos peridicos de perodo 3.
Um modelo que pode gerar pontos peridico o modelo linear por troos (ou, simplesmente, modelo limiar). Assume-se um comportamento diferenciado do sistema dinmico
consoante o estado do sistema no momento t

1; concretamente, consoante yt

230

se encontre

0.8
0.6
0.4
0.2

-0.5

-0.25

0.25

0.5

0.75

-0.2
-0.4

Figura 7-14: Grfico Teia de Aranha da equao yt = 3:3yt

(1

yt 1 )

abaixo ou acima de certo limiar : No caso mais simples o modelo corresponde a


8
< c +
1
yt =
: c +
2

1 yt 1 ;

yt

2 yt 1 ;

yt

<
:

A funo g (x) pode no ser contnua (no limiar ), como o exemplo precedente mostra.
O modelo seguinte, com c1 =

yt =

A funo g (x) portanto

8
<

1)

+ c2 ; define uma funo contnua no ponto :

1)

+ c2 +

: c +
2

g (x) =

Logo g ( ) = c2 +

8
<

2 yt 1 ;

1)

: c +
2

e limx" g (x) =

+ c2 +

1)

+ c2 +

c2 +

2x

1x

yt

yt

1 x;

1 ) + c2

= c2 +

2:

Podemos ainda

fazendo
2

= x; Soluo: x =

c2

= x; Soluo: x =
2

231

<

x<

2 x;

exigir a existncia de um ponto fixo no ponto

1 yt 1 ;

c2

e, agora resolvendo,

2+
1

g (x) =

ou

c2

8
<

Veja-se que

2)

8
<
:

1)

(1

g (x) =

c2
2

, sai c2 =

+ (1

(1
2)

2) :

1 x;

x<

2 x;

(1

1)

1 x;

x<

(1

2)

2 x;

g( ) =

(1

Assim, tem-se

2)

e
lim g (x) =
x"

(1

1)

= :

Estabilidade dos Pontos Peridicos


Tal como no caso dos pontos fixos de g; pontos peridicos podem ser estveis ou instveis.
Intuitivamente, um ponto peridico de perodo k estvel se qualquer trajectria iniciada
numa vizinhana desse ponto no se afasta desse ponto de k em k iteraes, para todo o t (da
mesma forma se interpreta ponto peridico assimptoticamente estvel e instvel). O facto
essencial que um ponto peridico de g de perodo k um ponto fixo de gk : Desta forma,
a definio de estabilidade para pontos peridicos pode basear-se na definio 7.2.2, sendo
que agora dever ler-se gk em lugar de g (gt dever ler-se gkt ). Em geral so aplicveis as
proposies precedentes, desde que se procedam s necessrias adaptaes. Por exemplo, a
proposio 7.2.3 estabelece que y assimptoticamente estvel se jg 0 (y)j < 1 e instvel no
caso contrrio. Se as condies da proposio 7.2.3 se aplicarem, e fazendo h (x) = g k (x) ;
podemos estabelecer que o ponto peridico p de perodo k assimptoticamente estvel se
jh0 (p)j < 1 e instvel no caso contrrio.
Vimos na proposio 7.2.9 que, se p ponto peridico de perodo k ento a aplicao
g admite adicionalmente k

1 pontos peridicos. Se p exibe uma certa caracterstica qual-

itativa que concluses podemos tirar para os demais pontos peridicos? A proposio e a
demonstrao seguintes mostra que todos os pontos peridicos partilham das mesmas propriedades qualitativas. Desta forma pode-se falar de rbitas peridicas estveis e instveis
(em alternativa a pontos peridicos estveis e instveis).

232

Proposio 7.2.10 Seja g uma aplicao de classe C 1 em R e seja fp1 ; p2 ; :::; pk g uma rbita
peridica de perodo k: Ento fp1 ; :::; pk g assimptoticamente estvel (escoadouro) se
jg 0 (pk ) :::g 0 (p1 )j < 1
e instvel (fonte) se
jg 0 (pk ) :::g 0 (p1 )j > 1:
Dem. Nicolau (2004).
Pode-se provar que se pi um ponto peridico assimptoticamente estvel (instvel) da
rbita fp1 ; :::pk g ento pj tambm um ponto peridico assimptoticamente estvel (instvel).
Exemplo 7.2.20 Considere-se a EDF yt = 3:5x (1

x) : Utilizando-se um programa de

Matemtica obtiveram-se os seguintes resultados:

Pontos Fixos de g k (os pontos peridicos esto em negrito)

f0; 0:714286g

f0; 0:714286; 0:428571; 0:857143g

f0; 0:714286g

f0; 0:714286; 0:428571; 0:857143; 0:38282; 0:500884; 0:826941; 0:874997g

Analisa-se agora a estabilidade dos pontos peridicos na tabela seguinte.

Anlise da Estabilidade dos Pontos Peridicos (proposio 7.2.10)


jg 0 (0)j = 3:5;

jg 0 (0; 0:714286)j = 1:5

g 0 (0:428571) g 0 (0:857143)0 = 1:25

2
3
4

jg 0 (0:38282) g 0 (0:500884) g 0 (0:826941) g 0 (0:874997)j = 0:03

Os resultados apresentados na tabela anterior podem tambm ser obtidos da seguinte


forma
0

g 2 (0:428571)
g 4 (0:38282)

g 4 (0:500884)

=
=

g 2 (0:857143)
g 4 (0:826941)

233

= 1:25
=

g 4 (0:874997)

= 0:03:

f
1

0.8

0.6

0.4

0.2

0.2

0.4

0.6

0.8

Figura 7-15: Grfico Teia de Aranha da equao yt = 3:5yt

(1

yt 1 )

Naturalmente esta segunda alternativa bastante mais trabalhosa. Conclui-se que todos os
pontos peridicos de perodo k = 4 so assimptoticamente estveis; todos os outros pontos
em anlise so instveis. O grfico 7-15 permite identificar um comportamento peridico
de perodo k = 4:
Tem interesse ainda observar o grfico teia de aranha do modelo g 4 (x) - ver figura 7-16.
Observe-se (talvez com alguma dificuldade) que a funo g 4 corta o eixo de 45o oito vezes
(considerando tambm o ponto zero). Este facto corrobora a primeira tabela deste exemplo
(ltima linha).

7.3
7.3.1

Modelo Limiar Autoregressivo (Threshold AR - TAR)


Introduo

Como argumentmos na introduo deste captulo, uma classe importante de processos no


lineares na mdia baseia-se na ideia de regime-switching. Nesta seco apresentam-se vrios
modelos onde a mudana de regime depende de uma varivel observvel. Provavelmente o
modelo mais conhecido desta famlia (onde os regimes dependem de variveis observveis)
o modelo Threshold AR ou TAR. Para exemplificar, considere-se um modelo TAR com

234

1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1.0

Figura 7-16: Grfico Teia de Aranha do Modelo g 4 (x)


dois regimes
yt =
onde

8
<
:

10

20 +

11 yt 1
21 yt

1 + ut qt

o valor do limiar (threshold values), qt

No caso especial em que qt

= yt

+ ut qt

<

>

(7.7)

a varivel limiar e d > 0 um inteiro.

o modelo (7.7) designa-se por Self-Exciting TAR ou

SETAR ( o prprio processo y que determina a mudana de regime).


A ideia principal do modelo pode ser exposta da seguinte forma. Se certo fenmeno y
no linear na mdia, ento incorrecto assumir que y se comporta linearmente em todo o
seu domnio. A soluo que est implcita no modelo TAR consiste em assumir linearizaes
diferenciadas, consoante o valor de y: Em lugar de se ter uma aproximao linear global, tmse vrias linearizaes em sub-intervalos do espao de estados7 . Por exemplo, no modelo
(7.7), com qt

= yt 1 ; pode admitir-se que a representao linear

boa aproximao para o comportamento de yt quando yt

10

11 yt 1

+ ut uma

< : Todavia, quando yt

sai do

intervalo ( 1; ) ; yt passa a ser melhor caracterizado pelo segundo ramo da especificao


(7.7).
7

A este respeito a frmula de Taylor instrutiva. Suponha-se que f : R ! R possui derivada contnua
2
de primeira ordem. Pela frmula de Taylor tem-se f (x) = f (a) + f 0 (a) (x a) + O jx aj : Esta

frmula diz-nos que f (x) pode ser arbitrariamente bem aproximada atravs da expresso linear (em x) f (a) +
f 0 (a) (x a). Note-se que a; f (a) e f 0 (a) so constantes e o erro envolvido na aproximao de ordem
2
jx aj : Se procuramos aproximar f (x) quando x se afasta de a a aproximao piora significativamente,
tendo em conta o erro envolvido O jx

aj

. Assim, podemos usar a frmula de Taylor na forma linear,

repetidamente, para vrios valores de a; e assim obter boas aproximaes de f em todo o seu domnio. este
o princpio que est subjacente ao modelo TAR.

235

Outra interpretao do TAR sugerida pela seguinte representao equivalente de (7.7):


10 Ifqt

yt =
+
=
=

20 Ifqt
10 Ifqt

d>

+
{z

11 Ifqt

21 Ifqt

20 Ifqt

(qt d ) +

(qt d ) yt

d>

d>

0 (yt 1 )

g yt 1

g yt 1

+ ut :

+ ut :
11 Ifqt

+
{z

21 Ifqt

d>

1 (yt 1 )

yt
}

+ ut

Observa-se, assim, que o modelo TAR pode ser interpretado como um processo AR de coeficientes aleatrios com dependncia em qt d :

7.3.2

Solues Peridicas

Considere-se o processo linear, yt = c + yt

+ ut ; j j < 1: Recorde-se que o esqueleto

da equao estocstica a correspondente equao determinstica com ut

0; i.e., y~t =

c + y~t 1 : De acordo com a definio 7.2.1, o ponto fixo da equao yt = g (yt 1 ) o valor
y tal que g (y) = y: No caso linear, g (x) = c + x; a soluo de g (y) = y y = c= (1

):

Recorda-se que se y~t for inicializado no ponto fixo, y~t permanece no valor do ponto fixo
para todo o t . Com efeito, se yt
nula, i.e.,

yt = yt

yt

= y e y um ponto fixo, a variao da soluo,

= g (yt 1 )

yt

=y

yt ;

y = 0: Se a soluo no inicializada

numa vizinhana do ponto fixo, mas j j < 1, ento y~t tender para y; quando t ! 1.
Quando a equao linear (de primeira ordem) existe apenas o ponto fixo y = c= (1

),

que poder ser ou no assimptoticamente estvel (dependendo do valor de ). Uma das


caractersticas dos processos no lineares o de admitirem esqueletos com vrios pontos
fixos e com periodicidade superior a um. Esta possibilidade permite modelar dados que
exibam solues peridicas estveis.
Para concretizar considere-se o exemplo:
8
< 1 + 0:5y + u
t 1
t
yt =
: 1 0:5y + u
t 1

O esqueleto da equao

8
< 1 + 0:5~
yt 1 ;
yt
y~t =
: 1 0:5~
yt 1 ; y t
236

yt

yt

<0

(7.8)

0:

<0

(7.9)

-4

-2

yt = 1 + 0.5 yt 1

yt = 1 0.5 yt 1

-2

-4

Figura 7-17: Grfico Teia de Aranha do modelo (7.9). Os valores 0.4 e -1.2 so pontos
peridicos de perodo 2
y

6
5
4
3
2

1
0
-1
-2
-3
-4
1

11

16

21

26

31

Figura 7-18: Trajectria de (7.10) com y0 = 5


e a funo g (x) representa-se na forma
8
< 1 + 0:5x x < 0
g (x) =
: 1 0:5x x 0:

(7.10)

As figuras 7-17 e 7-18 mostram que os valores 0.4 e -1.2 so pontos peridicos8 de perodo
2. Estes pontos so assimptoticamente estveis. Qualquer que seja o valor de inicializao,
a soluo y~t atrada para a rbita f0:4; 1:2g :
No faz sentido falar-se em solues peridicas do modelo estocstico definido em (7.8).
8

possvel obter estes pontos resolvendo g (g (x)) = x em ordem a x:

237

Figura 7-19: Grfico dos pares (yt 1 ; yt ) aps se ter gerado uma trajectria do processo 7.8
(traam-se tambm as rectas 1 + :5x e 1 0:5x)
A componente estocstica impede, de facto, que yt possa oscilar entre os pontos 0.4 e -1.2.
Todavia, o comportamento peridico subjacente ao esqueleto est parcialmente presente no
modelo estocstico, tal como mostra a figura 7-19, onde se apresenta o grfico scatter (i.e. o
grfico dos pares (yt 1 ; yt )) depois de se ter simulado uma trajectria.
Como o processo EE (veja-se o exemplo 4.5.9), pode tambm indagar-se que tipo
de distribuio estacionria define o processo. A expresso analtica desta distribuio
desconhecida, mas pode estimar-se de vrias formas. Provavelmente o procedimento mais
simples consiste em gerar uma trajectria suficientemente longa e, depois de se desprezarem
os primeiros valores9 (digamos os primeiros 10), estima-se a funo de densidade marginal
f (x) atravs do estimador
n

S
1 X
f^ (x) =
K
nS h i=1

yi
h

(7.11)

onde h a bandwidth, nS o nmero de observaes simuladas usadas na estimao e K


, por exemplo, o Kernel (ou ncleo) Gaussiano (para uma discusso alargada do estimador
p
f^ ver o ponto 10.2). Sob certas condies sabe-se que f^ (x) ! f (x) onde f no mais

do que a densidade estacionria. Naturalmente, necessrio considerar vrios valores de


9

A justificao: o valor incial y0 ; a partir da qual gerada a trajectria, no obtido em condies estacionrias porque estas so desconhecidas.

238

Figura 7-20: Densidade Estacionria de 7.8 estimada a partir de 50000 observaes simuladas.
x na expresso (7.11) para se ter uma ideia do comportamento de f no espao de estados
da varivel. Como ns est sob nosso controle, a funo f pode ser estimada de forma arbitrariamente precisa. Na figura 7-20 apresenta-se a densidade estacionria estimadaf^ (x) :
A existncia de duas modas acaba por no surpreender tendo em conta a estrutura do esqueleto (recorde-se a existncia de dois pontos peridicos). J a assimetria da distribuio
no clara (pelo menos primeira vista). A probabilidade de y se encontrar abaixo de zero
P
b (y) = 0:333: O grfico teia de aranha talvez possa
cerca de 0.562 ('
Ifyt 0g =n) e E
explicar estes valores. Observe-se que na estrutura determinstica, um valor negativo inferior
a

2 seguido por outro valor negativo, enquanto um valor positivo passa imediatamente

a negativo. Este facto explica por que razo a probabilidade de y se encontrar abaixo de
zero superior a 0.5 e, de certa forma, tambm explica a existncia de uma mdia marginal
negativa.

239

7.3.3

Estacionaridade

A estacionaridade estrita pode ser analisada no contexto das proposies apresentadas no


ponto 4.5. Por exemplo, no modelo mais geral

yt =

se a condio max1

8
>
>
>
<
>
>
>
:

i k

10

11 yt 1

+ ::: +

1p yt p

+ ut yt

:::

<

>

:::

k0

k1 yt 1

Pp

ji

j=1

+ ::: +

kp yt p

+ ut y t

< 1 se verificar, ento o processo EE, atendendo

proposio 4.5.4. Esta condio apenas suficiente, mas no necessria. Como tal,
pode ser demasiado exigente. Para certos modelos particulares so conhecidas as condies
necessrias e suficientes. o caso do modelo

yt =

8
>
>
c +
>
< 1

c2 +
>
>
>
: c +
3

1 yt 1

+ ut

2 yt 1

+ ut

3 yt 1

+ ut

yt

yt

yt

<

>

(7.12)

Proposio 7.3.1 O processo fyt g definido pelo sistema (7.12) EE sse qualquer uma das
seguintes condies se verificar:
(i)

< 1;

(ii)

= 1;

< 1;

1 3

< 1;

< 1; c1 > 0;

(iii)

< 1;

= 1; c3 < 0;

(iv)

= 1;

= 1; c3 < 0 < c1 ;

(v)

1 3

= 1;

< 1; c1 +

3 c1

> 0;

O resultado apresentado no envolve qualquer restrio sobre o regime 2. Mesmo no


caso de k regimes AR(1), o teorema acima continua a aplicar-se (neste caso o regime 3
encarado como o ltimo regime).

240

7.3.4

Exemplo (Bounded Random Walk)

Um caso muito interessante o seguinte:


8
>
>
c + 1 yt 1 + ut
>
< 1
yt =
c2 + yt 1 + ut
>
>
>
: c + y +u
3 t 1

yt

yt

yt

<

>

(7.13)

2
2

Assuma-se j 1 j < 1 e j 3 j < 1: Observe-se que o processo no regime 2 integrado de ordem


1; i.e., exibe o comportamento de um random walk. No entanto y EE, pela proposio
7.3.1.
Se P (

yt

2)

uma probabilidade alta, ento durante a maior parte do tempo

y comporta-se como um random walk. Sempre que os limiares

ou

so atingidos o

processo passa a exibir reverso para uma certa mdia e, deste modo, y globalmente estacionrio e, portanto, limitado em probabilidade (ou contrrio do random walk). Na figura
7-21 apresenta-se uma trajectria simulada a partir do processo
8
>
>
0:9yt 1 + ut
>
<
yt =
y t 1 + ut
>
>
>
: 0:9y + u
t 1

yt
3

<

yt
yt

3
1

(7.14)

>3

onde fut g uma sucesso de v.a. i.i.d. com distribuio N (0; 0:22 ) :
Processos do tipo (7.14) confundem-se facilmente com passeios aleatrios. Por esta
razo, o teste Dickey-Fuller tende a no rejeitar a hiptese nula de raiz unitria quando a
alternativa um processo estacionrio do tipo (7.14); por outras palavras, o teste DickeyFuller pouco potente contra alternativas do tipo (7.14). No contexto do modelo (7.13),
pode mostrar-se que a potncia do teste Dickey-Fuller diminui quando
ou

1;

7.3.5

baixo e

alto

< 1 so altos ou Var (ut ) baixa.

Estimao

Considere-se, sem perda de generalidade, o modelo com dois regimes:

yt =

8
<
:

10

20 +

11 yt 1

+ ::: +

1p yt p

+ ut qt

21 yt

+ ::: +

2p yt

+ ut qt

241

(7.15)
>

Figura 7-21: Trajectria Simulada a partir do Processo (7.14)


2

onde se assume que fut g um rudo branco com Var (ut ) =


dos so d; ;

0
1

0
2

onde

i0

: Os parmetros desconheci0

:::

i1

ip

. Reescreva-se (7.15)

na forma
yt =

10

+
20

11 yt 1

+ ::: +

21 yt 1

1p yt p

+ ::: +

Ifqt

2p yt p

Ifqt

g
d>

+ ut :

Seja x0t = (1; yt 1 ; :::; yt p ) : Observe-se que cada um dos ramos pode escrever-se como

10

11 yt 1

+ ::: +

1p yt p

Ifqt

=
|

= x0t
20

21 yt 1

+ ::: +

2p yt p

Ifqt

d>

=
=

242

x0t

1 yt

::: yt
{z

x0t

1 Ifqt

1 yt

::: yt
{z
xt

2 Ifqt

d>

g:

}
}

1 Ifqt

2 Ifqt

d>

Assim, (7.15) pode ainda escrever-se na forma


yt = x0t
=

ou ainda, com xt ( )0 =

1 Ifqt

x0t Ifqt

x0t Ifqt

2 Ifqt

d>

x0t IIfq

t d>

x0t IIfq

+ x0t

t d>

yt = xt ( )0

+ ut
1
0

1
2

A + ut

+ ut :

Se fut g um rudo branco Gaussiano ento


yt j Ft

N xt ( )0 ;

e o mtodo da mxima verosimilhana equivalente ao mtodo dos mnimos quadrados


condicionados. Assim, o estimador para ; dado ;
^ ( ) = X ( )0 X ( )

X( )y

(7.16)

onde X ( ) a matriz das variveis explicativas endgenas desfasadas (dado ), tendo


por linha genrica o vector-linha xt ( )0 e y o vector das observaes fyt g : Claro que o
estimador ^ ( ) depende de ; que desconhecido. Como estimar ? Seja

^2 ( ) =

Pn

t=1

yt

xt ( )0 ^ ( )

a soma dos quadrados dos resduos. Supondo d conhecido, toma-se para estimativa de

valor que minimiza ^ 2 ( ) ; i.e.,


^ = arg min ^ 2 ( ) :
2

O conjunto

o espao do parmetro

(todos os valores que

= R: Como a derivada de ^ 2 ( ) em ordem a

(7.17)
pode assumir). Claramente

no est definida, o problema de esti-

mao (7.17) no standard. Uma forma expedita de obter a sua soluo consiste em fazer
percorrer

no conjunto

e, depois, seleccionar o valor que minimiza ^ 2 ( ) : Felizmente, a

243

relativamente pequena. Sejam y(1) ; y(2) ; :::; y(n) so

escolha dos valores relevantes para


as estatstica de ordem tais que
y(1)
Como ^ 2 ( ) no se altera quando

y(2)

:::

y(n) :

varia entre duas estatsticas de ordem, o problema de

optimizao (7.17) equivalente a


~ = y(1) ; :::; y(n)

^ = arg min ^ 2 ( ) ;
2~

(7.18)

no conjunto ~ e seleccionar, depois aquele que mini-

ou seja, para obter ^ basta percorrer

miza ^ 2 ( ). Na prtica, impe-se que cada regime possua pelo menos uma certa fraco
de observaes (efectivamente, no faz sentido, tomar ^ = y(1) ou ^ = y(n) ). Assim, deve
restringir-se o conjunto ~ ; passando a ser y((

(n 1))) ; :::; y((1

)(n 1))

onde (:) representa a

parte inteira do nmero. Neste novo conjunto ~ no fazem parte as 100% mais baixas nem
as (1

) 100% mais altas.

Falta-nos ainda tratar a estimao de d; que tambm no standard tendo em conta que
d 2 N: Como ^ 2 depende de d; escolhe-se d num certo conjunto D = f1; 2; :::; d g de forma
a minimizar ^ 2 : Logo,

^ ; d^ = arg min ^ 2 ( ; d)
2 ~ ;d2D

onde, agora,
2

^ ( ; d) = n

n
X

yt

xt ( ; d)0 ^ ( ; d)

t=1

^ ( ; d) = X ( ; d)0 X ( ; d)

X ( ; d) y:

Em suma, os passos na estimao dos parmetros so o seguintes:


1. para cada

2 ^ e para cada d 2 D; construir X ( ; d) e estimar ^ ( ; d) e ^ 2 ( ; d);

2. tomar para estimativa de

e de d o par ( ; d) que minimiza ^ 2 ( ; d); seja esse par

dado por ^ ; d^ :
3. tomar para estimativa de , o valor ^ ^ ; d^ :

244

Exemplo 7.3.1 Considere

yt =

com Var [ut ] =

8
<
:

1 yt 1

+ ut se yt

2 yt 1

+ ut se yt

>

: Suponha que os resultados na fase da estimao so:

Valores de ^ 2 em funo de
d!

-1

15.5

16

-0.7

12.4

13.5

-0.1

12.1

12.3

-.001

3.5

2.5

0.0

1.2

2.4

1.2

2.5

2.8

1.5

5.5

ed

Resulta do quadro (veja o valor a negrito) que ^ = 0; d^ = 1 e ^ 2 = 1:2: Por outras


palavras
(0; 1) = arg min ^ 2 ( ; d) e min ^ 2 (0; 1) = 1:2.
Para ilustrar a matriz X ( ; d), suponha que os dois ltimos valores de y so yn
e yn =

= 1:5

1:5; ento a ltima linha da matriz X ( ; d)


0

xn ^ ; d^ =
(o valor yn =

7.3.6

yn 1 Ifyn

0g

yn 1 Ifyn

1 >0g

0 1:5

1:5 no entra na matriz X).

Inferncia

Pode mostrar-se que o estimador para d super-consistente, isto , possui uma varincia proporcional a 1=n com

> 1 (os estimadores habituais possuem uma varincia proporcional

a 1=n). A distribuio assimpttica tambm conhecida (Hansen, 2000). Dada a superconsistncia de d^ podemos, para efeitos de inferncia estatstica sobre os demais parmetros,
assumir que d conhecido.

245

Inferncia sobre
Sob certas condies (incluindo estacionaridade estrita) tem-se
p
2

onde I ( 0 ) =

n ^ (^ )

! N 0; I ( 0 )

E (xt ( 0 ) xt ( 0 )) (

0:

(7.19)

so, de acordo com a notao habitual, os

verdadeiros, mas desconhecidos valores dos parmetros


^ um estimador consistente para

e ). Supomos, naturalmente, que

A matriz I ( 0 ) estimada consistentemente por

1X
xt (^ ) xt (^ )0 :
n t=1
n

O resultado (7.19) indica-nos que, em grandes amostras, a inferncia estatstica sobre os


parmetros

ij

conduz-se da forma habitual.

Inferncia sobre a existncia de Threshold


Uma questo importante saber se o modelo TAR prefervel ao simples AR. Para o efeito,
testa-se H0 :

pois, sob esta hiptese, o TAR reduz-se ao AR. Aparentemente, o

resultado (7.19) permite ensaiar H0 ; no quadro do teste de Wald. Esta ideia incorrecta,
pois sob a hiptese nula o parmetro

no identificvel. Este um problema que ocorre

tipicamente em modelos no lineares (veja-se, por exemplo, o modelo Markov-switching,


no ponto 7.4). Observe-se que, sob a hiptese nula, a funo de verosimilhana deixa de
depender do parmetro

( indiferente o valor que

assume)10 . Nestas circunstncias, a

matriz de informao singular e no possvel usar os resultados assimptticos habituais.


Hansen (2000) sugere o seguinte procedimento:
1. obter Fn = n ~ 2n

^ 2n =^ 2n onde ~ 2n a varincia dos erros de regresso do modelo

AR (sob H0 ) e ^ 2n resulta de (7.18);


2. simular ut ; t = 1; :::; n com distribuio i.i.d. N (0; 1) ;
3. yt = ut ;
4. fazer a regresso de yt sobre xt =

1 yt

10

::: yt

e obter ~ n2

Veja-se mais um exemplo. No caso yt = x + ut ; x > 0; ocorre uma situao similar com H0 : = 0
ou com H0 : = 0: Por exemplo, sob a hiptese = 0; desaparece da especificao; como consequncia, a
verosimilhana deixa de depender de . J o ensaio H0 : = 0 com 0 6= 0 no levanta problemas.

246

5. obter ^ = arg min

2~

^ n2 ( ) onde ^ n2 ( ) resulta da regresso de yt sobre xt ( );

^ n2 =^ n2

6. obter Fn = n ~ n2

7. repetir os passos 2-6 B vezes


8. valor-p = percentagem de vezes (em B) em que Fn

Fn .

A fundamentao do teste baseia-se na prova segundo a qual Fn possui a mesma distribuio assimpttica de Fn ; sob H0 . Observe-se, com efeito, que Fn construda sob a
hiptese de ausncia de threshold. Assim, existe indcio de violao da hiptese nula quando
~ 2n significativamente superior a ^ 2n ; de tal forma que Fn tende a ser geralmente alto quando
comparado com Fn : Nestas circunstncias raramente ocorre Fn

Fn (nas B simulaes) e

o valor-p vem baixo.


Inferncia sobre o threshold
Seja
Fn ( ) = n

^ 2n ( ) ^ 2n (^ )
^ 2n (^ )

(7.20)

Sabe-se que (Hansen, 1997)


d

Fn ( 0 ) !
onde P (

x) = 1

x=2 2

: Com base neste resultado, Hansen (1997) recomenda o

seguinte procedimento para a construo de um intervalo de confiana para :


1. Calcular Fn ( ) para

2~

2. Determinar o conjunto C =
(inclui, portanto, todos os
Como P (

2C )!

: Fn ( )

onde q o quantil da distribuio de

tais que Fn ( ) menor ou igual a q ):

(quando n ! 1), o intervalo de confiana a 100% precisa-

mente C :
Usando a funo de distribuio de ; tem-se q0:90 = 5:94; q0:95 = 7:35 e q0:99 = 10:59:
Ilustre-se o procedimento com o seguinte exemplo artificial. Admita-se que se observam os valores da tabela 7.1. Note-se que a estimativa para

^ = 1:2 pois Fn (1:2) =

0: Tendo em conta que q0:95 = 7:35; o intervalo de confiana para


f : 1:15

1:45g :

247

a 95% C0:95 =

Fn
1
12.2
1.1 10.2
1.15 7.35
1.2 0
1.35 6.31
1.45 7.35
1.6 15
Tabela 7.1: Intervalo de Confiana para o Threshold: Ilustrao do mtodo de Hansen

7.4
7.4.1

Modelo Markov-Switching
Introduo

Outro modelo importante baseado na ideia de regime switching o modelo Markov-Switching


(MS). Nos modelos apresentados no ponto anterior a mudana de regime baseada em variveis observveis. No modelo MS a mudana de regime no observvel.
Considere-se o modelo
yt = c1 +

1 dt

+ yt

+ ut

(7.21)

onde dt uma varivel dummy


8
< 1 se evento A ocorre
dt =
: 0 se o evento A no ocorre.

Sabemos exactamente quando o evento A ocorre. Por exemplo, o evento A pode representar segunda-feira. Trata-se de um evento obviamente determinstico. Suponhamos agora
que A no observvel. Como modelar, estimar e prever y? So estas as questes que
abordaremos ao longo deste ponto.
Para trabalharmos com alguma generalidade, admita-se que esto definidos N regimes.
Por exemplo, um modelo relativamente simples com dois regimes, N = 2;
8
< c + y +u
se yt est no regime 1
1
t 1
t
yt =
: c + + y + u se y est no regime 2
1
1
t 1
t
t

(7.22)

O regime 1 pode estar associado, por exemplo, ao evento A no ocorre e o regime 2 A


ocorre. Este modelo , em vrios aspectos, similar ao modelo (7.21); h, no entanto, um
diferena aprecivel: agora no se sabe quando que y est no regime 1 ou 2. Seja St o

248

regime em que o processo y se encontra no momento t (assim, se St = i, ento yt est


no regime i). No modelo anterior, equao (7.22), S pode assumir os valores St = 1 ou
St = 2: A sucesso fSt g claramente um processo estocstico com espao de estados
(finito) E = f1; 2; :::; N g.
necessrio, naturalmente, especificar um modelo para St . Admita-se E = f1; 2g : Se
o valor que S assume em t nada tem a ver com o valor que S assume em t

1; t

2;

:::; ento fSt g uma sucesso de v.a. i.i.d. com distribuio de Bernoulli de parmetro
p que pode ser identificado com o regime 1, isto , P (St = 1) = p. O processo y vai
saltando entre os regimes 1 e 2 de forma independente de acordo com a probabilidade
p. Num dado momento t; y est no regime 1 com probabilidade p (independentemente do
regime anterior assumido). Na prtica, a independncia entre os sucessivos valores de St no
apropriada para um grande nmero de aplicaes. Por exemplo, suponha-se que y a taxa
de crescimento do produto. Admita-se ainda que y se comporta diferentemente consoante a
economia est em expanso ou em recesso. Temos, assim dois regimes St = 1 (recesso),
St = 2 (expanso). A sucesso fSt g no provavelmente independente: se a economia, num
certo momento, est em expanso (St

= 2), mais provvel que no momento seguinte a

economia se encontre em expanso do que em recesso. Formalmente,


P (St = 2j St

= 2) > P (St = 1j St

= 2) :

Logo fSt g formado por uma sucesso de v.a. dependentes. Uma sucesso ou trajectria de
S; poder ser, por exemplo, f1; 1; 1; 1; 2; 2; 2; 2; 1; 1; 1; :::g :

7.4.2

Cadeias de Markov em tempo discreto com espao de estados discretos finito

Um modelo conveniente para caracterizar fSt g ; num cenrio de dependncia temporal,


a cadeia de Markov homognea em tempo discreto com espao de estados discretos finito.
A teoria das cadeias de Markov tem aplicaes em muitas reas, como por exemplo, em
modelos de inventrio, em gentica, em filas de espera, etc. Iremos apresentar as ideias
principais.
Uma cadeia de Markov um processo de Markov no seguinte sentido:
P (St = jj St

= i; :::; S0 = i0 ) = P (St = jj St
249

= i)

isto , St independente de St 2 ; St 3 ; :::; S0 dado St 1 .


Uma cadeia de Markov completamente caracterizada pela chamada matriz de probabilidades de transio a um passo (ou simplesmente matriz de probabilidades de transio) e,
eventualmente, por uma condio inicial. No caso de dois regimes, E = f1; 2g ; esta matriz
define-se da seguinte forma
0

P=@

P (St = 1j St

= 1) P (St = 2j St

= 1)

P (St = 1j St

= 2) P (St = 2j St

= 2)

A=@

p11 p12
p21 p22

A:

No caso geral (N regimes) tem-se


0

p
B 11
B .
P = B ..
@
pN 1

1
p1N
C
.. C
. C:
A
pN N

...

A matriz P respeita as condies:


0

pij

PN

j=1

1; (i; j = 1; :::; N ) ;

pij = 1; (i = 1; :::; N ) (as linhas soma 1).

Exemplo 7.4.1 Convencione-se que St = 1 representa o estado economia em recesso no


momento t; St = 2 representa o estado economia em expanso no momento t. Suponhase que a matriz de probabilidades de transio
0

P=@

0:7 0:3
0:2 0:8

Se a economia est em expanso no perodo t

A:
1; i.e., St

= 2; a probabilidade da

economia se encontrar ainda em expanso no perodo t 0.8 e a probabilidade de ela passar


para recesso 0.2.
Podemos estar interessados em calcular uma probabilidade de transio a dois passos,
por exemplo,
P (St = 1j St

250

= 2) :

Neste caso, pela lei das probabilidades totais, vem com N = 2

P (St = 1j St

= 2) =
=
=

2
X

i=1
2
X
i=1
2
X

P (St = 1; St

= ij St

= 2)

P (St = 1j St

= i; St

= 2) P (St

P (St = 1j St

= i) P (St

= ij St

= ij St

= 2)

= 2)

i=1

= elemento (2; 1) da matriz P 2 = P

P:

Relativamente ao exemplo 7.4.1, calcule-se a matriz P 2 : Tem-se:


0
@

Assim, P (St = 1j St

0:7 0:3
0:2 0:8
2

10
A@

0:7 0:3
0:2 0:8

A=@

0:55 0:45
0:3

0:7

= 2) = 0:3 (elemento (2; 1) da matriz P 2 ).

A:

O resultado geral dado pelas designadas equaes de Chapman-Kolmogorov:

P (Sm+n = jj S0 = i) =

#E
X

P (Sm = kj S0 = i) P (Sm+n = kj Sm = j) :

k=1

Deduz-se da expresso anterior que


P (Sn+h = jj Sn = i) = elemento (i; j) da matriz P h .

(7.23)

Note-se ainda o seguinte:


P (St = 1j St

= 2) = P (St+k = 1j St = 2) :

No interessa o momento em que a probabilidade calculada. O que relevante o desfasamento temporal entre as variveis. Na equao anterior o desfasamento k. Esta propriedade resulta de se ter uma matriz de probabilidades de transio que no depende de t.
Diz-se nestes casos que a matriz de probabilidades de transio homognea.
Em certos problemas importante obter probabilidades relacionadas com eventos a longo
prazo. No exemplo 7.4.1, interessante saber a probabilidade da economia se encontrar
em expanso (ou recesso) no longo prazo, dado que no momento presente a economia se

251

encontra em expanso. Formalmente, a questo


lim P (St+n = 2j St = 2) :

(7.24)

n!1

Tendo em conta a observao anterior, a probabilidade em questo corresponde ao elemento


(2; 2) da matriz limite

lim @

n!1

Observe-se
0
@

0:7 0:3
0:2 0:8

0:7 0:3

0:7 0:3

0:2 0:8

0:2 0:8

110
A

120
A

140
A

0:7 0:3
0:2 0:8

= @

1n

A :

0:40059 0:59941

0:39961 0:60039
1
0:4 0:6
A
= @
0:4 0:6
0
1
0:4 0:6
A:
= @
0:4 0:6
0

1
A

intuitivo admitir-se que


0

lim @

n!1

0:7 0:3
0:2 0:8

1n

A =@

0:4 0:6
0:4 0:6

A:

Logo limn!1 P (St+n = 2j St = 2) = 0:6; mas tambm limn!1 P (St+n = 2j St = 1) =


0:6: Isto , a probabilidade da economia se encontrar em expanso (ou recesso) no longo
prazo independente do estado inicial, o que bastante intuitivo (no longo prazo irrelevante
saber se hoje a economia est ou no em expanso).
Nem todas as cadeias de Markov admitem estas probabilidades limites. Sob certas
condies pode-se provar a
Proposio 7.4.1 Se S recorrente11 positiva aperidica com espao de estados finito f1; 2; :::; N g12
11
Um regime ou estado i recorrente sse, depois de o processo se iniciar em i; a probabilidade de retornar
a i, ao fim de algum tempo finito, igual a um. Se S contvel e se todos os estados comunicam, ento todos
os estados so recorrentes ou transientes (Taylor e Karlin, 1984).
12
O caso infinito adapta-se facilmente.

252

ento, o vector (linha) das probabilidades estacionrias


=

onde

lim P (St+n = ij St = j) (para qualquer j)

n!1

= P (St = i)

satisfaz as equaes
N
X

= P;

= 1:

i=1

f i ; i = 1; 2; :::; N g a distribuio estacionria da cadeia S:


Exemplo 7.4.2 Considere-se o exemplo 7.4.1,
0

0:7 0:3

P=@

0:2 0:8

A:

O vector das probabilidades estacionrias pode ser determinar da seguinte forma:

Tem-se,

8
>
>
>
<
>
>
>
:

0:7

+ 0:2

= 0:7

+ 0:2

= 0:3

+ 0:8

=1

Exemplo 7.4.3 Considere


0
@

p11
1

p22

p11
p22

A;

0:7 0:3

0:2 0:8
2

8
>
>
>
<
>
>
>
:

0:3

+ 0:8

= 0:4

= 0:6

= 1:

0 < p11 ; p22 < 1:

Pela proposio 7.4.1 fcil concluir que as probabilidades estacionrias so dadas por

1 p22
;
2 p11 p22

253

1 p11
:
2 p11 p22

Retomando o exemplo 7.4.2, facilmente se obtm:

1 0:8
= 0:4;
2 0:7 0:8

1 0:7
= 0:6:
2 0:7 0:8

Observao 7.4.1 Um mtodo para determinar Pn o seguinte. Como se sabe, quando os


vectores prprios de P so independentes verifica-se P = V V
vectores prprios de P e
prprio de P e
e

n
1

onde V a matriz dos

a matriz diagonal dos valores prprios. Ora se V

o valor prprio associado V

o valor prprio associado. Logo P n = V

7.4.3

ainda vector prprio de P n

ento V

V permite obter facilmente P n :

vector

Modelos Markov-Switching

Seja y a varivel dependente. Um exemplo de um modelo MS com dois regimes E = f1; 2g


, por exemplo,

8
< c +
1
yt =
: c +

1 yt 1
2 yt

1 "t

1+

se St = 1

(7.25)

2 "t se St = 2

onde St uma cadeia de Markov homognea (escondida ou latente por St no ser observvel)
com matriz de probabilidades de transio
0

P=@

p11 p12
p21 p22

A:

Uma representao equivalente


yt = c1 + (c2
+

+(

c1 ) IfSt =2g +
2

1 ) IfSt =2gt

+(

1 ) IfSt =2g

yt

"t :

Outra representao sugestiva:


yt = c (St ) + (St ) yt

+ (St ) "t

(7.26)

onde
8
< c se S = 1
1
t
c (St ) =
;
: c se S = 2
2
t

(St ) =

8
<
:

se St = 1

se St = 2

254

(St ) =

8
<
:

se St = 1

se St = 2:

A representao (7.26) sugere que o modelo MS (7.25) pode ser escrito como um processo
AR(1) com coeficientes aleatrios (vrios outros modelos no lineares podem tambm ser
representados como um AR(1) com coeficientes aleatrios).

7.4.4

Funo densidade de probabilidade de y

Vamos caracterizar a fdp f (yt j Ft 1 ) que essencial no mbito da estimao, inferncia e


previso.
Retome-se o modelo
8
< c +
1
yt =
: c +
2

Se assumirmos "t

1 yt 1

1 "t

se St = 1

2 yt 2

2 "t

se St = 2:

N (0; 1) ento as fdp condicionadas associadas aos regimes 1 e 2

(N = 2) so respectivamente
f (yt j Ft 1 ; St = 1) = p

f (yt j Ft 1 ; St = 2) = p

1
2
12

1
2
22

1
(yt
2 2
1

c1

2
1 yt 1 )

1
(yt
2 2
2

c2

2
2 yt 1 )

Como obter f (yt j Ft 1 )? Recordando a regra da probabilidade total


P (A) =

P (Aj Bi ) P (Bi )

(ou fx (x) =

fxjy (xj yi ) fy (yi ) no caso em que y uma v.a. discreta) tem-se que fdp

condicionada de y
f (yt j Ft 1 ) = f (yt j Ft 1 ; St = 1) P (St = 1j Ft 1 )
+f (yt j Ft 1 ; St = 2) P (St = 2j Ft 1 )
1=2

2
12

=
+

2
22

1=2

1
(yt
2 2
1
1

2
1 yt 1 )

c1

(yt
2 2
2

c2

P (St = 1j Ft 1 )

2
2 yt 1 )

P (St = 2j Ft 1 ) :

Se identificarmos, para simplificar, f (yt j Ft 1 ; St = i) = fit tem-se


f (yt j Ft 1 ) = f1t P (St = 1j Ft 1 ) + f2t P (St = 2j Ft 1 ) :
255

Claro que P (St = 1j Ft 1 )+P (St = 2j Ft 1 ) = 1: interessante observar que a fdp condicionada igual mdia ponderada das fdp condicionadas associadas aos vrios regimes. Os
ponderadores so naturalmente P (St = 1j Ft 1 ) e P (St = 1j Ft 1 ) (e somam 1). Por exemplo, se num determinado momento, P (St = 1j Ft 1 ) muito alto (perto de 1) a funo
f (yt j Ft 1 ) depender sobretudo de f1t e pouco de f2t :
No caso geral com N regimes, a expresso da fdp

f (yt j Ft 1 ) =

7.4.5

N
X
i=1

fit P (St = ij Ft 1 ) :

(7.27)

Probabilidades Associadas aos Regimes

A expresso (7.27) envolve as probabilidades P (St = ij Ft 1 ) ; i = 1; 2; :::; N que so


necessrio caracterizar.
Regimes Independentes
No caso mais simples em que fSt g uma sucesso de v.a. independentes (no s dos seus
valores passados e futuros como tambm de Ft 1 ) tem-se
P (St = ij Ft 1 ) = P (St = i) = pi

(7.28)

e, portanto,
f (yt j Ft 1 ) =

N
X

fit pi :

i=1

Esta hiptese conhecida pelo menos desde 1972 com os trabalhos de Goldfeld e Quandt,
entre outros.
O caso de regimes independentes um caso particular da cadeia de Markov. Notando
que
P (St = ij St

= j) = P (St = i)

para qualquer i e j 2 E; conclui-se que este caso induz uma matriz de probabilidades de

256

transio com colunas iguais,


0

P (St = 1) P (St = 2)
B
B
B P (St = 1) P (St = 2)
P=B
B
..
..
B
.
.
@
P (St = 1) P (St = 2)

P (St = N )
..

C
C
P (St = N ) C
C:
C
..
C
.
A
P (St = N )

A probabilidade de atingir, por exemplo, o regime 1 sempre igual a P (St = 1) no importando o regime em que S se encontre no perodo anterior (ou seja, o evento St = 1
independente de St 1 ).
Regimes Seguem uma Cadeia de Markov
Sob esta hiptese, St dado St 1 ; no depende de Ft 1 : Isto ,
P (St = ij St

= j; Ft 1 ) = P (St = ij St

= j) = pji :

(7.29)

Tem-se, pela regra da probabilidade total, com N = 2


P (St = 1j Ft 1 ) = P (St = 1j St

+P (St = 1j St
= P (St = 1j St

+P (St = 1j St
= p11 P (St

= 1; Ft 1 ) P (St
1

= 2; Ft 1 ) P (St

= 1) P (St
1

= 1j Ft 1 )

= 2) P (St

= 2j Ft 1 )

= 1j Ft 1 )
1

= 2j Ft 1 )

= 1j Ft 1 ) + p21 P (St

= 2j Ft 1 ) :

De uma forma geral,

P (St = ij Ft 1 ) =

N
X

pj1 P (St

j=1

= ij Ft 1 )

(7.30)

Estas expresses envolvem uma estrutura recursiva que iremos expor a seguir. Tendo em
conta a expresso (7.30), calcule-se P (St
P (St

= 1j Ft 1 ) = P (St

= ij Ft 1 ) : Observe-se, em primeiro lugar, que

= 1j yt 1 ; Ft 2 ) =

g (yt 1 ; St 1 = 1j Ft 2 )
:
f (yt 1 j Ft 2 )

A primeira igualdade verifica-se por definio. A segunda envolve a regra P (Aj B; C) =


257

P (A; Bj C) =P (Bj C) ; sendo g a funo de probabilidade conjunta de (yt 1 ; St 1 ) : Tem-se


assim, pela regra das probabilidades totais (com N = 2)
P (St

g (yt 1 ; St 1 = 1j Ft 2 )
f (yt 1 j Ft 2 )
f (yt 1 j Ft 2 ; St 1 = 1) P (St 1 = 1j Ft 2 )
= PN
: (7.31)
j=1 f (yt 1 j Ft 2 ; St 1 = j) P (St 1 = jj Ft 2 )

= 1j Ft 1 ) =

Para simplificar, defina-se

pit = P (St = ij Ft 1 )
= ij Ft 2 )

pi;t

= P (St

fi;t

= f (yt 1 j Ft 2 ; St

= i) :

Em suma, com N = 2; a expresso da fdp


f (yt j Ft 1 ) = f1t p1t + f2t p2t = f1t p1t + f2t (1

p1t )

onde
p1t = p11 P (St

= 1j Ft 1 ) + p21 P (St

= 2j Ft 1 )

= 1j Ft 1 ) + p21 (1 P (St 1 = 1j Ft 1 ))
f1;t 1 p1;t 1
= p11
f1;t 1 p1;t 1 + f2;t 1 (1 p1;t 1 )
f1;t 1 p1;t 1
+p21 1
:
f1;t 1 p1;t 1 + f2;t 1 (1 p1;t 1 )

= p11 P (St

(7.32a)
(7.32b)

Observe-se a estrutura recursiva: dadas as condies iniciais


f1;0 ; f2;0 e p1;0 ;
obtm-se (para t = 1) p1;1 e depois f (y1 j F0 ) : Com os valores
f1;1 ; f2;1 e p1;1
obtm-se (para t = 2) p1;2 e depois f (y2 j F1 ) : O procedimento recursivo repetido at se
obter f (yn j Fn 1 ) :
258

Regimes dependentes de St

e de Ft

Assume-se para simplificar N = 2: Sob esta hiptese a cadeia de Markov no homognea


(varia ao longo do tempo). Desta forma, as probabilidades P (St = 1j St
P (St = 2j St

= 1; Ft 1 ) e

= 2; Ft 1 ) dependem de Ft 1 : Suponha-se, para simplificar, que estas prob-

abilidades dependem apenas de yt 1 : Uma forma de relacionarmos as probabilidades com


yt

consiste, por exemplo, em formular uma representao probit para as probabilidades:

onde

P (St = 1j St

= 1; Ft 1 ) =

1 yt 1 ) ,

P (St = 2j St

= 2; Ft 1 ) =

1 yt 1 )

a funo de distribuio normal (como usual na representao probit). A matriz

de probabilidades de transio agora


2

Pt = 4

p11t p12t
p21t p22t

5=4

(
1

0+

1 yt 1 )

1 yt 1 )

(
(

0+

1 yt 1 )

1 yt 1 )

3
5

O procedimento anterior (ponto Regimes Seguem uma Cadeia de Markov) mantm-se


vlido, havendo apenas que substituir pij por pijt :
Regimes dependentes apenas de Ft

Assume-se para simplificar N = 2: Sob esta hiptese, St dado Ft 1 ; no depende de St 1 :


Por exemplo, suponha-se que St depende de yt 1 : Desta forma, a probabilidade P (St = ij Ft 1 )
pode ser estimada no quadro do modelo probit ou logit. Considerando a representao probit,
tem-se
P (St = 1j Ft 1 ) =

1 yt 1 ) :

(7.33)

Esta hiptese, mais restritiva do que a precedente, simplifica consideravelmente a calculatria j que a funo densidade de probabilidade condicional pode agora expressar-se
P2
simplesmente na forma f (yt j Ft 1 ) =
i=1 fit P (St = ij Ft 1 ) = f1t ( 0 + 1 yt 1 ) +
f2t (1

1 yt 1 )) :

259

7.4.6

Estacionaridade

Considere-se
8
>
>
>
<

yt =

c1 +

>
>
>
: c +
N

11 yt 1

+ ::: +

1p yt p

+ ut se St = 1
(7.34)

:::
N 1 yt 1

+ ::: +

N p yt p

+ ut se St = N

onde ut um rudo branco e S uma cadeia de Markov estacionria com vector de probabilidades estacionrias ( 1 ;

2) :

O modelo anterior pode escrever-se na forma

yt = c (St ) +

(St ) yt

+ ::: +

(St ) yt

+ ut

ou ainda na forma Markoviana


0

yt

B
B
B yt 1
B
B
B yt 2
B
B
..
B
.
@
yt p+1
|
{z
yt

C B
C B
C B
C B
C B
C=B
C B
C B
C B
A @
}

1 (St )

2 (St )

p (St )

0
..
.

1
..
.

0
..
.

..

{z

10

yt

1
CB
CB
CB yt 2
CB
CB
CB yt 3
CB
CB ..
CB .
A@
yt p
}| {z
yt

At

C B
C B
C B
C B
C B
C+B
C B
C B
C B
A @
}

c (St ) + ut
0
0
0
0
{z
Ct

C
C
C
C
C
C:
C
C
C
A
}

(7.35)

Stelzer (2009) estabelece a seguinte


Proposio 7.4.2 Considere-se o processo (7.34) na representao (7.35) e assuma-se: fug
um processo EE, E log+ kA0 k < 1, E log+ kC0 k < 1 e

= lim 1= (n + 1) E log+ kA0 A 1 :::A t k < 0:


n!1

Ento y EE. Alm disso, se fAt g um processo EE ento E log+ kA0 k < 0 implica
< 0:
Proposio 7.4.3 Considere-se yt = c (St ) +
jam

(St ) yt

+ ut com dois regimes N = 2: Se-

as probabilidades estacionrias da cadeia de Markov S. Se fut g um processo

EE com segundo momento finito e j

11 j

21 j

260

< 1 ento y EE.

Dem. Considerando a norma Euclidiana e a desigualdade de Jensen, tem-se


+

E log kC0 k

q
= E log
c2 (St ) + u2t
+

1
log E c2 (St ) + E u2t
2

1
+
2
2
E log c (St ) + ut
2
< 1:

Como a cadeia de Markov estritamente estacionria (tem distribuio estacionria


( 1;

2 ),

segue-se que fAt g um processo EE, pelo que basta verificar E log+ kA0 k < 0:

No caso em anlise a matriz A0 reduz-se ao elemento A0 =


8
< log j
log j 1 (St )j =
: log j

e, portanto,

+
E log kA0 k

= E (log j

log j

= log (j
Segue-se que j

11 j

21 j

11 j

11 j

St = 1

21 j

St = 2

(St ) : Tem-se

(St )j)

= P (St = 1) log j
=

11 j

+
j

2
21 j

11 j

+ P (St = 2) log j

log j
2

21 j

21 j

):

< 1 implica E log+ kA0 k < 0:

Exemplo 7.4.4 Considere-se


8
< 2y + u se S = 1
t 1
t
t
yt =
: 0:6y + u se S = 2
t 1
t
t

P =@

0:1 0:9
0:2 0:8

onde ut um processo rudo branco. Um processo AR(1) com coeficente

1
A

(7.36)

= 2 no s no

estacionrio como explosivo (tende para mais infinito em tempo finito). No entanto, yt
EE. Com efeito, a partir de P obtm-se

= 0:1818 e

=1

= 0:8182 (conferir a

proposio 7.4.1 e o exemplo 7.4.3). Por outro lado, invocando a proposio 7.4.3, tem-se
j

11 j

21 j

= 20:1818 0:60:8182 = 0:746 < 1: Logo y EE. Este resultado interessante.

De facto poderamos pensar que o comportamento explosivo de yt no regime 1 implicaria


um processo no estacionrio. Isto no sucede porque a probabilidade do sistema estar num
dado momento no regime estvel relativamente elevada. O processo pode, episodicamente,
entrar no regime 1 e atingir valores extremamente elevados, mas num intervalo de tempo
261

Figura 7-22: Simulao de uma trajectria do processo (7.36) onde ut


observaes)

N (0; 1) (10000

relativamente curto o process reentra no regime 2 com probabilidade elevda, e o valor do


processo retorna ao intervalo dos valores moderados do processo (diramos ao centro de
gravidade da distribuio estacionria). A figura apresenta uma trajectria simulado do
processo.
No contexto dos modelos MS com heterocedasticidade condicional, Bauwens et al. (2006)
o seguinte modelo
yt =

onde

8
>
>
>
<

c1 +

>
>
>
: c +
N
2
it

= !i +

1t "t

se St = 1

:::
N t "t

2
i ut 1

se St = N

2
i t 1:

Supe-se ainda que a cadeia St depende de yt 1 ;


P (St = ij Ft 1 ) = pit yt2

i = 1; 2; :::; N

Sem perda de generalidade, seleccione-se o regime 1 como sendo o regime estvel,


1

< 1: Bauwens et al. (2006) estabelecem a


262

Proposio 7.4.4 Suponha-se: (a) f"t g uma sucesso de v.a. i.i.d. de mdia zero e varincia um, com funo de densidade contnua em R; (b)
(c)

< 1 e (d) p1t yt2

> 0 e pit yt2

> 0;

> 0; para i = 1; 2; :::; N ;

! 1 quando yt2

! 1: Ento y EE.

A proposio assegura que o processo retorna ao regime estvel sempre que yt tende a
assumir valores muito altos (alnea d)).
No caso especial em que as probabilidades so constantes, pit =

i;

vlido a seguinte

Proposio 7.4.5 Suponham-se verificadas as condies (a) e (b) da proposio anterior.


Se

N
X

<1

j=1

ento EE.

7.4.7

Estimao e Inferncia

Comece-se por analisar o modelo (7.25) e seja o vector dos parmetros a estimar. Como haPn
bitualmente, o estimador de mxima verosimilhana dado por ^n = arg max
t=1 lt ( ) ;

onde

lt ( ) = log f (yt j Ft 1 ; ) = log (f1t p1t + f2t (1

p1t )) :

Se os regimes so independentes, p1t dado pela equao (7.28); se seguem uma cadeia de
Markov, p1t dada por (7.32a); finalmente, se os regimes so Ft

mensurveis, p1t dado

por (7.33) ou (??).


Pode-se mostrar:
p
n ^n

! N 0; I ( 0 )

onde I ( 0 ) a matriz de informao de Fisher. Verifica-se I ( 0 ) = A ( 0 ) = B ( 0 ) onde


A( ) =

@ 2 lt ( )
@ @ 0

@lt ( ) @lt ( )
@
@ 0

B( )=E

Estimadores consistentes de A e B so

A^n =

2
^
n
1 X @ lt n
n t=1 @ @ 0

X @lt
^n = 1
B
n t=1
@
n

! A ( 0)

^n @lt ^n
@
263

! B ( 0) :

Os ensaios individuais para os parmetros da mdia e da varincia condicional (GARCH)


podem ser feitos como habitualmente. Isto , podem basear-se no resultado
^i;n
onde

N ( i ; v^ii )

o parmetro (escalar) i; e vii o elemento ii da matriz I ( 0 )

No ensaio, um regime versus dois regimes, H0 : c1 = c2 ;


falsa, a situao similar ao do ensaio H0 :

1=

2;

=n:
1

2;

H1 : H0

no contexto do modelo TAR: os testes

assimptticos habituais (rcio de verosimilhanas, Wald e multiplicador de Lagrange) no


podem ser empregues. Sob a hiptese nula (um regime) vrios parmetros no so identificveis (o score com respeito a estes parmetros identicamente nulo e a matriz informao
de Fisher resulta singular). Uma forma de lidar com este tipo de ensaio no standard
proposto por Davies (1987), que obtm um limite superior para o nvel de significncia do
teste rcio de verosimilhana quando q parmetros apenas so identificveis sob a hipteses
alternativa:
P (sup LR > LRobs )

2
q

> LRobs

(q 1)=2

+V:LRobs
onde

a funo gama, LRobs = 2 (log L1n

: exp f LRobs g

2 q=2
:
(q=2)

(7.37)

log L0n ) e L1n e L0n so os valores da funo de

log-verosimilhana sob H1 e H0 , respectivamente. Se a funo o rcio de verosimilhanas


p
admite um mximo global ento V = 2 LRobs . Os passos para implementar o teste no
contexto do modelo (7.25) so os seguintes:
1. Estimar o modelo AR(1) e obter L0n ;
2. Estimar o MS (7.25) e obter L1n ;
3. Calcular LRobs ; P

2
q

> LRobs ; V; etc.;

4. Calcular o limite superior de P (sup LR > LRobs ) usando a expresso (7.37).


Suponhamos que se obtm P (sup LR > LRobs )

0:02: Ento rejeita-se H0 ao n.s. de

5% pois o verdadeiro p-value inferior a 0.02. Suponhamos que P (sup LR > LRobs )
0:06: Nada se pode concluir ao n.s. de 5% pois o verdadeiro p-value pode ser 0.04 ou 0.055.
Tudo o que sabemos que inferior a 0.06.
Outro teste, designado por teste-J, proposto por Garcia e Perron (1996) e baseia-se na

264

significncia estatstica do parmetro (teste-t) da regresso


Xt = (1
(1)

^t
onde X

(2)

^t
eX

^ t(1) + X
^ t(2) + "t
)X

so os previsores dos modelos com um e dois regimes, respectivamente (o

^ t(1) o previsor do modelo com menos


teste generaliza-se imediatamente ao caso em que X
regimes). Assim, a rejeio de H0 :

= 0 mostra evidncia a favor do modelo com mais

regimes.

7.4.8

Previso

Suponha-se que y segue um modelo MS com dois regimes e esto disponveis em n observaes de y; fy1 ; y2 ; :::; yn g : Usando, como previsor para yn+h a funo E (yn+h j Fn ) ;
tem-se
E (yn+h j Fn ) = E (yn+h j Fn ; Sn+h = 1) P (Sn+h = 1j Fn )
+ E (yn+h j Fn ; Sn+h = 2) P (Sn+h = 2j Fn )
onde E (yn+h j Fn ; Sn+h = i) , como j vimos, a mdia condicional do regime i (no contexto
do modelo (7.25) tem-se E (yn+h j Fn ; Sn+h = 1) = E (c1 +

1 yn+h 1 j Fn )).

A probabili-

dade P (Sn+h = ij Fn ) depende da hiptese que se tem sobre S: Se admitirmos que S segue
uma cadeia de Markov, vem

P (Sn+h = 1j Fn ) =
=
=

2
X
i=1
2
X

i=1
2
X
i=1

P (Sn+h = 1; Sn = ij Fn )
P (Sn+h = 1j Sn = i; Fn ) P (Sn = ij Fn )
P (Sn+h = 1j Sn = i) P (Sn = ij Fn ) :

Tendo em conta (7.23), resulta


h
P (Sn+h = jj Sn = i) = Pi;j
= elemento (i; j) da matriz P h :

265

Finalmente, tendo em conta a equao (7.31),

7.4.9

f (yn j Sn = i; Fn 1 ) P (Sn = ij Fn 1 )
P (Sn = ij Fn ) = PN
:
j=1 f (yn j Sn = j; Fn 1 ) P (Sn = jj Fn 1 )

Aplicao

Analisa-se a taxa de juros FED fund13 (EUA) no perodo Julho de 1954 a Outubro de 2006
(628 observaes mensais).
A literatura dos modelos de taxas de juro (a um factor) sugere que a volatilidade da taxa
de juro depende do nvel da taxa de juro. Um dos modelos mais usados em matemtica
financeira (tempo contnuo) o processo CIR (devido a Cox, Ingersoll e Ross):
drt =

p
rt dWt ;

rt ) dt +

; ;

>0

(7.38)

onde rt a taxa de juro spot instantnea e W o chamado processo de Wiener. Todos


os parmetros podem ser estimados consistente e eficientemente pelo mtodo da mxima
verosimilhana. A discretizao do processo (i.e. a passagem para um processo em tempo
discreto que aproximadamente traduz a dinmica de (7.38)) simplifica a anlise (embora no
caso presente no seja necessrio). A discretizao pelo esquema de Euler (supondo para
simplificar que o hiato entre duas observaes consecutivas,

; constante e igual a um)

conduz ao modelo,
rt = c + rt
onde c =
dt por

rt 1 "t

(7.39)

= (1

). Esta discretizao de Euler envolveu a troca de drt por rt rt 1 ,


p
= 1, e dWt por
"t : Estas trocas representam apenas aproximaes e envolvem,

por isso, erros.


Resultados preliminares mostram que existe forte presena de heterocedasticidade e que
a sua dinmica compatvel com a que est subjacente ao modelo (7.39).
A estimao dos parmetros do modelo (7.39), pelo mtodo da mxima verosimilhana,
assumindo normalidade, conduziu aos resultados que se apresentam na figura 7-23.
Vrios autores tm sugerido a existncia de diferentes dinmicas ou regimes no comportamento da taxa de juro (veja-se, por exemplo, Gray, 1996). Concretamente, argumenta-se o
seguinte: quando as taxas de juro so altas (anos 80) a volatilidade alta e o processo exibe
13

oficialmente designada por Federal funds effective rate, com maturidade overnight.

266

Mean log-likelihood
Number of cases
628

-1.07420

Covariance of the parameters computed by the following method:


QML covariance matrix
Parameters
Estimates
Std. err.
Gradient
-----------------------------------------------------------------c
0.0764
0.0394
0.0000
fhi
0.9878
0.0091
0.0000
sigma
0.0355
0.0052
0.0000

Figura 7-23: Resultados da estimao do modelo (7.39)


Mean log-likelihood
Number of cases
628

-0.767141

Covariance of the parameters computed by the following method:


Inverse of computed Hessian
Parameters
Estimates
Std. err.
Gradient
-----------------------------------------------------------------c1
0.0937
0.0508
0.0000
fhi1
0.9848
0.0077
0.0000
sigma1
0.5497
0.0183
0.0000
c2
0.2100
0.1357
0.0000
fhi2
0.9697
0.0157
0.0000
sigma2
0.0866
0.0093
0.0000
p11
0.9976
0.0024
0.0000
p22
0.9912
0.0083
0.0000

Figura 7-24: Resultados da estimao do modelo (7.39)


reverso para uma mdia de longo prazo; quando as taxas de juro so baixas, a volatilidade
baixa e observa-se ausncia de reverso para uma mdia. Este argumento sugere a existncia de dois regimes: um regime de altas taxas de juro e alta volatilidade e um regime de
baixas taxas de juro e baixa volatilidade. Depois de vrios ensaios seleccionou-se o seguinte
modelo:
yt =

8
<

c1 +

1 yt 1

+ 1 "t
se St = 1
: c + y + py " se S = 2
2
2
t 1 t
t
2 t 1

(7.40)

cujos resultados de estimao, pelo mtodo da mxima verosimilhana, assumindo normalidade, esto apresentados na figura 7-24.

n
o
^
A figura 7-25 apresenta a sucesso das probabilidades estimadas P (St = 1j Ft 1 ) ; t = 2; :::; n :

Recorde-se que P (St = 1j Ft 1 ) a probabilidade de y se encontrar no regime 1 no mo-

mento t; dado Ft 1 : Podemos observar, a partir da figura 7-25, que o processo y se encontrou,
com alta probabilidade, no regime 1 durante as dcadas de 80 e 90. Durante os anos 20032005 o processo encontrou-se, com alta probabilidade no regime 2. Em 2006, o processo
no est totalmente em nenhum dos regimes.

267

Figura 7-25: Taxa de juro e probabilidades P (St = 1j Ft 1 ) estimadas


Pgina em branco

268

Captulo 8
Modelao da Heterocedasticidade
Condicionada - Caso Univariado
(ltima actualizao: 3/2010)

8.1

Introduo

Vimos no captulo 3 que fortes variaes dos retornos so normalmente seguidas de fortes
variaes dos retornos em ambos os sentidos, e que baixas variaes dos retornos so normalmente seguidas de baixas variaes dos retornos, tambm, em ambos os sentidos (veja-se,
por exemplo, a figura 3-17). Este facto estilizado indica muito claramente que a volatilidade
no constante ao longo do tempo. Uma forma mais subtil de mostrar que a volatilidade
no constante consiste em constatar que a srie dos quadrados dos resduos (ou mesmo os
quadrados dos retornos) autocorrelacionada.

8.1.1

Por que razo a volatilidade no constante?


Uma parte da volatilidade pode ser relacionada com a especulao. Em certos modelos distingue-se duas classes de investidores: investidores racionais que tendem a empurrar o preo dos activos na direco do valor fundamental ou intrnseco da empresa
(normalmente formalizado como o valor actual dos fluxos financeiros que o investidor
espera vir a receber no futuro) e especuladores que baseiam as suas decises em informaes estatsticas geradas pelo mercado, como por exemplo, os preos passados
e o volume de transaces. Quando a proporo de especuladores alta e os sinais
269

de mercado so interpretados de forma anloga pela maior parte dos especuladores,


formam-se tendncias fortes de compra ou de venda que se reflectem no preo e na
volatilidade.
Episdios de extrema volatilidade ocorrem quando uma bolha especulativa rebenta,
i.e., quando depois de um perodo considervel de crescimento dos preos, sucede
uma repentina e inesperada quebra do mercado. Estas bolhas especulativas esto
normalmente associadas a uma nova tecnologia (por exemplo, o boom da electrnica
nos anos 60, da biotecnologia nos anos 80 ou da internet no fim dos anos 90) ou
a um novo negcio (mais uma vez o caso da internet no fim dos anos 90). Gerase um ambiente de euforia em torno dos ttulos associados a uma certa tecnologia
e/ou negcio e emerge um comportamento irracional de grupo totalmente desligado
do valor intrnseco dos ttulos.
Graves crises econmicas e polticas tambm explicam momentos de alta volatilidade.
Uma outra explicao (em certa medida complementar com as precedentes) relaciona
a volatilidade com a chegada de informao aos mercados. Suponha-se, num cenrio
ideal ou hipottico, que o mercado est em equilbrio (no h flutuao dos preos).
Quando chega informao ao mercado os agentes reavaliam as suas carteiras (perante
a nova informao, deixam de ser ptimas); tendero, por conseguinte, a vender
ou a comprar activos at que se atinja um novo equilbrio. A aco de comprar e
vender ttulos tende a alterar os preos. A hiptese crucial a de que a informao no
chega de forma homognea e contnua ao mercado. Quando a chegada de informao
reduzida e pouco relevante os mercados tendero a exibir baixa volatilidade; pelo
contrrio, quando a informao intensa e relevante, podero ocorrer perodos de
forte volatilidade. A informao relevante aqui deve ser entendida como a informao
que, de alguma forma, afecta a rendibilidade dos activos. Por exemplo, a libertao de
notcias relacionadas com inflao, taxas de juro, PIB, etc., geralmente tm impacto
sobre a volatilidade e sobre os preos.
O modelo que se apresenta a seguir procura replicar o fenmeno de volatilidade no
constante a partir do conceito de chegada de informao. Seja Nt o nmero de notcias no
dia t: Quando uma notcia chega ao mercado supe-se que existe uma reviso do preo de um
certo activo. Essa reviso traduz-se numa variao do preo numa quantidade aleatria dada
270

por "i;t (i = 1; :::; Nt ). Se existir uma notcia (relevante) num certo dia t; o logaritmo do preo
no dia t representado por log Pt = log Pt

+ + "1;t ; se existirem duas notcias o modelo

passa a ser representado por log Pt = log Pt

+ "1;t + "2;t (e assim sucessivamente).

Assuma-se que f"i;t ; i = 1; 2; :::; Nt g uma sucesso de v.a. i.i.d. com distribuio N (0;

e independentes de Nt : Tem-se assim que o retorno do activo dado por

rt =

Nt
X

"i;t :

(8.1)

i=1

Resulta do modelo que a varincia de rt dado Nt no constante, pois


Var (rt j Nt = nt ) = nt

(de acordo com este modelo, quanto maior o nmero de notcias que chegam ao mercado,
maior a volatilidade). razovel admitir-se uma distribuio de Poisson de parmetro
para a v.a. Nt ; i.e., Nt

P ( t ). Podemos ainda refinar o modelo, incorporando persistncia

em Nt , i.e. permitindo que Nt seja alto (baixo) sempre que Nt

alto (baixo). Por outras

palavras, o volume de informao tende a ser alto (baixo) em perodos seguidos. Nestas
circunstncias, passa a assumir-se Nt

P ( t ) com

= Nt

+ 1 (o nmero mdio de

notcias no dia t igual ao nmero de informaes do perodo anterior mais uma unidade)
(adiciona-se uma unidade para evitar que

= 0 para algum t). Na figura 8-1 representa-se

= 0;

uma trajectria simulada de (8.1) para

= 0:0015 e Nt

P ( t) ;

= Nt

+ 1:

Podemos observar que a trajectria simulada replica algumas das caractersticas tpicas das
sries financeiras.
Retome-se a equao (8.1). Esta equao sugere a especificao
rt =

+ ut ;

ut =

t "t :

O essencial nesta equao a ideia de que ut tem varincia condicional


Suponha-se de agora em diante que
iveis observadas no momento t
1

No exemplo anterior,

2
t

= nt

2
t

Ft 1 -mensurvel (i.e.,

1)1 .

no Ft

1 -mensurvel.

271

2
t

2
t

no constante.

depende apenas de var-

0.03
0.025
0.02
0.015
0.01
0.005
0
-0.005
-0.01
-0.015
-0.02
-0.025
1

101

201

301

401

501

601

701

801

901

Figura 8-1: Simulao de uma trajectria de rt ; assumindo


onde t = Nt 1 + 1:

8.1.2

= 0;

= 0:0015 e Nt

P ( t)

Processos Multiplicativos

Considere-se ut =

t "t

e as seguintes hipteses:

H1 f"t g uma sucesso de v.a. i.i.d. com E ("t ) = 0 e Var ("t ) = 1;


H2 "t independente de ut k ; k 2 N;
H3

Ft

mensurvel.

Tem-se:
E (ut j Ft 1 ) = E ( t "t j Ft 1 ) =
Var ( ut j Ft 1 ) = E u2t Ft

E ("t j Ft 1 ) = 0

2 2
t "t

=E

Assim, processos multiplicativos do tipo ut =

t "t ,

Ft

com

2
t

2
E "t Ft

2
t:

no constante, so processos het-

erocedsticos (varincia no constante). Este tipo de modelos esto presentes na abordagem


tradicional da heterocedasticidade. Por exemplo, se zt
ento a expresso Var (ut j zt 1 ) =

2 2
zt 1

> 0 exgena e ut =

z t 1 "t ;

no constante.

Processos estocsticos com heterocedasticidade condicional (HC) (varincia no constante ao longo do tempo), so tambm definidos a partir de um processo multiplicativo do
tipo ut =

t "t

mas, comparativamente ao caso tradicional, a forma como

varia substancialmente, como veremos a seguir. Que funo especificar para

2
t

especificado
t

ou

2
t ? Vimos

que uma das caractersticas das sries financeiras exibir volatility clustering: fortes variaes so normalmente seguidas de fortes variaes em ambos os sentidos, devendo ocorrer,
272

portanto, Corr u2t 1 ; u2t > 0. Suponha-se, por um momento que ut representa a srie financeira. Portanto, se u2t

um valor alto (baixo), em mdia, u2t ser tambm um valor alto

(baixo). Nestas circunstncias, faz sentido escrever o seguinte modelo para


2
t

2
1 ut 1 ;

=!+

! > 0;

2
t

0:

(8.2)

Com efeito, tem-se esquematicamente:


u2t

alto )

2
t

alto ) u2t alto (recorde-se ut =

t "t ).

No caso clssico de heterocedasticidade, a varincia depende da evoluo de uma ou mais


variveis exgenas, determinadas fora do modelo (zt
HC, a volatilidade

2
t

no exemplo anterior); no modelo de

uma varivel aleatria funo de choques aleatrios determinada

dinamicamente, a partir do prprio modelo:


u2t

2
t

! u2t !

2
t+1

! :::

Se ut encarado como uma v.a. residual do modelo


yt =

+ ut

fcil ver que a heterocedasticidade definida em ut transmitida a yt :


Var ( yt j Ft 1 ) = E (yt

8.1.3

t)

Ft

= Var (ut j Ft 1 ) =

2
t:

Distribuies de Caudas Pesada

Uma caracterstica muito importante dos modelos de HC o de implicar (sob certas condies)
distribuies marginais leptocrticas. Retome-se o modelo ut =

t "t

sob as hipteses H1-

H3. Admita-se ainda que o choque aleatrio "t tem distribuio N (0; 1) : Tem-se
E (ut ) = 0
Var (ut ) = E u2t = E
3
E ut

2
t

= 0 ) skweness = 0.

273

Mostre-se que a distribuio marginal de u leptocrtica. Para o efeito, calcule-se o coeficiente de kurtosis de u;
ku =

E (u4t )
2
E (u2t )

e verifique-se que ku > 3: Ora


4
E ut

= E

4 4
t "t

> E

2 2
t

=E

4
t

4
E "t = E

4
2
E "t = E ut

2 2
t

4
E "t

4
2
E "t = E ut

pelo que
2

E (u4t )
E (u2t ) 3
ku =
>
2
2 = 3:
E (u2t )
E (u2t )
Este resultado sugere que um modelo de HC pode ser adequado para modelar retornos, pois
acomoda uma das caractersticas mais importantes das sries financeiras que a dos retornos
seguirem uma distribuio leptocrtica.

8.1.4

O papel da Mdia Condicional e o Modelo de Heterocedasticidade


Condicionada

Vimos que fortes variaes de y so normalmente seguidas de fortes variaes em ambos os


sentidos. Teoricamente, este efeito pode ser modelado atravs da mdia condicional. Esta
seria a situao ideal. Se a mdia condicional modelasse este efeito, conseguiramos prever
razoavelmente as variaes de y e, nestas circunstncias, no s o erro ut = yt

seria

baixo como tambm a volatilidade de y poderia ser baixa e mesmo constante ao longo do
perodo. No entanto, vimos que a mdia condicional geralmente uma componente muito
fraca do modelo (recorde-se a questo dos mercados eficientes). Isto , se considerarmos o
modelo yt =

+ ut ; a mdia condicional

(representada, por exemplo, por um AR ou

MA), uma componente pouco explicativa do modelo. Assim, quando yt2 alto, u2t tambm
alto (porque a mdia condicional no acompanha as flutuaes de yt ) e, consequentemente,
espera-se que u2t esteja fortemente correlacionado com u2t 1 .

8.1.5

Vantagens dos modelos de Heterocedasticidade Condicionada

Antes do artigo seminal de Engle (1982) as dependncias temporais nos momentos superiores a um eram tratadas como simples rudo. Engle mostrou que as dependncias temporais

274

do segundo momento, podem explicar razoavelmente a evoluo da volatilidade ao longo do


tempo. A volatilidade condicional (doravante volatilidade) da srie pode ser identificada com
a varincia condicional,
a volatilidade com

t,

2
t;

pois

ou, simplesmente, com


t

(em princpio, prefervel identificar

est na escala da varivel).

Iremos ver que os modelos de HC permitem:


modelar a volatilidade (e as covarincias condicionais, no caso multivariado); como
se sabe, a volatilidade uma varivel fundamental na anlise do risco de mercado, na
construo de portfolios dinmicos, na valorizao de opes, etc.;
estimar de forma mais eficiente os parmetros definidos na mdia condicional (por
exemplo, se um processo ARMA exibir heterocedasticidade condicional, a estimao
conjunta dos parmetros da mdia e dos parmetros da varincia permite estimar eficientemente os parmetros da mdia);
estabelecer intervalos de confiana correctos para y: Isto , se y exibe HC e esta negligenciada, os intervalos de previso para y so incorrectos. Observe-se, com efeito,
que os intervalos de confiana dependem da varincia do erro de previso e o erro de
previso depende (entre outros aspectos) da varincia (condicional) da v.a. residual.

8.2

Modelo ARCH

Considere-se o seguinte modelo


yt =
t

+ ut ;

= E (yt j Ft 1 ) mdia condicional

ut =

t "t

Assumam-se as hipteses H1-H3.


Definio 8.2.1 ut segue um modelo ARCH(q) (ou tem representao ARCH(q)) se
ut =
2
t

t "t

= !+

2
1 ut 1

+ ::: +

275

2
q ut q ;

! > 0;

volatilidade

Panel (a)

retornos
4

20

15

10

-2

volatilidade

Panel (b)

retornos
15

20

10

15

5
0

10

-5

-10
-4

0
r(t)

0
r(t)

volatilidade

Panel (c)

retornos
15

-15

sigma(t)

20

10

volatilidade

Panel (d)

retornos
30

20

20

15

sigma(t)

15

10
10

0
-5

-10

-10

10

-20

-15

0
r(t)

-30

sigma(t)

r(t)

sigma(t)

Figura 8-2: Simulao de 4 trajectrias ARCH de acordo com o modelo (8.3).


importante constatar que

2
t

2 Ft 1 .

Como a volatilidade exibe forte dependncia temporal, raramente se considera q =


1: Discute-se a seguir esta questo atravs de um exerccio de simulao. Na figura 8-2
apresenta-se as trajectrias simuladas para o retorno (rt ) e
ores para os parmetros

i:

considerando diferentes val-

O modelo simulado

rt = ut ;
ut =
2
t

t "t ;

= !+

= 0)

"t RB Gaussiano com varincia 1


2
1 ut 1

+ ::: +

(8.3)

2
8 ut 8 :

Em todos os casos ! = 1: Na figura 8-2 tem-se:


Painel (a) ARCH(0)

= ::: =

Painel (b) ARCH(1)

= 0:8;

= ::: =

Painel (c) ARCH(3)

= 0:3;

= 0:3;

Painel (d) ARCH(8)

= 0:2;

= ::: =

= 0;

276

= 0;

= 0:2;
8

= 0:1

= ::: =

= 0;

Na figura 8-2 os grficos que mais fielmente reproduzem o fenomeno de volatility clustering (volatilidades altas (baixas) so geralmente seguidas por volatilidades altas (baixas))
e exibem alguma persistncia no comportamento da volatilidade (tal como vimos nos pontos
3.2.2 e 3.2.3), correspondem aos painis (c) e (d). A simulao sugere que mais apropriado
em aplicaes empricas considerar-se um q elevado (no obstante, veremos adiante que
problemtico estimar-se um modelo com q elevado).

8.2.1

Dois Primeiros Momentos de ut

Como "t independente de ut k ; k 2 N; segue-se que

2
t

(que uma funo de ut k ; k 2 N)

independente de "t : Logo,


E (ut ) = E ( t "t ) = E ( t ) E ("t ) = 0,
Var (ut ) = E u2t = E

2 2
t "t

=E

2
t

2
E "t = E

2
t

(8.4)

Por outro lado, como fut g uma diferena de martingala, pois E (jut j) < 1 e E (ut j Ft 1 ) =
0; resulta pela proposio 4.4.1, que ut no autocorrelacionado, i.e. Cov (ut ; ut k ) = 0.

8.2.2

Representao AR de um ARCH

Vimos, j por vrias ocasies, que existem dependncias no segundo momento do processo.
A representao autoregressiva do processo ARCH mostra exactamente esse aspecto. Temse,

u2t +

2
t

= !+

2
1 ut 1

2
t

= !+

2
1 ut 1

+ u2t

u2t = ! +

2
1 ut 1

u2t

2
1 ut 1

2
+ u2t
| {z }t
vt

Como E (vt j Ft 1 ) = E (u2t

= !+

2
t j Ft 1 )

+ vt

= E (u2t j Ft 1 )

2
t

= 0, conclui-se pela definio

4.4.3, que fvt g (admitindo que E (jvt j) < 1) uma diferena de martingala e, portanto,
um processo no autocorrelacionado (E (vt ) = 0 e Cov (vt ; vt k ) = 0). Logo, tem-se o
importante resultado: se ut segue um modelo ARCH(1) ento u2t segue um processo AR(1).

277

Esquematicamente:
ARCH(1) ) u2t

ut

Assim, o processo u2t autocorrelacionado (se

AR(1):

> 0) e apresenta as caractersticas bsicas

de um processo AR(1). De igual forma se conclui:


ARCH(q) ) u2t

ut

8.2.3

AR(q):

Estacionaridade de Segunda Ordem do ARCH(q)

Estude-se a ESO de u. Vimos que E (ut ) e Cov (ut ; ut k ) so finitos e no dependem de t;


s falta estudar Var (ut ). Em que condies Var (ut ) = E (u2t ) no depende de t e finita?
Considere-se o ARCH(1) na sua representao autoregressiva:
u2t = ! +

2
1 ut 1

+ vt ;

Da estrutura autoregressiva conclui-se que a condio j


do polinmio AR (1

0:

1j

< 1 (ou equivalentemente: a raiz

= 0 , em mdulo, superior a um) implica E (u2t ) =

1 L)

1: Se adicionarmos a esta condio, a restrio

<

0; a condio de ESO passa a ser

simplesmente,
0

< 1:

Se u um processo ESO vem


2
E ut

= !+

2
E ut

2
E ut

= !+

2
2
E ut ) E ut =

!
1

Considere-se agora o ARCH(q) na sua representao autoregressiva:


u2t = ! +

2
1 ut 1

+ ::: +

2
q ut q

+ vt ;

0:

Da estrutura autoregressiva conclui-se que, se as razes do polinmio AR (1


0; estiverem todas fora do circulo unitrio (complexo), ento E (u2t ) =
armos a esta condio, as restries

+ ::: +

:::

q
qL )

< 1: Se adicion-

0; a condio de ESO simplifica-se e, pode-se

provar, igual a
1

1L

< 1;

278

0).

Neste caso, depois de algumas contas, obtm-se


Var (ut ) = E u2t =

!
1

+ ::: +

q)

Observao 8.2.1 Embora a expresso Var ( ut j Ft 1 ) seja varivel, Var (ut ) constante.
Assim: ut condicionalmente heterocedstico (heterocedasticidade condicional) mas em
termos no condicionais ou marginais, ut homocedstico. De forma anloga, tambm
num processo estacionrio, a mdia condicional varivel e a no condicional constante.
Por exemplo, num processo AR(1) estacionrio, a mdia condicional varivel ao longo do
tempo e dada por

= c + yt 1 ; no entanto, a mdia marginal c= (1

) constante.

FAC e FACP de um u2t e Identificao do Processo ARCH(q)

8.2.4

Suponha-se que o momento de ordem quatro de u finito no depende de t. A FAC de u2t


dada por

u2 =

Cov u2t ; u2t k


=q
Var (u2t ) Var u2t

; Var u2t = E u4t

2
E ut

Vimos que se ut segue um ARCH(q), ento u2t segue um AR(q). Assim, a FAC e a FACP
tericas de u2 exibem o comportamento tpico de um AR:
no se anula e k ! 0;
8
< no se anula se k = 1; 2; :::; q
(FACP) kk =
: 0
se k = q + 1; q + 2; :::
(FAC)

Em particular, tem-se num ARCH(1):

k
1;

11

k
kk

1
= 0; k

Observao 8.2.2 Num ARCH(1) o 4o momento existe se 3

2:
2
1

< 1 i.e. se

condio , na prtica, um pouco severa.


Passos para a identificao da ordem q de um processo ARCH(q)
1. Estima-se o modelo yt =

+ ut supondo
279

2
t

constante;

< 0:5774 e esta

0.5

0.5

FAC de u^2

0.4

0.4

0.3

0.3

0.2

0.2

0.1

0.1

-0.1

FACP de u^2

-0.1

13

17

21

25

29

13

17

21

25

29

Figura 8-3: Simulou-se (n = 5000) um ARCH(q). Qual a ordem de q?


2. Obtm-se os resduos u^t = yt

^ t ; t = 1; :::; n;

3. Calcula-se u^2t ; t = 1; :::; n;


4. Calcula-se a FAC e a FACP de u^2t e identifica-se a ordem q:
Na figura 8-3 simulou-se um ARCH(q) com n = 5000 observaes. Qual a ordem de q?

8.2.5

Caractersticas da Distribuio Marginal de ut

Suponha-se que "t um rudo branco Gaussiano N (0; 1) : Ento a distribuio condicional
de ut N (0;

t "t j Ft 1

) ; i.e., ut =

N (0;

2
t):

Sob certas condies, a distribuio

marginal de ut ; f (ut ), dada pela expresso


f (ut ) = lim f (ut j Fs ) :
s! 1

Como na prtica no se consegue obter a expresso para o limite anterior, f geralmente


desconhecida; podemos ainda assim investigar algumas propriedades de f calculando alguns
momentos:
E (ut ) = 0
!
1 ( 1 + ::: + q )
= 0 ) skweness = 0
E (u4t )
=
2 > k" = 3 (j vimos).
E (u2t )

Var (ut ) = E u2t =


3
E ut

ku

Tem-se a seguinte importante concluso: ku

k" : A distribuio de u tem caudas mais

pesadas do que a distribuio de ": Se, como habitualmente, se assumir "t


280

N (0; 1) ; ento

kurtosis

25

20

15

10

0
0.0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

1;

Figura 8-4: Valor de kurtosis como funo do parmetro

0.8

0.9

1.0

alfa 1

associada a um ARCH(1)

a distribuio marginal de u leptocrtica! Note-se, em esquema:


ut j Ft

t "t j Ft 1

N 0;

2
t

) ut

Dist:Leptocurtica:

Podemos obter uma expresso exacta para ku . Por exemplo, suponha-se ut


"t

i.i.d.

N (0; 1) e 3

2
1

ARCH(1);

< 1: Deixa-se como exerccio mostrar que


4
E ut = 3 E

4
t

! (1 + 1 )
;
(1
3 21 )
1 ) (1
2
3 (1
6 21
E (u4t )
1)
ku =
=
=
3
+
2
1 3 21
1 3
E (u2t )
E

4
t

2
1

> 3:

Vimos que a distribuio de u tem caudas mais pesadas do que a distribuio de ": A
proposio seguinte caracteriza as caudas da distribuio marginal.
Proposio 8.2.1 Seja ut =
!+

2
1 ut 1 .

Suponha-se

t "t

onde "t um rudo branco Gaussiano N (0; 1) e

2 (0; 2e ) onde

a constante de Euler,

2
t

' 0:5772: Seja

> 0 a soluo nica da equao

onde

2
E Z

a funo Gama e Z

=1,

(2 1 )
p

1
2

=1

(8.5)

N (0; 1) : Ento quando x ! 1; a probabilidade P (ut > x)

281

converge para
c
x
2

; c > 0:

A proposio 8.2.1 basicamente estabelece que as abas da fdp f (x) de ut tm caudas de


Pareto (i.e., para x suficientemente grande P (ut > x) - como funo de x - e f (x) apresentam um decaimento polinomial). Este resultado est de acordo com os factos estilizados
analisados no captulo 3. interessante verificar, mais uma vez, que embora a distribuio
condicional seja normal a distribuio marginal leptocrtica e apresenta caudas pesadas
(light-value input causes heavy-tailed output). O parmetro
equao (8.5). No h, no entanto, uma soluo explcita para

obtm-se da resoluo da
(em funo de

1)

-a

equao (8.5) deve resolver-se numericamente.


Algumas concluses:
Embora fut g seja um processo no autocorrelacionado, fut g no uma sucesso
de variveis independentes (basta observar, por exemplo, E u2t u2t

6= 0 ou que

E (u2t j Ft 1 ) depende de u2t 1 );


Mesmo que ut seja condicionalmente Gaussiano a distribuio marginal no Gaussiana. Em particular, se ut condicionalmente Gaussiano ento a distribuio marginal
leptocrtica.

8.2.6

Momentos e Distribuio de y

Seja
yt =

+ ut

ut =

t "t

(assumem-se as hipteses habituais para "t ). Deixa-se como exerccio verificar que:
E (yt j Ft 1 ) =
Var ( yt j Ft 1 ) =

t;
2
t;

Se "t Gaussiano ento yt j Ft

N ( t;

2
t);

E (yt ) = E ( t ) ;
Var (yt ) = Var (E (yt j Ft 1 )) + E (Var ( yt j Ft 1 )) = Var ( t ) + E ( 2t ) :
282

Retorno A

-1

-1

-2

-2

-3

-3

-4

Retorno B

-4

Figura 8-5: Qual o retorno mais voltil?

8.2.7

Volatilidade: Definies

A volatilidade condicional no momento t (=

t)

uma medida da magnitude das variaes

(ou flutuaes) no explicadas dos preos no momento t. No entanto, como


sempre uma componente pouco explicativa de y (i.e.

quase

0; pelo menos para dados de

frequncia alta - dados semanais ou dirios) podemos dizer (sem grande margem de erro)
que a volatilidade condicional uma medida da magnitude das variaes (ou flutuaes)
dos preos no momento t. Esta a definio usual de volatilidade do ponto de vista das
instituies financeiras:
[. . . ] practitioners often refer to the term volatility when speaking of movements
in financial prices and rates. RiskMetrics
Um ttulo A pode exibir, comparativamente a um outro ttulo B, maior volatilidade condicional em certos momentos do tempo mas, globalmente A pode ser menos voltil do que
B. Nas figuras 8-5 o retorno A exibe episdios de grande volatilidade, mas B (globalmente) mais voltil (i.e. considerando o perodo todo).
Definimos volatilidade no condicional (ou marginal) como uma medida da magnitude
das variaes (ou flutuaes) dos preos num hiato de tempo (meses ou anos) (que no so
explicadas). Pode ser medida atravs da estatstica

ou se yt

d (ut ) =
Var

ARCH(q)
d (ut ) =
Var

Pn

!
^
;
(^ 1 + ::: + ^ q )
283

t=1

u^t 2

+ ::: +

< 1):

No exemplo acima, a volatilidade marginal de B maior do que a de A, embora B exiba


volatilidade constante.

8.3

Modelo GARCH

Tendo em conta a forte dependncia temporal da volatilidade, era usual, nas primeiras aplicaes, considerar-se um ARCH de ordem elevada. Um ARCH de ordem elevada levanta
problemas de estimao (mais concretamente, de convergncia dos algoritmos de optimizao) e, no raras vezes obtm-se mximos locais (e no globais, como desejvel). Como
consequncia, alguns das estimativas dos parmetros podem vir desprovidos de significado
(por exemplo, podem vir negativos)2 . Para superar este problema, foram tentadas vrias
solues (a maioria ad-hoc e sem muita relevncia). Contudo, a melhor soluo apareceu
com o modelo GARCH. Veremos adiante este aspecto.
Definio 8.3.1 ut segue um modelo GARCH(p,q) (ou tem representao GARCH(p,q)) se
ut =
2
t

! > 0;

t "t
2
1 ut 1

= !+

0;

2
q ut q

+ ::: +

2
1 t 1

+ :: +

2
p t p

0 (ver no entanto a observao 8.3.1).

Surpreendentemente, o modelo mais simples GARCH(1,1),

2
t

2
1 ut 1

=!+

2
1 t 1;

veio a revelar-se suficiente em muitas aplicaes.

8.3.1

GARCH(p,q) representa um ARCH(1)

Considere-se o GARCH(p,q):
2
t

=!+

2
1 ut 1

2
t

= ! + ( 1 L + ::: +
|
{z

+ ::: +

2
q ut q

q
2
q L )ut

A(L)

(1

B (L))

2
t

2
1 t 1

1L

+ ::: +

+ ::: +
{z
B(L)

= ! + A (L) u2t :

2
p t p
P
pL

2
t

No mtodo dos mnimos quadrados (OLS) a estimao relativamente simples e imediata, mesmo que o
nmero de parmetros a estimar seja alto. Afinal, o algoritmo de optimizao converge numa nica iterao.
J no mbito dos modelos ARCH a estimao mais complicada pois a funo a minimizar altamente no
linear e os estimadores no podem ser escritos atravs de uma frmula fechada.

284

Assim,
(1

B (L))

= ! + A (L) u2t
!
A (L)
!
=
+
u2t =
+ D (L) u2t
1 B (L) 1 B (L)
1 B (L)
!
=
+ d1 L + d2 L2 + ::: u2t
1 B (1)
1
X
!
=
+
di u2t i :
1 B (1) i=1

2
t
2
t
2
t

Em suma, o modelo GARCH(p,q) pode ser representado como um ARCH(1):


2
t

!
1

+ d1 u2t

:::

+ d2 u2t

+ :::

Os parmetros di podem ser determinados pelo mtodo dos coeficientes indeterminados3 ou


a partir da frmula de Taylor (veja-se o exemplo seguinte).
Exemplo 8.3.1 Represente-se o GARCH(1,2) num ARCH(1). Tem-se
2
t

= !+

2
1 ut 1

2
t

= !+

1L

2
2 ut 2

2
1 t 1

+ 2 L2 u2t + ( 1 L) 2t :
| {z }
{z
}
B(L)

A(L)

Assim, o GARCH(1,2) pode representar-se na forma


2
t

A (L)
!
!
+
u2t =
B (1) 1 B (L)
1

+
1

1L

2
2L

1L

u2t :

Podemos obter os primeiros termos do desenvolvimento em srie (de potncias de L) de


2
1 L+ 2 L
1L

no programa Mathematica atravs da instruo

Series[
3

1L

2
2L
1L

; fL; 0; 7g]:

Considere-se

,
,

1L

2
2L

A (L)
= D (L)
1 B (L)
2
q
1 L + 2 L + ::: + q L
= d1 L + d2 L2 + :::
P
1
:::
1L
pL
+ ::: +

q
qL

= d1 L + d2 L2 + :::

1L

:::

P
pL

A partir da ltima equao igualam-se os coeficientes homlogos e resolvem-se as igualdades obtidas em ordem
a di :

285

O output do programa fornece:


1L

2
2L

1L

1L

1 1) L

2
1 1

L3

+(

2
2 1

3
1 1

L4 +

3
2 1

4
1 1

L5

4
2 1

5
1 1

L6 +

5
2 1

6
1 1

L7 + :::

2 1

Assim,
d1 =
Em geral di =

1;

1 di 1 ,

d2 =

1 1;

2 1

2
1 1;

etc:

i = 3; 4:::

Observao 8.3.1 A condio ! > 0;

0 certamente implica 2t > 0 mas no


P
!
2
+ 1
i=1 di ut i : Logo, para se ter
B(1)

0;

2
t

necessrio exigir tanto. Vimos atrs que


2
t

d3 =

> 0 basta exigir


! > 0 e di

0; i = 1; 2; :::

Por exemplo, no GARCH(1,2) vimos:


d1 =

1;

d2 =

1 1;

di =

1 di 1

Assim, temos apenas de garantir

(verifique que os valores

8.3.2

0;

= 0:2;

0;

0:05;

1 1

= 0:5 so admissveis).

Representao ARMA de um GARCH

Para simplificar considere-se o GARCH(1,1):

2
t

=!+

2
1 ut 1

os termos a varivel u2t :


u2t +

2
t

=!+

2
1 ut 1

286

+ u2t +

2
1 t 1;

2
1 t 1:

Some-se a ambos

isole-se u2t no lado esquerdo da equao e simplifique-se a equao at se obter o ARMA


implcito:
u2t = ! +

2
1 ut 1

= !+

2
1 ut 1

= !+(
= !+(

2
1 t 1

2
1 t 1

2
1 ) ut 1

2
1 ) ut 1

2
+ u2t
| {z }t
vt
2
1 ut 1

u2t

{z

vt

1 vt 1

2
1 ut 1
2
t 1

+ vt :

Como E (vt ) = 0 e Cov (vt ; vt k ) = 0 conclui-se: u2t

+ vt

+ vt

ARM A(1; 1). No caso geral

pode-se mostrar
ut

GARCH(p,q) ) u2t

ARMA(max fp; qg ; p):

Por exemplo,
ut

GARCH(1,2) ) u2t

ARMA(2,1)

ut

GARCH(2,1) ) u2t

ARMA(2,2)

ut

GARCH(2,2) ) u2t

ARMA(2,2)

Em geral problemtico identificar o GARCH a partir das FAC e FACP de u2t . Por duas
razes: 1) o GARCH implica uma estrutura ARMA para u2t e, como se sabe, no ARMA,
nenhuma das funes de autocorrelao (FAC ou FACP) nula a partir de certa ordem em diante (e, esta caracterstica que facilita a identificao das ordens do AR ou do MA, mas no
do ARMA); 2) no existe uma correspondncia perfeita entre a estruturas ARMA e GARCH
(por exemplo, um ARMA(2,2) para u2t pode ser um GARCH(2,1) ou um GARCH(2,2) para
ut ). Quer isto dizer que as funes de autocorrelao no so interessantes nesta fase? De
forma alguma, por duas razes: 1) se FAC e a FACP de u2t no apresentarem coeficientes
significativos ento no existe efeito ARCH; 2) a existncia de vrios coeficientes de autocorrelao e de autocorrelao parcial significativos indcio forte da presena de efeitos
ARCH4 .
Coeficientes de autocorrelao de u2t estatisticamente significativos podem ainda dever-se a um erro de especificao do modelo (veremos isso adiante) ou presena de outros modelos no lineares, como por exemplo,
o modelo bilinear.
4

287

Como regra geral, no devemos usar o ARCH; o GARCH prefervel. A identificao


das ordens p e q do GARCH faz-se na fase da estimao.
Estacionaridade de Segunda Ordem num GARCH(p,q)
Como se sabe E (ut ) = Cov (ut ; ut k ) = 0; 8k 2 N: Assim, para discutir a ESO do
processo u; basta analisar E (u2t ) :
Vimos
GARCH(p,q) ) u2t

ut

ARMA(max fp; qg ; p).

De facto, pode-se mostrar


u2t = ! +

q
X

p
X

2
i ut i +

p
X

i vt i

+ vt

i=1

i=1

i=1

maxfp;qg

= !+

2
i ut

2
i ) ut

i vt i

+ vt

i=1

i=1

= ! + (A (L) + B (L)) u2t i + (1

B (L)) vt :

Tem-se assim
(1

B (L)) u2t = ! + (1

A (L)

B (L)) vt :

A ESO de ut depende das razes do polinmio autoregressivo, (1


2

retamente, para que se tenha E (u2t ) =

A (L)

B (L)). Conc-

< 1 necessrio e suficiente que as razes do

polinmio autoregressivo estejam fora do circulo unitrio. Se adicionarmos a esta condio,


as restries

0e

0; a condio de ESO simplifica-se e, pode-se provar, igual a


q
X

i=1

8.4

p
X

< 1:

i=1

Modelo IGARCH

Definio 8.4.1 ut segue um modelo IGARCH(p,q) (ou tem representao IGARCH(p,q)) se


ut =
2
t

t "t

= !+

2
1 ut 1

2
q ut q

+ ::: +

q
X
i=1

p
X
i=1

288

2
1 t 1

=1

+ :: +

2
p t p

i.e., a soma dos parmetros

se

s igual a um.
2
t

Vamos analisar apenas o IGARCH(1,1):

2
1 ut 1

=!+

2
1 t 1;

onde

= 1:

A designao Integrated GARCH resulta do facto de u2t possuir uma raiz unitria:
u2t = ! + (
|

2
1 )ut 1

+
{z

+ vt

1 vt 1

+ vt

L) u2t = !

1 vt 1

+ vt

u2t = ! + u2t

(1

1 vt 1

(logo u2t um ARIMA(0,1,1)). Nestas condies ut no ESO. Durante algum tempo


pensou-se que ut seria tambm no estacionrio em sentido estrito. Daniel Nelson mostrou
que um IGARCH poderia ser estritamente estacionrio (EE). Concretamente mostrou: 1) a
condio necessria e suficiente para que ut seja EE5
E log

2
1 "t

< 0;

2) e que esta condio acaba por ser menos exigente que a condio de ESO,
Se E (log (

2
1 "t ))

< 1.

< 0; ento a distribuio conjunta de (u1 ; u2 ; :::; uk ) igual

distribuio conjunta de (ut ; ut+1 ; :::; ut+k ) para todo o t e k e, em particular, as funes
densidade de probabilidade so constantes no tempo f (ut ) = f (us ) ; 8t; s; pode-se ainda
2
t

mostrar que

uma varivel aleatria limitada em probabilidade (no tende para 1; como


p

2
t

primeira vista poderamos pensar) e

(!) (

(!) uma v.a.) (embora no

exista o segundo momento). Vrios estudos mostram que os testes assimptticos habituais
permanecem vlidos6 . Para assentar ideias, suponha-se "t
se

< 1 ) ut ESO;

se

< 1 vem, pela desigualdade de Jensen,


E log

e, portanto,

2
1 "t

log E

< 1 ) log E (

2
1 "t )

2
1 "t

N (0; 1) : Ento:

= log (

1)

<0

< 0; isto , se o processo ESO ento

Na proposio 4.5.5 e exemplo 4.5.13 aborda-se, do ponto de vista terico, esta questo.
Esta concluso contrasta com o processos integrados na mdia, por exemplo do tipo, yt = yt 1 + "t que,
como se sabe, no so nem estacionrios de segunda ordem nem estritamente estacionrios e onde os testes
habituais no so vlidos.
6

289

1 + 1 > 1

[ (

)]

E log 1 + t2 > 0

1 + 1 < 1

[ (

1 + 1 > 1

[ (

)]

E log 1 + t2 < 0

)]

E log 1 + t2 < 0
1

Figura 8-6: Regies no espao dos parmetros (

1;

1)

onde o processo fut g E2O e EE

tambm EE;
pode-se provar que

= 1 ) E (log (

2
1 "t ))

< 0 (este valor esperado

pode ser calculado de forma exacta7 ). Como referimos, o processo IGARCH EE. A
condio de ESO acaba por ser mais exigente do que a condio de EE. A primeira
exige a existncia do momento de segunda ordem enquanto EE exige que toda a estrutura probabilstica (leia-se funo de distribuio finita) seja estvel ao longo do
tempo, independentemente dos momentos serem finitos ou no.
E (log (

2
1 "t ))

< 0 6)

<1

A figura 8-6 mostra trs regies no espao dos parmetros (


o processo fut g ESO e EE. Na regio f(

1;

1)

2 R2 :

o processo fut g no ESO mas EE. Na regio f(

1;

1)

1;
1

2 R2 :

1 ).

Na regio f(

1;

1)

2 R2 :

> 1; E (log ( + "2 )) > 0g

Persistncia na Varincia

Certos processos exibem reverso para a mdia; outros no (e.g. RW). usual chamar a estes
ltimos processos persistentes no sentido em que choques nas inovaes exercem um efeito
7
Com efeito, a varivel aleatria Z = log 1 + 1 "2 tem distribuio conhecida. Por exemplo, basta
2
fazer uma transformao de varivel e atender ao facto de "2
(1) :

290

> 1; E (log ( + "2 )) < 0g

o processo fut g no ESO nem EE.

8.4.1

<

fhi = 0.1

fhi = 0.8

120

120

115

115

110

110

105

105

100
95

100

90

90

85

85

95

80

80
1

26

51

76

101 126 151 176

26

51

fhi = 0.98

76

101 126 151 176

fhi = 1
120

120
115

110

110
105

100

100
95

90

90

80

85
80

70
1

26

51

76

101 126 151 176

26

51

76

101 126 151 176

Figura 8-7: Persistncia e o processo AR(1)


persistente no nvel do processo. Na literatura, variam no s as definies de persistncia
como tambm as ferramentas estatsticas usadas para a avaliar.
Considere-se por exemplo o AR(1)
yt =

(1

) + yt

+ "t ;

Uma medida de persistncia pode basear-se em : Se

ut rudo branco
= 1 o processo persistente. Se j j <

1 no persistente. Poderamos ainda discutir nveis de persistncia (quanto mais perto


estiver de 1 maior a persistncia). Na figura 8-7 mostram-se 4 trajectrias simuladas de
yt =

(1

) + yt

+ "t ; ("t rudo branco Gaussiano) para

= 100; y0 = 80: Apenas

varia (tudo o resto igual, incluindo as inovaes "t ). Consideram-se os casos


= 0:8;

= 0:98 e

= 0:1;

= 1: Procura-se verificar a velocidade da reverso do processo

face sua mdia de longo prazo (no caso

= 1 no existe mdia de longo prazo) dada uma

condio inicial y0 = 80 relativamente afastada da mdia de longo prazo. Isto , tende ou no


o processo rapidamente para a sua mdia de longo prazo? A figura mostra que quanto maior
o valor do parmetro

mais lenta a reverso e, portanto, maior o nvel de persistncia.

291

Existem outras medidas de persistncia. Por exemplo a half-life o valor de h tal que
1
(yt
2

j Ft )

E (yt+h

);

(supondo yt > )

Suponha-se que em t existe um desvio de y face sua mdia de longo prazo igual a yt

Questo: quantos perodos so necessrios para que metade desse desvio seja eliminado (em
mdia)? Ou, em quanto tempo o processo elimina metade do desvio yt
Para exemplificar, considere-se o processo AR(1), yt =

yt

? A resposta h:

+ ut (note-se,

= 0).

Como se viu atrs


E (yt+h j Ft ) =
Assim, a half-life o valor de h tal que
h

yt :

yt = 21 yt : Logo

1
log (1=2)
yt = yt ) h =
:
2
log

Se temos dados dirios (t = 1 corresponde a uma dia) e, por exemplo,

= 0:8; ento

h = log (1=2) = log (0:8) = 3:1 o nmero de dias necessrios para que, em mdia, metade
do desvio de y face sua mdia de longo prazo seja eliminado. Valores altos de h indicam
maior persistncia (o processo demora mais tempo a eliminar desvios face mdia de longo
!

prazo e, neste caso, o processo exibe uma reverso para a mdia mais lenta). No caso

1 ) h ! 1 e o processo persistente. Obviamente, se E (yt+h j Ft ) no converge quando


h ! 1 o processo y persistente.
Tradicionalmente, o conceito de persistncia aplica-se mdia do processo. Com o
GARCH surgiu a ideia da persistncia em varincia. Choques na varincia so rapidamente
eliminados e

2
t

tende rapidamente para E ( 2t ) ou, pelo contrrio, os choques tm um efeito

duradouro na varincia?
Podemos tambm definir uma half-life para a varincia. Trata-se do valor de h tal que

onde

2
t+h

1
2

>

= E ( 2t ) : Para exemplificar, considere-se o GARCH(1,1). Vem

Ft

2
t

2
t

(supondo

)
= != (1

e
E

2
t+h

Ft = (

h
1)

2
t

(este resultado mostra-se no captulo da previso). Assim a half-life o valor de h tal que

292

1)

1)

2
t

(
Quando

1+ 1

) = 12 (

h
1)

2
t

2
t

) : Logo

1
2

2
t

)h=

log (1=2)
:
log ( 1 + 1 )

tende para 1; h tende para mais infinito e o processo persistente na varincia

(ou a volatilidade persistente).


Uma das dificuldades na anlise dos processos GARCH em geral, e dos IGARCH em
particular, o de que certos processos podem ser persistentes num certo modo de convergncia e no ser num outro modo de convergncia. Pode-se provar que os IGARCH, embora persistentes de acordo com a medida E

2
t+h

Ft no so persistentes no modo

de convergncia designado quase certamente ou com probabilidade 1 (como notmos


2
t

q:c:

(!) ; i.e.

2
t

converge quase certamente para uma varivel aleatria, apesar de

E ( 2t ) no existir).
Em muitas aplicaes empricas observa-se que a estimativa para

se encontra

muito perto de um, sugerindo que a volatilidade pode ser persistente (forte dependncia
temporal) e que Var (yt ) pode no existir. Este facto est de acordo com os factos estilizados
discutido no ponto no captulo 3.
Um modelo estacionrio mas em que a volatilidade exibe memria longa o FIGARCH
(GARCH fraccionrio).

8.4.2

Alteraes de Estrutura e o IGARCH

Modelos aparentemente IGARCH podem tambm dever-se a alteraes de estrutura (tal


como processos aparentemente do tipo yt = yt

+ ut podem dever-se a alteraes de estru-

tura). Por exemplo, considere-se a seguinte simulao de Monte Carlo:


yt = ut ;

ut =

t "t ;

2
t

= 0:1;

t = 1; 2; :::; 1000

= ! + u2t 1 + 2t 1 ;
8
< 0:5 t = 1; 2; :::; 500
= 0:6; ! =
: 1:5 t = 501; 502; :::; 1000

(8.6)

Este modelo foi simulado 500 vezes. Na figura 8-8 representa-se uma das 500 trajectrias
simuladas.
Em cada simulao (ou trajectria simulada) estimaram-se os parmetros. Embora o

293

10
8
6
4
2
0
-2
-4
-6
-8
1

101

201

301

401

501

601

701

801

901

Figura 8-8: Uma trajectria simulada de acordo com o modelo 8.6


modelo simulado no seja claramente um IGARCH (note-se que

= 0:7), concluiu-se

que:
em 83% das simulaes a soma dos parmetros ^ + ^ esteve acima de 0.99;
em 99.6% das simulaes a soma dos parmetros ^ + ^ esteve acima de 0.95;
em todos os casos ^ + ^ esteve acima de 0.9.
Este exerccio de simulao ilustra o impacto de alteraes de estrutura sobre os coefie : A mensagem clara: num aplicao emprica, se ^ + ^ estiver prximo de

cientes

um, convm verificar se o modelo subjacente de facto um IGARCH ou, pelo contrrio, se
existem alteraes de estrutura que causem um falso IGARCH . No obstante, quer se verifique +

= 1 ou o caso de ! no ser constante ao longo da amostra, o processo subjacente

sempre no estacionrio de segunda ordem. No primeiro caso a varincia no finita; no


segundo no constante. Quebras de estrutura ocorrem frequentemente quando o perodo
de anlise muito extenso. Nestes casos, ou se modela a quebra de estrutura (em princpio
a melhor estratgia) ou se encurta o perodo de observao (se os objectivos da aplicao
emprica assim o permitirem).

8.4.3

EWMA (Exponential Weighted Moving Averages)

Considere-se a seguinte estimativa para a volatilidade no momento t


1X 2
1 2
(h) =
yt i =
y
h i=1
h t
h

2
t

294

+ yt2

+ ::: + yt2

0.0007
0.0006
0.0005

Vol30

0.0004

Vol60

0.0003

Vol120

0.0002

Vol240

0.0001
Jan-06

Aug-04

Mar-03

Oct-01

May-00

Dec-98

Jul-97

Feb-96

Sep-94

Apr-93

Nov-91

Jun-90

Jan-89

Figura 8-9: Estimativas da volatilidade do ndice Dow Jones ao longo do perodo, baseadas
no estimador 2 (h) para diferentes valores de h (e.g., Vol30 = 2t (30) ; Vol60 = 2t (60) ;
etc.)
(supomos E (yt j Ft 1 ) = 0).
Na figura 8-9 mostram-se vrias estimativas da volatilidade do ndice Dow Jones ao longo
do perodo, baseadas no estimador
Vol60 =

2
t

(h) para diferentes valores de h (e.g., Vol30 =

2
t

(30) ;

(60) ; etc.)
2
t

O estimador

(h) levanta as seguintes questes e objeces:

qual o melhor valor de h? um pouco arbitrria a escolha de h;


o estimador

2
t

(h) implica que todas as observaes no perodo (t

mesmo peso na determinao do valor de

2
t

h; t

1) tm o

(h) : Por exemplo, com

1 X 2
1
(240) =
yt2
yt i =
240 i=1
240
240

2
t

+ yt2

+ ::: + yt2

240

todas as observaes tm um peso de 1/240. No entanto, seria prefervel dar mais peso
s observaes mais recentes;
o estimador

2
t

(h) implica que todas as observaes fora do perodo (t

h; t

1)

tm peso zero. Como consequncia, pode suceder o seguinte. Se na janela amostral


(t

h; t

1) existir uma observao extrema, a volatilidade sobrestimada; quando

essa observao sai da janela amostra, a volatilidade estimada cai depois abruptamente.
O estimador Exponential Weighted Moving Averages (EWMA, proposto pela J.P. Morgan) resolve algumas das fragilidades dos estimador acima descrito, dando mais peso s
295

observaes mais recentes:


2
t

= (1

= (1

1
X

i 1 2
yt i ;

i=1
yt2 1

+ yt2

0<

2 2
yt 3

<1
+ ::: :

Quanto mais alto for ; mais peso o estimador d s observaes mais antigas (o decrscimo
dos ponderadores , no entanto, sempre exponencial).
i

; somam 1,

! i = (1

) 1+

Os ponderadores, ! i = (1
1
X

+ ::: = 1

i=1

(recorde-se a soma de uma progresso geomtrica). Por exemplo, com


2
t

A expresso de

2
t

= (1

) yt2

= 0:5

yt2

2 2
yt 3

+ yt2

+ 0:5yt2

+ 0:25yt2

= 0:5 vem

+ :::
3

+ 0:125yt2

+ ::: :

pode ser reescrita de uma forma mais sugestiva. Notando que


2
t 1

) yt2

= (1

+ yt2

2 2
yt 4

+ :::

temos
2
t

) yt2

= (1

2
t 1:

(8.7)

Qual a relao entre o IGARCH e o EWMA? Considere-se um processo y com mdia


condicional igual a zero e com especificao IGARCH(1,1): yt = ut ; ut =
2
t

= !+

2
1 ut 1

= ! + (1

2
1 t 1;

2
1 ) yt 1

t "t :

Vem

=1

2
1 t 1:

Se ! = 0 conclui-se que um IGARCH(1,1) corresponde ao modelo EWMA. Assim, o modelo EWMA um caso muito particular do IGARCH.

296

8.5

Modelo CGARCH

Considere-se o GARCH(1,1):
2
t

= !+

2
1 ut 1

= !+

u2t

(1

1
1)

Esta equao relaciona

u2t
2
t

2
1 t 1

2
t 1

u2t

1
2

2
t 1

2
t 1

com a respectiva mdia de longo prazo e mostra como se processa


2
t

a dinmica de ajustamento de

face constante

O Component GARCH model (CGARCH) permite representar:


2
t

= qt +
2

qt =
2

onde

u2t

qt

qt

u2t

= E ( 2t ) : O ajustamento de curto prazo de


2

a qual tende, no longo prazo, para

2
t 1

2
t

qt

(8.8)

2
t 1

faz-se agora em relao v.a. qt ,

: A primeira equao designada de componente

transitria e a segunda equao de componente de longo prazo. O modelo CGARCH um


GARCH(2,2) com restries sobre os parmetros. Com efeito, substituindo
2

(1

qt =

2
t 1

u2t 1
L)

)+
(1

na equao (8.8) vem


2
2
t

(1

)+
(1

u2t 1
L)

2
t 1

+
= (1

2
t 1

1 ) (1

+(

(1
2

+ )

u2t

+(
2
t 1

u2t 2
L)

)+
(1

+ ) u2t

+ ((

(1

1
1)

2
t 2

+(
1

u2t 2
L)

)+
(1

2
t 2

= ::: =
1

1)

) u2t

2
t 2:

Atendendo condio de ESO do GARCH(p,q) fcil concluir que o processo CGARCH

297

ESO sse
(1

(1
( (1

1)

< 1:

Nestas circunstncias,

Var (ut ) =

1 ) (1

1) +

1)

A principal vantagem do CGARCH est na interpretao da dinmica de ajustamento, e no


necessariamente no ajustamento da varincia (um GARCH(2,2), sem restries nos parmetros, ajusta melhor, i.e., o valor da funo de verosimilhana no decresce).
O caso
qt =

= 0 sugere a presena de um GARCH(1,1). Com efeito, se

+ (qt

) : Para simplificar, suponha-se que q0 =

(verifique!). No caso q0 6=

tem-se qt !

: Se

= 0; vem

= 0 ) qt =

(se j j < 1). Esta convergncia deter-

minstica (a velocidade de ajustamento depende de ). Em qualquer dos casos (q0 =


q0 6=

ou

), e supondo j j < 1; tem-se, ao fim de algum tempo, um ajustamento dinmico, de

acordo com o modelo

2
t

u2t

2
t 1

: Assim, o caso

= 0;

sugere a presena de um GARCH(1,1).


O parmetro

est associado reverso de qt para

: Quanto mais alto (mais prximo

de um) mais lenta a velocidade de reverso e, portanto, maior o nvel de persistncia na


varincia condicional. Note-se que a reverso de
qt !

8.6

2
t

para

feita atravs de qt ; i.e.,

2
t

Modelo GJR-GARCH

O modelo GJR-GARCH devido a Glosten, Jagannathan e Runkle. Uma das caractersticas das sries de retornos de ttulos o Leverage Effect (i.e. momentos de maior volatilidade so despoletados por variaes negativas nos preos). Vimos no ponto 3.2.4 que este
efeito pode ser detectado atravs da medida (naive) Cov (yt2 ; yt 1 ) < 0: Veremos agora uma
forma bastante mais eficiente de estimar esse efeito. Comece-se por observar que o modelo ARCH/GARCH apenas detecta o chamado efeito magnitude. Isto , a volatilidade s
responde magnitude do valor de ut . Em esquema:
" u2t

)"

2
t

(efeito magnitude)

298

Para modelar o efeito assimtrico necessrio que a volatilidade responda assimetricamente


ao sinal de ut : Mais precisamente, a volatilidade deve aumentar mais quando ut < 0 (m
notcia) do que quando ut > 0 (boa notcia).
O modelo GJR-GARCH (assim como o EGARCH, AARCH, etc.) modela no s o efeito
magnitude como tambm o efeito assimtrico. A especificao mais simples (suficiente para
um grande nmero de aplicaes)
2
t

=!+
Ifut

2
1 ut 1

1 <0g

+ 1 2t 1 + 1 u2t 1 Ifut
8
< 1 se u < 0
t 1
=
: 0 se u
0:
t 1

De acordo com o efeito assimtrico devemos esperar

1 <0g

> 0: Como que

2
t

varia como

resposta a uma variao em ut 1 ? Uma forma de visualizar esta relao consiste em fixar
2
t 1

2
t

(varincia marginal) e depois traar

como funo de ut 1 : Este grfico designa-

se por news impact curve (NIC). NIC portanto uma funo de ut 1 . No caso GARCH,
tem-se
N IC (ut 1 ) = ! +

2
1

2
1 ut 1

= const: +

2
1 ut 1

(8.9)

e, no caso do modelo GJR-GARCH, a NIC


2

N IC (ut 1 ) = ! +

= const: +
Por exemplo, admita-se

= 0:2;

2
1 ut 1

2
1 ut 1

2
1 ut 1 Ifut

2
1 ut 1 Ifut

= 0:5; ! = 0:1;

1 <0g

(8.10)

1 <0g

= 0:4: Para estes valores as

NIC (8.9) e (8.10) esto representadas na figura 8.6. Como seria de esperar, a NIC associada
ao modelo (8.10) assimtrica e aba esquerda mais inclinada, traduzindo o facto de que a

299

volatilidade comparativamente maior quando ut

< 0:

12
10

Vol(t)

NIC GARCH

GJR-GARCH
4
2
0
-4

-3

-2

-1

u(t-1)

NIC GARCH e GJR-GARCH para

= 0:2;

= 0:5; ! = 0:1;

Para ensaiar o efeito assimtrico podemos considerar o ensaio H0 :

= 0:4

= 0 (atravs, por

exemplo, do teste de Wald). Pode-se provar que a condio de ESO (no caso em que a
distribuio de " simtrica)

1 =2

2
t

Var (ut ) = E

+
=

< 1: Nesta circunstncias,

!
1

1 =2

1)

Este modelo designado por TGARCH no EVIEWS.

8.7

Modelo GARCH-M

A teoria financeira postula uma relao entre rendimento esperado e o risco associado. Em
geral deve-se esperar que os activos com maior risco estejam associados aos activos com
maior rendimento.
yt = c + g

2
t

+ ut ;

ut =

2
t

t "t ;

=!+

Especificaes mais utilizadas:


g

2
t

t;

300

2
t

= log

2
1 ut 1

2
1 t 1:

Dada a estreita relao entre os parmetros da mdia e da varincia condicional, um erro de


especificao da varincia condicional afecta a consistncia dos estimadores dos parmetros
da mdia condicional.

8.8

Modelo de Heterocedasticidade Condicionada com Variveis Explicativas

Considere-se um modelo GARCH(1,1) (poderia ser outro modelo qualquer) com variveis
explicativas:
yt =

ut =

t "t

2
t

onde a funo g tal que

2
t

+ ut

= !+

2
1 ut 1

2
1 t 1

+ g (xt )

> 0 (com probabilidade 1). Que variveis poderemos considerar

para xt ? Vejamos alguns exemplos:


Dias da semana (ou qualquer outro efeito de calendrio):
2
t

=!+

2
1 ut 1

2
1 t 1

1 St

2 Tt

a
3 Qt

u
5 Qt

onde St = 1 se t uma segunda-feira, etc. (dever ter-se ! +min f i g > 0 )

2
t

> 0).

Ocorrncia de factos, notcias significativas. Por exemplo8 ,


2
t

goodt

badt

=!+

2
1 ut 1

2
1 t 1

1 goodt

2 badt

8
< 1 t = so divulgados resultados da empresa ABC acima do esperado
=
: 0
0
8
< 1 t = so divulgados resultados da empresa ABC abaixo do esperado
=
: 0
0

A chamada armadilha das variveis artificiais no ocorre no exemplo (embora parea) pois as notcias
podem ser boas, ms ou simplesmente no ocorrerem (e, neste caso, vem goodt = badt = 0).

301

Variao do preo do crude.


Medida de volatilidade de outro activo/mercado
Volume de transaces:
2
t

onde volt
volt

=!+

2
1 ut 1

2
1 t 1

pode ser especificada como volt

1 volt 1

volt
vol

ou volt

= log (volt 1 ) ou

= volt 1 =volt 2 , sendo vol o volume de transaces. Observe-se que o vol-

ume de transaces pode ser considerado como uma varivel proxy da varivel no
observada chegada de informao.
Qualquer outra varivel (estacionria) que supostamente afecte a volatilidade.
No ponto 7.4.9 vimos que o modelo em tempo discreto, compatvel com o processo CIR,
p
em tempo contnuo, drt = (
rt ) dt +
rt dWt conduz ao modelo,
rt = c + rt
ut =
2
t

+ ut

t "t
2

rt

Inspirados nesta especificao, certos autores modelam a taxa de juro em tempo discreto
combinando as caractersticas do GARCH com as caractersticas do processo de difuso
(modelo CIR):
rt = c + rt
ut =
2
t

O ensaio H0 :

= 0 vs. H1 :

+ ut

t "t

= !+

2
1 ut 1

2
t 1

+ rt 1 :

> 0 permite analisar se a nvel da taxa de juro influencia pos-

itivamente a volatilidade. Geralmente conclui-se


> 0:

302

> 0. A figura 8-10 sugere (claramente)

18
16
14
12
10
8
6
4
2
Jan-03

May-05

Sep-00

Jan-96

May-98

Sep-93

May-91

Jan-89

Sep-86

May-84

Jan-82

Sep-79

May-77

Jan-75

Sep-72

Jan-68

May-70

Sep-65

Jan-61

May-63

Sep-58

May-56

Jan-54

Figura 8-10: Taxa de Juro (Bilhetes do Tesouro a 3 meses -EUA)

8.9

Estimao

Seja yt =

t +ut

onde ut =

t "t :

Suponha-se que v.a. "t tem distribuio conhecida (normal,

t-Student ou outra) de mdia zero e varincia um. O vector dos parmetros desconhecidos,
, envolve parmetros definidos na mdia condicional e na varincia condicional.
A mdia condicional

pode depender de uma varivel xt (esta varivel pode ser encar-

ada tambm como um vector de variveis explicativas). Por exemplo, podemos ter,
yt =

ut =

t "t ;

2
t

1 yt 1

"t

+ ut

N (0; 1)

2
1 ut 1

= !+
= ( 0;

A estimao do vector

1 xt

1;

1 ; !;

1)

poderia ser feita da seguinte forma (tome-se como referncia o

modelo acima apresentado):


Passo 1 Estimao OLS de

0;

com base na equao yt =

Passo 2 A partir do passo 1, obtm-se os resduos u^2t : Como


uma representao AR(1) para

2
t

= !+

2
1 ut 1 ,

(vejam-se os pontos 8.2.2 e 8.3.2), os parmetros ! e


u^2t = ! +

^2t 1
1u

1 xt

= !+

1 yt 1

2
1 ut 1

ou seja, u2t = ! +

+ vt ; considerando o estimador OLS.

303

2
t

+ ut :

implica

2
1 ut 1

+ vt

estimam-se a partir da equao

O procedimento acima descrito envolve estimadores consistentes mas altamente ineficientes, pois em ambos os casos os erros das equaes so heterocedsticos (no caso da
estimao ! e

1;

a situao particularmente grave, pois, pode mostra-se, vt tende a exibir

forte heterocedasticidade).
O mtodo de estimao mais utilizado o mtodo da mxima verosimilhana (o GMM
tambm pode ser utilizado) que se descreve a seguir.

8.9.1

Estimador de Mxima Verosimilhana

Assuma-se que todos os parmetros de interesse, includos em ; apenas aparecem na densidade conjunta condicional f (Yn j Xn ; ) ; onde Yn = (yn ; yn 1 ; :::; y1 ) e Xn = (xn ; xn 1 ; :::; x1 ) :
Para simplificar a exposio, admite-se (sem perda de generalidade) que as condies iniciais Y0 so conhecidas. Tem-se assim, que a densidade relevante, para a estimao de ;
f (Yn j Y0 ; Xn ; ) :
Proposio 8.9.1 Se yt condicionalmente independente de (xn ; :::; xt+1 ) (n > t) dado
(Yt 1 ; Xt ), i.e.,
f (yt j Yt 1 ; Xn ) = f (yt j Yt 1 ; Xt ) ;
ento
f (Yn j Y0 ; Xn ; ) = f (yn j Yn 1 ; Xn ; )
:::
=

n
Y
t=1

f (yn 1 j Yn 2 ; Xn 1 ; )

f (y1 j Y0 ; x1 ; )

f (yt j Yt 1 ; Xt ; )

(8.11)

Dem. (esboo) Tem-se

f (Yn j Y0 ; Xn ; ) = f (yn j Yn 1 ; Xn ; ) f (Yn 1 j Y0 ; Xn ; )


|
{z
}

(8.12)

( )

Desenvolva-se a expresso (*):

f (Yn 1 j Y0 ; Xn ; ) = f (yn 1 j Yn 2 ; Xn ; ) f (Yn 2 j Y0 ; Xn ; )


= f (yn 1 j Yn 2 ; Xn 1 ; )f (Yn 2 j Y0 ; Xn ; )
|
{z
}|
{z
}
por hiptese

304

( )

(8.13)

Desenvolva-se a nova expresso (*):


f (Yn 2 j Y0 ; Xn ; ) = f (yn 2 j Yn 3 ; Xn ; ) f (Yn 3 j Y0 ; Xn ; )
= f (yn 2 j Yn 3 ; Xn 2 ; )f (Yn 3 j Y0 ; Xn ; )
{z
}|
{z
}
|
por hiptese

(8.14)

( )

A nova expresso (*) pode ser desenvolvida de forma similar. Coligindo as equaes (8.12)(8.14), obtm-se (8.11).
A hiptese definida na proposio anterior, estabelece que yt no depende dos valores
futuros xt+1 ; xt+2 dado It = Yt
de Yt

[ Xt ou, por outras palavras, xt dado Xt

no depende

(ou ainda, y no causa Granger x). Doravante assume-se esta hiptese.

A funo de verosimilhana (supondo que as condies iniciais Y0 so dadas)


Ln ( ) = f (Yn j Y0 ; Xn ; ) =
onde It = Yt

1 [ Xt

n
Y
t=1

f (yt j It ; )

(8.15)

(na prtica, se a ordem mxima do desfasamento das variveis definidas

na mdia condicional for p, dever ler-se no produtrio, t = p + 1 e no t = 1; para


simplificar, continue a assumir-se t = 1).
O estimador de mxima verosimilhana , como habitualmente,
^n = arg max log Ln ( ) = arg max log

n
Y
t=1

f (yt j It ; ) = arg max

n
X
t=1

log f (yt j It ; ) :

Sob certas hipteses, incluindo, f(yt ; xt )g um processo estacionrio e fracamente dependente, o estimador de mxima verosimilhana consistente e assimptoticamente eficiente.
A sua distribuio dada por
p
n ^n

! N 0; I ( 0 )

onde I ( 0 ) a matriz de informao de Fisher. Verifica-se I ( 0 ) = A ( 0 ) = B ( 0 ) onde


A( ) =

@ 2 lt ( )
@ @ 0

B( )=E

lt ( ) = log f (yt j It ; ) :

305

@lt ( ) @lt ( )
@
@ 0

Sob certas condies, A e B podem ser estimados consistentemente por


2
^
n
1 X @ lt n
n t=1 @ @ 0

A^n =

X @lt
^n = 1
B
n t=1
@
n

! A ( 0)

^n @lt ^n

! B ( 0) :

A aplicao do mtodo da mxima verosimilhana exige (em princpio) o conhecimento


da fdp condicional de yt dado It ; ou seja, necessrio conhecer-se f (yt j It ) : Num modelo
de heterocedasticidade condicional do tipo yt =

+ ut onde ut =

imediatamente da distribuio dos erros ": Por exemplo, suponha-se "t


ut j It =

t "t j It

N 0;

2
t

) yt j It

t;

t "t ;
i:i:d

2
t

a fdp f resulta

N (0; 1) : Logo,

e, portanto,
log f (yt j It ; ) =

1
log (2 )
2

1
log
2

2
t

1
(yt
2 ( )

( )

2
t

( ))2 :

(8.16)

Implementao no programa EVIEWS


Considere-se, a ttulo de exemplo, o modelo
yt =

ut =
2
t

=!+

2
1 ut 1

1 xt

t "t ;
2
1 ut 2

1 yt 1

"t
+

2
1 t 1

+ ut

N (0; 1)
+

0 segt

+ volumet

onde segt uma varivel dummy que assume 1 se t corresponde a uma segunda feira. Para
estimar o modelo no EVIEWS, atravs do mtodo da mxima verosimilhana, basta seleccionar estimate e depois ARCH"em method. Ver a figura 8-11.
Escolhendo 1 em Threshold order poderia estimar-se o GJR-GARCH.
Eficincia do Estimador de MV vs. Estimador OLS
Considere-se o modelo de regresso linear
yt = x0t + ut ;

ut = "t t ; "t

306

i:i:d

N (0; 1)

Figura 8-11: Estimao do GARCH no EVIEWS


onde x0t =

1 x1t

: Como fut g no autocorrelacionado e marginalmente

xkt

homocedstico resulta que o estimador OLS ~ n = (X0 X)

X0 y BLUE (best linear unbi-

ased estimator). Significa que o melhor estimador? No. O estimador de MV (no linear)
para ; ^ n ; assimptoticamente mais eficiente. Pode-se provar que a matrix
Var ^ n

Var ~ n

semidefinida positiva. Isto implica, em particular, que as varincias dos estimadores OLS
so maiores ou iguais s correspondentes varincias dos estimadores de mxima verosimilhana. Para confirmarmos esta ideia, simulou-se 1000 vezes o modelo
yt =

2 xt

+ ut ; xt
1

i:i:d

= 10;

ut = "t t ; "t
2
t

N (0; 1) ; t = 1; :::; 1000

i:i:d

= 0:05 + 0:2u2t

Em cada simulao estimaram-se os

= 5;

N (0; 1)
+ 0:75

2
t 1

pelo mtodo OLS e pelo mtodo da MV (us-

ando este ltimo mtodo estimaram-se ainda os parmetros da varincia condicional). Os


resultados esto presentes na tabela 8.1. Por exemplo, o erro quadrtico mdio do estimador

307

(1) OLS
0.001
Erro Quad.Mdio

(2) MV
0.0006

(1)/(2) (3) OLS


1.667 0.0011

(4) MV
0.0006

(3)/(4)
1.833

Tabela 8.1: Eficincia do Estimador OLS vs. Estimador de MV

Figura 8-12: Distribuies do Estimadores OLS e de MV de


simulao Monte Carlo)
OLS relativamente ao parmetro

1000

(obtidas a partir de uma

1 X ~ (i)
1
1000 i=1
(i)
e ~ 1 a estimativa OLS para

10

obtida na i-sima simulao).

A tabela 8.1 sugere que o estimador ML substancialmente mais preciso do que o estimador OLS. Com base nas 1000 estimativas OLS e de MV do parmetro

2;

apresenta-se na

figura 8-12 as fdp estimadas (no parametricamente) dos estimadores OLS e de MV.
A figura 8-12 confirma a tabela 8.1: o estimador de MV mais eficiente do que o estimador OLS (i.e., mais preciso ou apresenta menor variabilidade). A figura 8-12 tambm
sugere que ambos os estimadores so asimptoticamente centrados.
Prova-se (sob as condies usuais de regularidade) que o estimador de mxima verosimilhana apresenta as propriedades habituais, isto , consistente, assimptoticamente eficiente
e tem distribuio assimpttica normal (como vimos). O estimador OLS consistente para

308

os parmetros da mdia condicional mas, como vimos, no assimptoticamente eficiente.

8.9.2

Estimador de Pseudo Mxima Verosimilhana

Na prtica, a distribuio de "t no conhecida. Podemos ainda assim supor, por exemplo,
"t

N (0; 1) ou "t

t (n)? A resposta afirmativa no seguinte sentido: mesmo que a

verdadeira distribuio seja desconhecida, podemos ainda assim trabalhar com a hiptese
"t

N (0; 1) ou "t

t (n) e obter, sob certas condies, estimadores consistentes. Seja


yt =

(yt 1 ; yt 2 ; :::; xt ; xt 1 ; :::; ) + ut

ut =

(ut 1 ; ut 2 ; :::; ) "t

"t

Suponhamos que a verdadeira mas desconhecida fdp condicional de " f . O estimador de


mxima verosimilhana
^n = arg max

n
X
t=1

log f (yt j It ; )

no pode ser implementado, pois a funo f desconhecida. O estimador de pseudo mxima


verosimilhana usa como pseudo verdadeira fdp a funo h (que na generalidade dos casos
diferente de f ),
^pmv
= arg max
n

n
X
t=1

log h (yt j xt ; :::x1 ; yt 1 ; yt 2 ; :::y1 ; )

Sob certas condies, mesmo que h 6= f; o estimador de pseudo mxima verosimilhana


apresenta boas propriedades. As condies so:
h pertence famlia das densidades exponenciais quadrticas (a normal e a t-Student,
entre muitas outras distribuies, pertencem a esta famlia);
R
R

yh (yj It ) dy =
(y

2
t)

(a mdia condicional est bem especificada);


2
t

h (yj It ) dy =

(a varincia condicional est bem especificada).

Pode-se provar, sob estas condies:

^pmv
n

p
^pmv
!
n
d

! N 0; A ( 0 )
309

B ( 0) A ( 0)

Se, por acaso, a funo h a prpria funo f , i.e., f = h, ento o estimador de pseudo
mxima verosimilhana o estimador de mxima verosimilhana e, neste caso, tem-se
A ( 0 ) = B ( 0 ) e, portanto, A ( 0 )

B ( 0) A ( 0)

=A

( 0) :

Em suma, mesmo que a distribuio de "t no seja conhecida podemos supor, por exemplo, "t

N (0; 1) (ou "t

D tal que a densidade h satisfaa as condies estabelecidas),

pmv
porque ^n , ainda assim, um estimador consistente (embora no assimptoticamente efi-

ciente) e tem distribuio assimpttica normal. O nico cuidado adicional tomar como
matriz de varincias-covarincias (assimpttica) a expresso9 A ( 0 )

B ( 0) A ( 0)

no I ( 0 ) 1 .

8.9.3

Mtodo da Mxima Verosimilhana com Distribuies No Normais

No mbito do mtodo da mxima (ou da pseudo mxima) verosimilhana, normalmente


assume-se "t

N (0; 1). Contudo, verifica-se habitualmente que os resduos estandardiza-

dos, ^" = u^t =^ t apresentam um valor de kurtosis quase sempre acima do valor 3, i.e., k^" > 3.
Este resultado , at certo ponto, inesperado. O que habitual ter-se ku^ > 3. Quando u^t
so ponderados por ^ t seria natural esperar-se uma reduo significativa do valor da kurtosis
pois os valores muito altos e muito baixos de u^t sero ponderados por valores altos de ^ t :
Embora ocorra uma reduo do valor da estatstica de kurtosis quando se passa de u^t para
^"t = u^t =^ t ; normalmente observa-se ainda k^" > 3 (embora k^" < ku^ ). Assim, tambm a
distribuio condicional ut j Ft

(e no s a marginal) leptocrtica.

J vimos uma forma de lidar com este problema: basta tomar o estimador de pseudo
mxima verosimilhana. Uma alternativa consiste em formular uma distribuio leptocrtica
para "t tal que E ("t ) = 0 e Var ("t ) = 1. importante assegurar E ("t ) = 0 e Var ("t ) = 1:
Com efeito, suponha-se que Var ("t ) =

6= 1: Vem ento Var ( ut j Ft 1 ) =

amos de poder identificar a varincia condicional como

2
t:

2 2
t

e deix-

Vejamos algumas distribuies

habitualmente consideradas na literatura.


Hiptese: "t

t-Student(v)

A implementao desta distribuio envolve uma (pequena) dificuldade: se X


Student(v) ento Var (X) = v= (v

t-

2) : Mas dever ter-se Var ("t ) = 1 (pois s assim

Esta opo no EVIEWS dada por heteroskedasticity consistent covariance (Bollerslev-Wooldrige) no


menu options da estimao.

310

2
t

Var ( ut j Ft 1 ) =

- caso contrrio ter-se- Var ( ut j Ft 1 ) =

2
t v= (v

2)). A soluo

simples. Basta reparametrizar a varivel:


"t = X

2) =v ) Var ("t ) = 1; k" = kx = 3 +

(v

6
v

Considere-se assim a distribuio t-Student T(0,1) (de mdia zero e varincia 1):

g (x) = p

v+1
2
v
2

1
(v

2)

v+1
2

x2

1+

Para aplicar o mtodo da mxima verosimilhana necessrio conhecer-se f (yt j It 1 ) :


Pode-se provar10

f (yt j It ) =

yt

1
t

(v

v+1
2
v
2

2)

B
@1 +

1
log
2

+ log

Hiptese: "t

2
t

v+1
2
v
2

1
2
t

(v

2)

1
1
log
log (v 2)
2
2
v+1
1 (yt
log 1 +
2
v 2

t=1 lt

yt

B
@1 +

2
t)
2
t

v+1
2

C
A

Pn

v) onde

lt ( ) = log f (yt j It ) = log p

t
t

Assim, o estimador de mxima verosimilhana ^n = arg max

v+1
2
v
2

yt

( ) ; ( inclui

v+1
2

C
A

GED (Generalized Error Distribution)

Rx
g (x) dx a respectiva funo de distribuio. Qual a fdp de
Seja g (x) a fdp de " e G (x) =
1
yt = t + t "t condicionada a Ft 1 ; sabendo que (1) a fdp de "t dada pela funo g e (2) t e t so
conhecidos dado Ft 1 (ou It )? Trata-se de um problema clssico de mudana de variveis. Comece-se por
analisar a funo de distribuio condicional
10

P ( yt

yj Ft

Logo, a fdp de yt condicionada a Ft

f ( yj Ft

1)

=P(

1) =

dP ( yt

t "t

yj Ft

1)

=P

"t

t
t

Ft

=G

t
t

, pelo teorema da derivada da funo composta, dada pela expresso

yj Ft
dy

1)

=G

t
t

311

t
t

=g

t
t

1
t

g(x)

2.5
2.0
1.5
1.0
0.5

-3

-2

-1

Figura 8-13: Distribuio GED no caso v = 1=2


Diz-se que "t tem distribuio GED se a sua fdp dada por
1
v exp
2
g ("t ) =
(1+1=v)
2

"t v

(1=v)

funo Gama,

2=v

(1=v)
(3=v)

Pode-se provar E ("t ) = 0 e V ar ("t ) = 1: Se v = 2 ) distribuio normal padronizada, se


v < 2 ) g leptocrtica. Na figura 8-13 traa-se a g com v = 1=2:
Implementao no programa EVIEWS
Considere-se, a ttulo de exemplo, o modelo
yt =

ut =
2
t

=!+

2
1 ut 1

1 xt

t "t ;

2
1 ut 2

1 yt 1

"t

2
1 t 1

+ ut

t (v)
+

0 segt

+ volumet

onde segt uma varivel dummy que assume 1 se t corresponde a uma segunda feira. Para
estimar o modelo no EVIEWS, atravs do mtodo da mxima verosimilhana, basta seleccionar Students t em Error distribution. Ver a figura 8.9.3. O output fornece tambm
uma estimativa para o nmero de graus de liberdade da distribuio t-Student. Esta estimativa interessante pois fornece informao sobre o achatamento da distribuio condicional.

8.10

Ensaios Estatsticos

H basicamente dois momentos de interesse na realizao de ensaios estatsticos. Num


primeiro momento, interessa verificar se existe evidncia do efeito ARCH. Posteriormente,
depois da estimao, haver que analisar a adequabilidade do modelo estimado.
312

8.10.1

Ensaios Pr-Estimao

Teste ARCH (teste multiplicador de Lagrange)


Considere-se
yt =

ut =

t"

2
t

+ ut

= !+

2
1 ut 1

+ ::: +

Existe efeito ARCH se pelo menos um parmetro

2
q ut q .

for diferente de zero. Se todos forem

zero, no existe efeito ARCH. Pode-se provar, sob a hiptese H0 :

= ::: =

=0

que
d

nR2 !

2
(q)

onde R2 o coeficiente de determinao da regresso de u^2t sobre as variveis


1 u^2t
(^
u o resduo supondo

2
t

::: u^2t

(8.17)

constante). Suponha-se que q elevado e a hiptese nula

rejeitada. Ento conveniente considerar o GARCH. Na verdade, pode-se provar que o teste
multiplicador de Lagrange do efeito GARCH baseia-se tambm na regresso de u^2t sobre as
variveis u^2t i :

313

Para a realizao do teste os passos so:


1. Estima-se o modelo yt =

2
t

+ ut supondo

2. obtm-se os resduos u^t = yt

constante;

^ t ; t = 1; :::; n; (resduos OLS, depois da regresso

OLS de y sobre as variveis explicativas, ou resduos ARMA);


3. regresso OLS de u^2t sobre as variveis definidas em (8.17);
4. obteno de R2 da equao anterior e clculo do valor-p
nR2 :

2
(q)

FAC de u^2t
Como se viu, a existncia de um processo GARCH implica a correlao das variveis u2t
e u2t k : O teste Ljung-Box assimptoticamente equivalente ao teste ARCH. A sua hiptese
nula H0 :

(^
u2t ) = ::: =

(^
u2t ) = 0; sendo

(^
u2t ) o coeficiente de autocorrelao entre

u^2t e u^2t i : Sob H0 tem-se


Q = n (n + 2)

m
X
i=1

1
n

^2i u^2t

2
(m k)

onde k o nmero de parmetros estimados menos o termo constante. Evidncia contra a


hiptese nula sugere a existncia de um efeito ARCH.
Implementao no programa EVIEWS
O programa EVIEWS fornece o valor-p do teste multiplicador de Lagrange. Para obter
esse valor necessrio estimar primeiro o modelo sem efeito ARCH. No exemplo a seguir
(figura 8-14) considerou-se
yt = c + u t

+ ut :

onde y so os retornos do PSI20 (Jan 93 a Out 04). O modelo foi estimado atravs da instruo y c ma(1). Uma vez estimado o modelo, o programa EVIEWS oferece a opo
ARCH LM test... em view-Residual Tests. A figura 8-14 mostra que o valor-p zero,
pelo que existe forte evidncia contra a hiptese nula; por outras palavras, existe forte evidncia da presena de efeito ARCH. O teste Ljung-Box (ver a figura 8-15) corrobora as
concluses do teste ARCH.
314

ARCH Test:
F-statistic
Obs*R-squared

23.58130
218.9822

Probability
Probability

0.000000
0.000000

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Included observations: 2925 after adjustments
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
RESID^2(-1)
RESID^2(-2)
RESID^2(-3)
RESID^2(-4)
RESID^2(-5)
RESID^2(-6)
RESID^2(-7)
RESID^2(-8)
RESID^2(-9)
RESID^2(-10)

5.64E-05
0.183900
0.058698
0.019230
0.040301
0.004380
0.036872
0.032363
0.109910
-0.020103
0.029723

8.24E-06
0.018517
0.018824
0.018745
0.018739
0.018741
0.018741
0.018739
0.018745
0.018824
0.018517

6.840992
9.931537
3.118322
1.025890
2.150692
0.233690
1.967414
1.727034
5.863338
-1.067965
1.605224

0.0000
0.0000
0.0018
0.3050
0.0316
0.8152
0.0492
0.0843
0.0000
0.2856
0.1086

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.074866
0.071691
0.000376
0.000413
18918.62
1.999284

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

0.000112
0.000391
-12.92829
-12.90579
23.58130
0.000000

Figura 8-14: Output do EVIEWS associado ao teste multiplicador de Lagrange H0 :


2 = ::: = 10 = 0 (o p-value est destacado)

Figura 8-15: FAC de u^2t (e valores-p da estatstica Ljung-Box)

315

Existem muitos outros testes para ensaiar efeitos e modelos especficos (ver por exemplo,
Franses e van Dijk, 2000). Estes testes tm como objectivo sugerir a especificao da estrutura de

2
t

e, portanto, so realizados antes da fase da estimao (final) do modelo. Como

alternativa, podemos discutir esses efeitos especficos (por exemplo, efeito assimtrico) na
fase da estimao, a partir dos ensaios habituais de significncia e dos critrios SC e AIC.
Por exemplo, suponha-se que se pretende ensaiar a presena do efeito assimtrico. Em
alternativa aos testes apresentados em Franses e van Dijk (2000), pode-se ensaiar a hiptese
1

= 0 (j na fase da estimao) no contexto do modelo

2
t

8.10.2

=!+

2
1 ut 1

2
1 t 1

2
1 ut 1 Ifut

1 <0g

; Ifut

1 <0g

Ensaios Ps-Estimao

8
< 1 se u
t
=
: 0 se u
t

<0

0:

Depois do modelo estimado (pelo mtodo da mxima (ou da pseudo) verosimilhana) h


interesse em testar determinada suposio envolvendo os parmetros ou em analisar a adequabilidade do modelo. Os trs testes assimptticos, rcio de verosimilhanas, multiplicador
de Lagrange ou teste de Wald, podem naturalmente ser usados. Uma aplicao do teste
multiplicador de Lagrange foi j vista (teste ARCH).
Teste de Wald
O teste de Wald muito fcil de usar no programa EVIEWS. Veja-se primeiro um esboo
da teoria. J conclumos que
p

n ^n

! N (0; V0 )

(8.18)

onde
8
< I( ) 1 = A( ) 1
0
0
V0 =
: A( ) 1B( )A( )
0
0
0

se ^n o est. de mxima verosimilhana


1

se ^n o est. de pseudo mxima verosimilhana

Suponha-se que se pretende ensaiar H0 : R


(recorde-se que

= r onde R uma matriz de tipo q

um vector coluna de dimenso k) e r um escalar. Por exemplo, se

316

k = 5 e H0 :

+2

= 3 tem-se q = 1 e
0

+2

B
B
B
B
B
=3, 0 0 0 1 2 B
|
{z
}B
B
B
R
@

Para obter a estatstica de teste associada a H0 : R


p
n R^n

2
3
4
5

C
C
C
C
C
3 :
C = |{z}
C
r
C
C
A

| {z }

= r considera-se, a partir de (8.18),

! N (0; RV0 R0 )

e, consequentemente11 ,
n R^n

r (RV0 R0 )

R^n

2
(q) :

(8.19)

O programa EVIEWS permite aplicar de forma muito fcil o teste de Wald. No exemplo
anterior, e depois de estimado o modelo GARCH, bastaria seleccionar view-coefficient
tests-Wald e depois escrever c(4)+2*c(5)=3. possvel tambm ensaiar relaes no
lineares entre os parmetros, como por exemplo, c(4)^2+c(5)^2=1.12
Testes individuais (por exemplo, do tipo H0 :
^n

= 0) baseiam-se na relao

^0
V
0;
n

devido a (8.18) (para n finito mas suficientemente alto, ^n tem distribuio aproximadamente
igual a N ( 0 ; V0 =n)). Assim, para ensaiar, por exemplo, H0 :
t^n;2 =

= 0 considera-se o rcio-t

^n;2
se ^n;2

com distribuio N (0; 1) onde se ^n;2 o erro padro de ^n;2 ( a raiz quadrada do ele11

Note-se que se X um vector aleatrio dimenso q


1 com distribuio N ( ; ) ; ento
0
1
2
)
(x
)
:
(q)
12
Neste caso no linear seria necessrio adaptar a estatstica de teste (8.19). Observe-se que R 0 expressa
uma relao linear.
(x

317

^ 0 =n). O programa EVIEWS fornece automaticamente os rcios-t.


mento (2,2) da matriz V
Testes de Diagnstico
O modelo em anlise
yt =

+ ut ;

ut =

t "t :

e as hipteses so E ("t ) = 0; Var ("t ) = 1 (verificam-se sempre, por construo), f"t g um


processo diferena de martingala ou rudo branco e f"t g um processo homocedstico.
Nestas circunstncia, se o modelo est bem especificado, deve ter-se: f"t g deve ser no
autocorrelacionado e f"t g deve ser condicionalmente homocedstico.
Assim, se
(a) y , por exemplo, um ARMA e a mdia condicional no captar esta estrutura, os processos fut g e f"t g exibiro autocorrelao;
(b) de igual forma, se y segue um GARCH e a varincia condicional no captar esta estrutura
"2t = u2t =

2
t

exibir autocorrelao;

(c) finalmente, se " segue uma distribuio leptocrtica ento k^" > 3:
Para analisar (a) e (b), devemos:
1. estimar um modelo ARMAX+GARCH;
2. obter os resduos u^t ;
3. obter os resduos estandardizados ^"t = u^t =^ t ;
4. (Anlise da questo (a)). Efectuar o teste Ljung-Box tomando como hiptese nula,
H0 :

(^"t ) = ::: =

(^"t ) = 0 ( i (^"t ) o coeficiente de autocorrelao entre ^"t e

^"t i ) e estatstica de teste


Q = n (n + 2)

m
X
i=1

1
n

^2i (^"t ) !

2
(m k)

onde k o nmero de parmetros AR e MA estimados. Evidncia contra a hiptese


nula sugere que ^"t autocorrelacionado. Neste caso necessrio rever a especificao
da mdia condicional.
318

5. (Anlise da questo (b)). Efectuar o teste Ljung-Box tomando como hiptese nula,
H0 :

^"2t = ::: =

^"2t = 0 (

^"2t o coeficiente de autocorrelao entre ^"2t e

^"2t i ) e estatstica de teste


Q = n (n + 2)

m
X
i=1

1
n

^2i ^"2t

2
(m k)

onde k o nmero de parmetros estimados (McLeod e Li, 1983, sugere que k pode
ser apenas o nmero de parmetros dinmicos estimados na varincia condicional; por
exemplo, 2 no GARCH(1,1)). Evidncia contra a hiptese nula sugere que ^"2t autocorrelacionado. Neste caso necessrio rever a especificao da varincia condicional.
Taylor (2005), p. 258, aponta outros procedimentos alternativos.
Teste Alternativo
Uma forma alternativa de analisar a questo (b) atrs referida consiste em verificar a
presena de efeitos ARCH remanescentes atravs da especificao (Franses e van Dijk, 2000,
e Lundbergh e Tersvirta, 2002):
yt =

ut =

t "t

"t = e t
Sob H0 :

= ::: =

+ ut

q
1+

2
1 "t 1

+ ::: +

2
m "t m

= 0 (no existem efeitos ARCH remanescentes), tem-se


d

nR2 !

2
(m)

onde R2 o coeficiente de determinao da regresso de ^"2t sobre as variveis


1 ^"2t

::: ^"2t

x^t

onde
x^t =
e

1 @ ^ 2t
^t @ 0

o vector de parmetros especificados em

2
t.

319

Calcule-se

@
@

2
t
0

no caso

2
t

= !+

2
1 ut 1 +

2
1 t 1:

Tem-se
@
@

Suponha-se

@ 20
@!

2
t
0

=
@

2
t

@ 2t
@!

@
@

2
t
1

@
@

2
t

= 0: Vem

@ 2t
= 1+
@!

2
t 1

@
1

= 1+

@!
+

2
1

=1+

t 1
1

+ ::: +

1+
=

@
1

t
X

2
t 2

@!
i 1
1

= ::: =
1

=
1

i=1

t
1

1 :

Deixa-se como exerccio verificar que


@
@

2
t
0

Pt

i=1

i 1
1

Pt

i=1

i 1 2
^t i
1 u

Pt

i=1

i 1 2
1 ^t i

Nota: O programa EVIEWS esquece o vector x^t . Como consequncia, o valor da


estatstica nR2 apurado no EVIEWS depois da estimao ARCH/GARCH est subestimado
e, assim, a probabilidade P (rejeitar H0j H1 verdadeira) vem baixa. Tenderemos a concluir
quase sempre que o modelo est bem especificado, mesmo nos casos em que ainda existem
efeitos ARCH remanescentes. No EVIEWS, bem mais simples considerar o teste LjungBox (aplicado a ^"2t ).

8.11

Previso

A previso no contexto do modelo ARCH/GARCH envolve habitualmente a previso de yt


e de

2
t:

Todavia, em vrias aplicaes, como por exemplo, estimao do risco de mercado,

construo de portfolios dinmicos, valorizao de opes, etc., a previso da volatilidade


mais importante do que a previso de yt :
Vamos analisar a previso de yt e de

2
t

e estabelecer os respectivos intervalos de con-

fiana (ICs) ou de previso. Concretamente, temos um modelo do tipo ARMA+GARCH,


baseado em n observaes, fy1 ; y2 ; :::; yn g e procura-se,
prever yn+1 ; yn+2 ; :::;
estabelecer ICs para yn+1 ; yn+2 ; :::;

320

prever

2
n+1 ;

2
n+2 ; :::;

8.11.1

2
n+2 ; :::;

2
n+1 ;

estabelecer ICs para

Previso da Varincia Condicional

Vimos que o previsor com EQM mnimo para yn+h (dada a informao em Fn ) E (yn+h j Fn ) :
De igual forma, o previsor com EQM mnimo para

2
n+h

(dada a informao em Fn ) (nat-

uralmente)
E
Note-se que E u2n+h Fn = E
considere-se

2
n+h;n

Modelo ARCH(1)

2
t

2
2
n+h "n+h

2
n+h

:= E

2
n+h

Fn :
2
n+h

Fn = E

Fn . Para facilitar a notao

Fn : Vejam-se os exemplos seguintes.

2
1 ut 1

=!+

Previso a um passo h = 1
Como

2
n+1

2
1 un

=!+

tem-se

2
n+1;n

(na prtica, como

2
n+1;n

=E !+

2
1 un

Fn = ! +

2
1 un

desconhecido deve considerar-se ^ 2n+1;n = !


^ + ^ 1 u^2n ).

Previso a dois passos h = 2


Como

2
n+2

2
1 un+1

=!+

tem-se

2
n+2;n

Podemos ainda escrever


terior,

2
n+1;n

por ! +

2
n+2;n

2
1 un :

2
1 un+1

= E !+

Fn

= !+

2
E un+1 Fn

= !+

= !+

2
1 n+1;n

2
n+1

Fn

como funo do valor u2n : Basta substituir na expresso an-

Vem
2
n+2;n

= !+

2
1 n+1;n

= !+

!+

= ! (1 + ) +
321

2
1 un
2
1 un

Previso a h passos
2
n+h;n

= !+

2
E un+h

= !+

= !+

2
1 n+h 1;n :

Tal como anteriormente, podemos escrever


2
n+h;n

Se 0

2
n+h 1

2
n+h;n

2
1 n+h 1;n

=!+

Fn
Fn
Fn

como funo de u2n : Pode-se provar que

=!

h
1

1
1

h 2
1 un

< 1; conclui-se
2
n+h;n

O caso

2
1 un+h 1

= E !+

(quando h ! 1).

= Var (ut )

= 1 analisado adiante, no contexto do GARCH.


2
t

Modelo GARCH(1,1)

=!+

2
1 ut 1

2
1 t 1

Previso a um passo h = 1
Como

2
n+1

2
1 un

=!+
2
n+1;n

(na prtica, como

2
1 n

2
1 un

=E !+

2
n+1;n

tem-se
+

2
1 n

Fn = ! +

2
1 un

2
1 n

desconhecido deve considerar-se ^ 2n+1;n = !


^ + ^ 1 u^2n +

Previso a dois passos h = 2


Como

2
n+2

=!+

2
1 un+1

2
n+2;n

2
1 n+1

2
1 un+1

= E !+
= !+
= !+(

tem-se
+

2
1 n+1

2
E un+1 Fn +
1

1)

322

2
n+1;n

Fn
E

2
n+1

Fn

2
1 ^ n ).

Previso a h passos
2
n+h;n

2
1 un+h 1

= E !+
= !+

2
E un+h

= !+(

2
1 n+h 1

Fn +

Fn
2
n+h 1

Fn

2
n+h 1;n

1)

Um pouco semelhana do que fizemos para a previso no ARCH, a expresso


2
n+h;n

=!+(

pode ser reescrita, como funo de u2n e


sob a condio 0

2
n+h;n

Assim, no caso

2
n+h;n

No caso

1)

2
n+h 1;n

h
1)

(8.20)

Pode-se provar que a soluo da equao (8.20),

< 1 (e dada a condio inicial

! 1
=

2
n:

+(

h 1
1)

2
n+1;n

=!+

2
1 un

2
1 un

2
1 n

2
1 n)

< 1; tem-se
!

!
1

(quando h ! 1).

= Var (ut )

= 1 (IGARCH(1,1)) vem
2
n+2;n

= !+

2
n+1;n

2
n+3;n

= !+

2
n+2;n

=!+ !+

2
n+1;n

= 2! +

2
n+1;n

:::
2
n+h;n

= (h

1) ! +

2
n+1;n

e, portanto,
2
n+h;n

2
n+h;n

! 1,

Para alm da estimao pontual de

2
n+1;n ,

se ! = 0
se ! > 0 (quando h ! 1).

2
n+h;n ;

h interesse tambm em estabelecer ICs. Esta

questo tratada no ponto 8.11.3.

323

8.11.2

A Previso da Varivel Dependente y

Qualquer que seja o modelo para y; o previsor de yn+h com EQM mnimo, baseia-se, como
vimos, no valor esperado condicionado de y. Assim, a previso pontual de yn+h no envolve
qualquer novidade face ao que foi j exposto no ponto 6.6. Todavia, a estimao por intervalos deve agora reflectir a presena de heterocedasticidade condicional. Seja (l1 ; l2 ) o IC a
(1

) 100% associado a yn+h ; i.e, l1 e l2 so tais que


P (l1 < yn+h < l2 j Fn ) = 1
P

l1 E (yn+h j Fn )
yn+1 E (yn+h j Fn )
l2 E (yn+h j Fn )
p
< p
< p
Fn
Var ( yn+h j Fn )
Var (yn+h j Fn )
Var (yn+h j Fn )

Seja Zn+h = (yn+h

p
E (yn+h j Fn )) = Var ( yn+h j Fn ) e q1

=2

=1

o quantil de ordem 1

=2

da distribuio da v.a. Zn+h j Fn : Como tambm se tem


P

q1

=2

< Zn+h < q1

=2

Fn = 1

(supondo que a distribuio de Zj Fn simtrica) conclui-se


l1 E (yn+h j Fn )
p
=
Var ( yn+h j Fn )

q1

=2

l2 E (yn+h j Fn )
ep
= q1
Var (yn+h j Fn )

=2 :

Resolvendo estas igualdades em ordem a l1 e a l2 ;


l1 = E (yn+h j Fn ) q1

=2

p
Var (yn+h j Fn );

obtm-se o seguinte IC13 a (1

l2 = E (yn+h j Fn )+q1

=2

p
Var (yn+h j Fn )

) 100% para yn+h :

E (yn+h j Fn )

q1

=2

13

p
Var (yn+h j Fn )

Note-se que Var ( yn+h j Fn ) = Var ( en (h)j Fn ) onde en (h) = yn+h E ( yn+h j Fn ) o erro de previso
a h passos. Assim, o IC (1
) 100% pode ser tambm apresentado da seguinte forma:
p
E ( yn+h j Fn ) q1 =2 Var ( en (h)j Fn ):

324

Por exemplo, assuma-se que yn+h j Fn tem distribuio N (E (yn+h j Fn ) ; Var ( yn+h j Fn ))
e, portanto, Zn+h j Fn

N (0; 1). Nestas condies, o IC a 95% para yn+h


p
1:96 Var ( yn+h j Fn ):

E (yn+h j Fn )

Infelizmente esta expresso s est correcta para h = 1: O problema o de que yn+h j Fn


para h > 1 no tem geralmente distribuio normal na presena de efeitos ARCH/GARCH,
mesmo que as inovaes "t sejam Gaussianas e, portanto, mesmo que yn+1 j Fn tenha distribuio normal. No ponto 8.11.3 apresentamos um procedimento de bootstrap que permite
obter IC correctos para yn+h ; com h

1.

Outro caso de interesse o da previso de longo prazo. Se o processo ESO (e ergdico),


2
t

a previso de yt e de

no longo prazo, i.e. quando t ! 1 , respectivamente, E (y) =

limh!1 E (yn+h j Fn ) e Var (y) = limh!1 Var (yn+h j Fn ) (tratam-se afinal dos momentos
marginais da distribuio de y). O IC a (1

) 100% para a previso de longo prazo de y ,

desta forma,
E (y)
onde

=2

o quantil de ordem 1

p
Var (y)
=2

=2 da distribuio marginal de y. Este quantil pode

ser estimado a partir da distribuio emprica da sucesso de valores observados fy1 ; :::; yn g :
Analise-se nesta seco apenas a previso a um passo e deixe-se o caso da previso a
h > 1 passos para o ponto 8.11.3
Exemplo 8.11.1 Considere-se o modelo AR(1)+GARCH(1,1)
yt = c + yt
2
t

Se ut j Ft

N (0;

=!+

2
1 ut 1

+ ut ;

2
t ) ento um IC a 95% para yn+1

ou seja
c + yn

p
1:96 ! +

p
E (yn+h j Fn ) 1:96 Var ( yn+h j Fn )

2
1 un

Modelo de Regresso
Considere-se o modelo de regresso
yt = x0t + ut
325

2
1 t 1:

2
1 n:

onde x0t um vector linha de dimenso k e

vector coluna de dimenso k: Supomos que u e

X so independentes e ainda que ut j Ft

N (0;

2
t):

O previsor de yn+1 de EQM mnimo

E (yn+1 j Fn ; xn+1 ) = xn+1


Por que razo o valor esperado condicionado tambm a xn+1 ? A razo a seguinte: a
previso de y no momento n + 1 depende de xn+1 ; e, portanto, xn+1 tem de ser conhecido.
Na prtica, s em casos muito especiais se conhece xn+1 no momento n (mesmo assim,
podemos estar interessados em prever yn+1 admitindo um dado cenrio ou hiptese para
xn+1 ).
Assim, um IC para yn+1 a 95%
p
1:96 Var ( yn+1 j Fn ) , x0n+1

x0n+1

1:96

n+1;n :

Analise-se agora uma questo que normalmente descurada no mbito das sries temporais (mas no na rea da econometria). O intervalo de previso acima estabelecido assume
que

conhecido. Ao substituirmos

pela respectiva estimativa, introduz-se uma nova

fonte de variabilidade, que deve ser incorporada no intervalo de previso. Para se ter em
conta a variabilidade de ^ ; necessrio obter a distribuio da varivel yn+1

x0n+1 ^ : A

representao
yn+1

x0n+1 ^ = x0n+1 + un+1

permite concluir que yn+1

x0n+1 ^ = un+1 + x0n+1

^ = en (1)

x0n+1 ^ tem distribuio normal de mdia E (en (1)j Fn ; xn+1 ) =

0 e varincia
Var ( en (1)j Fn ; X) = Var x0n+1

^ + un+1 Fn ; xn+1
^

= x0n+1 Var

Fn ; xn+1 xn+1 + E u2n+1 Fn ; xn+1

= x0n+1 Var ^ xn+1 +

2
n+1;n

(assumindo-se E (un+1 j X) = 0). Considerando (1

) 100% = 95% tem-se

P (l1 < yn+h < l2 j Fn ) = 0:95 ,


P

l1

x0n+1 ^

yn+1

x0n+1 ^

l2

x0n+1 ^

p
<p
<p
Fn
Var (en (1)j Fn ; xn+1 )
Var ( en (1)j Fn ; xn+1 )
Var ( en (1)j Fn ; xn+1 )
326

= 0:95:

Obtm-se assim o seguinte IC a 95% para yn+1 :


r

x0n+1 ^

1:96

x0n+1 Var ^ xn+1 +

2
n+1;n :

Para amostra grandes podemos continuar a usar a aproximao x0n+1 ^

(8.21)
1:96^ n dado que

x0n+1 Var ^ xn+1 aproximadamente proporcional a 1=n e, portanto, tende para zero assimptoticamente (por outras palavras, uma quantidade pequena quando comparada com
2
n+1;n ).

8.11.3

Intervalos de Confiana para y e para a Volatilidade baseados


em Boostrap

Vimos at agora as seguintes questes:


intervalos de confiana para yn+1 ;
previso de

2
t

para os perodos n + 1; n + 2; :::;

Estas questes so relativamente simples tratar. J a obteno de intervalos de confiana


para yn+h ; h > 1 e para

2
n+h ;

1 problemtica, pois no so conhecidas as distribuies

de interesse. Estas questes resolvem-se de forma muito satisfatria recorrendo ao bootstrap.


Para exemplificar considere-se o modelo
8
>
>
y = c + yt 1 + ut
>
< t
ut = t "t
>
>
>
: 2 = ! + u2 +
t 1
t

(8.22)
2
t 1:

onde " tem distribuio desconhecida de mdia nula e varincia um. O algoritmo o
seguinte:
1. Estimar o modelo (8.22) e obter
u^t
^t
c^
^=
1 ^

f^"t ; t = 1; :::; ng ; onde ^"t =


^2 =

!
^
1

^ = c^; ^ ; !
^; ^; ^

327

2. Simular o modelo

8
>
>
y = c^ + ^ yt 1 + ut
>
< t
u t = t "t
>
>
>
: 2=!
^ + ^u 2 + ^
t

(8.23)
2
t 1

t 1

2
0

com os seguintes valores iniciais:

= ^ 2 e y0 = ^ : Os valores de "t so retirados

aleatoriamente com reposio do conjunto f^"1 ; :::; ^"n g :


3. Estimar o modelo (8.23) e obter as seguintes previses:
8
< y
^ + ^ yn+h 1
n+h = c
: ^ 2 =!
2
^ ^ 2
^ + ^ un+h
n+h
n+h
1+

Note-se que ^ = c^ ; ^ ; !
^ ;^ ;^

o vector das estimativas obtidas no contexto

do modelo simulado (8.23).


4. Repetir os passos 2 e 3 B vezes. Com este procedimento obtm-se as seguintes sries:
n
o
(1)
(2)
(B)
yn+j ; yn+j ; :::; yn+j ;
n
o
2 (1)
2 (2)
2 (B)
^ n+j ; ^ n+j ; :::; ^ n+j
;
5. Um intervalo de previso a (1

j = 1; :::; h:

) 100% para yn+j


q 2 ; q1

onde q 2 e q1

j = 1; :::; h;

n
o
(1)
(2)
(B)
so os quantis empricos da amostra yn+j ; yn+j ; :::; yn+j :

6. Um intervalo de previso a (1

) 100% para
q 2 ; q1

onde agora q 2 e q1

2
n+j

n
o
2 (1)
2 (2)
2 (B)
so os quantis empricos da amostra ^ n+j ; ^ n+j ; :::; ^ n+j
:

Com o passo 3 incorpora-se a variabilidade do estimador de ^ na construo dos ICs (esta


ideia idntica que conduz a considerar o valor x0n+1 Var ^ xn+1 na expresso 8.21).
Para mais pormenores veja-se Pascuala et al. (2006).

328

8.12

Problema dos Erros de Especificao na Mdia Condicional

Considere o modelo
yt =

2
E ut Ft

+ ut ;

t:

Em aplicaes desconhece-se a verdadeira funo

mente) para a mdia condicional a especificao mt 6=

constante

Suponha-se que se prope (erradat.

Ou seja prope-se

yt = mt + vt ;
onde vt tomada como a v.a. residual. Nestas condies pode existir um efeito ARCH
esprio.
Para exemplificar, suponha-se que o verdadeiro processo
yt = c + yt

+ ut ;

ut RB Gaussiano N 0;

Por erro de especificao supe-se mt = c. Nestas condies existe um efeito ARCH esprio. O modelo considerado (erradamente)
yt = c + vt ;

vt = yt

+ ut

onde vt tomada como a v.a. residual. Ora


vt2 = ( yt

+ ut )2 =

2 2
yt 1

+ u2t + 2 yt 1 ut

(c + vt 1 )2 + u2t + 2 yt 1 ut

2 2

c +

2cvt

2 2
vt 1

+ u2t + 2 yt 1 ut :

Tomando o valor esperado condicional e reagrupando os termos vem:


2
E vt Ft

= c1 + c2 vt

2 2
vt 1 :

Significa que vt exibe um efeito do tipo ARCH, apesar do modelo inicial ser condicionalmente homocedstico.
329

Considere-se agora um caso mais geral.


Modelo Verdadeiro : yt =

t.

Tem-se vt =

mt +ut : Como

+ ut ;

yt = mt + vt ;

Modelo Especificado Incorrectamente :


com mt 6=

e mt pertencem a Ft

e E (ut j Ft 1 ) = 0

vem
2
E vt Ft

Se E (u2t j Ft 1 ) =
stante, pois E (

Se E (u2t j Ft 1 ) =

= E (

= E (

= E (

mt )2 + 2 (
mt )2 Ft

mt ) ut + u2t Ft

+ E u2t Ft

ento a varincia condicional de vt ; E (vt2 j Ft 1 ), no con-

mt )2 Ft
2
t

mt + ut )2 Ft

no constante.

ento a varincia condicional associada ao modelo incorrecto

yt = mt + vt ser superior verdadeira varincia condicional


2
E vt Ft

=E (

mt )2 Ft

2
t:

Com efeito,

2
t:

A concluso deste ponto bvia: importante especificar bem a mdia condicional.


Como nota final registe-se que, na prtica, a mdia condicional que especificamos
E yt j Ft

onde Ft

o nosso conjunto de informao, necessariamente limitado, e

no o conjunto de todos os acontecimentos ! 2

que geram y no momento t

1: Como

resultado a mdia condicional que especificamente envolve quase sempre erros de especificao. A existncia do efeito ARCH pode dever-se ou acentua-se na presena desses erros
de especificao. interessante observar Engle (1982): the ARCH regression model is an
approximation to a more complex regression which has no-ARCH disturbances. The ARCH
specification might then picking up the effect of variables omitted from the estimated model.
The existence of an ARCH effect would be interpreted as evidence of misspecification.

330

8.13

Modelos No Lineares na Mdia combinados com o


GARCH

8.13.1

Modelo Limiar Autoregressivo com Heterocedasticidade Condicionada

O modelo TAR tal como foi apresentado na seco 7.3 no apropriado para sries temporais financeiras, pois assume que a varincia condicional constante ao longo do tempo.
Podemos, no entanto, generalizar o TAR de forma a acomodar heterocedasticidade condicionada. Se admitirmos o caso mais geral em que o padro de heterocedasticidade se distingue consoante o regime, o modelo a considerar, com dois regimes e um desfasamento
(veja-se Gospodinov, 2005)
yt = (
onde ut =
2
t

t "t

10

11 yt 1 ) Ifqt

+(

21 yt 1 ) Ifqt

20

d>

+ ut :

(8.24)

e f"t g uma sucesso de v.a. i.i.d. de mdia zero e varincia um e

= !1 +

2
1 ut 1

2
1 t 1

Ifqt

+ !2 +

2
2 ut 1

2
2 t 1

Ifqt

d>

g:

(8.25)

Aborda-se a seguir a estimao do modelo. Suponha-se que " um rudo branco Gaussiano.
Assim,
yt j Ft
onde

=(

(8.25). Seja

10

11 yt 1 ) Ifqt

+(

20

t;

2
t

21 yt 1 ) Ifqt

d>

2
t

dado pela equao

o vector de todos parmetros do modelo com excepo de :A funo log-

verosimilhana vem

log Ln ( ; ) =

n
X
t=1

log f (yt j It ; ; ) =

log f (yt j Ft 1 ; ; )

1
log (2 )
2

O problema de optimizao max


de log Ln ( ; ) em ordem a

Pn

t=1

1
log
2

2
t

( ; )

2
t

1
(yt
( ; )

( ; ))2 :

log f (yt j Ft 1 ; ; ) no standard, pois a derivada

no existe. O princpio do mtodo de mxima verosimilhana

mantm-se, todavia: necessrio maximizar a funo em ordem aos parmetros. A estimao dos parmetros processa-se da seguinte forma:
331

Parmetro
c

Estimativa
0.0478
0.2332
!
0.0118
0.1111
0.8812
Log-Veros.= 11439:3

Erro Padro
0.0075
0.0112
0.0015
0.0073
0.0074

Tabela 8.2: Resultados da estimao do modelo AR+GARCH


1. Escolha-se um valor para
Seja

no conjunto ~ (sobre o conjunto ~ veja-se o ponto 7.3.5).

esse valor.

2. Resolva-se o problema de optimizao max log Ln ( ;


o valor que maximiza Ln ( ;

) (dado

3. Registe-se o valor de log Ln ^n ( ) ;

) em ordem a ; seja ^n ( )

), i.e., ^n ( ) = arg max log Ln ( ;

):

4. Repitam-se os passos 1-3 at se exaurir o conjunto ~ :


5. A estimativa para

aquela que maximiza a funo de verosimilhana; seja ^ n esse

valor.
6. A estimativa para

, naturalmente, ^n (^ n ) :

Exemplo 8.13.1 Considere o retorno dirio em percentagem, yt = 100

log (Pt =Pt 1 ),

associados ao ndice NASDAQ, no perodo 5-02-1971 a 13-10-2006 (9006 observaes).


Na tabela 8.2 apresentam-se os resultados da estimao do modelo AR(1)+GARCH(1,1).
De seguida, estimou-se o modelo SETAR (8.24)-(8.25), com qt
os seis passos do procedimento descrito atrs. Obteve-se ^ n =

= yt 1 : Seguiram-se

0:356 (trata-se do valor

que maximiza a funo de log-verosimilhana log Ln ( ; )): A figura 8-16 mostra o valor
de log Ln como funo de

(observe-se que ^ n =

0:356 maximiza log Ln ). Para o valor

^ n estimado, obtiveram-se os resultados que constam da tabela 8.3. O primeiro regime modela os retornos quando estes esto em queda, mais precisamente, quando o retorno anterior
inferior a

0:356%: A mdia marginal deste regime

:1718= (1

:0563) =

:182%.

Tendo em conta este valor, h tendncia para o processo sair do regime 1, mantendo, ainda
assim, uma rendibilidade negativa. Talvez o dado mais significativo a forte persistncia
da volatilidade neste regime, associada a valores altos de volatilidade (w1 > w2 ). Este
resultado est de acordo com os factos estilizados habitualmente observados em dados financeiros, segundo os quais, a volatilidade tende a ser superior quando as cotaes esto
332

Figura 8-16: Valor da mximo da funo log-Verosimilhana como funo do parmetro :


Estimativa de : 0:358316
Parmetro

Estimativa
-0.1718
10
0.0563
11
!1
0.0233
0.0982
1
0.9776
1
0.0426
20
0.2384
21
!2
0.0175
0.0733
2
0.8575
2
Log-Veros.= 11344:5

Erro Padro
0.0312
0.0310
0.0075
0.0097
0.0152
0.0099
0.0177
0.0024
0.0073
0.0093

Tabela 8.3: Resultados da estimao do modelo SETAR+GARCH


a descer. A volatilidade associada ao regime 1 pode ser identificada como a m volatilidade, i.e., aquela que est ligada queda dos preos.

8.13.2

Modelo Markov-Switching com Heterocedasticidade Condicionada

Vimos na seco 7.4 que a separao das dinmicas do processo em estudo em dois ou mais
regimes permite, na maior parte dos casos, obter diferentes valores para

(veja-se o mod-

elo (7.25)). Significa isto que os erros so heterocedsticos. No entanto, possvel ir um


pouco mais longe se admitirmos, mesmo em cada regime, erros heterocedsticos. Em sries
financeiras, o modelo (7.25) pode mostrar-se insuficiente para modelar a volatilidade tpica

333

das sries financeiras. O caminho est assim indicado: necessrio admitir, em cada regime,
uma especificao dinmica para a volatilidade. Entendeu-se inicialmente (e.g. Hamilton)
que os modelos Markov-switching com efeitos GARCH eram intratveis e impossveis de
serem estimados, devido dependncia da varincia condicional de toda a trajectria passada
(em ltima anlise, a estrutura que se admitia para um Markov-Switching com N regimes
obrigaria posteriormente a expandir o nmero de regimes para N n sendo n o nmero de
observaes). Gray (1996) props um modelo que resolve a dependncia da varincia condicional de toda a trajectria passada.
O modelo MS+GARCH com dois regimes
8
< c +
1
yt =
: c +
2

onde

it

1 yt 1

1t "t

se St = 1

2 yt 2

2t "t

se St = 2

seguem a representao sugerida por Gray(1996),


2
it

2
i ut 1

= !i +

2
t 1;

(8.26)

sendo
ut = yt

2
t

E (yt j Ft 1 ) ;

= Var (yt j Ft 1 ) :

Pode mostrar-se que o problema da dependncia da varincia condicional surge quando se


define

2
it

como funo de ui;t

(erro no perodo t

1 associado ao regime i) e de

especificao (8.26) evita esse problema; observe-se que

2
it

depende ut

2
i;t 1 .

2
t 1:

Momentos de y
Determinem-se os momentos do processo. Seja

it

= E (yt j Ft 1 ; St = i) : No contexto

do modelo (7.25) tem-se:


E (yt j Ft 1 ; St = 1) = c1 +

E (yt j Ft 1 ; St = 2) = c2 +

1 yt 1 ;

334

2 yt 1 :

Tem-se

= E (yt j Ft 1 )
= E (yt j Ft 1 ; St = 1) P (St = 1j Ft 1 )
+ E (yt j Ft 1 ; St = 2) P (St = 2j Ft 1 )
=

1t p1t

2t p1t :

E (yt j Ft 1 ) , portanto, a mdia ponderada dos valores esperados condicionais dos regimes
1 e 2. Por outro lado,
2
t

= Var ( yt j Ft 1 ) = E yt2 Ft

(E (yt j Ft 1 ))2

= E yt2 Ft 1 ; St = 2 P (St = 1j Ft 1 )
+ E yt2 Ft 1 ; St = 2 P (St = 2j Ft 1 )
=

8.A

2
1t

2
1t

p1t +

2
2t

2
2t

p2t

2
t

2
t:

Estabilidade de EDF e a Estacionaridade (Caso modelo ARCH)

Apresenta-se uma abordagem alternativa para analisar a ESO. A ideia tomar, num primeiro
passo, os valores esperados marginais como funo de t; e verificar depois em que condies
esses valores esperados no dependem de t: Considere-se o ARCH(1). Como se sabe neste
caso tem-se
2
E ut = ! +
| {z }

u2t 1 ;
| {z }

1E

= !+

t 1

1 t 1

O ponto fixo da equao s diferenas finitas (EDF)14 ,


!
1
14

i.e.

:
1

Ver a definio de ponto fixo na seco 7.2.

335

=!+

1 t 1;

Este ponto assimptoticamente estvel se j


ento
EDF

t
t

=!+

1j

< 1; alm disso, se a condio inicial

; 8t. Quando a condio inicial


1 t 1

6=

!
1

pode-se provar que a soluo da

Se j

1j

=!

<1)
t

t
1)

(1
1

=!

t
1 0

t
1)

(1
1

(Soluo)

t
1 0

1
!

Se a condio inicial no igual soluo de longo prazo,

; o processo ut assimptot-

icamente estacionrio (ou ESO se o processo teve incio num passado remoto). Em suma,
se

< 1 (por hiptese

0) (e a condio inicial for != (1

2
E ut =

!
1

1 ))

ento

0;

2
E ut

, 8t

e o processo ut ESO.
No caso ARCH(2), tem-se

2
t

Var (ut ) = E u2t = E


= E !+

2
1 ut 1

=!+

2
2 ut 2 ;

! > 0;

0: Assim,

2
t

2
1 ut 1

2
2 ut 2

=!+

2
E ut

Donde
2
E ut = ! +
| {z }

=!+

1L

Pode-se provar que

u2t 1 +
| {z }

1E

t 1

1 t 1

u2t 2 ;
| {z }

i.e.

2E

t 2

2
2L

converge se as razes de (1

2 t 2

=!
1L

2
2L )

estiverem fora do circulo

unitrio, i.e.,
1

Como

0;

< 1;

< 1;

1<

< 1:

0; a nica condio que precisamos de verificar

336

< 1:

Nestas condies, se

2
E ut = ! +

1 (

!
1+

2)

2
E ut +

< 1 o processo u ESO e

2
2
E ut ) E ut =

337

!
1

2)

Pgina em branco

338

Captulo 9
Modelao da Heterocedasticidade
Condicionada - Caso Multivariado
(ltima actualizao: 3/2011)

9.1

Introduo

Vimos no ponto 3.2.6 que muitas sries financeiras (por exemplo, ndices bolsistas ou cotaes de aces) apresentam co-movimentos de rendibilidade e volatilidade, isto , quando
a rendibilidade e a volatilidade de uma srie aumenta (diminui), a rendibilidade e a volatilidade das outras tende, em geral, a aumentar (diminuir).
A estimao destes co-movimentos de rendibilidade e volatilidade deve ser naturalmente
feita no quadro da estimao multivariada (por multivariada entendemos vrias equaes).
Esta anlise relevante, por exemplo, no mbito da seleco de portfolios, da gesto do risco,
etc. Permite tambm discutir questes do tipo:
como se transmite a volatilidade de um mercado aos demais mercados? qual a magnitude do impacto da volatilidade de um mercado sobre outro?
os mercados globais influenciam a volatilidade de outros mercados (regionais ou
nacionais) sem serem por eles influenciados (contagiados)?
A volatilidade de um activo transmite-se a outro directamente (atravs da sua varincia
condicional) ou indirectamente (atravs das covarincias condicionais)?

339

Como se comportam as correlaes condicionais? So variveis ao longo do tempo?


Tendem a aumentar ou a diminuir em perodos de alta volatilidade e instabilidade dos
mercados?
Para tratar estas questes vai considerar-se um modelo genrico, envolvendo m equaes:
y1t =

1t

+ u1t ;

:::
ymt =
onde

mt

+ umt

:= E (yit j Ft 1 ) para i = 1; :::; m: Para usarmos uma notao mais compacta,

it

definam-se os seguintes vectores-coluna m dimensionais:


0

1
y1t
B
C
B . C
yt = B .. C ;
@
A
ymt

1t

B
B
=B
@

..
.
mt

C
C
C;
A

1
u1t
B
C
B . C
ut = B .. C :
@
A
umt

De forma compacta, o modelo pode representar-se na forma


yt =
A mdia condicional

+ ut :

no aqui relevante, mas pode supor-se que yt bem mode-

lado por um VARMA (vector ARMA, ou mesmo vector ARMAX). Tem-se um modelo de
heterocedasticidade condicional multivariado se ut um processo multiplicativo do tipo,
1=2

ut = Ht "t
onde "t um vector de v.a. i.i.d. (condicionalmente homocedstico) tal que
E ("t ) = 0;

Var ("t ) = Im (matriz identidade de ordem m)

e Ht uma matriz quadrada de ordem m; simtrica, definida positiva e Ft


(Ft a -algebra gerada por (yt ; yt 1 ; ::)). A notao
1=2

menos que Ht seja uma matriz diagonal, Ht


1=2

dos elementos de Ht . Ht
1=2

matriz Ht

1=2
Ht

mensurvel

merece alguns comentrios. A

no representa naturalmente a raiz quadrada


1=2

uma matriz quadrada ordem m tal que Ht

pode ser obtida utilizando a factorizao de Cholesky.


340

1=2

Ht

= Ht : A

Dadas as hipteses, tem-se


Var (yt j Ft 1 ) = Var (ut j Ft 1 ) = E (ut u0t j Ft 1 )
1=2

1=2

= Ht Var ("t j Ft 1 ) Ht
|
{z
}

= Ht :

Var("t )=Im

9.2

Densidade e Verosimilhana

N (0; Im ) : Nestas

Para simplificar a exposio assuma-se normalidade dos erros: "t


circunstncias, tem-se a seguinte relao:
N (0; Im ) ) ut j Ft

"t

N (0; Ht ) ) yt j Ft

N(

t ; Ht ) :

Assim, a densidade conjunta condicional de yt


f (yt j Ft 1 ) = (2 )

m=2

jHt j

1=2

exp

1
(yt
2

0
t)

Ht 1 (yt

t)

A funo log-verosimilhana ento

log Ln ( ) =

n
X
t=1

log f (yt j Ft 1 )

nm
log (2 )
2

nm
log (2 )
2
1X
(yt
2 t=1

1X
log jHt j
2 t=1
n

1X
(yt
2 t=1
n

0
t)

Ht 1 (yt

1X
log jHt ( )j
2 t=1
n

( ))0 Ht 1 ( ) (yt

t)

(9.1)

( ))

(a ltima equao destaca a dependncia face a ). No caso univariado (i.e. m = 1), vem
Ht =

2
t

e log f (yt j Ft 1 ) dada pela equao (8.16).

Nesta fase necessrio definir uma hiptese sobre a estrutura de


condicional

e de Ht . A mdia

pode ser definida atravs de um VAR(1) (vector autoregressivo) ou VARMA(1,1)

(vector ARMA), etc. No abordaremos aqui a especificao da mdia condicional. Neste


captulo estamos interessados sobretudo na especificao de Ht : Nos pontos seguintes discutiremos possveis especificao para Ht .

341

9.3

Modelo VECH (ou VEC)

necessrio, em primeiro lugar, introduzir o operador vech : Considere-se, por exemplo,


0

a11 a12 a13

B
B
A = B a21 a22 a23
@
a31 a32 a33

C
C
C:
A

O operador vech selecciona os elementos abaixo da diagonal principal (elementos dentro dos
quadrados) e passa-os para um vector-coluna:
0

B
B
B
B
B
B
vech (A) = B
B
B
B
B
B
@

a11

C
C
C
C
C
C
C:
C
C
C
C
C
A

a21
a22
a31
a32
a33

Obviamente que no se perde informao com esta operao se A uma matriz (real)
simtrica, hiptese que doravante se assume, sempre que se empregar tal operador.
O modelo VECH (ou VEC) (Engle e Kroner, 1995) prope uma estrutura GARCH(p,q)
multivariada. No caso GARCH(1,1), a matriz Ht tal que
vech (Ht ) = w + A1 vech ut 1 u0t

+ B1 vech (Ht 1 ) :

(9.2)

No caso m = 2 (processo bivariado) e GARCH(1,1) a expresso (9.2) toma a forma


0

h
B 11;t
B
vech (Ht ) = B h12;t
@
h22;t
0
B
B
+B
@

(h11;t :=

2
1t ;

ht;22 :=

2
2t ;

w
C B 11
C B
C = B w12
A @
w22

11

12

13

21

22

23

31

32

33

h12;t :=

C B
C B
C+B
A @

10

h
C B 11;t
CB
C B h12;t
A@
h22;t

t12 ).

11

12

13

21

22

23

32

33

31
1
1
1

10

u21;t 1

CB
CB
C B u1;t 1 u2;t
A@
u22;t 1

1
C
C
C
A

C
C
C
A

Note-se, por exemplo, que a covarincia condi-

342

cionada h12;t := E (u1t u2t j Ft 1 ) igual a


2
21 u1;t 1

w12 +

2
23 u2;t 1

22 u1;t 1 u2;t 1

21 h11;t 1

22 h12;t 1

23 h22;t 1

(9.3)

Como subproduto do mtodo, obtm-se as correlaes condicionais entre os retornos1

ij;t

hij;t
=p
;
hii;t hjj;t

i; j = 1; :::; m:

A condio de ESO no caso GARCH(1,1) a seguinte: fut g ESO se todos os valores


prprios de A1 + B1 forem em mdulo menores do que um (i.e., sse as razes em
jA1 +B1

de

Ij forem em mdulo menores do que um)2 . Nestas condies:


0

E (vech (ut ut )) = E (vech (Ht )) = (I

A1 B1 )

w:

A principal vantagem do modelo VEC a sua grande flexibilidade, pois permite que
todos os elementos de Ht dependam de todos os produtos cruzados de vech ut 1 u0t

e de

todos os elementos de Ht 1 : No entanto, as suas desvantagens superam largamente as suas


vantagens. As duas principais desvantagens do modelo VEC so as seguintes:
O nmero de parmetros a estimar excessivamente alto. No GARCH(1,1) multivariado com m equaes, o nmero de parmetros a estimar (m (m + 1) =2) (1 + (m (m + 1)))
(veja-se a tabela 9.1)3 .
Por definio a matriz Ht deve ser definida positiva, mas no fcil garantir isso a
partir das matrizes A e B. Se Ht no definida positiva, possvel, por exemplo, obter
1

indiferente identicar ij;t como as correlaes condicionais entre os retornos ou entre os erros, pois,
por definio, ij;t = Corr ( yit ; yjt j Ft 1 ) = Corr ( uit ; ujt j Ft 1 ) : J as correlaes marginais no so
necessariamente iguais, isto , em geral, tem-se Corr (yit ; yjt ) 6= Corr (uit ; ujt ).
2
Com efeito, pode-se provar que
E ( vech (Ht )j F0 ) = I+ (A1 + B1 ) + ::: + (A1 + B1 )
t

t 1

w+ (A1 + B1 ) vech (H1 )

sendo vech (H1 ) 2 F0 ). Se (A1 + B1 ) ! 0 (quando t ! 1) ento E ( vech (Ht )j F0 ) converge para o
1
t
momento estacionrio E (vech (Ht )) = (I (A1 +B1 )) : Ora, (A1 + B1 ) ! 0 sse os valores prprios de
A1 + B1 so em mdulo menores do que 1.
3
Com efeito, note-se que A1 e B1 so matrizes quadradas de ordem m (m + 1) =2 e o vector w possui
2
m (m + 1) =2 elementos. Assim, o nmero total de elementos a estimar 2 (m (m + 1) =2) +m (m + 1) =2 =
(m (m + 1) =2) (1 + (m (m + 1))) :

343

m (m (m + 1) =2) (1 + (m (m + 1)))
2
21
3
78
4
210
Tabela 9.1: Nmero de parmetros a estimar no VEC
coeficientes de correlao superiores a um e/ou varincias negativas (i.e.

ij;t

> 1 ou

ht;ii < 0).


Estas duas desvantagens acabam por limitar, de facto, a aplicao do modelo. Mesmo no
caso m = 2 tm-se 21 parmetros (tabela 9.1). Estimar 21 parmetros usando o OLS fcil
(desde que o nmero de graus de liberdade assim o permita). Mas estimar 21 parmetros
maximizando a funo log-verosimilhana (9.1) extremamente difcil. Frequentemente,
implementa-se o modelo VEC impondo vrias restries de nulidade sobre A1 e B1 , como
podemos ver no exemplo seguinte.
Exemplo 9.3.1 Existem efeitos de rendimento e de volatilidade do PSI20 que possam ser
antecipados atravs do Dow Jones (DJ)? Seja y1t e y2t o retorno dirio associado, respectivamente, aos ndices, PSI20 e DJ. Para reduzir o nmero de parmetros a estimar, as variveis y1t e y2t foram previamente centradas (e, como consequncia, os termos constantes
das equaes foram eliminados). Depois de vrios ensaios, definiu-se o seguinte modelo
0
@

y1t
y2t

A=@

11

12

22

10
A@

y1;t

y2;t

A + H1=2 "t

onde
0

h
B 11;t
B
vech (Ht ) = B h12;t
@
h22;t
0
B
B
+B
@

10

0
0 13
C B
C B 11
CB
C B
C B
CB
C = B 0 C + B 0 0 0 CB
A @
A @
A@
w22
0 0 33
10
1 0
0
0
h
volt 1
11
C B 11;t 1 C B
CB
C B
0 0 0 C B h12;t 1 C + B
0
A@
A @
0 0 33
h22;t 1
0

u21;t 1
u1;t 1 u2;t
1

u22;t

1
C
C
C
A

C
C
C
A

(vol uma medida do volume de transaces do mercado portugus). Todas as matrizes


quadradas so triangulares superiores, porque se assume que o DJ influencia o PSI20 e
no existem efeitos de feedback (o PSI20 no influencia o DJ). Usando os dados no perodo
344

31/12/92 a 15/03/99 (1496 observaes) obteve-se,


y^1t = :2343y1t
(:028)

^ 1t = :3132u^2
h
1t

(:0466)

^ 2t = 1:25
h
Assim,

B
^1 = B
A
B
@

7)

+ :1430y2t 1 ;

y^2t = :0753y2t

(:023)

+ :0466u^22t

(:0151)

10

(5:2 10

+ :0903u^22t
(:0195)

:3132 0 :0466
0

0 :0903

(:023)

^ 1t
+ :6053h
(:0459)

C
C
C;
A

+ :0254volt
(:0062)

^ 2t 1 ;
+ :897 h
(:0227)

B
^1 = B
B
B
@

h12;t = 0:

:6053 0

0 :897

1
C
C
C
A

^1 + B
^ 1 so f0:987; 0:918; 0g : Conclui-se: (1)
Os valores prprios (estimados) da matriz A
O comportamento do ndice DJ afecta significativamente o comportamento do PSI20, quer
em termos de rendimento quer em termos de volatilidade; (2) ganhos do DJ afectam favoravelmente o PSI20; (3) aumentos ou diminuies de volatilidade do DJ afectam no mesmo
sentido o PSI20; (4) os valores prprios respeitam a condio de ESO (note-se, todavia, que
esto sujeitos a variabilidade amostral). As concluses (1)-(3) so vlidas, naturalmente,
no muito curto prazo (um, dois dias). As possibilidades de ganho so muito reduzidas,
pois grande parte das variaes dos ndices no so explicadas (alta volatilidade). Como
nota final registe-se que a hiptese h12;t = 0 no realsta, pois implica que as correlaes
condicionais so zero. Ora a literatura mostra que as correlaes condicionais entre ndices
bolsistas quase sempre significativa.

345

9.4

Modelo Diagonal VECH

Podem obter-se modelos VECH com menos parmetros impondo que as matrizes A1 e B1
sejam diagonais. Por exemplo, no caso m = 2; vem
0

h
B 11;t
B
vech (Ht ) = B h12;t
@
h22;t
0

w
C B 11
C B
C = B w12
A @
w22
0

B 11
B
+B 0
@
0

22

0
C B 11
C B
C+B 0
22
A @
0
0
10
1
0
h
C B 11;t 1 C
CB
C
0 C B h12;t 1 C
A@
A
h22;t 1
33

10

u21;t 1

CB
CB
0 C B u1;t 1 u2;t
A@
u22;t 1
33

1
C
C
C
A

(este princpio aplica-se naturalmente no caso de modelos multivariados GARCH(p,q)).


Com matrizes A1 e B1 diagonais pode optar por escrever o modelo diagonal VECH na
forma equivalente
Ht = ! + a1 ut 1 u0t

+ b1 Ht

m e o produto de Hadamard4 . Por

onde !, a1 e b1 so matrizes simtricas de tipo m

exemplo, no caso m = 2; o modelo anterior escreve-se


0
@

h11;t h12;t
h12;t h22;t

onde a11 =

A = @

11 ;

a12 =

w11 w12

A+@

a11 a12

1 0
A @

w12 w22
a12 a22
0
1 0
b
b
h
h
@ 11 12 A @ 11;t 1 12;t
b12 b22
h12;t 1 h22;t
22 ;

a22 =

33 ,

h22;t = ! 22 + a22 u22;t

1
3

2
4

u22;t

A+

+ b11 h11;t

h12;t = ! 12 + a12 u1;t 1 u2;t

Dadas duas matrizes A = (aij )m


B = (aij bij )m m . Por exemplo,

u1;t 1 u2;t

u1;t 1 u2;t

etc. Note-se, portanto, que

h11;t = ! 11 + a11 u21;t

u21;t 1

e B = (bij )m
5
7

6
8

346

+ b12 h12;t

+ b22 h22;t 1 :
m

; o produto Hadamard define-se como A

5
21

12
32

A vantagem do modelo em anlise face ao modelo VECH a de reduzir o nmero de


parmetros a estimar. Num modelo multivariado GARCH(1,1) com m equaes, o nmero
total de parmetros a estimar no modelo Diagonal VECH de apenas 3m (m + 1) =2: Todavia h uma desvantagem face ao VECH. Para ilustrar este ponto considere-se o caso
m = 2. No modelo Diagonal VECH fcil verificar que hii;t s depende dos termos u2i;t
e hii;t 1 ; e h12;t s depende dos termos u1;t 1 u2;t

e h12;t 1 . Desta forma, a especificao

Diagonal VECH elimina a possibilidade de interaco entre as diferentes varincias e covarincias condicionais. Por outro lado, a matriz Ht ; por construo, no resulta definida
positiva. H vrias formas de ultrapassar este ltimo problema no mbito da especificao
Diagonal VECH. Uma possibilidade consiste em reespecificar o modelo na forma
Ht = !
~ 1 (~
! 1 )0 + ~
a1 (~
a1 )0 ut 1 u0t
~1 b
~1
com ! = !
~ 1 (~
! 1 )0 , a1 = ~
a1 (~
a1 )0 e b1 = b

~1 b
~1
+b

Ht

~ 1 so matrizes quadradas
e!
~ 1, ~
a1 e b

de ordem m: As matrizes !; a1 e b1 assim construdas implicam uma matriz Ht definida


positiva. Esta forma de definir o modelo resulta claro com o seguinte exemplo univariado.
Suponha-se que os parmetros

do modelo yt =

Podemos impor essa restrio estimando yt =


e

2
= ~ 1 : Desta forma

~2
0

0 + 1 xt + ut tm de ser positivos.
2
~ xt + ut e assumindo que
~2
0 =
1
0

vm sempre positivos quaisquer que sejam os valores de

~ 0 e ~ 1 : Em termos matriciais, o produto ~


a1 (~
a1 )0 resulta sempre numa matriz semidefinida
positiva, e o produto de Hadamard ~
a1 (~
a1 )0

ut 1 u0t

= diag (ut 1 ) ~
a1 (~
a1 )0 diag (ut 1 ) ,

por definio, uma matriz semidefinida positiva (ou definida positiva se ~


a1 tiver caracterstica
m). Vrias verses deste modelo so estimadas pelo software EVIEWS 6.
Um modelo ainda mais restritivo (mas que usado com algum sucesso na modelao
de sistemas com muitas equaes) foi desenvolvido pela J.P. Morgan (1996). Basicamente
usa o princpio exponentially weighted moving average (EWMA) para captar a dinmica das
varincias e covarincias condicionais,
hij;t = (1

) ui;t 1 uj;t

347

+ hij;t 1 :

O modelo EWMA, no caso m = 2; tem a seguinte representao VECH:


0

h
B 11;t
B
B h12;t
@
h22;t

C B
C B
C=B
A @

0
0

10

CB
CB
C B u1;t 1 u2;t
A@
u22;t 1

u21;t 1

1 0

10

0 0
h
C B
C B 11;t
C B
CB
C+B 0
0 C B h12;t
A @
A@
0 0
h22;t

1
1
1

C
C
C:
A

Existe uma reduo dramtica do nmero de parmetros a estimar (passamos para apenas 1,
qualquer que seja o nmero de equaes do modelo).

9.5

Modelo BEKK

O modelo BEKK (devido a Baba, Engle, Kroner e Kraft; veja-se Engle et al. 1993) assegura
por construo que Ht definida positiva. No caso mais simples BEEK(1,1), a matriz de
varincias-covarincias condicionais igual a
Ht = W + A01 ut 1 u0t
onde W; A1 e B1 so matrizes de tipo m

A1 + B01 Ht 1 B1

m; com W simtrica e definida positiva. Ht

definida positiva por construo pois W definida positiva e os demais termos esto expressos como formas quadrticas definidas positivas. No caso m = 2 tem-se
0

Ht = @
0
@

w11 w12
w12 w22
11

+@

12

21

22

A+

10 0
A @

11

12

21

22

u21;t 1

u1;t 1 u2;t

u1;t 1 u2;t 1
10 0
h
h
A @ 11;t 1 12;t
h12;t 1 h22;t

u22;t 1
1
1

10
A@

10
A@
11

12

21

22

11

12

21

22

1
A

A:

Depois de algumas contas, pode-se concluir, por exemplo, que:


h11;t = w11 +

2 2
11 u1;t 1

11

2
11 h11;t 1

12 u1;t 1 u2;t 1

12

2
21 u2;t 1
11

11 12 h12;t 1

348

21 u1;t 1 u2;t 1

11 21 h12;t 1

12 21 h22;t 1 :

Figura 9-1: Simulao do modelo BEKK (m = 2).


Com o modelo BEKK h ainda uma reduo de nmero de parmetros a estimar: passam
agora a existir (m + 5m2 ) =2: Na figura seguinte mostra-se uma simulao com dois activos.

9.6

Modelo de Correlaes Condicionais Constantes

O modelo VEC sem restries (quase) impossvel de ser implementado. O modelo BEKK
envolve ainda muitos parmetros e a maximizao da funo de verosimilhana extremamente difcil para m moderadamente elevado. A hiptese de Bollerslev (1990) consiste em
admitir correlaes condicionais constantes (i.e. iguais s correlaes marginais):
Esta hiptese reduz significativamente o nmero de parmetros a estimar. Tem-se

ij

ij;t

hij;t
=q

2 2
it jt

) ht;ij =

349

ij

it jt :

ij;t

ij :

VEC

BEEK
m+5m2

m (m (m + 1) =2) (1 + (m (m + 1)))
2
21
3
78

11
24

Correl.Const.
3m + 21 m (m
7
12

1)

Tabela 9.2: Nmero de parmetros a estimar


Logo
0

Ht

B
B
B
= B
B
B
@

B
B
B
= B
B
B
@
|

2
1t

12 1t 2t

12 1t 2t

2
2t

..
.

..
.

2t

..

{z

Dt

= Dt RDt :
2
it

..

..
.

2
mt

2m 2t mt

0
..
.

Supondo que

2m 2t mt

..
.

1m 1t mt
1t

1m 1t mt

= !i +

10

CB
CB
0 CB
CB
.. CB
. CB
A@
mt

2
i ui;t 1

C
C
C
C
C
C
A

12

1m

..
.

1
..
.

1m

2m

12

}|

2m

..

..
.

{z
R

Por outro lado, a matriz R envolve m (m

2
i i;t 1 ;

10
CB
CB
CB
CB
CB
CB
A@
}|

cada elemento

1t

0
..
.

..
.

C
C
0 C
C
.. C
. C
A

2t

..

mt

{z

Dt

2
it

envolve 3 parmetros.

1) =2 parmetros. Na tabela 9.2 comparam-se os

modelos VEC, BEEK e de correlaes constantes (na verso GARCH(1,1).


No s o nmero de parmetros a estimar menor como tambm a maximizao da
funo de log-verosimilhana mais fcil. Retome-se a equao (9.1):

log Ln ( ) =

nm
log (2 )
2

1X
log jHt j
2 t=1
n

1X
(yt
2 t=1
n

t)

Ht 1 (yt

t) :

Pode-se simplificar esta expresso atendendo aos seguintes resultados:


Ht = Dt RDt ;
log jHt j = log jDt RDt j = log jDt j + log jRj + log jDt j = 2 log jDt j + log jRj ;
(yt

0
t)

Ht 1 (yt

t)

= (yt

0
t)

Dt 1 R 1 Dt 1 (yt

350

t)

= vt0 R 1 vt :

Observe-se que vt representa o vector das variveis aleatrias estandardizadas:


0
t)

vt0 = (yt

Dt 1 =

y1t

y2t

1t
1t

ymt

2t

mt
mt

2t

Assim,
log Ln ( ) =

n
X

nm
log (2 )
2

t=1

1X 0 1
v R vt :
2 t=1 t
n

n
log jRj
2

log jDt j

Podemos simplificar log Ln ( ) se substituirmos R pela expresso que representa a soluo


da equao matricial @ log Ln ( ) =@R = 0: Pode-se provar que tal soluo
R=

Pn

t=1

vt vt0

A funo log-verosimilhana que assim se obtm designa-se funo log-verosimilhana concentrada:


log Ln ( ) = const:

n
X
t=1

Sabendo log jDt j = log (

n
log
2

log jDt j

1t

+ ::: +

mt ) ;

Pn

t=1

vt vt0

1X 0
v
2 t=1 t
n

Pn

t=1

vt0 vt

vt :

e utilizando-se mais algumas propriedades ele-

mentares do clculo matricial, a expresso da funo log-verosimilhana pode ainda apresentarse na forma simplificada:

log Ln ( ) = const:

n
X

log (

1t

+ ::: +

mt )

t=1

n
X
n
log
vt vt0 :
2
t=1

P
P
Note-se que j nt=1 vt vt0 j naturalmente o determinante de nt=1 vt vt0 : Nos modelos VEC e

BEEK, necessrio inverter a matriz Ht para cada t e para cada iterao do algoritmo de
maximizao. Esta dificuldade superada com o presente modelo. A principal desvantagem
do modelo em anlise o de assumir correlaes condicionais constantes.

9.7

Modelo DCC

O modelo DCC (Dynamic Conditional Correlation), devido a Engle (2002), uma extenso
do modelo de correlaes condicionais constantes (CCC).
No modelo de CCC a matriz de varincias-covarincias definida como Ht = Dt RDt ;

351

sendo R a matriz de correlaes condicionais (constante). Esta matriz , por definio,


E (vt vt0 j Ft 1 ) e calcula-se da seguinte forma:
0
1
E (vt vt j Ft 1 ) = E Dt (yt

t ) (yt

t)

Dt 1 F t

= Dt 1 Ht Dt 1 = R:

Nos modelos VEC e BEKK (entre outros) a matriz E (vt vt0 j Ft 1 ) varivel ao longo
do tempo. Este resultado decorre das hipteses formuladas para Ht (, portanto, uma consequncia da forma como Ht especificada). No modelo DCC E (vt vt0 j Ft 1 ) tambm varivel, mas este resultado decorre directamente da forma como a matriz E (vt vt0 j Ft 1 ) parametrizada. A ideia consiste em propor um modelo para Rt = E (vt vt0 j Ft 1 ) : Considere-se
0

B
B
B
Rt = B
B
B
@
Como parametrizar ou modelar

1
12;t

..
.
1m;t

12;t

1
..
.
2m;t

1m;t
2m;t

..

..
.

C
C
C
C:
C
C
A

ij;t ?

** incompleto**

9.8
9.8.1

Modelo Triangular
Introduo e Formalizao do Modelo

O modelo que designamos de triangular inspirado em Christiansen (2007).


Em certas aplicaes admissvel supor que a mdia de y1t condicionada a Fty1 1 =

fy1;t 1 ; y1;t 2 ; :::g no depende de Fty2 1 = fy2;t 1 ; y2;t 2 ; :::g ; i.e.,


y
y
y
E y1t j Ft 1 1 [ Ft 2 1 = E y1t j Ft 1 1 :

Diz-se, nestes casos, que y2 no causa Granger y1 : Para concretizar, suponha-se que y1t
o retorno do NASDAQ e y2t o retorno do PSI20. Dadas as dimenses relativas dos
mercados, no faz sentido, supor-se que y1 (NASDAQ) dado todo o seu passado, possa ser
influenciado pelos valores atrasados de y2 (PSI20). Tambm em termos de volatilidade,
idntica conjectura pode ser estabelecida, i.e., a varincia de y1t condicionada em Fty1 1 no

depende dos valores passados de y2 ; Fty2 1 : No entanto, y2 (PSI20) dado Fty2 1 pode depender
352

de Fty1 1 (valores passados do NASDAQ).


Para processos y1 e y2 com as caractersticas acima descritas, possvel definirem-se
processos multivariados simplificados.
Para se ilustrar o modelo, considere-se o processo y = (y1 ; y2 ; y3 ) e suponham-se as
seguintes relaes: y1

y2

y2 significa y1 influencia y2 dado Fty2 1 e

y3 onde y1

y2 no influencia y1 dado Fty1 1 : Suponha-se ainda que y segue um processo VAR(1) (vector
autoregressivo de ordem 1). Sob a hiptese y1

y2

y3 e VAR(1), o processo y tem a

seguinte representao:
0

y
B 1t
B
B y2t
@
y3t

c
C B 1 C B
C B
C B
C = B c2 C + B
A @
A @
c3

11

21

22

31

32

10

y
C B 1;t
CB
0 C B y2;t
A@
y3;t
33

1
1
1

u
C B 1t
C B
C + B u2t
A @
u3t

C
C
C:
A

(9.5)

A matriz dos coeficientes autoregressivos triangular, porque na mdia condicional y1;t apenas depende de y1;t 1 , y2t depende de y1;t

e y2;t

e y3t depende de y1;t 1 ; y2;t

e y3;t 1 :

Como definir a estrutura de dependncias do segundo momento condicional, continuando


a assumir a relao y1

y2

y3 ? Uma forma simples e que facilita extraordinariamente a

estimao do modelo, consiste em admitir que


8
0
>
>
u
u = e1t
>
B 1t
< 1t
B
, B u2t
u2t = ae1t + e2t
>
@
>
>
: u = be + ce + e
u3t
3t
1t
2t
3t
| {z

1
C B
C B
C=B a
A @
b
} |

ut

0 0

10

e
CB 1t
CB
1 0 CB e2t
A@
c 1
e3t
{z
}| {z

onde se admite que (e1t ; e2t ; e3t ) so independentes entre si, e eit j Ft
!i +

2
i ei;t 1

2
i i;t 1 :

et

1
C
C
C
A

N (0;

2
it ) ;

2
it

Observe-se que u2t depende de e2t (efeitos idiossincrsicos) e ainda

dos choques idiossincrsicos da primeira equao. Por seu turno, u3t depende de e3t (efeitos
idiossincrsicos) e ainda dos choques idiossincrsicos da primeira e da segunda equao. A
volatilidade que decorre dos efeitos no idiossincrsicos designa-se de volatility spillover.
A designao modelo triangular agora bvia: a equao matricial (9.5) representa-se
na forma,
yt = c +
sendo
y2

yt

et

(9.6)

matrizes triangulares inferiores. Naturalmente que se perde a relao y1

y3 ; se as matrizes

no forem triangulares inferiores.

353

Dadas as hiptese sobre o vector et ; defina-se

2
it

Tendo em conta

!1

B
B
+B
@
0

2
i ei;t 1

!2
0

2
i i;t 1 ;

C B
C B
0 C+B
A @
!3

2
1 1;t 1

0
0

B 1
B
+B 0
2
@
0 0
|
{z
B

0
0

C
C
0 C
A
3

= W + A et 1 e0t

B
B
B
@

} |

+B

2
1;t 1

0
2
3 e3;t 1

C
C
C
A

C
C
C
A

e1;t 1 e2;t

e22;t 1

e2;t 1 e3;t
{z

et

0
1 et 1

2
2;t 1

0
{z

t 1

t 1

e21;t 1

B
B
B e1;t 1 e2;t
@
e1;t 1 e3;t
|

1 0

2
3;t

2
2 e2;t 1

2
3 3;t 1

C
C
0 C:
A

2
2;t

2
2 2;t 1

tem-se

2
1 e1;t

!
0 0
B 1
C
B
C
= B 0 !2 0 C
@
A
0 0 !3
0
1
0 0
B 1
C
B
C
+B 0
C
0
2
@
A
0 0
3
{z
}
|
0

2
1;t

B
B
:= Var (et j Ft 1 ) = B 0
@
0

= !i +

B
B
= B 0
@
0
0

0
2
3;t 1

1
C
C
C
A

e1;t 1 e3;t

e2;t 1 e3;t

e23;t

1
C
C
C
A

onde o produto de Hadamard e A e B so matrizes diagonais, tendo como elementos


genricos

i;

respectivamente.

Para se estudar a relao entre Var (et j Ft 1 ) (=

354

t)

e Var ( ut j Ft 1 ) (= Ht ) comece-se

por observar que


ut =

et ;

et =

ut ;

et e0t =

ut u0t

1 0

e, portanto,
Ht = Var (ut j Ft 1 ) = Var ( et j Ft 1 ) =
Desta ltima relao (i.e., Ht =

Ht =

A et 1 e0t

); sai

ut 1 u0t

(B
1 0

Var ( et j Ft 1 )
1

1 0

Ht (

t 1)

) : Em suma,

0
1

Esta ltima relao escreve Ht como funo dos termos ui;t 1 uj;t

Ht

1 0

e hij;t 1 : Expandindo

a expresso anterior e depois de clculos simples mas fastidiosos obtm-se, por exemplo,
h22;t = a2 ! 1 + ! 2 + a2 (
2a

2 u1;t 1 u2;t 1

2
2 ) u1;t 1

+ a2 (

2 ) h11;t 1

2a

2 h12;t 1

2 h22;t 1

(todas as expresses hij;t podem ser assim obtidas).


tambm interessante obter Ht como funo das expresses
Ht =

10

2
1;t

10

2
i;t :

1 0 0
0
0
1 a b
B
CB
CB
C
B
CB
C
B
C
2
= B a 1 0 CB 0
0 CB 0 1 c C
2;t
@
A@
A@
A
2
b c 1
0
0
0
0
1
3;t
0
1
2
2
2
a 1;t
b 1;t
B 1;t
C
B
C
= B a 21;t a2 21;t + 22;t
C:
ab 21;t + c 22;t
@
A
2
2
2
2 2
2 2
2
b 1;t ab 1;t + c 2;t b 1;t + c 2;t + 3;t

355

(9.7)

A partir de (9.7), deduzem-se tambm os coeficientes de correlao condicionados:

12;t

13;t

23;t

= q
= q

a 2
q 1;t
2
a2 21;t +
1;t
q
2
b2
1;t

2
2;t

2
1;t

2
1;t

+ c2

=q
a2

2
2;t

2
3;t

2
2
1;t + c 2;t
q
2
2
b2 21;t + c2
1;t + 2;t

= q
a2

ab

1;t

2
1;t

=q
2
2;t

2
2;t

b
2
1;t

b2

1;t
2
2;t

+ c2

2
3;t

:
2
3;t

Os sinais dos coeficientes a; b e c so decisivos nos sinais dos coeficientes de correlao


condicionados.
Observao 9.8.1 Tendo em conta as relao Vec (ABC) = (B 0
diag (Vec (A)) Vec (B) onde

A) Vec (C) e Vec (A B) =

o produto de Kronecker e diag definido como


00

diag @@

x1
x2

11

AA = @

x1

x2

A;

possvel reescrever Ht usando o operador Vec. Depois de algumas contas, obtm-se


~ +A
~ Vec ut 1 u0t
Vec (Ht ) = W

~ Vec (Ht 1 )
+B

(9.8)

onde
~ = (
W

) Vec (W) ;

~ = (
A

) diag (Vec (A))

~ = (
B

) diag (Vec (B))

Como a equao (9.8) est basicamente na forma da equao (9.2) deduz-se que a condio
~ +B
~ sejam, em mde ESO do processo fut g estabelece que todos os valores prprios de A

~ +B
~ so f0; 0; 0; 0; 0; 0;
dulo, menores do que um. Pode-se provar que os valores prprios de A
1;

3;

3 g:

Logo, dado

i;

0; o processo ESO sse

< 1; i = 1; 2; 3:

Conclui-se que a condio de segunda ordem coincide com a do processo fet g :

356

1+

9.8.2

Estimao

Considere a representao yt = c +

onde eit j Ft

yt

et (equao (9.6)), isto ,

y1t = c1 +

11 y1;t 1

+ e1t

y2t = c2 +

21 y1;t 1

22 y2;t 1

+ ae1t + e2t

(9.10)

y3t = c3 +

31 y1;t 1

32 y2;t 1

33 y3;t 1

(9.11)

2
i ei;t 1

2
i i;t 1 :

2
it ) ;

N (0;

2
it

= !i +

(9.9)

+ be1t + ce2t + e3t

A estimao do modelo pode ser

conduzida da seguinte forma:


1. Estimar a equao (9.9), pelo mtodo da mxima verosimilhana, e obter os resduos
f^
e1t g :
2. Substituir, na equao (9.10), e1t por e^1t e estimar o modelo. Obter os resduos f^
e2t g :
3. Substituir, na equao (9.11), e1t por e^1t e e2t por e^2t e estimar o modelo.
Estuda-se a seguir a verosimilhana associada ao modelo em anlise. A funo logverosimilhana dada pela expresso (9.1). Tendo em conta a estrutura triangular do
modelo possvel simplificar a log-verosimilhana e decomp-la em trs parcelas, como se
mostra a seguir. Observe-se, em primeiro lugar,
(yt

0
t)

Ht 1 (yt

1
1
= u0t ( 0 )
ut
t
1 2
1
=
u
+
(u2t au1t )2
1t
2
2

t)

1t

log jHt j = log j

(b

2
1t

2
3t

(u3t

j = log j j2 j

= log j j2 + log (j
= log

2t

+ log

ac) u1t

t j)

2
2t

357

ac) u1t

cu2t )2

tj

= log (1) + log

+ log

cu2t =

Tem-se assim,

(b

be1t

2
3t

ce2t :

2 2 2
1t 2t 3t

log Ln ( ) =

nm
log (2 )
2

nm
log (2 )
2
1X
2 t=1
n

2
3t

1
2
1t

(u3t

1X
log jHt j
2 t=1
1X
log
2 t=1

1X
2 t=1
n

u21t +
(b

=
|

+
|
|

1
2
1t

2
2t

2
1t

2
2t

+ log

0
t)

Ht 1 (yt
2
3t

+ log

(9.13)

cu2t )2

1X
log
2 t=1

t) :

(9.12)

au1t )2

(u2t

ac) u1t

(9.14)

nm
log (2 )
2

1X
(yt
2 t=1

u21t +

2
2t

2
1t

ae1t )2 +

(u2t

1X
log
2 t=1
{z

1
2
3t

(u3t

log Ln;1

1X
log
2 t=1

1X 1
(u2t
2 t=1 22t
{z

2
2t

ae1t )

log Ln;2

1X
log
2 t=1

1X 1
(u3t
2 t=1 23t
{z

2
3t

be1t

2
1t

be1t

2
3t

+ log

1X 1 2
u
2 t=1 21t 1t

nm
log (2 ) +
2

2
2t

+ log

!
}

ce2t )2

ce2t )2

!
}

!
}

log Ln;3

= log Ln;1 + log Ln;2 + log Ln;3

A decomposio log Ln ( ) = log Ln;1 +log Ln;2 +log Ln;3 ; mostra que a estimao pode
ser feita consistentemente de acordo com os passos acima indicados. A primeira parcela,
log Ln;1 ; s depende do vector

= (c1 ;

11 ; ! 1 ;

1;

0
1)

Estes parmetros so estimados de forma consistente e eficiente maximizando (apenas) log Ln;1
(trata-se, portanto, da estimao, pelos mtodos habituais, da equao (9.9)). A segunda
parcela, log Ln;2 ; depende do vector,

= (c2 ;

21 ;

22 ; ! 2 ;

358

2;

0
2 ; a)

e ainda de

1;

atravs dos erros fe1t g : A estimao de

atravs da maximizao de log Ln;2

pode ser feita de forma consistente, mas no eficiente, substituindo os erros fe1t g por f^
e1t g :
A estimao consistente pois f^
e1t g baseiam-se no estimador consistente ^1 ; obtido no

primeiro passo. Claro que a maximizao de log Ln;2 corresponde estimao da equao
(9.10), pelos mtodos habituais ((com f^
e1t g em lugar de fe1t g). Este raciocnio aplica-se de
forma anloga a log Ln;3 .
Como nota final, observe-se que a estimao do modelo pode ser totalmente eficiente
se a maximizao de log Ln for simultnea (confiram-se as equaes (9.12)-(9.14)). Como
se sabe, o problema da maximizao de log Ln , entre outros, o dos valores iniciais dos
parmetros a estimar. Este problema mitigado no presente contexto: basta fornecer como
valores iniciais as estimativas obtidas na estimao em trs passos, acima apresentada.

9.8.3

Testes e Rcios de Varincia

Considere-se novamente
8
>
>
h = 21t
>
< 11;t
h22;t = a2 21t + 22t
>
>
>
: h = b2 2 + c 2 2 +
33;t
1t
2t

8
>
>
u = e1t
>
< 1t
;
u2t = ae1t + e2t
>
>
>
: u = be + ce + e
3t
1t
2t
3t

2
3t :

Observmos que u2t depende de e2t (efeitos idiossincrsicos) e ainda dos choques idiossincrsicos da primeira equao. Por seu turno, u3t depende de e3t (efeitos idiossincrsicos) e
ainda dos choques idiossincrsicos da primeira e da segunda equao. Como referimos, a
volatilidade que decorre dos efeitos no idiossincrsicos designa-se de volatility spillover.
Desta forma, existem efeitos de volatility spillover do mercado 1 para o mercado 2 se a 6= 0
e dos mercados 1 e 2 para o mercado 3 se b 6= 0 e c 6= 0:
Pode-se ainda obter informao sobre a evoluo da transmisso da volatilidade ao longo
do tempo atravs de rcios de volatilidade. Seja RVti;j a proporo da varincia do mercado
j que causada pelo efeito de volatility spillover do mercado i (efeito do mercado i para j;
i 7! j). Tem-se
a2 21t
;
h22;t
b2 21t
=
h33;t

RVt1;2 =
RVt1;3

359

RVt2;3 =

c2 22t
:
h33;t

Dependent Variable: R1
Method: ML - ARCH
Sample (adjusted): 6/01/1993 4/09/2009
Included observations: 4055 after adjustments
Variable

Coefficient

Std. Error

z-Statistic

Prob.

C
R1(-1)

0.052202
-0.017161

0.013247
0.017808

3.940658
-0.963644

0.0001
0.3352

6.546092
13.74617
181.7812

0.0000
0.0000
0.0000

Variance Equation
C
RESID(-1)^2
GARCH(-1)

0.007049
0.066257
0.929667

0.001077
0.004820
0.005114

Figura 9-2: Estimao, primeiro passo - ver equao (9.9)


Dependent Variable: R2
Method: ML - ARCH
Sample (adjusted): 6/01/1993 4/09/2009
Included observations: 4055 after adjustments
Variable

Coefficient

Std. Error

z-Statistic

Prob.

C
R1(-1)
R2(-1)
RES1

0.052704
0.449084
-0.179191
0.552914

0.013123
0.019369
0.015456
0.015972

4.016235
23.18547
-11.59382
34.61746

0.0001
0.0000
0.0000
0.0000

3.367632
6.497201
84.55149

0.0008
0.0000
0.0000

Variance Equation
C
RESID(-1)^2
GARCH(-1)

0.009916
0.068232
0.923938

0.002944
0.010502
0.010928

Figura 9-3: Estimao, segundo passo - ver equao (9.10)


Por exemplo, RVt2;3 representa a proporo da varincia condicional do mercado 3 que
causada pelo efeito volatility spillover do mercado 2:

9.8.4

Exemplo

Pinto (2010) analisou a transmisso de volatilidade do mercado Norte-Americano (US) para


o mercado Europeu (EU) e, em particular, as repercusses destes dois mercados no mercado
Portugus (PT), atravs de um modelo triangular. O perodo analisado foi 4 de Janeiro de
1993 a 4 de Setembro de 2009. As variveis em anlise so: r1t - retorno do SP500, r2t retorno do DJ Euro 50 e r3t - retorno do PSI 20. Nas figuras 9-2 a 9-4 apresentam-se os
modelos estimados (na verso mais simples).
fcil constatar que existe evidncia estatstica de efeitos de volatility spillover do mercado US para o mercado EU (^
a = 0:55291 e rejeita-se a hiptese a 6= 0 com p-value = 0 - ver
figura 9-3) e dos mercados US e EU para o mercado PT (^b = 0:233, c^ = 0:4066 e rejeitam-se
as hipteses b 6= 0 e c 6= 0 - ver figura 9-4).
360

Dependent Variable: R3
Method: ML - ARCH
Sample (adjusted): 6/01/1993 4/09/2009
Included observations: 4055 after adjustments
Variable

Coefficient

Std. Error

z-Statistic

Prob.

C
R1(-1)
R2(-1)
R3(-1)
RES1
RES2

0.043610
0.222423
-0.093210
0.143101
0.233364
0.406663

0.010837
0.010966
0.012230
0.016376
0.007759
0.008429

4.024173
20.28223
-7.621611
8.738563
30.07544
48.24352

0.0001
0.0000
0.0000
0.0000
0.0000
0.0000

9.681126
16.00381
76.60615

0.0000
0.0000
0.0000

Variance Equation
C
RESID(-1)^2
GARCH(-1)

0.027709
0.158430
0.815877

0.002862
0.009900
0.010650

Figura 9-4: Estimao, terceiro passo - ver equao (9.11)


Na figura 9-5 apresentam-se os coeficientes de correlao condicionados (valores mdios
mensais). Podem ser retiradas algumas concluses:
As correlaes condicionadas entre os mercados US e EU e entre os mercados EU e
PT so, em mdia, relativamente fortes.
A correlao menos expressiva, mas significativa, entre o mercado US e o mercado
PT, embora se assista ao longo do perodo a um aumento dessa correlao.
Tendo em conta que as correlaes so positivas, os retornos tendem a flutuar na
mesma direco; por outro lado, verifica-se uma tendncia de crescimento das correlaes, ou seja, uma tendncia crescente de interligao entre os diferentes mercados.
Alguns dos valores mais altos dos coeficientes de correlao coincidem com algumas
crises financeiras5 . Este facto particularmente notrio com a crise do subprime de
2008.
Na figura 9-6 analisa-se a transmisso da volatilidade dos mercados EU e US para o
mercado PT atravs dos rcios de volatilidade. So considerados os seguintes rcios
RV _U St = RVt1;3 =

^b2 ^ 2
1t
;
^h33;t

c^2 ^ 22t
;
^ 33;t
h
RV _U St RV _EUt :

RV _EUt = RVt2;3 =
RV _P Tt = 1
5

As principais crises financeiras no perodo em anlise so as seguintes: Recesso do Japo, 1991; Crise do
Mxico, 1994/1995; Bolha Dot.com, 2000; Crise de 2001 (ataque s Twin Towers); Crise da Argentina, 2002;
Crise do Subprime, 2007/2008.

361

.9
.8
.7
.6
.5
.4
.3
.2
.1
94

96

98

00

PT-EU

02

04

PT-US

06

08

EU-US

Figura 9-5: Coeficientes de Correlao Condicional

Podem ser retiradas algumas concluses:


A volatilidade do mercado PT decorre em larga medida do seu prprio mercado (efeito
idiossincrtico), embora este efeito tenha a vindo a diminuir ao longo do tempo. Por
outras palavras, o efeito de volatilidade spillover dos mercados EU e US sobre o mercado PT tem vindo a aumentar ao longo do tempo.
O efeito de volatilidade spillover do mercado EU (para o mercado PT) geralmente
mais forte do que o do mercado US. No entanto, no perodo da crise do subprime, o
mercado US transmitiu mais volatilidade ao mercado PT do que o mercado EU.
Nos perodos de crise o efeito idiossincrtico tende em geral a diminuir. Observe-se
por exemplo, as crise de 2000 (das dot.com), de 2001 e de 2008.
Verifica-se uma tendncia de crescimento do rcio de volatilidade US para o mercado
PT.

9.9

GARCH Ortogonal

semelhana do modelo triangular, a principal vantagem do GARCH ortogonal a de


podermos estimar um GARCH multivariado atravs de GARCHs univariados.
362

1.0

0.8

0.6

0.4

0.2

0.0
94

96

98

00

02

RV_EU

04

RV_PT

06

08

RV_US

Figura 9-6: Rcios de Volatilidade


Seja yt = (y1t ; y2t ; :::; ymt )0 o vector das observaes no momento t (t = 1; :::; n). Se
quisermos normalizar as variveis consideramos
xit =

yit

E (yit )

(substituir E (yit ) e

pelos respectivos momentos da amostra, caso os parmetros sejam

desconhecidos). Logo E (xit ) = 0 e Var (xit ) = 1: Para simplificar suponhase E (yit ) = 0:


Nestas condies podemos escrever
0

B
B
B
yt =B
B
B
@
|

0
..
.

..
.

..
{z

0
..
.
m

10

x1t

CB
CB
CB x2t
CB
CB ..
CB .
A@
xmt
}| {z
xt

C
C
C
C=
C
C
A
}

Suponha-se que possvel encontrar matrizes Pt de tipo m

xt :

1 e W de tipo m

m nas

seguintes condies:
xt = WPt
Pt P0t diagonal.

363

(9.15)

Suponha-se que W no aleatrio dado Ft 1 . Vem


Cov (yt j Ft 1 ) = Cov ( xt j Ft 1 )
= E ( xt x0t j Ft 1 )
=

0
E (xt xt j Ft 1 )

0
0
E (WPt Pt W j Ft 1 )

W E (Pt P0t j Ft 1 ) W0

Tendo em conta (9.15) vem


0

(P 2 j F )
0
B E t1 t 1
B
B
0
E (P2t2 j Ft 1 )
0
E (Pt Pt j Ft 1 ) = B
B
..
..
B
.
.
@
0
0
conhecem as matrizes

..

0
..
.

2
j Ft 1 )
E (Pmt

W E (Pt P0t j Ft 1 ) W0

Vantagem da especificao Cov (yt j Ft 1 ) =

C
C
C
C:
C
C
A

? Supondo que se

e W; modelar Cov (yt j Ft 1 ) equivale a modelar apenas as varin-

cias condicionais de Pit : No temos que nos preocupar com a modelao das covarincias
condicionais! Alm disso Cov (yt j Ft 1 ) definida positiva, por construo.
Obter a matriz W
Seja X a matriz das observaes estandardizadas, X =
n

de tipo

m (por exemplo, x 1 representa o vector das observaes estandardizadas da varivel 1)

e
0

^ =X X:
V
n
V a matriz de correlaes de yt : Por exemplo, o elemento (1; 2) de V
x0 1 x
n

=
=

Pn y1t E(y1t ) y2t E(y2t )


x
x
t=1
1t
2t
t=1
1
2
=
n
n
Pn
1
E (y1t )) (y2t E (y2t ))
t=1 (y1t
n
:

Pn

1 2

Considerar
x0 1 x
n
se os momentos E (y1t ), E (y2t ),

=
1

1
n

Pn

t=1

(y1t

y1 ) (y2t
^1 ^2

y2 )

forem desconhecidos.
364

Como se sabe, se W i vector prprio de V e


^
VW
i =

iW i;

o valor prprio associado a W i ento

i = 1; :::; m

Compactamente
^
VW
=W
onde W =

::: W m a matriz dos vectores prprios associada a V e = diag ( 1 ; :::;


^ simtrica, logo possvel obter W tal que W0 W = I ). Como
Note-se que W0 W = I (V
W

X = PW0 , P = X (W0 )

= XW

tem-se
P0 P = W0 X0 XW
^
= nW0 VW
= nW0 W
= n :
Portanto, se W a matriz dos vectores prprios associada a V ento P0 P uma matriz
diagonal.
Passos:
1. Estandardizar Y e obter X: Estimar
0

B
B
B
=B
B
B
@

0
..
.

..
.

0
0
..
.

..

C
C
C
C;
C
C
A

Var (yit )

^ = X0 X=n.
2. Calcular V
^
3. Calcular os vector prprios (W) de V:
4. Obter P = XW.
5. Modelar separadamente as coluna de P atravs de um GARCH.
365

m) :

Figura 9-7: Aplicao (rendabilidade do ndice de mercado: NASDAQ; INDUSTRIAL,


COMPUTER)

6. Para cada t considerar


W E (Pt P0t j Ft 1 ) W0 :

Cov (yt j Ft 1 ) =

Modelao de Sistemas de Grande Dimenso


possvel reduzir a calculatria considerando apenas certos vectores de P = XW - estes
vectores designam-se de componentes principais. Para explicar esta ideia, considere-se
P0 P
=
n
Logo

(9.16)

pode ser considerado uma estimativa da matriz de varincias-covarincias de P:

Como
P=

::: P

366

tem-se

B
B
B
0
P P =B
B
B
@

P 1P

0
..
.

P 2P
..
.

0
..
.

...

P0 m P

C
C
C
C
C
C
A

e, atendendo a (9.16), conclui-se que a varincia da componente principal i igual a


P0 i P
n

i:

Por outro lado, atendendo a X = PW0 ; tem-se


X0 X WP0 PW0
=
= W W0 :
n
n
Em suma, a proporo da variao total de X que explicada pela i-sima componente
P
principal i = m
j=1 i = i =m. Quanto maior for i mais peso tem a i-sima componente

principal na explicao da variao total de X: As componentes principais cujos valores


prprios so muitos baixos podem ser descartados. Na prtica procede-se assim:
ordenam-se os valores prprios por ordem descendente , i.e.

>

> :::

ordenam-se os vectores prprios de acordo com os valores prprios ordenados, i.e., a


primeira coluna de W; W 1 ; o vector prprio associado a
W

o vector prprio associado a

2;

1;

a segunda coluna de

etc.

Em lugar de se trabalhar com W trabalha-se com uma submatriz de W; seja W essa


matriz, constituda pelas primeiras k colunas. Como resultado passa-se a ter apenas as k
componentes principais mais significativas:
P = XW
que tem dimenso n

k: Nestas circunstncias necessrio modelar apenas estas k compo-

nentes principais. Assim,

Cov (yt j Ft 1 )

W E Pt (Pt )0 Ft

367

(W )0

0
E Pt (Pt ) Ft

0
(P 2 j F )
B E 1t t 1
B
B
0
E (P2t2 j Ft 1 )
=B
B
..
..
B
.
.
@
0
0

0
..

0
..
.

E (Ptk2 j Ft 1 )

C
C
C
C:
C
C
A

(Pt a linha t da matriz P ).


Passos:
1. Estandardizar Y e obter X: Estimar
0

B
B
B
=B
B
B
@

0
..
.

..
.

..

0
..
.
m

C
C
C
C;
C
C
A

Var (yit )

^ = X0 X=n.
2. Calcular V
^ (ordenam-se os valores prprios
3. Calcular os valores prprios e vector prprios de V
por ordem descendente , i.e.

>

> :::e ordenam-se os vectores prprios de acordo

com os valores prprios ordenados).


4. A partir do passo 3 obter W e P = XW .
5. Modelar separadamente coluna de P atravs de um GARCH.
6. Para cada t considerar
Cov ( yt j Ft 1 )

9.10

W E Pt (Pt )0 Ft

(W )0

Testes de Diagnstico

Nos vrios modelos, a hiptese de partida ut j Ft


1=2

lente, ut = Ht "t onde "t

N (0; Ht ) ou, de forma equiva-

N (0; Im ) : Se o modelo estiver correctamente especificado,

f"t g deve ser uma sucesso de vectores i.i.d., com matriz de varincias-covaricias (contempornea) dada por Im : Naturalmente que "t desconhecido, mas pode ser estimado da
368

seguinte forma
^ t 1=2 u
^
"t = H
^t :
^ t 1=2
^
"t o vector dos resduos estandardizados (e u
^ t o vector dos resduos). A matriz H
pode obter-se a partir da decomposio Cholesky, seguindo os seguintes passos. 1) Dado
^ t ; obter uma matriz triangular H
^ 1=2
H
t ; usando a decomposio de Cholesky, i.e., obter uma
0

^ 1=2
^t = H
^ 1=2
^ t1=2
matriz H
tal que H
H
t
t

^ t1=2 : Por exemplo, considere-se um


; 2) Inverter H

sistema de duas equaes (m = 2)


2

Ht = 4

2
1t

12;t

12;t

2
2t

5=4

2
1t

t 1t 2t

t 1t 2t

2
2t

5:

A decomposio de Cholesky fornece


2

1=2

Ht

1=2

(verifique que o produto Ht

Ht

1=2

0
p
1
2t

1t

=4

1=2

Ht

t 2t

2
t

5:

Ht ). Assim,

=4

1t

1t

pt

2
t

2t

p1

2
t

5:

(Deixa-se como exerccio mostrar que E ("t ) = 0 e Var ("t ) = Var Ht


^t
forma (continuando o exemplo) a expresso ^
"t = H
2
4

^"1t
^"2t

5=4

1
^ 1t
^t
^ 1t

1 ^2t

0
^ 2t

p1

2
t

32
54

u^1t
u^2t

1=2

1=2

ut = In ). Desta

u
^ t vale
2

5=4

u
^1t
^ 1t
^ 2t

u
^2t
p

1 ^2t

u
^1t ^t
^ 1t

1 ^2t

5:

Vrios testes podem ser invocados. Para avaliar se os efeitos de heterocedasticidades


esto convenientemente modelados, Engle (2002) sugere o seguinte procedimento. Primeiro
passo: regresso de ^"21t sobre as seguintes variveis (para alm de um termo constante):
resduos quadrticos ^"2i;t k ; com i = 1; :::; m e k = 1; :::; L (L desfasamentos) e
termos cruzados ^"i;t k ^"j;t k ; com i; j = 1; :::; m e k = 1; :::; L:

369

Por exemplo no caso m = 2 e L = 1; a regresso envolveria as seguintes variveis:


1; ^"21t 1 ; ^"22t 1 ; ^"1;t 1^"2;t

Segundo passo: teste F de nulidade de todos os parmetros com excepo do do termo independente. Se existir evidncia estatstica contra a hiptese nula, podemos suspeitar que
a matriz Ht no foi convenientemente modelada. Nos passos seguintes repete-se o procedimento, tomando sucessivamente ^"2i;t i = 2; :::; m como varivel dependente na regresso
auxiliar.
Naturalmente conveniente verificar tambm se ^
"t um rudo branco. O procedimento
anterior pode ser repetido substituindo os resduos estandardizados ao quadrado simplesmente pelos resduos estandardizados e eliminando os termos cruzados.

370

Captulo 10
Regresso No Paramtrica
(ltima actualizao: 1/2010. Preliminar e incompleto)

10.1

Introduo

***

10.2

Estimao No Paramtrica da Funo Densidade de


Probabilidade

10.2.1

Introduo

Suponha-se que X uma v.a. discreta. A estimao da funo de probabilidade, f (x) ;


imediata: f^ (x) pode ser estimado como a proporo de valores na amostra fx1 ; x2 ; :::; ng
que so iguais a x, i.e.,

1X
Ifxi :xi =xg :
f^ (x) =
n t=1
n

Se X uma varivel contnua, a probabilidade do evento fxt = xg zero e, desta forma, a


estimao da fdp f (x) deve envolver a proporo de valores xt que se encontram perto de
x; digamos numa vizinhana x
Se tomarmos

h=2 (h d a largura do intervalo).

1X
1X
Ifxt :j xt x j< 1 g =
I
h
2
n t=1
n t=1 fxt :
n

x
x
1
< th < 21
2

temos simplesmente a proporo de observaes na amostra que se encontram no intervalo

371

(x

h; x + h) : Esta proporo deve ser dividia por h :


11X
xt x
f^ (x) =
I
1 :
h n t=1 fxt :j h j< 2 g
n

(10.1)

Tem-se assim que f^ (x) representa a proporo de observaes por unidade relativa de frequencia. Naturalmente, podemos fazer variar h: Um valor maior implica um maior alisamento da estimativa (mais observaes so consideradas), diminuindo a variabilidade de f^:
Todavia, valores muitos altos de h podem distorcer a estimativa de f (x), na medida em que
podem entrar observaes muito afastadas de x; no traduzindo, portanto, o comportamento
local de f no ponto x:
Pode-se mostrar que

f^ (x) dx = 1:

Apresenta-se a seguir a derivao formal de f^: Por definio, a funo de distribuio de


X
P (X

x) = F (x) =

f (u) du
1

A respectiva fdp
F (x + h)
h!0
h

f (x) = F 0 (x) = lim

F (x)

ou, equivalentemente,
f (x) = lim

F (x + h=2)

h!0

= lim

h=2)

h
h=2 < X < x + h=2)
h
X x
1
<2
h
h

P (x

h!0

= lim

F (x

h!0

Dada esta definio de f (x) ; imediato concluir que uma estimativa da ltima expresso
1
n

Pn

t=1

Ifxt :j xt x j< 1 g
h
2
h

que exactamente a expresso obtida em (10.1). Esta estimativa pode tambm ser escrita da
seguinte forma

1 X
f^ (x) =
K
nh t=1
n

372

xt

x
h

onde

8
<

1
se 1 < u < 1
1
2
K (u) = Ifu:juj<1g =
: 0 caso contrrio.
2

A funo K (u) ; designada por kernel (ou ncleo) uma funo densidade de probabilidade
(Uniforme). Resulta que outros kernels, com baseados em funes densidade de probabilidade, podem tambm ser usados. Por exemplo,
1
1 2
u
kernel Gaussiano
K (u) = p exp
2
2
1
K (u) =
Ifu:juj<1g kernel Uniforme,
2
15
K (u) =
1 u2 Ifu:juj<1g .
16

10.2.2

Propriedades

Considerem-se as seguintes hipteses:


A1 f(yt ; xt )g um processo EE e fracamente dependente no seguinte sentido: dada uma
sucesso de v.a. fyt g tem-se jCorr (y1 ; y1+t )j
C2 e

2t

C1 e

1t

e jCorr (h (y1 ) ; h (y1+t ))j

; C1 ; C2 ; t > 0 para qualquer funo contnua h:

R
R
A2 K uma funo simtrica em torno de zero, K (u) du = 1; uK (u) du = 0;
R 2
R
u K (u) du = 2K ; K 2 (u) du < 1; jxj K (x) ! 0 quando jxj ! 1; sup jK (x)j <
1

A3 A funo f 00 (x) contnua e limitada numa vizinhana de x.


A4 h ! 0 quando n ! 1, nh ! 1 quando n ! 1
A5

p 5=2
nh ! 0 quando n ! 1:
Assumam-se as hipteses A1-A4.

Proposio 10.2.1 Tem-se


E f^ (x)
Var f^ (x)

= f (x) +
= O

1
nh

373

h2 f 00 (x)
2
:

2
K

+ O h4

Note-se que O (h4 ) representa um termo de ordem h4 ou inferior. Por outras palavras,
O (h4 ) proporcional ou menos do que proporcional a h4 ; podendo ser, por exemplo, 2h4 :
Obviamente limh!0 O (h4 ) = 0 e limh!0 O (h4 ) =h4 uma constante.
p
Proposio 10.2.2 Tem-se f^ (x) ! f (x) :

A demonstrao obvia tendo em conta a proposio 10.2.1:


lim E f^ (x)

= f (x)

n!1

lim Var f^ (x)

= 0;

n!1

pois n ! 1 arrasta h ! 0 e nh ! 1: A hiptese A4 crucial. Nestas condies, o


estimador f^ (x) consistente (em probabilidade).

p
R
nhf^ (x) ! f (x) K 2 (u) du

Proposio 10.2.3 Tem-seVar

Proposio 10.2.4 Sob as hipteses A1-A4 e


p

nh f^ (x)

K (u)2+ du < 1 tem-se

E f^ (x)

!N

0; f (x)

K 2 (u) du

Proposio 10.2.5 Sob as hipteses da proposio anterior e A5 tem-se


p
nh f^ (x)

10.2.3

f (x)

!N

0; f (x)

K 2 (u) du

Escolha de h

Na prtica como escolher K e h? A escolha do kernel , geralmente, pouco relevante, j


que os resultados finais dependem pouco da escolha do kernel. Muito mais relevante a
escolha de h: Sabemos que h deve depender de n; tendo em conta as hipteses A4 e A5. Se
definirmos h = n ; sendo

parmetros a determinar, sabe-se que

tem de ser menor

do que zero tendo em conta que h ! 0: Por outro lado, como nh = n1+ ! 1,
respeitar a relao 1 +

deve

> 0: Dada a hiptese A5

p 5=2
nh = n1=2 (n )5=2 = n1=2 n5

=2

= n(1+5

)=2

!0

dever ter-se (1 + 5 ) < 0: Coligindo todas as desigualdades obtm-se


preciso todavia encontrar um valor para

1<

<

1=5:

e : Para o efeito, necessrio usar um critrio de


374

seleco. Existem vrios propostos na literatura, mas focaremos apenas o Mean Integrated
Squared Error:

M ISE (h) = E

f^ (x)

f (x)

dx :

Em princpio, poderamos escolher h a partir do critrio mais simples E f^ (x)

f (x)2 ;

mas existe um inconveniente: queremos que f^ (x) seja uma boa estimativa para todos os
valores de x que a varivel X pode assumir, e no apenas para um x particular. Por isso
integramos o erro quadrtico no domnio ou espao de estados de X:
Fazendo a troca do operador de valor esperado com o do integral, considerando os valores
aproximados de E f^ (x) e Var f^ (x) e notando que

E f^ (x)

f (x)2 ' Var f^ (x) + f (x)

E f^ (x)

R
f (x) K 2 (u) du h4 (f 00 (x))2
+
=
nh
4

tem-se
Z

K 2 (u) du h4 (f 00 (x))2
+
M ISE (h) =
nh
4
R 2
Z
K (u) du h4 4K
2
=
+
(f 00 (x)) dx:
nh
4
f (x)

4
K

dx

Resolvendo o problema de optimizao


min
h

K 2 (u) du h4 4K
+
nh
4

(f 00 (x)) dx

obtm-se o valor ptimo de h (de acordo com o critrio M ISE):


R

hopt =

Usando o kernel Gaussiano, tem-se

4
K

K 2 (u) du
(f 00 (x))2 dx

!1=5

K 2 (u) du ' 0:282 e

1=5

4
K

= 1: O valor de hopt depende

ainda de f 00 (x) que desconhecido. Este valor pode ser estimado no parametricamente.
Uma alternativa mais simples consiste em assumir que f (x)

N( ;

) (vrios estudos

indicam que esta escolha relativamente robusta desde que a verdadeira densidade no seja
bimodal ou excessivamente assimtrica). Com estas simplificaes obtm-se
^ opt = 1:06^ n
h

375

1=5

4
K

(^ desvio padro estimado de xt ).


Exemplo 10.2.1 Dow Jones*** retornos

10.2.4

Estimao localmente linear da Mdia Condicional

Vamos considerar como modelo base


yt =

(xt ) + ut

ut =

(xt ) "t

onde "t um rudo branco e tal que E ("t j xt ) = 0;

(xt ) a mdia condicional e

(xt )

a varincia condicional. Os momentos condicionais dependem apenas de xt ( naturalmente possvel generalizar). Para simplificar admitiremos que xt = yt
generalizar). O problema de estimao o dos momentos condicionais
semelhana da estimao de f (x) ; a estimao de
estima-se

(x) (e

(mas possvel
(x) e

(x) :

(x)) faz-se localmente, i.e.,

(x) separadamente para cada x. Por exemplo, seleccionando x = 1 estimamos


(1) = E (yt j xt = 1)

e repete-se o procedimentos para outros pontos x e assim obtemos uma ideia do comportamento de

(x) :

Na anlise da estimao local da mdia condicional, o ponto de partida a frmula de


376

Taylor de

(xt ) numa vizinhana de x :


@ (x)
(x) +
(xt
@x0

(xt ) =

@ 2 (x ) (xt x)2
x) +
@x2
2

onde x um valor entre xt e x: Desta forma yt pode ser representado pela expresso
yt =

@ (x)
(x) +
(xt
@x0

@ 2 (x ) (xt x)2
+ ut :
x) +
@x2
2

Se o modelo linear, por exemplo, um AR(1), vem


yt

@ (x)
@ 2 (x ) (xt x)2
=
(x) +
+ ut
(xt x) +
@x0
@x2
2
= c + x + (xt x1 ) + 0 + ut
= c + xt + u t :

(x) no linear o erro de aproximao no nulo e aumenta quando xt se afasta de

Se

x. Desta forma, obtm-se uma boa aproximao de

(x) se usarmos apenas as observaes

que se encontram perto de x: Em alternativa, pode-se usar todas as observaes mas damos
mais peso s observaes que se encontram perto de x:
Trade-off na estimao de

(x) :

no considerar todas as observaes ou no dar peso significativo a parte das observaes acarreta um custo: aumento da varincia do estimador.
considerar demasiadas observaes, diminui a varincia do estimador mas aumenta o
erro de aproximao R i.e. aumenta o enviesamento do estimador.
O peso a dar s observaes controlado pelo kernel K (u) : Seja x 2 R. Como atribuir
mais ou menos peso s observaes xt ?
1
K
h

xt

x
h

1 1
p exp
=
0:1 2

1
2

u 1
:01

h : bandwidth ou parmetro de alisamento.


Aproximao de ordem zero (estimador de Nadaraya-Watson):
Considera-se a aproximao yt = c + vt onde vt =
c=

@ (x)
@x0

(xt

x) + R (xt ; x) + ut e

(x) : O objectivo estimar c dando mais peso s observaes prximas de x: Tem-se

377

2.0

1.5

1.0

0.5

-4

-3

-2

-1

1 p1
0:2 2

Figura 10-1:

exp

1
2

u 1 2
0:2

2.0

1.5

1.0

0.5

-4

-3

-2

-1

Figura 10-2:

1 p1
1 2

exp

378

1
2

u 1 2
1

assim,
^ N W (x; h) = c^ = arg min
c

wt = h1 K

xt x
h

n
X

c)2 wt

(yt

t=2

: Resolvendo obtm-se
Pn
K
c^ = Pt=2
n
t=2 K

Aproximao linear:

xt x
h
xt x
h

yt

Considera-se a aproximao
@ (x)
(xt x) + et
@x0
= c + c1 (xt x) + et

yt =

(x) +

onde et = R (xt ; x) + ut : O objectivo estimar c dando mais peso s observaes prximas


de x: Tem-se assim
^ (x; h) = c^
e c^ obtm-se a partir do problema de optimizao

f^
c; c^1 g = arg min

fc;c1 g

n
X

(yt

c1 (xt

x))2 wt

t=2

Notando que
n
X

=
=

(yt

t=im +1
n
X
t=im +1
n
X

(yt

c1 (xt
c

1=2

yt wt

c1 (xt
1=2

cwt

x))2 wt
1=2

x)) wt

1=2

c1 w t

(xt

x)

t=im +1

o problema de optimizao pode ser encarado como um problema de estimao OLS relativamente seguinte especificao:
1=2

yt wt

1=2

= cwt

onde c o parmetro de interesse (c =

1=2

+ c1 w t

(xt

x) + errot

(x)). Fixado o valor de h e dado o valor de x

379

imediata a construo das variveis


1=2

1=2

yt wt ; wt

(xt1

x1 ) ; etc:

O problema de optimizao pode tambm ser encarado como um problema de estimao


GLS relativamente especificao
yt = c + c1 (xt

x) + errot

assumindo-se uma pseudo heterocedasticidade da forma Var ( yt j xt ) = 1=wt : O estimador


GLS corresponde ao estimador OLS aplicado sobre as variveis transformadas. Tem-se:
2
4

c^
c^1

5 = (Z0 (x) W (x; h) Z (x))

Z0 (x) W (x; h) y

onde
2

1
6
6 ..
Z (x) = 6 .
4
1
2
y
6 2
6 .
y = 6 ..
4
yn

x2

x
..
.

xn
3

3
7
7
7
5

W (x; h) = diag fw2 ; :::; wn g

7
7
7
5

e a estimativa de interesse c^ dada por


c^ =

1 0

(Z0 (x) W (x; h) Z (x))

Z0 (x) W (x; h) y:

O estimador de Nadaraya-Watson um caso particular:


c^ = (Z0 (x) W (x; h) Z (x))
e Z (x) = Z = 11

Z0 (x) W (x; h) y

(n 2) :

Podamos estar interessados em E ( yt j xt = x) e no em E (yt j xt = x) : Nesse caso


tudo se mantm com a seguinte excepo: em lugar de yt deve-se considerar
380

yt ; por exem-

plo,
yt j xt = x) =
E( \

1 0

(Z0 (x) W (x; h) Z (x))

Z0 (x) W (x; h) y

Propriedades
Vamos considerar primeiro o caso em que xt i.i.d., por ser mais fcil tratar.
2

B1 xt i.i.d. e E (ut j xt ) = 0; Var (ut j xt ) =

(xt )

B2 As funes m00 (x) e f 00 (x) so contnuas e limitada numa vizinhana de x.


B3 (nh)1=2 h2 ! 0 quando n ! 1;
Sob as hipteses A1-A4 e B1 e B2, tem-se
Proposio 10.2.6
E (^ N W
Var (^ N W

h2
(x)) =
(x) +
( 00 (x) f (x) + 2f 0 (x)
2f (x)
Z
2
1
(x)
1
(x)) =
K 2 (u) du + o
nh f (x)
nh

(x))

2
K

+ o h2

Proposio 10.2.7
h2 00
(x) +
(x) 2K + o h2
E (^ (x)) =
2
2
(x) 2
1
:
Var (^ (x)) =
K +o
nhf (x)
nh
Proposio 10.2.8
p

^ N W (x) !
p

^ (x) !

(x)

(x)

Proposio 10.2.9 Sob as hipteses anteriores e E juj2+


p
nh (^ N W (x)

E (^ N W (x))) ! N

381

<1e
2

0;

K (u)2+ du < 1

R
(x) K 2 (u) du
f (x)

Proposio 10.2.10 Sob as hipteses anteriores e B3 tem-se


p

K 2 (u) du
nh (^ N W (x)
0;
N W (x)) ! N
f (x)
R 2
2
p
(x) K (u) du
d
nh (^ (x)
(x)) ! N 0;
f (x)
d

(x)

O caso em que xt envolve valores desfasados de yt mais difcil de tratar. De todo o


modo possvel provar que se yt um processo EE e fracamente dependente, os resultados
anteriores mantm-se.

10.2.5

Estimao localmente linear da Varincia Condicional

10.A

Demonstraes

Demonstrao da proposio 10.2.1


Tem-se
1 X
K
nh t=1
n

E f^ (x)

= E
= E
Z
=
Z
=
Z
=
Z
=
Z
=

xt

x
h

xt x
1
K
(devido a A1)
h
h
x
1
K
f ( )d
h
h
1
K (u) f (uh + x) hdu (mudana de varivel
h

x
h

= u)

K (u) f (uh + x) du

h2 u2 00
f (x) + ::: du (invocando a frmula de Taylor)
K (u) f (x) + huf (x) +
2
Z
Z
h2 u2 00
0
K (u) f (x) du + K (u) huf (x) du + K (u)
f (x) du + :::
2
Z
h2 f 00 (x)
K (u) u2 du + :::
= f (x) +
2
h2 f 00 (x) 2K
= f (x) +
+ O h4
2
0

A ltima equao decorre de A2. Note-se que todos os termos do tipo

K (u) uk du so zero

quando k mpar. O termo O (h4 ) inclui todos os restantes termos so de ordem igual ou
inferior a h4 no seguinte sentido limh!0 O (h4 ) =h4 = constante.

382

Por outro lado,


1 X
K
nh t=1
n

Var f^ (x)

= Var

1
=
Var
n2

xt

x
h

1X
K
h t=1
n

xt

x
h

1
Var (w1 + w2 + ::: + wn ) (com wt = h 1 K ((xt
2
n
n
2 XX
1 X
Var
(w
)
+
Cov (wi ; wj )
=
t
n2 t=1
n2

1
2X
=
Var (wt ) +
1
n
n t=1
n 1

t
n

x) =h)

Cov (w1 ; wt+1 ) (devido a A1):

Analise-se separadamente cada um destes termos.


Var (wt ) = Var
=
=
=
=
=

1
K
h

xt

h
xt x
h

1
Var K
h2
#
"
2
1
x
x
x
x
t
t
2
E K
E K
h2
h
h
#
"Z
Z
2
1
x
x
f ( )d
K
f ( )d
K2
h2
h
h
"Z
#
Z
2
1
K 2 (u) f (hu + x) hdu
K (u) f (hu + x) hdu
h2
Z
1
h2 u2 00
2
0
K
(u)
f
(x)
+
huf
(x)
+
f (x) + ::: hdu
h2
2
Z
2
1
h2 u2 00
0
K (u) f (x) + huf (x) +
f (x) + ::: hdu
h2
2
Z
Z
1
2
K (u) f (x) du + K 2 (u) uf 0 (x) du + :::
h
Z
Z
2
K (u) f (x) du + K (u) huf 0 (x) du + :::
Z
f (x)
K 2 (u) du + O (1)
h

(note-se que o termo de ordem O (1) definido na ltima equao inclui todos os demais
termos no presentes na equao e que so relativamente pequenos em comparao com
R
f (x) h 1 K 2 (u) du quando n grande e h pequeno).
P
Analise-se n2 nt=11 1 nt Cov (w1 ; wt+1 ). Notando que Cov (w1 ; wt+1 ) = t Var (w1 ) ;
383

devido a A1, tem-se


2X
1
n t=1
n 1

2X
jCov (w1 ; wt+1 )j =
1
n t=1
n 1

t
n

t
n

j t j Var (w1 )

2 Var (w1 ) X
=
1
n
t=1
n 1

Var (w1 )
n

n 1
X

t
n

j tj
t
n

t=1

C2 e

Var (w1 )
=
O (1)
n
1
= O
(pois Var (w1 ) = O
nh

2t

1
h

(devido a A1)

).

Desta forma,
1
2X
=
1
Var (wt ) +
n
n t=1
Z
f (x)
=
K 2 (u) du + O
nh
n 1

Var f^ (x)

t
n

Cov (w1 ; wt+1 ) (devido a A1):

1
nh

Demonstrao da proposio 10.2.2


Demonstrao da proposio 10.2.3
n 1
X
p
^
Var
nhf (x) = h Var (wt ) + 2h
1
t=1

Seja

2h

p1
h

n 1
X

t
n

Cov (w1 ; wt+1 ) = 2h

n
X

384

t
n

Cov (w1 ; wt+1 )


{z

J1;n

tem-se

t=1

+2h

Para 1

Cov (w1 ; wt+1 )

onde [x] designa aqui a parte inteira de x: Tem-se

t=1

t
n

n 1
X

t=

n +1

t
Cov (w1 ; wt+1 )
n
{z
}

J2;n

jCov (w1 ; wt+1 )j

E jw1 wt+1 j
xt+1 x
x1 x 1
K
= E K
h
h
h
Z
xt+1 x
1
x1 x
K
f1;t+1 (xt ; xt+1 ) dxt dxt+1
=
K
2
h
h
h
Z
=
K (u) K (u + v) f1;t+1 (x; x) dudv + O (h)
= O (1) :

Assim
J1;n

n
X

Cov (w1 ; wt+1 ) = hO (

n)

= O (h

n)

=O

t=1

Para t >

h
p
h

=O

h = o (1) :

considera-se o seguinte argumento:


Cov (w1 ; wt+1 )

Var (w1 )
Z
f (x)
K 2 (u) du + O (1)
t
h
Z
t
f (x) K 2 (u) du + O (h) :
h
t

=
=
Assim,
n 1
X

J2;n = 2h

t=

n +1

n 1
X

t=

n +1

! 0
Pn

t=

1
n +1

t
n

Pn

t=

t
n

= 2 f (x)

pois

t
n

Cov (w1 ; wt+1 )

f (x)

K (u) du + O (h)

n 1
X

t=

1
n +1

K 2 (u) du + O (h)

n +1

! 0 quando n ! 1 e

Demonstrao da proposio 10.2.4


Demonstrao da proposio 10.2.5
Demonstrao da proposio 10.2.6

385

t
n

! 1:

Seja

xt x
:
h

Tem-se

yt =

(x) +

(x) (xt

(x) + h 0 (x)

00

x) +
00

t+

(x )

(x )
h2
2

x)2

(xt
2
2
t

+ ut

+ ut :

Por outro lado,


^N W

Pn
K ( t ) yt
(x) = Pt=2
n
K ( t)
Pn t=2
K ( t ) yt
= Pt=2
n
t=2 K ( t )
P
(nh) 1 nt=2 K ( t )
=
(nh)
=

Pn

t=2

K ( t)

(x) + h 0 (x) t +
P
(nh) 1 nt=2 K ( t )
(x) + h 0 (x)

00

(x ) h 2 t + ut

00

(x ) h 2 t + ut

f^ (x)
1 Pn
0
(nh)
t=2 K ( t ) h (x) t
t=2 K ( t ) (x) + (nh)
=
+
f^ (x)
P
P
2 2
(nh) 1 nt=2 K ( t ) 00 (x ) h 2 t + (nh) 1 nt=2 K ( t ) ut
+
f^ (x)
1 Pn

(x) 1 X
(x) +
K ( t)
f^ (x) n t=2
0

(x ) 1 X
+
K ( t)
t
2f^ (x) n t=2
h

00

2
t

1 X
+
K ( t ) ut :
f^ (x) nh t=2
1

Considerem-se os dois primeiros momentos condicionais:

E ( ^ N W (x)j x1 ; :::; xn ) =

(x) 1 X
(x) +
K ( t)
f^ (x) n t=2
0

386

(x ) 1 X
+
K ( t)
t
2f^ (x) n t=2
h

00

2
t:

Pela teorema do valor esperado iterado, vem


E (^ N W (x)) = E (E ( ^ N W (x)j x1 ; :::; xn ))
n
n
0
(x) 1 X
h 00 (x ) 1 X
= E
(x) +
K ( t) t +
K ( t)
f^ (x) n t=2
2f^ (x) n t=2
!
!
2
00
K
(u)
u
K
(u)
u
h
(x
)
=
(x) + 0 (x) E
+
E
2
f^ (x)
f^ (x)
=
=
=

(x) +

(x)

h2

h2 2K
(
2f (x)
h2 2K
(x) +
(
2f (x)
(x) +

2 0
Kf

(x)
+ o h2
f (x)

00

00

(x ) f (x) + 2f 0 (x)

00

(x) f (x) + 2f 0 (x)

0
0

h2

(x )
2

2
t

2
Kf

(x)
+ o h2
f (x)

(x)) + o h2

(x)) + o h2 :

Por outro lado,


Var ( ^ N W

n
1 X 2
(x)j x1 ; :::; xn ) =
K ( t)
f^2 (x) n2 h2 t=2

(xt ) :

Dado que o segundo termo da expresso Var (^ N W (x)) = E (Var ( ^ N W (x)j x1 ; :::; xn )) +
Var (E ( ^ N W (x)j x1 ; :::; xn )) zero, vem
Var (^ N W (x)) = E (Var ( ^ N W (x)j x1 ; :::; xn ))
n
1
1
1 X 2
=
K ( t)
E ^2
nh
f (x) nh t=2
1 X 2
K ( t)
f^2 (x) nh t=2

1
=
E
nh

1
K ( t)
h

(xt )

Z
1
=
K2
h
Z
=
K 2 (u)
=

(x) f (x)

1 2
K ( t)
2
f^ (x) h

x
h

( )f ( )d =

(x) f (x) + o (h) du

K 2 (u) du + o (h) :

387

(xt )

1
=
E
nh

(xt )

(xt )

K 2 (u)

(x + uh) f (x + uh) du

Desta forma,

Var (^ N W

!
1 2
K ( t ) 2 (xt )
2
^
h
f (x)
Z
2
1
(x)
1
=
:
K 2 (u) du + o
nh f (x)
nh

1
(x)) =
E
nh

Demonstrao da proposio 10.2.7


Demonstrao da proposio 10.2.8
Demonstrao da proposio 10.2.9

388

Parte III
Aplicaes

389

Pgina em branco

390

Captulo 11
Eficincia do Mercado de Capitais
(ltima actualizao: Maio/2010)

11.1

Introduo e Definies

O mercado de capitais diz-se eficiente se os preos dos produtos financeiros reflectirem toda
a informao disponvel. Quando libertada uma informao relevante (por exemplo, um
anncio de distribuio de dividendos de valor superior ao esperado, um anncio de fuses
ou aquisies, etc.) num mercado eficiente os agentes reagem imediatamente comprando ou
vendendo de acordo com a informao e os preos ajustam-se imediatamente.
Num mercado eficiente, supe-se que os agentes interpretam correctamente a informao. Caso contrrio o preo pode no se ajustar rapidamente e abrem-se oportunidades
para a realizao de rendibilidades anormais. Por exemplo, um investidor que compre imediatamente aces aps a divulgao de uma boa notcia pode obter um retorno anormal
se o preo de mercado se ajustar lentamente informao disponvel. Com efeito, bastar ao
investidor vender as aces depois do preo se ajustar a um nvel mais alto.
difcil imaginar um mercado completamente eficiente em todos os perodos de tempo.
Pode suceder que em certos momentos e face a determinadas notcias o mercado apresente
ineficincias que podem ser exploradas. Faz tambm sentido admitir que existem mercados
mais eficientes do que outros (mercados emergentes tendem a ser menos eficientes).
A eficincia dos mercados est intimamente relacionada com a informao disponvel.
Fama (1970) props trs formas de eficincia consoante a natureza da informao disponvel:
um mercado eficiente na forma fraca se os preos dos ttulos reflectirem toda a informao sobre os preos passados; como consequncia, as cotaes passadas no podem
391

ser utilizadas para obter rentabilidades anormais;


um mercado eficiente na forma semi-forte se os preos dos ttulos reflectirem toda
a informao disponvel ao pblico; a informao disponvel ao pblico inclui os
preos passados, situao econmica e financeira da empresa e, em geral, toda a informao no confidencial que o pblico em geral pode aceder;
um mercado eficiente na forma forte se os preos dos ttulos reflectirem toda a informao disponvel, pblica e privada; a informao privada conhecida apenas dos
gestores da empresa.
A hiptese dos mercados eficientes admite que todas as informaes relevantes esto
disponveis (a baixo custo) e que as cotaes reflectem o conjunto dessas informaes. Desta
forma, no possvel com base na informao disponvel, obter ganhos persistentes acima
do retorno normal; se o mercado ineficiente, os preos no traduzem o seu valor justo
ou valor intrnseco e possvel obter rendibilidades anormais.
A questo que normalmente se coloca consiste em saber se possvel obter rendibilidades
anormais de forma persistente utilizando uma estratgia de investimento. Uma forma para
analisar esta questo consiste em comparar a rendibilidade que se obtm a partir de uma certa
estratgia de investimento com a rendibilidade normal ou esperada deduzida em funo de
um modelo de equilbrio como o CAPM ou APT. Outra metodologia baseia-se em saber se
os retornos so ou no previsveis. Esta anlise pode ser conduzida a partir de um modelo
do tipo
rt = f (xt 1 ) + ut
onde xt

um vector de variveis cujos valores so conhecidos no momento t 1. Assim, rt

previsvel se xt
O vector xt

explicar rt (por outras palavras, rt previsvel se E (rt j Ft 1 ) 6= E (rt )).

pode incluir rt

ou fundamental variables como por exemplo, variveis fi-

nanceiras (treasury bill rates, bonds returns, dividend yield (dividendo por aco/cotao),
price-earning ratios (cotao/lucro), etc.) ou variveis macroeconmicas (produto, inflao,
etc.).

11.2

Teste Eficincia Fraca de Mercado

Analisa-se se possvel obter rendibilidades anormais de forma persistente utilizando uma


estratgia de investimento baseada apenas nos preos passados.
392

Para simplificar admita-se que o retorno normal, E (rt ) =

> 0 constante. Se o

mercado eficiente ento indiferente usar ou no usar a informao disponvel Ft

para

prever rt e, desta forma tem-se


E (rt j Ft 1 ) = E (rt ) :

(11.1)

Note-se que E (rt ) representa a previso de rt no baseada em qualquer informao especfica, a no ser nas caractersticas gerais do processo. Pelo contrrio, se
E (rt j Ft 1 ) 6= E (rt )
ento, a informao disponvel Ft

relevante para prever os retornos futuros. Nestas

circunstncias, existe alguma informao sobre a tendncia provvel de rt ; e ser possvel,


em princpio, obter rentabilidades anormais, usando a informao disponvel Ft 1 .
A equao (11.1) pode ser violada de inmeras formas. Por exemplo, rt pode ser autocorrelacionado ou rt pode ser uma funo no linear de rt

(se rt seguir um qualquer

dos modelos discutidos anteriormente, como por exemplo, o modelo Markov-Switching ou o


Limiar Autoregressivo, a equao (11.1) violada). As regras de compra e venda baseadas
na anlise tcnica baseiam-se tambm em relaes no lineares entre os preos correntes
e os seus valores passados, ou sejam, supem que a igualdade (11.1) violada.
Certos autores formalizam o modelo de mercado eficiente estabelecendo que o preo ou
o logaritmo do preo um passeio aleatrio1 ,
log Pt = log Pt

+ ut

sendo fut g um processo rudo branco ou, em termos mais gerais, uma diferena de martingala. Esta formalizao implica (11.1) e ainda que log Pt uma martingala,
E (log Pt j Ft 1 ) = log Pt 1 :
1

A rigor um impossibilidade o preo ser um passeio aleatrio,


Pt = P t

+ ut

uma vez que Pt , neste modelo, no limitado em probabilidade. Isto significa que pode assumir valores
negativos com probabilidade um quando t tende para 1: De facto, prova-se que Pt visita os estados 1 e
+1 infinitas vezes quando t ! 1: Como os preos no podem ser negativos, por definio, o preo no pode
ser um passeio aleatrio.

393

Esta formalizao contra intuitiva pois assume que o valor esperado do retorno zero
(E (rt ) = 0) e, portanto, que o prmio de risco negativo. Todavia, se o retorno for convenientemente ajustado ao risco, a propriedade de martingala deve verificar-se (vejam-se as
referncias em Campbell et al., 1997, pg. 31).
Um modelo mais natural e compatvel com (11.1) o modelo de passeio aleatrio com
deriva (positiva),
log Pt = c + log Pt
Considerando rt = log Pt

+ ut ;

c > 0:

log Pt 1 ; o modelo de passeio aleatrio com deriva equivalente

a rt = c + ut e, portanto, E (rr j Ft 1 ) = E (rt ) = c:

11.2.1

Testes de Autocorrelao

Analise-se o exemplo seguinte.


Exemplo 11.2.1 Suponha-se rt = c + rt

+ ut ; j j < 1; onde ut um rudo branco.

Ento
E (rt ) =

c
1

E (rt j Ft 1 ) = c + rt

e a equao (11.1) violada. Note-se tambm que r autocorrelacionado.


Um teste eficincia fraca dos mercados consiste, por exemplo, em ensaiar H0 :
::: =

= 0 atravs da estatstica

Q = n (n + 2)

m
X
k=1

1
n

^2k !

2
(m)

A rejeio de H0 pode sugerir ineficincia de mercado, mas no a implica necessariamente.


Com efeito, pode suceder que a rejeio de H0 se faa com coeficientes de autocorrelao
demasiadamente baixos para oferecerem qualquer possibilidade de ganhos anormais, depois
de deduzidos os custos transaco. Seria necessrio investigar se a estrutura de autocorrelao detectada implicaria uma rendibilidade superior a um portfolio de referncia. Por outro
lado, a no rejeio de H0 no implica aceitao da eficincia da forma fraca porque pode
suceder que E (rt j Ft 1 ) seja uma funo no linear de Ft

394

com fraca dependncia linear.

11.2.2

Regras de Compra e Venda e a Anlise Tcnica

Uma forma popular entre traders and financial professionals de definir regras de compra e
venda assenta na chamada anlise tcnica. A anlise tcnica baseia-se num conjunto de
indicadores estatsticos gerados pelo mercado, tais como preos e volume, visando estabelecer regras de compra e venda de activos cotados em bolsa2 . A generalidade dos indicadores
procura detectar tendncias de subida ou descida das cotaes. Analisam-se trs regras de
compra e venda (provavelmente as mais utilizadas e conhecidas, mas existem muitas outras regras) e discutem-se procedimentos economtricos destinados a aferir a qualidade das
regras. A previsibilidade associada s regras de compra e venda no significa necessariamente ineficincia de mercado. Para argumentar que um mercado ineficiente necessrio
demonstrar que a regra de investimento seleccionada superior a um porfolio de referncia.
Regra Mdia Mvel
Seja
Mt (k) =

Pt + P t

+ ::: + Pt
k

k+1

uma mdia mvel (MM) de ordem k da varivel P; no momento t: A estatstica Mt (k)


fornece uma medida de tendncia local de P: Quanto maior for k mais informao atrasada
a mdia mvel contm e, tambm, mais alisada a tendncia. Pelo contrrio, se k baixo, a
estatstica Mt (k) fornece apenas a tendncia recente de P: Defina-se assim a MM de curto
prazo, Mt (c) ; onde c uma valor baixo e a MM de longo prazo, Mt (l) onde l um valor
alto. Tipicamente, para dados dirios, c e l so escolhido nos intervalos, 1
50

5e

250: Do confronto entre a MM de curto e longo prazo argumenta-se que possvel

projectar uma tendncia futura de P: Mais concretamente, se Mt (c) > Mt (l) ; os preos
mais recentes esto mais altos do que os preos mais antigos. Isto sugere que os preos
seguem uma tendncia positiva. A regra prescreve uma compra para o perodo t + 1: Se as
duas mdias so aproximadamente iguais, a tendncia futura sobre os preos no clara, e
neste caso no h lugar a compra ou venda. Esta regra pode ser melhorada, estabelecendo um
sinal de compra ou venda apenas quando a diferena entre Mt (c) e Mt (l) for significativa,
digamos acima de um certo limiar B (bandwidth): Assim, as regras de compra e venda para
2
A abordagem fundamental analysis, ao contrrio, estabele regras de compra e venda com base em factores
financeiros e econmicos. Por exemplo, analisam-se variveis financeiras (treasury bill rates, bonds returns,
dividend yield (dividendo por aco/cotao), price-earning ratios (cotao/lucro), etc.) ou macroeconmicas
(produto, inflao, etc.).

395

NASDAQ composite
2380
2280
2180
2080

1980

MM curta

1880

MM longa

1780
Jan-05

Mar-05

May-05

Jul-05

Sep-05

Nov-05

Jan-06

comprar = 1, vender = 0
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
Jan-05

Mar-05

May-05

Jul-05

Sep-05

Nov-05

Jan-06

Figura 11-1: Regra Mdia Mvel - Aplicao ao NASDAQ composite Jan-05 a Mar-06
o dia t + 1, passariam a ser: comprar se Mt (c) > Mt (l) + B; vender se Mt (c) < Mt (l)
e no transaccionar se jMt (c)

Mt (l)j

B:

Na figura 11-1 ilustra-se a regra mdia mvel ao NASDAQ composite (Jan-05 a Mar06). Fixou-se c = 10 e l = 50: Em princpio deveriamos escolher um valor de c entre 1 e
5; todavia, a escolha c = 10 permite identificar melhor graficamente a mdia mvel Mt (10)
(com c

5 a srie Mt (c) praticamente no se distingue, graficamente, de P ).

Regra Canal
semelhana da regra mdia mvel, tambm esta regra se baseia numa hiptese sobre a
evoluo futura da tendncia dos preos. Antev-se uma subida ou descida dos preos com
base na comparao entre o valor actual do preo Pt e o valor mnimo ou mximo atingido
pelos preos nos ltimos L dias. Sejam,
mt

= min (Pt 1 ; Pt 2 ; :::; Pt

L) ;

Mt

= max (Pt 1 ; Pt 2 ; :::; Pt

L)

respectivamente os valores mnimo e mximo atingidos pelos preos nos ltimos L dias. A
ideia a seguinte: se no dia t houve uma indicao de compra e Pt significativamente
396

t+1

Comprar

t
Comprar
Vender
Neutro

Vender

Pt > (1 + B) mt
Pt > (1 + B) Mt
Pt > (1 + B) Mt

Pt < (1
Pt < (1
Pt < (1

1
1
1

Neutro
B) mt
B) Mt
B) mt

1
1
1

outros casos
outros casos
outros casos

Tabela 11.1: Regras de Compra e Venda Baseadas no procedimento Canal


NASDAQ composite
2380
2280
2180
2080
1980
1880
1780
Jan-05

Mar-05

May-05

Jul-05

Sep-05

Nov-05

Jan-06

comprar = 1, vender = 0
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
Jan-05

Mar-05

May-05

Jul-05

Sep-05

Nov-05

Jan-06

Figura 11-2: Regra Canal - Aplicao ao NASDAQ composite Jan-05 a Mar-06


superior a mt

ento antev-se uma tendncia de crescimento dos preos e a indicao

deve ser de compra; de igual forma, se no dia t houve uma indicao de venda e Pt significativamente inferior a Mt

ento antev-se uma tendncia de queda dos preos e a in-

dicao deve ser de venda. Diz-se que Pt significativamente superior (inferior) a Mt


se Pt > (1 + B) Mt

(respectivamente Pt < (1 + B) Mt 1 ) e B um parmetro positivo

(bandwidth), calibrado com base na experincia passada. Formalmente, as regras canal de


compra e venda esto apresentadas na tabela 11.1.
Na figura 11-2 ilustra-se a regra canal ao NASDAQ composite (Jan-05 a Mar-06). Fixouse L = 50 e B = 0:

397

t+1
t
Comprar
Vender
Neutro

Comprar
t+1;t
t+1;t
t+1;t

>0
>B
>B

Vender
t+1;t
t+1;t
t+1;t

< B
<0
< B

Neutro
outros casos
outros casos
outros casos

Tabela 11.2: Regras de Compra e Venda Baseadas num ARMA


Regra Modelo ARMA
Seja

t+1;t

a previso do retorno para o momento t + 1 dado Ft ; baseado num certo modelo

ARMA. Na tabela 11.2 definem-se as regras de compra e venda. A posio (1,1) na tabela
11.2, estabelece o seguinte: se no perodo t houve uma indicao de compra e

t+1;t

> 0

ento antecipa-se uma tendncia de subida dos preos e a indicao de compra para o
perodo t + 1 . A posio (2,1) estabelece o seguinte: se no perodo t houve uma indicao
de venda e

t+1;t

> B ento a indicao de compra para o perodo t+1: O perodo t+1 de

compra apenas se a previso do retorno for suficientemente alta, digamos, acima de B > 0:
Se

t+1;t

> 0 mas

t+1;t

< B entende-se que no existe indicao suficientemente clara

de compra dado que no perodo anterior o dia foi de venda e, nestas circunstncias, o dia
considerado neutro, isto , no h lugar a venda ou compra. As demais clulas interpretam-se
de forma similar.
O parmetro B pode ser estimado com base na informao passada: selecciona-se o valor
que maximiza o lucro.
Medidas de Previsibilidade
Embora as duas primeiras regras atrs apresentadas envolvam preos, as medidas de previsibilidade, por exigirem a aplicao do teorema do limite central e a lei dos grandes
nmeros, so construdas a partir dos retornos, dado que estes so (em princpio) processos estacionrios.
Considere-se um certa regra de compra e venda e defina-se, C o conjunto dos ndices t
onde h um sinal de compra para o perodo seguinte, t + 1; e V o conjunto dos ndices t onde
h um sinal de venda para o perodo seguinte, t + 1. Por exemplo, se nos dias 3, 7 e 9 h
sinais de compra para os respectivos perodos seguintes, e nos dias 6 e 11 h sinais de venda
para os perodos seguintes ento, C = f3; 7; 9g e V = f6; 11g : Seja nC o cardinal de C; nV

398

o cardinal de V (no exemplo dado nC = 3 e nV = 2),


rC =

1 X
rt+1
nC t2C

a mdia emprica dos retornos em que houve um sinal de compra e


rV =

1 X
rt+1
nV t2V

a mdia emprica dos retornos em que houve um sinal de venda.


Se a regra de compra e venda informativa ento
E (rt+1 j t 2 C) 6= E (rt+1 j t 2 V )
i.e., o valor esperado dos retornos depende da informao de compra ou venda e, por isso, os
dois valores esperados so diferentes. Se, pelo contrrio, E (rt+1 j t 2 C) = E (rt+1 j t 2 V )
ento o comportamento dos retornos no perodo t + 1 no reflecte a expectativa de subida ou
descida dos preos, dada pela regra de compra e venda.
Numa regra informativa devemos esperar E (rt+1 j t 2 C) > E (rt+1 j t 2 V ) ; i.e., o sinal
de compra (venda) est associado a uma expectativa de subida (descida) sustentada dos
preos.
Temos vrias formas de testar se uma regra de compra e venda informativa. Uma
possibilidade consiste em realizar o teste diferena de mdia. Admitindo que os retornos so
i.i.d., tem-se que, sob a hiptese nula, H0 : E (rt+1 j t 2 C) = E (rt+1 j t 2 V ) a estatstica
rC
z=q 2

rV

^C
nC

(11.2)

^ 2V
nV

tem distribuio assimpttica N (0; 1) :


Um teste prefervel que no exige independncia dos retornos e pode acomodar autocorrelao e heterocedasticidade dos erros consiste na anlise da significncia do parmetro

na regresso
rt =

1 It 1;C

2 It 1;N

+ ut

(11.3)

(com erros padro robustos) onde It;C e It;N so variveis dummies; It;C assume o valor 1
quando no perodo t houve uma indicao de compra e It;N que assume o valor 1 quando no
399

perodo t houve uma indicao neutra. O chamado grupo base consiste na indicao de
venda. Da equao (11.3) tem-se
E (rt+1 j t 2 C) =
e, portanto, se

1;

E (rt+1 j t 2 V ) =

= 0 ento E (rt+1 j t 2 C) = E (rt+1 j t 2 V ) : Pelo contrrio, se

ento E (rt+1 j t 2 C) > E (rt+1 j t 2 V ) : Deve-se ento realizar o ensaio H0 :


H1 :

>0

= 0 vs.

> 0:

11.3

Teste Eficincia Semi-Forte de Mercado

Analisa-se se possvel obter rendibilidades anormais de forma persistente utilizando uma


estratgia de investimento baseada nos preos passados e na informao pblica disponvel.
Seja It = Ft [ FtX onde FtX o conjunto de toda a informao pblica disponvel, como
por exemplo, balanos, relatrios da empresa, notcias divulgados pela empresa, etc. Se o
mercado eficiente no sentido semi-forte ento indiferente usar ou no usar a informao
disponvel It

para prever rt e, desta forma tem-se


E (rt j It 1 ) = E (rt )

Pelo contrrio, se
E (rt j It 1 ) 6= E (rt )
ento, a informao disponvel It relevante para prever os retornos futuros. Nestas circunstncias, existe alguma informao sobre a tendncia provvel de rt ; e ser possvel, em
princpio, obter rentabilidades anormais, usando a informao disponvel It .
Existem inmeros procedimentos e conjuntos de informao It usados para testar a eficincia (semi-forte) de mercado. A literatura tem estudado (entre muitos outros) os seguintes
tpicos:
Efeito do tamanho da empresa. A questo : apresentaro as empresas pequenas, em
termos da sua capitalizao de mercado, rendibilidades mdias superiores s empresas
grandes, com nvel de risco semelhante?
Reaco do mercado chegada de informao. Este tpico importante na anlise da
eficincia e analisado em detalhe na seco 11.3.1.
400

Valor de mercado versus valor contabilstico. Entende-se que um valor de mercado


baixo face ao valor contabilstico pode indicar, em certas circunstncias, que as aces
esto subavaliadas.
Rcio preo/lucro ou price-earnings ratio (P/E). Valores baixos significam que as
aces da empresa em anlise so transaccionados a um preo relativamente baixo
face ao valor dos lucros e, portanto, a cotao da empresa poder estar barata;
Impacto de outras variveis financeiras como por exemplo, taxas de juro de obrigaes
de tesouro, dividendos por aco (dividend yield), etc.
Impacto de variveis econmicas, como por exemplo, produto, inflao, etc.
Impacto de outras anomalias mercado, como por exemplo, efeito dos dias da semana,
efeito de fim de semana, fim de ano, etc. (efeitos de calendrio - algumas destes tpicos
foram j abordados na seco 3.1.6).
Se o objectivo analisar a eficincia do mercado (e, de certa forma a previsibilidade dos
retornos) com base na varivel x (e.g. taxa de juro) a varivel x dever entrar no modelo de
regresso com um ou mais desfasamentos. S assim possvel testar a previsibilidade de r.
O modelo seria assim do tipo
rt = c + x t

+ ut :

Pode at suceder que o modelo rt = c + xt + ut (com xt e no com xt 1 ) produza um


ajustamento superior; mas neste caso o modelo no pode testar a previsibilidade de r com
base em x (note-se de passagem que este ltimo modelo o CAPM se xt a rendibilidade
de mercado). Para se obterem rendibilidades anormais com base num modelo de previso
necessrio saber, com alguma antecipao, a tendncia futura dos preos (e da x entrar
desfasado no modelo).

11.3.1

Reaco do Mercado Chegada de Informao

Se o mercado totalmente eficiente os activos respondem imediatamente chegada de informao relevante ao mercado. A informao relevante poder ser informao especfica
sobre a empresa, como por exemplo, o anncio de lucros ou dividendos, o anncio de fuses
e aquisies, etc. Poder tambm ser o anncio de medidas de poltica econmica ou outros
eventos que tenham impacto sobre a rendibilidades dos activos financeiros.
401

A questo , portanto, bvia: trata-se de identificar as informaes similares relevantes


e verificar se na vizinhana da data da divulgao da notcia as rendibilidades apresentaram
um comportamento anormal.
Para simplificar divida-se o estudo do impacto da chegada da informao sobre as rendibilidades em duas reas: A) impacto de notcias similares sobre um conjunto de empresas e B)
impacto de notcias similares sobre uma empresa especfica. No caso A) comea-se por
recolher uma amostra de N empresas que estiveram expostas a anncios no antecipados e
observam-se as rendibilidades anormais na vizinhana das datas dos anncios. A rendibilidade anormal, ra; do activo i no perodo t
rat;i = rt;i

rendibilidade esperada do activo i no momento t:

sendo rt;i o retorno do activo i no momento t: Como avaliar a rendibilidade esperada do


activo i no momento t? A abordagem habitual consiste em tomar um modelo de equilbrio
como o CAPM ou a APT. Tomando o CAPM vem
^ i + ^ i rm;t

rat;i = rt;i

onde rm;t a rendibilidade do mercado no momento t: Sejam


rat =

PN

i=1

rat;i

s2t

PN

i=1

(rat;i rat )2
;
N 1

respectivamente, a mdia e a varincia emprica seccional das rendibilidades anormais das


empresas na data t: Estas estatsticas podem ser calculadas para qualquer t; mas tem sobretudo interesse analisar rat e s2t para t numa vizinhana do anncio. Convencionando que o
anncio ocorre na data 0 e fixando uma janela temporal de d perodos para antes e depois do
anncio, rat e s2t podem ser calculadas para t =

d; :::; 1; 0; 1; :::d:

Suponha-se que divulgada uma notcia boa, como por exemplo, um anncio de dividendos acima do esperado. Se as rendibilidades anormais se concentram em t = 0 no
podemos rejeitar a hiptese de o mercado ser eficiente. Pelo contrrio, se existirem rendibilidades anormais apenas para t > 0 podero existir indcios de ineficincia, sobretudo se t
medido em dias. Em geral prefervel usarem-se dados intra-dirios, por exemplo, perodos
de 5, 10 ou 15 minutos.
possvel aprofundar a anlise construindo uma sucesso frat g para todas as obser402

vaes disponveis (e no apenas na vizinhana da data do anncio). Com este procedimento


possvel comparar rat nos perodos vizinhos e no vizinhos do anncio, por exemplo,
analisando a significncia de

na regresso,

rat =

1 I0;t

2 I1;t

+ ut :

onde I0;t e I1;t so variveis dummies. I0;t assume o valor 1 quando t corresponde data de
anncio e I1;t assume o valor 1 quando t corresponde a uma data imediatamente a seguir
data de anncio . Se

significante ento possvel que o mercado seja ineficiente (ou no

totalmente eficiente). Se, pelo contrrio, apenas

significante ento o impacto do anncio

concentra-se no perodo do anncio e no h razes para rejeitar a hiptese de eficincia. A


anlise poder ser mais fina, adicionando-se mais variveis dummies.
Se o objectivo avaliar o impacto de notcias similares sobre uma empresa especfica caso B) - o procedimento mais simples consiste em formular a equao de regresso
rt =

1 I0;t

2 I1;t

3 rm;t

+ ut :

(11.4)

A introduo da varivel rm;t importante porque permite isolar o efeito do anncio do


efeito de mercado. Com efeito, suponha-se que o anncio tem impacto sobre a rendibilidade
do mercado. Como a rendibilidade do mercado est correlacionado com a rendibilidade da
aco em anlise, o anncio acaba por influenciar a rendibilidade da aco atravs do comportamento global do mercado. Um modelo de regresso sem a varivel rm;t no permite
isolar o efeito do anncio sobre a empresa. Por exemplo, neste modelo mais reduzido, se
o parmetro

vem diferente de zero no se sabe se

6= 0 se deve ao efeito retardado

do anncio sobre a empresa ou ao efeito do mercado sobre a empresa induzido pelo anncio. Pode haver outra razo para introduzir rm;t : Suponha-se que os anncios coincidem
com movimentos de alta do mercado. Se rm;t no est no modelo os anncios no podem
distinguir-se dos movimentos de alta.

403

Pgina em branco

404

Captulo 12
Seleco de Portfolios
(ltima actualizao: 2/2010)
Vai analisar-se o problema da determinao dos pesos ptimos de uma carteira constituda por m activos com risco e um activo sem risco por parte de um investidor individual.
Os resultados principais devem-se a Markowitz (prmio Nobel 1990), James Tobin (prmio
Nobel 1981) e William Sharpe (prmio Nobel 1990). O objectivo deste captulo consiste em
apresentar a teoria bsica e ilustrar o problema da determinao dos pesos ptimos a partir
de momentos marginais e condicionais da distribuio dos retornos.
Os modelos de heterocedastiocidade multivariada so particularmente teis quando os
pesos ptimos se baseiam em momentos condicionais.

12.1

Portfolio Baseado em Momentos Marginais

Assumem-se as seguintes hipteses:


1. Os retornos seguem uma distribuio marginal normal multivariada;
2. As correlaes entre os retornos so fixas ao longo do tempo;
3. O investidor racional, tem averso ao risco, usa toda a informao disponvel e
procura o mximo lucro, para um determinado nvel de risco;
4. No existem custos de transaco;
5. O investidor price taker, isto , no tem capacidade de influenciar os preos;
6. O investidor pode emprestar e pedir emprestado sem restries;
405

7. Todos os activos podem ser convenientemente fraccionados.

12.1.1

Todos os Activos Envolvem Risco

Para alm das hipteses anteriores suponha-se que no existe o activo sem risco, i.e., todos
os activos envolvem risco.
Estabelea-se a seguinte notao:
vector dos retornos: rt = (R1t ; :::; Rmt )0 ;
vector do valor esperado dos retornos:

= (E (R1t ) ; :::; E (Rmt ))0 ;

matriz das varincias-covarincias dos retornos: Var (rt ) = H;


vector dos pesos da carteira: ! = (! 1 ; :::; ! m )0 ;
retorno do portfolio: Rpt =

Pm

i=1

! i Rit = ! 0 rt

valor esperado do portfolio: E (Rpt ) = E (! 0 rt ) = ! 0


Varincia do portfolio
Naturalmente que

Pm

i=1

2
p

= Var (Rpt ) = Var (! 0 rt ) = ! 0 Var (rt ) ! = ! 0 H!:

! i = 1 , ! 0 1 = 1 onde 1 (a negrito) representa um vector-

coluna de 1s. Para simplificar, assume-se que todos os activos envolvem risco e que alguns
pesos ! i (mas no todos) podem ser negativos. Na teoria financeira um peso pode ser negativo quando h lugar a uma venda a descoberto ou short selling1 . Esta hiptese simplifica o
problema de optimizao.
Em condies normais, qualquer investidor procura dois objectivos antagnicos: maximizar o lucro (ou valor do retorno) e minimizar o risco. Os objectivos so contraditrios
porque, em geral, os activos com maior (menor) retorno (em mdia) so os que possuem
maior (menor) variabilidade. Para conciliar estes objectivos, pode-se, por exemplo, (i) fixar
um valor para o retorno esperado do portfolio e, para esse valor, procurar os activos com a
menor variabilidade possvel; ou (ii) fixar um valor para o risco do portfolio (varincia) e,
depois, procurar os activos com o maior retorno esperado possvel.
1

Venda a descoberto ocorre quando se vende um activo financeiro ou derivado que no se possui, esperando
que o preo caia para depois compr-lo e lucrar na transao. O mecanismo o seguinte: o agente A pede
(digamos) uma aco a B e promete-lhe todo o rendimento subjacente ao ttulo. A vende imediatamente a
aco a C; mais tarde, A compra no mercado a aco para a devolver a B. Se o preo da aco cair, esta
operao vantajosa para A.

406

Suponha-se que se opta pelo procedimento (i). O problema de optimizao ento


8
8
< min Var (R )
< min ! 0 H!
!i
pt
!i
,
P
m
: s.a E (R ) =
: s.a ! 0 =
0
pt
p e
p e! 1 = 1
i=1 ! i = 1

(12.1)

Considere-se a funo Lagrangeana,

L (!) = ! 0 H! +
(

!0

(1

! 0 1)

so os multiplicadores de Lagrange). Resolvendo o sistema, que se obtm a partir

das condies de primeira ordem (@L=@! = 0; ! 0

e ! 0 1 = 1), e notando que L

uma funo convexa2 , obtm-se a soluo do problema de optimizao:


! =!

= g+ p h

(12.2)

onde
g=
=

H 1 1;

H 11
=

h= H

H 1 1;

= 10 H 1 1;

1 = (1; 1; :::; 1)0 :


A expresso !
p;

valor para

mostra que os pesos ptimos dependem de

(fosse definido outro

e os pesos ptimos seriam outros).

Resulta que a varincia mnima associada ao retorno


2
p

= Vp

= ! 0 H! :

O problema (ii) equivalente ao problema (i) no seguinte sentido. Suponha-se que se


fixa Vp

como restrio e se procura maximizar o retorno, i.e.


8
< max E (R )
!i
pt
: s.a Var (R ) = V
pt

Pm

i=1

! i = 1:

A funo ! 0 H! estritamente convexa se H for uma matriz definida positiva (hiptese pacfica). As
funes 1 p ! 0
e 2 (1 ! 0 1) so convexas por serem lineares (funes lineares so, por definio,
cncavas e convexas).
2

407

Ento, pode-se provar, a soluo deste problema optimizao precisamente

p.

Desta forma

basta estudar o problema formulado na equao (12.1).


e H so desconhecidos. necessrio estim-los a

Na prtica os valores esperados

partir dos valores observados. Supondo que frt g um processo estacionrio fracamente
dependente,

e H podem ser estimados usando os seguintes estimadores consistentes:


0

r
B 1 C
B .. C
^ =B . C;
@
A
rm

h i
^ ij
^
H= h

i;j=1;::;m

^ ij o elemento (i; j) da matriz H;


^ dado por
onde h
X
^ ij = 1
(rit
h
n t=1
n

ri ) (rjt

rj ) :

Exemplo 12.1.1 Considere-se um portfolio constitudo pelas aces A1, A2 e A3. Vai ser
tomada uma deciso de investimento no valor de 1 milho de Euros. A questo : quanto
comprar de cada um desses activos? Com base em observaes dirias suponha-se que se
obtm3 :

5:22
B
C
B
C
^ = B 6:05 C
@
A
5:98

1:549 0:9534 0:465


B
C
B
^ = B 0:9534 2:093 1:0416 C
H
C:
@
A
0:465 1:0416 1:265

As rendibilidades esto anualizadas e em percentagem. Suponha-se que se pretende obter


um retorno esperado do portfolio de

= 5:85: Usando a expresso (12.2) obtm-se


0

0:176
B
C
C
^ =B
!
^ (5:85) = g
^+ p h
B 0:104 C :
@
A
0:720
3

Estimativas baseadas nos retornos dos ndices SP500, DowJones e PSI20, no perodo 04/01/199304/09/2009.

408

Desta forma, a varincia mnima do portfolio associado rendibilidade 5:85


Vpt (5:85) = !
^ 0 H^
!

0:176

0:104

1:549

0:9534

0:465

10

0:176

B
CB
C
B
CB
C
B 0:9534 2:093 1:0416 C B 0:104 C = 1:03:
@
A@
A
0:465 1:0416 1:265
0:720

0:72

p;

O vector de pesos ptimo associado combinao

1:03; 5:85 diz-nos que a

composio do portfolio deve ser de 17.6% de A1, 10.4% de A2 e 72% de A3.


No exemplo anterior o investidor pode estar interessado em analisar outras combinaes
de retorno versus risco (mnimo). Desta forma, podemos fixar outros valores para
sim, obter as correspondentes varincias mnimas do portfolio. No exemplo anterior,
variar entre 5.22 e 6.05. Faa-se uma grelha de valores para
100 valores equidistantes para

p;

p
p

e, aspode

por exemplo, escrevam-se

no intervalo [5:22; 6:05] e obtenham-se as correspondentes

varincias mnimas:
p

Vp

..
.

..
.

5:85
..
.

1:03
..
.

6:05

1:32

q
O grfico definido pelos pares ordenados
Vp

onde

maior ou igual ao re-

torno associado varincia mnima de todos os portfolios designa-se por fronteira eficiente.
q
Na figura 12-1 traam-se todos os pontos
Vp p ; p : O ponto A representa o par
p
ordenado
Vp ( min ); min onde Vp ( min ) o valor da varincia mnima de todos os
portfolios e

min

o retorno esperado associado (tambm mnimo). A fronteira eficiente

dada pelo segmento AB. O ponto C no faz parte da fronteira eficiente, pois existe um
ponto D com igual varincia mas retorno esperado superior. Assim, s os pontos sobre a
curva AB so relevantes para o investidor e, por isso, no grfico definido pelos pares ordeq
nados
Vp p ; p s interessam os pontos onde p maior ou igual ao valor da ordeq
nada do ponto A. O investidor deve agora decidir qual o par
Vp p ; p sobre a curva
AB que mais lhe interessa, tendo em conta a sua maior ou menor averso ao risco. Se for
q
averso ao risco tender a escolher um par
Vp p ; p mais prximo do ponto A; se tiver
maior apetncia pelo risco tender a escolher uma soluo mais prxima do ponto B. Contin409

Figura 12-1: Fronteira Eficiente: Curva AB


uando o exemplo anterior, suponha-se que a combinao preferida do investidor p ; p =
p
1:03; 5:85 . Tendo em conta que o vector de pesos ! = (0:176; 0:104; 0:72)0 , o investimento de 1 milho de Euros seria ento alocado da seguinte forma: 176000 Euros em A1,
104000 em A2 e 720000 em A3.
A fronteira eficiente dada pelo segmento AB uma funo no linear. Esta concluso
imediata tendo em conta a representao paramtrica da funo:
q
Vp

g+ p h H g+ p h ;

q
c0 + c1
=

+ c2

2;
p

Se c0 = c1 = 0 a funo seria linear.


Como determinar analiticamente o valor da varincia mnima de todos os portfolios efip
cientes? Trata-se, afinal, de determinar as coordenadas do ponto A =
Vp ( min ); min

da figura 12-1. Para o efeito resolve-se o problema de optimizao livre


dVp
d

d (! 0 H! )
= 0;
d p

cuja soluo
min

g0 Hh
:
h0 Hg

410

Inserindo este valor em Vp () obtm-se


Vp (

(g0 Hh)2
h0 Hh

0
min ) = g Hg

Aplicando estas frmula aos valores do exemplo anterior obtm-se

min

= 5:63 e Vp (

min )

0:919:

12.1.2

Modelo com Activo Sem Risco

O porfolio inclui agora o activo sem risco (por exemplo, obrigaes e os ttulos do Tesouro4 ).
Tem rendibilidade certa

(e, por isso, tem varincia e covarincias nulas com os demais ac-

tivos). A rendibilidade do portfolio agora ! 0 + (1


passa a ser

8
< min ! 0 H!
!i
: s.a ! 0 + (1 ! 0 1)

Note-se que os pesos ! 0 1; (1

! 0 1)

f:

O problema de optimizao

p:

! 0 1) ; somam um. A matriz H mantm-se naturalmente

inalterada e, por isso, a funo objectivo a mesma. Apenas as restries so modificadas.


Pode-se provar que a soluo
!
c

f1

p
0

=c

f
1

f1

Resulta que a varincia mnima associada ao retorno


Vp

= ! 0 H! = c

!;

! Hc

!=H

f1

! =c

2
p

! 0 H!:

Nesta formulao a composio da carteira dos activos com risco fixa, dado
quer que seja o valor
dade c

p.

f;

qual-

Com efeito, ! proporcional a ! e a constante de proporcionali-

: Por exemplo, suponha-se que se tem dois activos com risco e ! = (0:3; 0:6)0 :

Ento dado o valor de

f,

o nmero de aces do activo 2 sempre o dobro do do activo 1,

qualquer que seja o valor que queiramos para a rendibilidade do portfolio.


A observao anterior sugere que o valor do portfolio pode ser dado como uma combi4

Naturalmente, em condies normais, o estado no entra em falncia. No h portanto risco de incumprimento. Mas preciso notar que as obrigaes e os ttulos do Tesouro tm o risco da taxa de juro (risco da taxa
de juro subir e do preo dos ttulos descer).

411

nao linear de um portfolio constitudo apenas por activos de risco e o activo sem risco.
Este portfolio, constitudo apenas por activos de risco, designa-se por tangency portfolio. Os
pesos deste portfolio no podero ser exactamente dados por ! dado que os pesos ! 0i s no
somam um. Assim defina-se
!
! T = Pm

i=1

!i

!
:
!01

Note-se agora que a soma dos pesos do vector ! T somam um e ! = ! T ! 0 1: Podemos assim
escrever
! =c

! =c

! 0 1! T = a! T ;

a=c

! 0 1:

O retorno do portfolio pode ser escrito como uma combinao linear entre o retorno do
tangency portfolio,

=!

e o retorno do activo sem risco,

+ (1

! 0 1)

= a! 0T

f:

+ (1 a)

=a

+ (1

a)

f:

Por seu lado a varincia do portfolio pode tambm ser escrita em funo de ! T :
Vp

= ! 0 H! = a! 0T Ha! T = a2 ! 0T H! T = a2

e o desvio padro do portfolio

=a

2
T

T
p;

A fronteira eficiente linear no espao

. Com efeito, usando algumas expresses

j deduzidas, tem-se
p;

= a

T;a T

+ (1

a)

Esta representao paramtrica da fronteira eficiente permite deduzir

e, substituindo o valor de a em
espao

p;

=a

=a

)a=

+ (1

a)

p
T
f;

resulta que a fronteira eficiente no

dada pela recta (na forma reduzida)

+ s p;

s=

b representa

Na figura 12-2 a fronteira eficiente representada pela recta bT, i.e.


declive da recta s = (a
T:

b) =c (na figura a representa

O valor s designado por rcio de Sharpe.


412

T;

+ s p. O

e c representa

Figura 12-2: Fronteira Eficiente de um Portfolio com Activo Sem Risco (Recta)

12.2

Portfolio Baseado em Momentos Condicionais

O problema de optimizao de um portfolio baseado nos dois primeiros momentos marginais


da distribuio dos retornos implica que a deciso de investimento se mantm fixa ao longo
do tempo, pois se o processo dos retornos estacionrio, como se admite na fase da estimao dos parmetros, os momentos Var (Rpt ) e E (Rpt ) so constantes ao longo tempo e,
por isso, a soluo ptima sempre a mesma, quaisquer que sejam as condies de mercado.
Naturalmente, nenhum gestor de fundos segue esta estratgia de investimento, mesmo que
as suas decises se baseiem nos princpios do portfolio definido no ponto precedente. Na
^ usando mdias mveis ou alisamentos exponenciais para deprtica podem estimar ^ e H
sprezarem a informao antiga e actualizarem os parmetros

e H com informao mais

recente. Desta forma os peso ! i podem variar ao longo do tempo, e as decises de investimento podem ajustar-se de acordo com as condies de mercado. Mas a percepo de que
as condies de mercado se alteram ao longo do tempo exige uma abordagem diferente.
Uma deciso de investimento tomada no momento t 1; resulta da avaliao das condies
de mercado e, em geral, da informao disponvel no momento t
no perodo t

1: Esta deciso tomada

1 pode naturalmente alterar-se no momento t; se as condies de mercado

e a informao disponvel em t se alterarem tambm. Desta forma, a seleco dos activos


deve basear-se em momentos condicionais e no em momentos marginais. Recorde-se que
as melhores previses dos retornos e da volatilidade para o perodo t; dada toda a informao

413

disponvel at ao momento t

1; so dadas pelos dois primeiros momentos condicionais. A

determinao dos pesos ptimos usando momentos condicionais assenta na ideia de que o
portfolio pode ajustar-se continuamente ao longo do tempo em funo das condies de mercado. Esta abordagem tem ainda a vantagem de contornar as criticas que se fazem s duas
primeiras hipteses definidas na seco anterior (os retornos seguem uma distribuio marginal normal multivariada, e as correlaes entre os retornos so fixas ao longo do tempo).
Como se sabe, no quadro de um modelo baseado em momentos condicionais variveis, no
s a distribuio marginal no (em condies muito gerais) normal, como tambm as correlaes (condicionais) podem ser variveis ao longo do tempo.
Na formulao que a seguir apresentaremos, a deciso de investimento tomada no momento t

1; baseada numa suposio sobre o comportamento dos retornos esperados e do

risco envolvido no momento t: Na verdade as perdas ou ganhos que eventualmente ocorram


vo concretizar-se no momento t: por esta razo que os momentos condicionais envolvem
variveis aleatrias no momento t; dada a informao disponvel em t

1:

Estabelea-se a seguinte notao:


vector do valor esperado condicional dos retornos:

= (E (R1t j Ft 1 ) ; :::; E (Rmt j Ft 1 ))0 ;

matriz das varincias-covarincias condicionais dos retornos: Var ( rt j Ft 1 ) = Ht ;


vector dos pesos da carteira no momento t: ! t = (! 1t ; :::; ! mt )0 ;
retorno do portfolio: Rpt =

Pm

i=1

! it Rit = ! 0t rt

valor esperado condicional do portfolio: E (Rpt j Ft 1 ) = E (! 0t rt j Ft 1 ) = ! 0t

Varincia condicional do portfolio Vpt = Var (Rpt j Ft 1 ) = Var (! 0t rt j Ft 1 ) =


! 0t Var ( rt j Ft 1 ) ! t = ! 0t Ht ! t :
Os principais resultados foram j obtidos nos pontos precedentes. Substituindo os momentos marginais pelos momentos condicionais tm-se os seguintes resultados:
Pesos ptimos de um portfolio sem o activo sem risco, dado um determinado nvel de
retorno

p;t :

!t = !t

p;t

414

= gt +

p;t ht

onde
gt =

t
t

1
0
t Ht 1;

Ht 1 1
t

Ht 1 ;

1
0
t Ht

ht =

t;

Ht 1

t
t

Ht 1 1

= 10t Ht 1 1;

2
t;

t t

1 = (1; 1; :::; 1)0 :

Pesos ptimos de um portfolio com o activo sem risco, dado um determinado nvel de
retorno

p;t :

!
c

f1

p;t
0

p;t

Ht

p;

A fronteira eficiente no espao

=c

p;t

+ st

f1

p;t

!t;
! t = Ht 1

f1

com o activo sem risco


p;t ;

st =

T;t

T;t

Este rcio de Sharpe depende de t; pois, em ltima anlise, depende de

e Ht .

Se o horizonte do investimento fosse h perodos e admitssemos que no haveria lugar a


alteraes do portfolio durante o perodo do investimento, os momentos condicionais relevantes passariam a ser
E (rt+h j Ft ) ; Var (rt+h jFt ) :
Quando o horizonte de previso elevado, os momentos condicionais so, em condies
ergdicas, aproximadamente iguais aos momentos marginais.
Naturalmente os valores esperados condicionais

e Ht so desconhecidos. necessrio

estim-los, por exemplo, a partir de um modelo GARCH multivariado.

415

Pgina em branco

416

Captulo 13
Risco de Mercado e o Valor em Risco
(ltima actualizao: 2/2011)

13.1

Introduo

Em resposta aos desastres financeiros ocorridos no passado recente, a gesto do risco sofreu
uma revoluo nos ltimos anos. O valor em risco ou Value at Risk (VaR) iniciou essa
revoluo e tem ganho reconhecimento como medida fundamental na anlise e na gesto do
risco de mercado das instituies financeiras. Presentemente, muitas instituies reportam
medidas de risco relacionadas com o VaR para o pblico em geral e, em certos casos, tambm
para agncias reguladoras. Por exemplo, os bancos comerciais esto sujeitos a requisitos
mnimos de capital para cobrirem o seu risco de crdito e de mercado. O Acordo Basilia II
estabelece taxas de segurana baseadas em modelos VaR.
A literatura financeira enumera vrios tipos de risco, como por exemplo, risco de mercado, risco de crdito, risco de liquidez, risco operacional (associado ao risco de fraude,
erros de transaco e de apreamento, etc.) e risco sistmico (associado, por exemplo, a
situaes de incumprimento devido a reaces em cadeia). Neste captulo aborda-se o risco
de mercado, isto , o risco associado s variaes (inesperadas) de preos e taxas e algumas
metodologias de mensurao desse risco.
Para introduzir o VaR instrutivo, em primeiro lugar, pensar-se em anlise de cenrios.
Neste tipo de anlise, formulam-se vrios resultados possveis de acordo com a informao
disponvel e, quando tal possvel, atribuem-se probabilidades aos diversos cenrios. Em
geral, d-se especial ateno aos piores cenrios pois so estes que maior impacto tm sobre
o funcionamento normal da organizao.
417

Para avaliar os piores cenrios, podemos comear por formular a questo: Qual a
perda mxima que a organizao pode sofrer num certo perodo de tempo?. A resposta
no particularmente informativa, pois a perda mxima significa perder tudo (com probabilidade praticamente nula). Se reformularmos ligeiramente a questo, obtemos a medida VaR: Quanto que podemos perder com probabilidade
de tempo?. Impe-se que

> 0 num certo perodo

seja no nulo mas razoavelmente pequeno com vista a avaliar

os eventos que embora raros podem ocorrer e afectar o funcionamento normal da organizao. VaR portanto a perda que pode ocorrer num lapso de tempo determinado, com
certa probabilidade , supondo que o portfolio no gerido durante o perodo de anlise.
Em termos probabilsticos, o VaR o quantil de ordem
terica de ganhos e perdas. Para concretizar, seja

(em mdulo)1 da distribuio

Vn+h := Vn+h

Vn a variao do

valor do capital investido no gerido durante o horizonte de risco de h dias. Por exemplo, considere-se a compra de 200,000 aces

Pn = 5 Euros. O investimento de Vn = 5

200; 000 = 1; 000; 000 Euros. Suponha-se

de um ttulo no perodo n ; ao preo de

que no momento n + h o preo do ttulo passa para Pn+h = 5:5 Euros. A variao do capital de

Vn+h = 1; 100; 000

Rn+h = (Pn+h

1; 000; 000 = 100; 000: O retorno (em tempo discreto)

Pn ) =Pn = 0:1: importante notar que o retorno pode tambm ser obtido

atravs da expresso Rn+h =

Vn+h =Vn :3 Pode supor-se que Vt observado no perodo

t = 1; 2; :::; n, mas no em n + 1; n + 2; ::: Os valores que V vier a assumir no periodo


n + 1; n + 2; :::; n + h dizem respeito ao perdo de investimento e, portanto, Vn+h ; desconhecido para h

1:

O VaR a 100 % baseado na distribuio marginal de ganhos e perdas o valor VaR tal
que
P ( Vn+h <

V aR) = :

Por seu turno, o VaR a 100 % baseado na distribuio condicional o valor VaR tal que
P ( Vn+h <

V aRj Fn ) = :

O quantil de ordem < 0:05 da distribuio de ganhos e perdas um valor negativo. Para que o VaR
represente efectivamente uma perda, considera-se esse quantil em valor absoluto.
2
Seguimos a notao anglo-saxnica: a vrgula separa os milhares.
3
Este facto relevante, pelo seguinte. Como iremos ver mais frente uma das abordagens possveis ao VaR
consiste em modelar parametricamente o processo f Vt g : Ora este processo quase sempre no estacionrio.
Para confirmar este facto, veja-se a figura 6-9, no ponto 6.3.2, onde se exibe uma trajectria tpica de Vt .
Desta forma, usando a relao Rn+h = Vn+h =Vn ; pode-se modelar Vn+h via retornos, que geralmente
um processo estacionrio.

418

O VaR (condicional) uma medida que depende explicitamente de n; h e

e, portanto,

pode ser escrita como V aRn;n+h; : A estimao do VaR envolve princpios e procedimentos
at certo ponto similares com a da previso de

Vn+h : Em ambos os casos, a lei de prob-

abilidades relevante a distribuio condicional de


efeito, o previsor ptimo para

Vn+h dado Fn ; i.e., f ( j Fn ) : Com

Vn+h dado Fn (de acordo com o critrio do EQM) corre-

sponde ao primeiro momento da distribuio f ( j Fn ), i.e., E ( Vn+h j Fn ) : Por seu turno,


o V aRn;n+h; o quantil de ordem

da distribuio de f ( j Fn ). Em ambos os casos, as

quantidades de interesse so parmetros da distribuio f ( j Fn ) :


Uma vantagem do VaR a de poder agregar numa nica medida diferentes tipos de risco.
Pelo contrrio, as medidas tradicionais de risco no so agregveis. Revejam-se algumas
medidas tradicionais de risco.
O risco associado com uma obrigao do tesouro o risco da taxa de juro e a medida
tradicional deste risco a durao (medida de volatilidade do preo da obrigao face a variaes da taxa de rendimento at maturidade). O principal risco associado com obrigaes
emitidas por entidades particulares o risco de incumprimento (default risk), o qual pode
ser medido atravs de um sistema de rakings, disponibilizados em vrios casos por agncias
de crdito. Para portfolios de aces o risco normalmente avaliado atravs da volatilidade
do portfolio, que funo das volatilidades individuais e das correlaes entre os diferentes
activos. O risco de taxa de cmbio tipicamente inclui spreads e volatilidades das taxas de
cmbio. Os risco associados a swaps e opes tambm est sujeito a um tratamento especial.
Em geral, as medidas tradicionais de risco no podem ser agregadas numa nica medida
(por exemplo, a durao de uma obrigao no pode ser comparada com a volatilidade de
um portfolio). Pelo contrrio, uma das grandes vantagens da metodologia VaR a de poder
agregar diferentes tipos de risco numa nica intuitiva medida de risco.
Para simplificar admite-se inicialmente que o portfolio constitudo por apenas um activo.

13.2

Abordagem No Paramtrica

Seja
Vn+1 =

Vn+1
Vn = Rn+1 Vn
Vn

419

variao do capital ao fim de um perodo. Por definio tem-se


V aRn;n+1; j Fn ) =

P ( Vn+1 <
ou, equivalentemente,

Resulta V aRn;n+1; =

V aRn;n+1; j Fn ) =
V aRn;n+1;
<
Fn
=
Vn
P Rn+1 < q R Fn =

P (Rn+1 Vn <

Rn+1

q R Vn onde q R o quantil de ordem

:
da distribuio de Rn+1 dado

Fn :
Se assumirmos
P Rn+1 < q R Fn = P Rn+1 < q R
o VaR pode estimado a partir da expresso
V[
aRn;n+1; =
onde q~R o quantil emprico de ordem

q~R Vn

da srie de retornos fRt g4 . Observe-se que nen-

huma hiptese estabelecida sobre a distribuio (marginal) dos retornos - da a designao


de abordagem no paramtrica.
No caso h > 1; considera-se
Vn+h =

Vn+h
Vn = Rn+h (h) Vn
Vn

Para determinar V aRn;n+h; resolve-se a expresso


P ( Vn+h <

V aRn;n+h; j Fn ) =

Na literatura existem diferentes frmulas para calcular o quantil emprico de ordem : Usaremos a seguinte
conveno: o quantil emprico q~R corresponde estatstica de ordem [n ] ; sendo [x] o inteiro de x: Por
exemplo, na amostra de dimenso n = 6; f1; 4; 2; 7; 15; 0g , as estatsticas de ordem so: y(1) = 0; y(2) = 1;
y(3) = 2; y(4) = 4; y(5) = 7; y(6) = 15: O quantil de ordem = 0:9 a estatstica de ordem [0:9 6] = 5;
isto , y(5) = 7.

420

em ordem a V aRn;n+h; ou, equivalentemente, resolve-se a expresso


V aRn;n+h; j Fn ) =
V aRn;n+h;
Rn+h (h) <
Fn
=
Vn
P Rn+h (h) < q R Fn =

P (Rn+h (h) Vn <


P

em ordem a q R e obtm-se depois V aRn;n+1; =

q R Vn : Se assumirmos

P (Rn+h (h) < q j Fn ) = P (Rn+h (h) < q )


o VaR pode estimado a partir da expresso
V[
aRn;n+h; =
onde q~R o quantil emprico de ordem

q~R Vn

da srie de retornos fRn+h (h) ; n = 1; 2; :::g.

Naturalmente, o VaR pode ser obtido a partir directamente da distribuio emprica das
variaes de capital f Vn+h ; n = 1; 2; :::g : Neste caso viria V[
aRn;n+h; =
o quantil emprico de ordem

q~

; onde q~

da srie f Vn+h ; n = 1; 2; :::g.

Se a anlise incide sobre um portfolio linear, na construo da srie histrica dos retornos
Rp;t = ! 1 R1;t + ! 2 R2;t + ::: + ! n Rn;t ;
onde ! i so os pesos do capital investido no activo i (
manecer fixos durante todo o perodo histrico.

Pn

i=1

! i = 1), os pesos devem per-

A abordagem no paramtrica embora tenha a vantagem de ser simples, sofre dos seguinte
problemas:
Embora a distribuio no esteja especificada (por isso mesmo que o procedimento
se designa por no paramtrico) assume-se (incorrectamente) que a distribuio relevante para obter o VaR a distribuio marginal de Rn+h e no a distribuio condicional. Mas o VaR est associado a uma previso dos retornos dada (obviamente) a
informao disponvel Fn e, por isso, a distribuio condicional que nos interessa.
Assim, mesmo que no perodo n se registe, por exemplo, alta volatilidade e perdas
acentuadas, essa informao negligenciada para obter o VaR.

421

Quando

muito baixo por exemplo

= 0:01 ou inferior o estimador q~R muito im-

preciso. A justificao terica dada pelo seguinte resultado assimpttico. Suponhase que fXt ; t = 1; :::; ng uma sucesso de variveis i.i.d. com funo distribuio
F e funo densidade de probabilidade f e seja q = inf fx : F (x)

g : O quantil

emprico q~ (isto, a estatstica de ordem [n ]) tem distribuio assimpttica dada por


p
n (~
q

q ) !N

0;

(1
)
2
(f (q ))

A varincia assimpttica de q~ explode quando a fdp no ponto valor q , f (q ) ;


aproximadamente zero. Isto sucede quando q um valor extremo (i.e., muito afastado
do centro da distribuio), isto , quando

um valor muito baixo, perto de zero, (ou

muito alto, perto de 1). Em suma, a varincia do quantil emprico alta nas abas e
baixa no centro da distribuio.
At onde coligir os dados? Considerar todo o passado disponvel? Ou s o passado recente? Esta questo mais relevante neste procedimento do que em outros,
pois a metodologia exposta atribui o mesmo peso a todas as observaes. Normalmente considera-se o passado recente pois dados muito antigos podem no reflectir
a dinmica do processo no presente e no futuro imediato (ser relevante atribuir importncia ao crash de 1929-31 para obter o VaR num futuro prximo?). Por outro lado,
tambm no convm definir janelas de observaes muitas curtas pois a eficincia do
estimador do quantil de ordem

pode ser severamente afectada, sobretudo quando

muito baixo. Vrios estudos indicam como razovel considerar-se os ltimos dois
ou trs anos de observaes.

13.3

Abordagem Paramtrica

Considere-se novamente a expresso para o caso h = 1:


Vn+1 =

Vn+1
Vn = Rn+1 Vn ' rn+1 Vn :
Vn

Esta expresso mostra que a distribuio condicional de rn+1 Vn apenas depende da distribuio de rn+1 (no momento n; Vn conhecido). Podemos assim concentrar-nos apenas sobre a distribuio de rn+1 : Assuma-se rn+1 j Fn
422

n+1 ;

2
n+1

onde D uma

distribuio qualquer de mdia

Tem-se

V aRn;n+1; j Fn ) =

P ( Vn+1 <
P

2
n:

e varincia

V aRn;n+1;
Vn

rn+1 <

Fn

= :

Estandardizando rn+1 ; isto , considerando


Zn+1 =

rn+1

n+1
n+1

vem
P

Zn+1 <

V aRn;n+1;
Vn
n+1

V aR
Vn

n+1
n+1

(q Z o quantil de ordem

= q Z ) V aRn;n+1; =

n+1

Fn

n+1

+ qZ

(13.1)

n+1

Vn

(13.2)

da distribuio da varivel Zn+1 ).

No caso h > 1 tem-se


Vn+h =

Vn+h
Vn
Vn
(rn+1 + rn+2 + ::: + rn+h ) Vn ; rn+i = log (Pn+i =Pn+i 1 )

= rn+h (h) Vn :
No por mero acaso que se passa de
de

Vn+h para rn+h (h) Vn : A ideia obter a distribuio

Vn+h a partir da distribuio de rn+h (h) : Claro que, formalmente,

Vn+h igual a

Rn+h (h) Vn (onde Rn+h (h) so os retornos discretos multi-perodos). O problema com esta
relao decorre do facto da distribuio de Rn+h (h) ser geralmente difcil de tratar.
Para determinar V aRn;n+h; considera-se
P (rn+h (h) Vn <
P

rn+h (h) <

V aRn;n+h; j Fn ) =
V aRn;n+h;
Fn
=
Vn

423

e, estandardizando5 rn+h (h), i.e.,


Zn+h =
vem
P

rn+h (h) E (rn+h (h)j Fn )


p
Var (rn+h j Fn )

V aRn;n+h;
Vn

E (rn+h (h)j Fn )

p
Var (rn+h j Fn )

Zn+h <

Conclui-se

Fn

= :

V aRn;n+h;
Vn

) V aRn;n+h; =

E (rn+h (h)j Fn )
p
= qZ
Var ( rn+h (h)j Fn )
p
E (rn+h (h)j Fn ) + q Z Var (rn+h (h)j Fn ) Vn

(13.3)

Estas frmulas gerais sero agora adaptadas a casos mais simples.

13.3.1

Modelo Gaussiano Simples

O caso mais simples consiste em assumir


rt =
onde fut g um rudo branco Gaussiano, ut

+ ut ;
N (0;

(13.4)
2

) : Assim, rn+1

N( ;

) : No caso

h = 1; tem-se, pela frmula (13.2)


V aRn;n+1; =
onde q Z o quantil de ordem

+ qZ

Vn

da distribuio N (0; 1) (observe-se que a varivel Zn+1

na expresso (13.1) tem distribuio N (0; 1)). No caso h > 1 necessrio deduzir-se
a distribuio condicional de rn+h (h). Como, por hiptese, rn+h (h) no depende Fn ; a
distribuio condicional coincide com a distribuio marginal. Pelas propriedades habituais
da distribuio normal vem rn+h (h) = rn+1 + rn+2 + ::: + rn+h

N (h ; h 2 ) : Assim,

E (rn+h (h)j Fn ) = E (rn+h (h)) = h


Var (rn+h (h)j Fn ) = Var (rn+h (h)) = h
5

Admitindo que faz sentido a estandardizazo. Veremos que no caso geral a distribuio de Wn+h
desconhecida.

424

e, portanto, pela aplicao da frmula (13.3), vem


V aRn;n+h; =
Se

= 0 deduz-se V aRn;n+h; =

13.3.2

h +

h q Z Vn :

hV aRn;n+1;

Modelo RiskMetrics

As hipteses de normalidade e varincia condicional constante, assumidas no modelo anterior, so, como se sabe, bastante limitativas. Um modelo relativamente simples, mas
assumindo varincia condicional no constante corresponde ao modelo RiskMetrics desenvolvido pela J.P. Morgan para o clculo do VaR. A metodologia baseia-se no modelo EWMA
(equao (8.7)):
rt =

2
t

t "t ;

= (1

) rt2

2
t 1

onde f"t g um rudo branco de mdia nula e varincia 1. O modelo assenta na hiptese
IGARCH(1,1) com termo constante nulo, ! = 0; e mdia condicional nula,

= 0. Para

obter V aRn;n+h; aplica-se uma vez mais a frmula (13.3). Para o efeito estude-se a distribuio condicional de rn+h (h) : Comece-se por verificar que
E (rn+i j Fn ) = 0;

2
n+i

2
n

Fn =

(Ver previso IGARCH, ponto 8.11.1).

Logo, tendo em conta que E (rt rt+i ) = 0; vem


E (rn+h (h)j Fn ) = 0
Var ( rn+h (h)j Fn ) = Var (rn+1 + ::: + rn+h j Fn )
= Var ( rn+1 j Fn ) + ::: + Var ( rn+h j Fn )
2
n+1

= E
= h

2
n:

425

Fn + ::: + E

2
n+h

Fn

So conhecidos os dois primeiros momentos. Falta conhecer-se a lei de probabilidade de


rn+h (h) : Assuma-se que rn+h (h)j Fn tem distribuio aproximadamente normal6
rn+h (h)j Fn

N (E (rn+h (h)j Fn ) ; Var (rn+h (h)j Fn )) :

Pela frmula (13.3) vem


p
qZ h

V aRn;n+h; =
onde q Z o quantil de ordem
p

Vn

da distribuio N (0; 1) :

Naturalmente outras distribuies podem ser consideradas. Note-se finalmente V aRn;n+h; =


hV aRn;n+1; :

13.3.3

Modelo ARMA-GARCH

Assuma-se agora

(L) rt =
ut =

(L) ut

t "t ;

ut

GARCH:

A distribuio de rn+h (h)j Fn geralmente desconhecida. Mesmo no caso em que rn+1 j Fn tem
distribuio normal, rn+i j Fn para i = 2; 3; ::: no tem distibuio normal. Relembre-se que, sob certas
condies, a distribuio de rn+i j Fn quando i ! +1 converge para a distribuio marginal que geralmente
diferente da distribuio condicional. Pode-se mostrar que a funo de distribuio de rn+h (h)j Fn
Fn;h (x) =

rn (h) x

f ( rn+h (h)j Fn+h

1)

h
Y1
i=1

f ( rn+i j Fn+i

1 ) drn+1 :::drn+h :

Esta expresso s conhecida no caso h = 1. Para h > 1 a expresso anterior intratvel. Neste caso a
fdp rn+h (h)j Fn pode considerar-se desconhecida (Tsay (2001), cap.7 conclui erradamente que "n Normal
) rn+h (h)j Fn Normal). Apesar destas observaes, podemos assumir
rn+h (h)j Fn

N (E ( rn+h (h)j Fn ) ; Var ( rn+h (h)j Fn ))

por duas razes:


se h = 1 e "
N (0; 1) ; rn+h (h)j Fn ter certamente distribuio normal. A distribuio de
rn+h (h)j Fn no caso h = 2 ou h = 3 no dever, em princpio, afastar-se muito da distribuio
normal;
com h alto e supondo r estacionriope fracamente dependente, pode-se invocar o teorema do limite
central. Com efeito rn+h (h)j Fn = Var ( rn+h (h)j Fn ) uma soma normalizada que, sob certas
condies, converge em distribuio para Z N (0; 1).

426

Tal como no caso anterior, temos de obter a distribuio de rn+h (h)j Fn : Tem-se
E (rn+h (h)j Fn ) =
onde

n+i;n

n+1;n

+ ::: +

n+h;n

= E (rn+i j Fn ) a previso de r para o momento n + i dada a informao

disponvel no momento n: Para obter Var (rn+h (h)j Fn ) comece-se por observar que
Var ( rn+h (h)j Fn ) = E

rn+1 + ::: + rn+h

n+1;n

+ ::: +

2
n+h;n

Fn

= E (en (1) + ::: + en (h))2 Fn

(13.5)

Vimos no ponto 6.6.4 que

en (h) =

0 un+h

1 un+h 1

+ ::: +

h 1 un+1

h 1
X

j un+h j :

j=0

Como
en (1) = un+1 ;
en (2) = un+2 +

1 un+1 ;

:::;
en (h) = un+h +

1 un+h 1

+ ::: +

h 1 un+1

resulta
en (1) + ::: + en (h) = un+1 + (un+2 +

1 un+1 )

+ ::: +

h 1
X

j un+h j

j=0

= un+h + (1 +

1 ) un+h 1

+ ::: +

h 1
X
j=0

un+1 :

Como fut g um RB vem


Var ( rn+h (h)j Fn ) = E (en (1) + ::: + en (h))2 Fn
= Var ( un+h j Fn ) + (1 + 1 )2 Var (un+h 1 j Fn )
!2
h 1
X
+::: +
Var ( un+1 j Fn ) :
j
j=0

427

(13.6)

Falta conhecer-se a lei de probabilidade de rn+h (h) : Sob a hiptese


rn+h (h)j Fn

N (E (rn+h (h)j Fn ) ; Var (rn+h (h)j Fn ))

e atendendo formula (13.3) vem


E (rn+h (h)j Fn ) + q

V aRn;n+h; =

p
Var (rn+h (h)j Fn ) Vn

onde E (rn+h (h)j Fn ) e Var (rn+h (h)j Fn ) so dados pelas expresses (13.5) e (13.6).
Exemplo 13.3.1 Considere-se o modelo
rt =

2
t

=!+

k 1
1)

t "t ;

2
1 rt 1

2
1 t 1:

Tendo em conta que


2
n+k;n

!
1

+(

2
1 rn

2
1 n

(un = rn )

resulta
Var ( rn+h (h)j Fn ) = Var (un+h j Fn ) + Var ( un+h 1 j Fn ) + ::: + Var ( un+1 j Fn )
h
X
2
=
n+k;n
=

k=1
h
X

!
1

k=1

+(

k 1
1)

2
1 rn

2
1 n

h
1)

1
2
1 rn

h!

2
1 n

Tem-se
rn+h (h)j Fn

N (0; Var ( rn+h (h)j Fn ))

V aRn;n+h; =

qZ

1
1

h!

2
1 rn

2
1 n)

1)

Vn :

Exemplo 13.3.2 Na tabela seguinte apresentam-se os resultados da estimao GARCH dos


retornos do Dow Jones (28317 observaes dirias).
428

VaR

0.15

0.10

0.05

0.00
0

10

Figura 13-1: Value at Risk como funo de h. V aRn+h;n;0:01 trao grosso; V aRn+h;n;0:05
trao fino.
Dependent Variable: retornos do Dow JOnes
Method: ML - ARCH
Included observations: 28317 after adjusting endpoints

Coefficient

Std. Error

z-Statistic

Prob.

0.000416

4.54E-05

9.155216

0.0000

22.67097
67.38911
587.6203

0.0000
0.0000
0.0000

Variance Equation
C
ARCH(1)
GARCH(1)

1.17E-06
0.085080
0.905903

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood

-0.000450
-0.000556
0.010756
3.275823
94026.27

5.17E-08
0.001263
0.001542

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Durbin-Watson stat

0.000188
0.010753
-6.640694
-6.639529
1.921149

0:0101, ^ 2n = 0:00014:

Sabe-se que rn =

Dado que o modelo envolve um termo constante c, o V aRn;n+h; estimado; supondo


Vn = 1; corresponde expresso
c^h + q Z

onde u^n = rn
para

c^ =

= 0:01 e para

1
1

^1

0:0101

^ 1 u^2n + ^ 1

h^
!

^1 + ^1

2
n

0:000416 =

:01051: Na figura 13-1 representa-se o V aR

= 0:05 em funo de h.

Exemplo 13.3.3 Considere-se o modelo


rt = c + rt
2
t

+ ut ;

= ! + u2t 1 Ifut
429

ut =
1 <0g

t "t
2
t 1:

(13.8)
(13.9)

Tem-se,
E (rn+h (h)j Fn ) =

n+1;n

+ ::: +

n+h;n :

Tendo em conta a estrutura AR(1), vem pela equao (6.12),

n+h;n

=c

1
1

yn :

Assim,
1
1
c
+
E (rn+h (h)j Fn ) =
1
yn ( 1 + )
=

1
yn + ::: + c
1
h
1+
+ c h (1

h
h

)+

so os coeficientes que resultam da equao

2
n+h;n

(L) =

(confira-se (13.6)).
1
p

(L) (L) (veja-

(L) = 1+ L+:::+

se a equao (6.15)). No caso AR(1) facilmente se conclui que


:::; pelo que

1+

( 1 + )2

Por outro lado, para calcular Var ( rn+h (h)j Fn ) necessrio obter
Como se sabe,

yn

Lk +

: A aplicao da frmula (13.6) envolve tambm Var (un+h j Fn ) :=

que necessrio estabelecer. Para o modelo definido em (13.9) tem-se,


2
n+1;n

= ! + u2n Ifun <0g +

2
n+2;n

= ! + ( =2 + )

2
n

2
n+1;n

:::
2
n+h;n

Resolvendo iterativamente

2
n+h 1;n ;

= !+
2
n+h;n

2
n+h;n

como funo de
!

h 1

= =2 + :
2
n+1;n

2
n+1;n

facilmente se conclui que


!
1

A equao (13.6), para o modelo em anlise, escreve-se agora da seguinte forma

Var (rn+h (h)j Fn ) =

h
X
k=1

0
@

h k
X
j=0

!2

!
1

430

h 1

2
n+1;n

!
1

A:

O valor de Var (rn+h (h)j Fn ), dado pelo programa Mathematica, igual a


1
2
( 1+ ) ( 1+
+

2
n+1;n

B
B
@

+ !+

2
1+

2
n+1;n

1+h

1)
11

1 CC
CC :
AA

1+h

! 1
+
1+
h

2+2h

1+

h! +

Generalizao: Portfolio com m Activos

13.4

Obtenha-se agora o VaR supondo que o portfolio constitudo por m aces. Para simplificar
assuma-se que
rt = (R1t ; :::; Rmt )0 Ft
onde

N(

t ; Ht )

:= E (rt j Ft 1 ) e Var (rt j Ft 1 ) := Ht : No momento n o portfolio vale Vn ; por

exemplo, uma alocao de 1 milho de Euros no ttulo 1 e 2 mihes no ttulo 2, traduz-se por
um investimento no valor de Vn = 3 milhes, sendo ! 1 = 1=3 desse valor investido no ttulo
1 e ! 2 = 2=3 investido no ttulo 2. A obteno do VaR similar ao do caso de um portfolio
com apenas 1 activo:
V aRn;n+1; j Fn ) =

P ( Vn+1 <
Vn+1
Vn <
Vn

P
P

Rp;n+1 <

V aRn;n+1; Fn
V aRn;n+1;
Vn

Fn

=
= :

Estandardizando Rp;n+1 ; isto , considerando


Zn+1 =
vem
P
V aRn;n+1;
Vn

Zn+1 <

E (Rp;n+1 j Fn )

Var (Rp;n+1 j Fn )

Rp;n+1 E (Rp;n+1 j Fn )
p
Var (Rp;n+1 j Fn )

V aRn;n+1;
Vn

E (Rp;n+1 j Fn )

p
Var (Rp;n+1 j Fn )

= q ) V aRn;n+1; =

431

Fn

q
Var (Rp;n+1 j Fn ) Vn
E (Rp;n+1 j Fn ) + q
Z

Tendo em conta que Rp;n+1 =


!0

n+1

Pm

i=1

! i Ri;n+1 = ! 0 rn+1 ; tem-se Rp;n+1 = E (Rp;n+1 j Fn ) =

e Var ( Rp;n+1 j Fn ) = ! 0 Hn+1 ! e, finalmente


V aRn;n+1; =

onde q N o quantil de ordem

!0

n+1

p
+ q N ! 0 Hn+1 ! Vn

da distribuio N (0; 1) :

Exemplo 13.4.1 Considere-se um portfolio, no momento n; constitudo por de 1 milho de


Euros no ttulo 1 e 2 mihes no ttulo 2. Admita-se a seguinte distribuio
0
@

R1;n+1
R2;n+1

Tem-se para

= 0:05

V aRn;n+1;

v
u
u
u
= 1:645t

A Fn

1=3 2=3

00

N @@

0
@

0
0

0:01

1 0
A;@

0:01

0:002

0:002 0:005

0:002

0:002 0:005

10
A@

1=3
2=3

11

AA :

1
A

3 = 0:32 milhes.

O valor em risco com uma probabilidade de 0.05 para um horizonte temporal de h = 1


perodo de cerca de 0.32 milhes de euros.
Se considerassemos os dois activos separadamente teramos:
p
V aR do ttulo 1 = 1:645 0:01 1 = 0:164
p
V aR do ttulo 2 = 1:645 0:005 2 = 0:232:
Observa-se que a soma dos VaR individuais, 0:164 + 0:232 = 0:396; maior do que o VaR
do portfolio.

13.5

Abordagem pela Teoria dos valores Extremos

A teoria dos valores extremos um ramo da estatstica que se preocupa essencialmente com
o comportamento probabilstico dos valores extremos da amostra e, portanto, centra a sua
anlise nas caudas da distribuio. Esta anlise importante em todos os fenmenos em
que a ocorrncia de valores muitos altos e muitos baixos relevante, como por exemplo,
ocorrncia de cheias, furaces, recordes desportivos, etc. A teoria dos valores extremos tem

432

tambm sido aplicada na actividade seguradora e, mais recentemente, nas rea das finanas,
no clculo do VaR.
Recorde-se a abordagem no paramtrica. Vimos que o VaR pode estimado a partir da
expresso
V[
aRn;n+1; =
onde q~r o quantil emprico de ordem

q~r Vn

(13.10)

da srie de retornos fRt g (tambm poderia ser a

partir de frt g). Como referimos no ponto 13.2, a estimativa q~ muito imprecisa quando
muito baixo (ou muito alto). Como iremos ver a teoria dos valores extremos tem uma
resposta para este problema. O objectivo deste ponto obter uma estimativa para qa via
teoria dos valores extremos.

13.5.1

Introduo Teoria e Estimao. VaR Marginal

A teoria dos valores extremos trata habitualmente os eventos extremos que ocorrerm na
aba direita da distribuio. Seguiremos esta lgica na introduo e, depois, por analogia,
focaremos a aba esquerda que a relevante para o clculo do VaR. O leitor poder consultar
o livro de Franke et. al (2008) para mais pormenores sobre a teoria.
Seja fyt ; i = 1; 2; :::; ng uma sucesso de v.a. i.i.d. e Mn = max fy1 ; y2 ; :::; yn g o mximo da amostra. Pode-se provar que se existirem constantes normalizadoras cn > 0; dn 2 R
e uma distribuio no degenerada H (isto , que no atribui toda a massa de probabilidade
d

a um nico ponto) tal que cn 1 (Mn


H (x) = exp

dn ) ! H; ento H da forma
(1 + x)

1=

6= 0:

1 + x > 0;

Nestas circunstncias, para n suficientemente grande, tem-se P (cn 1 (Mn


H (x) (ou, P (Mn

x) ' H

para algum

ser interpretado no seguinte sentido: H0 (x) = lim

2 Re
!0

> 0). O caso

H (x) = e

dn )

x) '

= 0 deve

: H designado na

literatura por Generalised Extreme Value distribution (GEV)


Quando o resultado anterior se verifica para a v.a. y; com funo de distribuio F e
distribuio limite H; diz-se que F pertence ao domnio mximo de atraco da distribuio
H e, neste caso, escreve-se F 2 DM (H).
A metodologia de estimao que iremos apresentar, intitulada POT (peaks-over-threshold),
assenta na seguinte proposio:

433

Proposio 13.5.1 Suponha-se que fyt g uma sucesso de v.a. com funo de distribuio
F . Ento as seguintes proposies so equivalentes: 1) F 2 DM (H); 2) para alguma
funo

: R+ ! R+ ;
lim

sup

u"xF 0<x<xF

Fu (x)

; (u)

(x) = 0

(13.11)

onde
sup fx 2 R : F (x) < 1g

xF

8
< 1
(x) =
: 1

Fu (x) = P (y
1+

xj y > u)

1=

e x;

;
x

1+

> 0; x > 0 se

6= 0

se

= 0:

a funo de distribuio generalizada de Pareto e Fu (x) a designada excess

distribuition function. A equao (13.11) basicamente estabelece que (na classe das funes
F tais que F 2 DM (H)); para valores altos de u; Fu aproximadamente igual a G
portanto, uma estimativa para Fu pode basear-se em G

e,

(sempre que u relativamente

alto). Tendo em conta que, por definio,


1

Fu (x) = P (y

xj y > u) =

F (x + u)
1 F (u)

segue-se (considerando o primeiro e o terceiro termo da expresso anterior)


1

F (x + u) = (1

F (u)) (1

Fu (x))

ou (fazendo a substituio de x + u por x; passando agora x a ser definido por x > u),
1

F (x) = (1

F (u)) (1

Fu (x

u)) ;

u < x < 1:

(13.12)

Esta relao juntamente com (13.11) constitui o essencial do mtodo que se expe para a
estimao do VaR. Como F e consequentemente Fu so funes desconhecidas, a expresso
do lado direito de (13.12) pode ser estimada da seguinte forma
1

F^ (u)

434

F^u (x

u)

onde,

1X
N (u)
F^ (u) =
Ifyj >ug =
;
n j=1
n
n

F^u (x

^ ^ ^ (x
u) = G
;

u) :

A estimativa do lado direito de (13.12)

F^ (u)

F^u (x

N (u)
1
u) =
n

N (u)
u) =
n

^ ^ ^ (x
G
;

x
1+^

u
^

1=^

Substitua-se na expresso (13.12), x por q :

N (u)
F (q ) =
n
N (u)
=
n

1+

^ q^

1=^

q^
1+^

1=^

Resolvendo esta equao para q^ obtm-se


^
q^ = u +

Se

n
(1
N (u)

1 :

(13.14)

no for um valor muito alto (perto de 1) podemos usar para estimativa de q~ a

estatstica de ordem [n ] : Vimos, no entanto, que se

for um valor muito alto a varincia

assimpttica deste quantil empirico aproxima-se de mais infinito. Nestas circunstncias, a


teoria dos valor extremos tem uma soluo que consiste em estimar q pela expresso (13.14).
Existem ainda trs questes por analisar: 1) Como estimar e ?; 2) como escolher u? e
3) como obter o VaR?
Estimao de e
Sejam y (1) ; y (2) ; :::; y (n) as estatsticas de ordem tais que
y (1)
e Yi = y (i)

y (2)

:::

y (N (u))

y (n)

:::

u (nota: y (1) o valor mximo, y (2) o segundo valor mais alto etc.; relembra-

se o leitor que usmos y(1) para o mnimo, y(2) para o segundo mais baixo, etc. Resulta da
notao que y (1) = y(n) ; y (n) = y(1) ; etc.). Para estimar

dado que N (u) = m fixo,

assume-se que Y1 ; Y2 ; :::; Ym uma sucesso de v.a. i.i.d. com distribuio G

435

(y) ( > 0) :

Logo, a funo log-verosimilhana

log Lm ( ; j Y1 ; Y2 ; :::; Ym ; N (u) = m) =

m log

1+

m
X

log 1 +

Yj :

j=1

(13.15)

Os estimadores de mxima verosimilhana ^ e ^ obtm-se a partir da maximizao de


log Lm : Pode-se provar que, para
p

m@

^
^

>

1=2 e m ! 1

00

d
A !
N @@

0
0

1 0
A;@

(1 + )

(1 + )

(1 + ) 2 (1 + )

1 11

A A:

Como escolher u?
Quando u muito alto o valor de N (u) baixo (significa que o nmero de observaes
efectivamente usadas na estimao baixo) e a varincia do estimador tende a ser alta.
Quando u baixo, a aproximao para Fu (x) ; usando a distribuio G

(x) tender a

ser pobre e, como consequncia o estimador q^ pode vir fortemente enviesado.


Para ajudar na escolha de u considera-se o seguinte resultado: se Z

e0

< 1;

ento the average excess function linear:


e (u) = E (Z

uj Z > u) =

1+

1+

u;

0; 0

< 1:

Este resultado sugere seleccionar o limiar u de forma que a funo estimada para e (u) ;
en (v) ; para os valores v

u seja (aproximadamente) linear. Pode-se provar que


1 X
en (u) =
max f(yj
N (u) j=1
n

u) ; 0g :

Para verificar se en (v) (aproximadamente) linear pode-se analisar no plano o grfico dos
pontos y(k) ; en y(k)

onde y(1) ; y(2) ; :::; y(n) so as estatsticas de ordem tais que


y(1)

y(2)

:::

y(n) :

Devido alta variabilidade de en y(k) quando k alto, recomenda-se a eliminao desses


pontos na anlise grfica.
Como obter o VaR?
Como focmos a cauda direita da distribuio (e a que interessa a esquerda) assume-

436

se yt =
com

associada varivel y; ento q^r =

rt : Assim, se q^ o quantil de ordem

=1

, o quantil de ordem

q^

associado varivel r: Pela equao (13.10), uma

estimativa para o VaR


V aR =

q^r Vn = q^ Vn ;

=1

Para obter o VaR a 100% pode-se seguir os seguintes passos:


1. Definir yt =
2. Definir = 1

rt ;
;

3. Seleccionar u;
4. Obter ^; ^ ; maximizando (13.15);
5. Calcular q^ usando a equao (13.14);
6. Obter o V aR = q^ Vn

13.5.2

VaR Condicional

O ponto anterior assentou na hiptese de frt ; i = 1; 2; :::; ng ser uma sucesso de v.a. i.i.d.
Esta hiptese irrealista. O VaR calculado sob esta hiptese no reflecte a volatilidade corrente no momento n (seria de esperar o VaR aumentasse quando no momento n a volatilidade
alta). McNeil e Frey (2000) propem uma abordagem condicional do VaR no mbito da
teoria dos valores extremos. A ideia assenta no modelo ARMA-GARCH rt =

t+

t "t :

Se o

modelo estiver bem especificado ser de esperar que "t se comporte aproximadamente como
uma sucesso de v.a. i.i.d. Como os resultados principais da teoria dos valores extremos
se aplicam a sequncias i.i.d., prefervel aplic-los sucesso f"t g do que directamente
a frt g ; pois esta sucesso no geralmente i.i.d., devido presena de volatilidade no
constante.
Seja q^" o quantil da distribuio de "t obtido seguindo a metodologia do ponto anterior.
Tem-se assim,

rn+1

P ("n+1 < q " j Fn ) =


n+1
n+1

P rn+1 <

n+1

< q " Fn

+ q"
437

n+1

Fn

=
=

Em suma, uma vez apurado q^" ; o quantil da distribuio condicional de rn+1 vem igual a
qr =

n+1

+ q"

n+1 :

Como f"t g no observado, toma-se


^"t =

rt

^t
^t

onde ^ t e ^ t so estimativas da mdia e da varincia condicional baseadas em estimadores


consistentes. Finalmente,
q^r = ^ n+1 + q^^" ^ n+1 :

13.6

Avaliao do VaR (Backtesting)

Neste ponto avalia-se a qualidade da estimativa proposta para o VaR. Esta avaliao importante por vrias razes. As empresas (sobretudo bancos) que usam o VaR so pressionadas
interna e externamente (por directores, auditores, reguladores, investidores) para produzirem
VaR precisos. Um VaR preciso fundamental na gesto e controle do risco e na alocao de
capital. Por essa razo essencial que empresa teste regularmente as suas medidas de risco,
na linha das recomendaes adoptadas em acordo internacionais. Por outro lado, embora a
definio de VaR seja muito precisa e objectiva, existem diferentes mtodos de estimao do
VaR, que produzem diferentes estimativas (algumas bastante dspares); por isso, importante
identificar a melhor abordagem para o problema concreto em anlise.
Christoffersen e Diebold (2000) analisam a qualidade e a preciso dos intervalos de confiana produzidos para uma certa srie. Parte da metodologia pode ser adaptada na anlise
da qualidade do VaR. Seja V[
aRt;t
baseado na informao t

1;

uma estimativa para o VaR a 100% para o perodo t

1. Sendo este VaR construdo no perodo t

tecipadamente, se no perodo t se tem ou no


esperar que a desigualdade

Vt <

V[
aRt;t

Vt <
1;

V[
aRt;t

1;

: Intuitivamente, natural

; com t a variar, ocorra 100% das vezes.

Considere-se o evento aleatrio,


8
< 1 se V < V aR
t
t;t
It =
: 0 no caso contrrio.
438

1 no se sabe, an-

1;

ou rt <

V aRt;t 1;
Vt 1

Diz-se que a previso do VaR produz uma cobertura marginal correcta (correct uncondicional coverage) se
P (It = 1) =

, E (It ) = :

Se esta condio se verifica ento em 100% dos casos dever observar-se

Vt <

V aRt;t

1;

exactamente este raciocnio que se estabelece a priori quando se procura definir o VaR a
100%: Interessa depois saber se, na prtica, essa desigualdade se verifica efectivamente
em 100% das vezes. Esta condio , naturalmente, necessria mas no suficiente para
identificar uma medida VaR como apropriada. Suponha-se, como habitualmente nas sries
financeiras, que se tem o fenmeno de volatility clustering. Momentos de alta (baixa) volatilidade so seguidos por momentos de alta (baixa) volatilidade. Nestas circunstncias, o VaR
deve ser alto nos momentos de alta volatilidade e baixo nos momentos de baixa volatilidade.
Se o V aRt;t

1;

no reflecte o fenmeno de volatility clustering (nem em termos gerais as

propriedades da distribuio condicional) ento o VaR tender a falhar como medida de risco
em perodos consecutivos. Um VaR assim definido traz a seguinte implicao sobre fIt g: em
momentos de alta volatilidade os 10 s tendem a repetir-se (por exemplo, It = 1; It+1 = 1;
It+2 = 1; etc.), pois tender a observar-se em perodos seguidos

Vt <

V aRt;t

1;

e, em

momentos de baixa volatilidade, uma repetio de 00 s: Ou seja a sucesso It tender a apresentar dependncia temporal (ser autocorrelacionada). Mesmo neste caso, de autocorrelao de It ; poder ter-se E (It ) = : Por esta razo a cobertura marginal embora necessria
no suficiente para identificar o VaR como uma medida precisa.
Diz-se que a previso do VaR produz uma cobertura condicional correcta (correct condicional coverage) se
P (It = 1j Ft 1 ) =

, E (It j Ft 1 ) = :

Esta condio implica ausncia de autocorrelao, pois, tendo em conta a lei do valor esperado iterado,
Cov (It ; It k ) = E (It It k )

E (It ) E (It k )

= E (It

E (It j Ft k ))

E (E (Ij Ft 1 )) E (E (It k j Ft

= E (It

E ( E (It j Ft 1 )j Ft k ))

= E (It

E ( j Ft k ))

E (E (Ij Ft 1 )) E (E (It k j Ft

E( )E( ) =

439

k 1 ))

E (It k )

= 0:

k 1 ))

Existem vrias formas de testar a cobertura marginal e condicional. Por exemplo, se fIt g
uma sucesso de v.a. i.i.d. e E (It ) =

; ento ambas as coberturas so vlidas. Outra

possibilidade consiste em analisar somente a cobertura condicional pois, pela lei do valor
esperado iterado, tem-se, com vimos atrs,
E (It j Ft 1 ) =

) E (It ) = E (E (It j Ft 1 )) = E ( ) = :

Analise-se o teste de independncia de It : Uma possibilidade neste sentido baseia-se no


runs test. Procede-se da seguinte forma. Seja X o nmero sequncias seguidas de 10 s ou
00 s (X o nmero de runs)7 . Por exemplo, na sucesso f0; 0; 1; 1; 1; 0; 0; 0; 0; 1; 0g temos
X = 5: Sejam n0 e n1 o nmero de zeros e uns, respectivamente, e n = n0 + n1 a dimenso
da amostra. O nmero X fornece informao sobre se a amostra aleatria ou no. Se
ocorrem poucas sequncias de 10 s ou 00 s; como no exemplo,
f0; 0; 0; 0; 0; 0; 0; 0; 0; 1; 1; 1; 1; 1; 1g ;

(X = 2)

h indicao de dependncia temporal na sucesso. Se ocorrem demasiadas sequncias,


como no exemplo,
f1; 0; 1; 0; 1; 0; 1; 0; 1; 0; 1; 0; 1g

(X = 13)

tambm podemos suspeitar algum tipo de dependncia temporal (flutuaes cclicas de perodo
curto). Sob a hiptese, H0 : fIt g uma sucesso de v.a. independentes, a distribuio de X
dado n0 e n1 conhecida. Quando n0 > 20 ou n1 > 20 mais conveniente usar-se o
resultado assimpttico. Sob H0 tem-se

X E (X) d
Z= p
! N (0; 1)
Var (X)

O nmero mximo que X pode assumir


max X =

2 min fn0 ; n1 g
2 min fn0 ; n1 g + 1

440

se n0 = n1
se n0 6= n1 :

onde
2n0 n1
+1
n
2n0 n1 (2n0 n1 n)
:
Var (X) =
n2 (n 1)
E (X) =

O teste bilateral (afastamento hiptese nula pode dever-se quando X alto ou baixo).
Rejeita-se H0 se a probabilidade P (jZj > jzobs j) estiver abaixo do nvel de significncia
fixado.
Se a hiptese H0 no pode ser rejeitada pelos dados, pode-se assumir que fIt g uma
sucesso de v.a. i.i.d. com distribuio de Bernoulli de parmetro E (It ) : Interessa agora
P
investigar a cobertura marginal, i.e. se E (It ) coincide com : Seja Sn = ni=1 Ii = n1 a
soma dos 10 s que, como se sabe, tem distribuio Binomial de parmetros (n; E (It )) : Sob a
hiptese
H0 : E (It ) =
a estatstica de teste (rcio de verosimilhanas)
RV =

L ( j H0 )
2 log
=
L (^ )
2
(1) :

tem distribuio assimpttica

n1

(1
2 log n1
^ (1

)n0
^ )n0

^ o estimador de mxima verosimilhana, ^ = n1 =n e

a probabilidade previamente fixada para o VaR (por exemplo,

= 0:01 ou

= 0:05).

Exemplo 13.6.1 Suponha-se que numa amostra de 800 observaes foi calculado o VaR a
5% (
Vt <

= 0:05). Observou-se n0 = 750; n1 = 50; X = 90 (na amostra a desigualdade


V aRt;t

1;

verificou-se 50 vezes). Haver razes para pensar que o VaR a 5

% inapropriado? Considere-se primeiro a hiptese, H0 : fIt g uma sucesso de v.a.


independentes. Tem-se:
90
zobs = q

2n0 n1
n

+1

2n0 n1 (2n0 n1 n)
n2 (n 1)

90

94:75
=
3:298

1:43:

Como o valor-p P (jZj > 1:43) ' 0:15 relativamente alto no se rejeita H0 : Considere-se
agora H0 : E (It ) = 0:05: Tem-se ^ = n1 =n = 0:0625 e
RVobs =

0:05n1 (1
2 log
^ n1 (1
441

0:05)n0
= 2:447:
^ )n0

Como o valor-p P

2
(1)

> 2:477 ' 0:118 relativamente alto no se rejeita H0 .

Assim, existe evidncia de que o VaR estimado uma medida adequada.


Se It segue uma cadeia de Markov (em tempo discreto, com espao de estado f0; 1g), o
teste run pode apresentar baixa potncia8 , isto , se o usamos o teste run quando It segue
uma cadeia de Markov, a probabilidade de rejeitar independncia pode ser baixa.
Suponha-se que It segue uma cadeia de Markov com a seguinte matriz de probabilidades
de transio

onde pij = P (It = jj It

P=@

p01 p01

p11 p11

1
A

= i) : S no caso muito particular p01 = p11 ; fIt g uma sucesso

de v.a. i.i.d. (com distribuio de Bernoulli). Com efeito, sob a hiptese de independncia,
p01 = P (It = 1j It

= 0) = P (It = 1j It

= 1) = p11

ou seja, a probabilidade de It = 1 no depende do valor assumido por I no perodo anterior


(e, pode provar, tambm no depende da histria passada de I). Nesta condies It no
autocorrelacionado9 . Imagine-se, pelo contrrio, a seguinte matriz de probabilidades,
0
@

0:8 0:2
0:1 0:9

Calcule-se a probabilidade de It = 1: Se It
It

A:

= 1 a probabilidade de It = 1 0.9, mas se

= 0 a probabilidade de I passar para o estado 1 de apenas 0.2. Observa-se, portanto,

forte dependncia temporal na sucesso It :


Para ensaiar independncia, a hiptese nula mantm-se no essencial como no teste runs
test, H0 : fIt g uma sucesso de v.a. independentes ou seja H0 : p01 = p11 : Para a avaliarmos
o rcio de verosimilhanas necessrio obter-se, em primeiro lugar, a funo de verosimilhana associada a sucesso fI1 ; :::; In g; facilmente se conclui que
L (pij ) = (1

p01 )n00 pn0101 (1

p11 )n10 pn1111 ;

onde nij o nmero de vezes em que I passou de i para j: As estimativas de mxima


8

A potncia de um teste a probabilidade de rejeitar H0 dado que H1 verdadeira.


Pode-se provar que Corr (It ; It 1 ) = p11 p01 : Logo se p11 = p01 a correlao entre It e It
Nestas condies pode-se tambm provar que Corr (It ; It k ) = 0; para k 2 N:
9

442

nula.

verosimilhana de pij obtm-se facilmente a partir de L (pij ) ;


p^01 = n01 =n;

p^11 = n11 =n:

Por outro lado, sob H0 : p01 = p11 (substitua-se p01 e p11 por p1 )
RV =

2 log

L (pij j H0 )
=
L (^
pij )

2 log

(1

(1 p^1 )n00 +n10 p^n1 01 +n11


p^01 )n00 p^n0101 (1 p^11 )n10 p^n1111

2
(1)

onde p^1 = (n01 + n11 ) =n. Uma variante interessante deste teste consiste em tomar como
hiptese nula H0 : p01 = p11 =
marginal, E (It ) =

(no s se testa a independncia como tambm a cobertura

). Com se tm agora duas restries impostas em H0 (p01 = p11 ;

p01 = ), a estatstica de teste


RV =

2 log

(1
)n00 +n10
p^01 )n00 p^n0101 (1

(1

n01 +n11

p^11 )n10 p^n1111

2
(2) :

A vantagem deste teste do ponto de vista prtico clara: de uma vez s, ensaia-se a cobertura
marginal e condicional.
Estes testes, baseados no modelo da cadeia de Markov sofrem no entanto de uma limitao: baseiam-se em dependncias de primeira ordem. Ora, pode suceder que It dado
It

dependa ainda de It 2 : Neste caso, os testes baseados no modelo da cadeia de Markov,

podem perder bastante potncia.


Clements e Taylor (2003) generalizam a abordagem anterior. A hiptese E (It j Ft 1 ) =
sugere que It dado Ft
alguma varivel Ft

apenas depende de uma constante, : Assim, se It depende de

mensurvel, a hiptese E (It j Ft 1 ) =

a possibilidade de It depender de alguma varivel Ft

deve ser rejeitada. Para testar

mensurvel, uma possibilidade con-

siste em fazer uma regresso de It sobre as variveis definidas em Ft


It 1 ; It 2 ; :::; variveis dummy reportadas a t

It =

k
X

1, t

i It i

+ x0t

(como por exemplo,

2; etc., retornos, etc.),

+ ut

i=1

onde x0t

um vector 1

m de variveis Ft

estar parcialmente correlacionadas com It ) e

mensurveis (que de alguma forma podem

um vector de parmetros m

de correcta cobertura marginal e condicional envolve o ensaio H0 :


0;

1: A hiptese

= 0; :::;

= 0;

: Naturalmente a estatstica F pode ser usada. Tendo em conta a natureza da


443

varivel I; em princpio seria mais apropriado uma regresso binria. No entanto, Sarma et
al. (2003) refere que na presena de forte assimetria dos dados (mais de 95% ou 99% dos
dados so 0s ou 1s) a regresso binria envolve problemas tcnicos. Para grande amostras
o estimador OLS apropriado.

444

Pgina em branco

445

Referncias
(referncias incompletas!)

Basrak, B., R. Davis e T. Mikosch (2002). Regular variation of GARCH processes. Stochastic Processes and their Applications 99(1), pp. 95-115.
Christiansen, C. (2007). Volatility-Spillover Effects in European Bond Markets. European
Financial Management, 13 (5), pp. 923-948.
Bauwens, L., A. Preminger e J. Rombouts (2006). Regime switching GARCH models.
Dpartement des Sciences Economiques Working Paper 2006-6.
Christoffersen, P. e F, Diebold (2000). How Relevant is Volatility Forecasting for Financial
Risk Management? Review of Economics and Statistics 82(1), pp. 12-22
Davies, (1987). Hypothesis testing when a nuisance parameter is present only under the
alternative. Biometrika 74, pp. 33-43.
Dimson E., P. Marsh e M. Staunton (2002). Triumph of the Optimists:101 Years of Global
Investment Returns, Princeton University Press.
Engle R. (1982). Autoregressive Conditional Heteroscedasticity with Estimates of the Variance of United Kingdom Inflation. Econometrica 50 pp. 987-1007.
Engle R. (2001). Financial Econometrics - a New Discipline with new Methods. Journal
of Econometrics 100, pp. 53-56.
Engle, R. (2002). Dynamic Conditional Correlation: A Simple Class of Multivariate Generalized Autoregressive Conditional Heteroskedasticity Models. Journal of Business
& Economic Statistics, 20(3), pp. 339-50.
Fama, E. (1970). Efficient Capital Markets: A Review of Theory and Empirical Work.
Journal of Finance 25 (2), pp. 383-417.
Engle R. e K. Kroner (1995). Multivariate Simultaneous Generalized ARCH. Econometric
Theory 11, pp. 122-150.
Fan, J. e Q. Yao (2005), Nonlinear Time Series, Springer Series in Statistics, New York.
446

Franke, J., W. Hardle e C. Hafner (2008). Statistics of Financial Markets: An Introduction,


2a ed., Springer, Berlin Heidelberg New-York.
Franses, P. e van Dijk, D. (2000). Nonlinear Time Series Models in Empirical Finance,
Cambridge University Press, Cambridge.
Gospodinov, N. (2005). Testing For Threshold Nonlinearity in Short-Term Interest Rates.
Journal of Financial Econometrics, 3(3), pp. 344-371.
Gray, S., (1996). Modeling the Conditional Distribution of Interest Rates as a RegimeSwitching Process. Journal of Financial Economics, 42(1), pp. 27-62.
Groeneveld, R.A. e G. Meeden (1984). Measuring skewness and kurtosis. The Statistician,
33, pp. 391-399.
Lundbergh, S. e T. Tersvirta (2002). Evaluating GARCH models. Journal of Econometrics
110(2), pp. 417-435 .
McNeil, A. e R. Frey (2000). Estimation of Tail-Related Risk Measures for Heteroscedastic
Financial Time Series: an Extreme Value Approach. Journal of Empirical Finance 7,
pp. 271-300.
Mokkadem, A. (1985). Le Modle Non Linaire AR(1) Gnral. Ergodicit et Ergodicit
Gometrique. Comptes Rendues Academie Scientifique Paris 301(I), pp. 889-892.
Morgan J., (1996). RiskMetrics Technical Document, Part II: Statistics of Financial MarketReturns, 4th edition, New York.
Murteira, B. (1990). Probabilidades e Estatstica, Vol. I e II. Mc Graw-Hill.
Nelson, D. (1990). Stationarity and persistence in the GARCH(1,1) model. Econometric
Theory 6, pp. 318-334.
Nicolau, J. (2004). Equaes Diferenciais & Equaes s Diferenas, Texto de Apoio no
28, CEMAPRE-ISEG/UTL.
Pascuala L. , J. Romob e E. Ruiz (2006). Bootstrap Prediction for Returns and Volatilities
in GARCH models. Computational Statistics & Data Analysis, 50(9), pp. 2293-2312.
Pinto, S. (2010), Transmisso de Volatilidade nos Mercados Financeiros durante Perodos
de Crises, Tese de Mestrado em Matemtica Financeira, ISEG/UTL.
447

Stelzer, R. (2009). On Markov-Switching Arma Processes? Stationarity, Existence of Moments, and Geometric Ergodicity. Econometric Theory, 25(1), pp. 43-62.
Taylor, H. e S. Karlin (1984). An Introduction to Stochastic Modeling. Academic Press,
New York.
Taylor S. (2005). Asset Price Dynamics, Volatility, and Prediction, Princeton University
Press.
Wooldridge, J. (1994). Estimation and Inference for Dependent Processes, in Handbook
of Econometrics, Vol. 4 , pp. 2641-2700., edited by Engle R.F. and McFadden D.L.
Elsevier Science B.V. , Amsterdam.

448