Você está na página 1de 86

AN

ALISE DE S

ERIES TEMPORAIS
RICARDO S. EHLERS
Departamento de Estatstica
Universidade Federal do Paran a
Primeira publica c ao 2003
Segunda edi c ao publicada em 2004
Terceira edi c ao publicada em 2005
c RICARDO SANDES EHLERS 2003
Prefacio
O objetivo principal deste texto e oferecer um material did atico b asico em
portugues para um curso de An alise de Series Temporais a nvel de gradua c ao
para alunos de cursos de Bacharelado em Estatstica. Alternativamente ele
tambem pode ser adotado em outros cursos de gradua c ao e de p os-gradua c ao
aonde os alunos tenham conhecimentos b asicos de Probabilidade e Estatstica.
O texto se originou de notas de aulas da disciplina de An alise de Series Tem-
porais ministrada em programas de gradua c ao e p os-gradua c ao na Universidade
Federal do Paran a.
Existem atualmente excelentes livros sobre o assunto e este texto n ao tem a
pretens ao de substitui-los. A maioria deles e motivado por aplica c oes em Eco-
nomia, outros em Fsica e Engenharia (principalmente processamento de sinais)
sendo Diggle (1990) uma excess ao cuja motiva c ao principal vem de aplica c oes
em Biologia. Atualmente uma otima referencia em portugues e Morettin e Toloi
(2004) . Procurei citar a maior parte destas excelentes referencias e o leitor e
fortemente encorajado a consult a-las conforme sua area de interesse.
O manuscrito foi preparado usando o L
A
T
E
X e todos os exemplos, tabelas
e ilustra c oes foram produzidas no pacote estatstico R (gratuito e de c odigo
aberto) que pode ser obtido em
http://www.r-project.org/
Em v arios exemplos s ao fornecidos tambem os comandos do R que foram uti-
lizados e mostradas as sadas resultantes de modo que o leitor e encorajado a
reproduzi-los. Talvez este seja o maior diferencial em rela c ao a outros textos
de series temporais de meu conhecimento.
Este texto certamente n ao est a livre de erros, e coment arios e sugest oes dos
leitores s ao sempre bem vindos. Citar este texto como:
Ehlers, R.S. (2005) An alise de Series Temporais. Departamento de Estatstica,
UFPR. Disponvel em http://www.est.ufpr.br/ ehlers/notas. Acesso em: 21
nov. 2005.
Ricardo S. Ehlers
Curitiba, novembro de 2005.
i
Sumario
1 Introdu c ao 1
2 Tecnicas Descritivas 3
2.1 Decomposi c ao Cl assica . . . . . . . . . . . . . . . . . . . . . . . . 3
2.1.1 Series com Tendencia . . . . . . . . . . . . . . . . . . . . 3
2.1.2 Series Sazonais . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2 Autocorrela c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2.1 O Correlograma . . . . . . . . . . . . . . . . . . . . . . . 8
3 Modelos Probabilsticos 14
3.1 Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.2 Processos Estacion arios . . . . . . . . . . . . . . . . . . . . . . . 15
3.3 A Fun c ao de Autocorrela c ao . . . . . . . . . . . . . . . . . . . . . 16
3.4 Alguns Processos Estoc asticos . . . . . . . . . . . . . . . . . . . . 16
3.4.1 Sequencia Aleat oria . . . . . . . . . . . . . . . . . . . . . 16
3.4.2 Passeio Aleat orio . . . . . . . . . . . . . . . . . . . . . . . 17
3.4.3 Processos de Media M oveis . . . . . . . . . . . . . . . . . 17
3.4.4 Processos Autoregressivos . . . . . . . . . . . . . . . . . . 19
3.4.5 Modelos Mistos ARMA . . . . . . . . . . . . . . . . . . . 23
3.4.6 Modelos ARMA Integrados . . . . . . . . . . . . . . . . . 23
4 Estima c ao 26
4.1 Autocovari ancia e autocorrela c ao . . . . . . . . . . . . . . . . . . 26
4.2 Ajustando Processos Autoregressivos . . . . . . . . . . . . . . . . 27
4.3 Ajustando Processos Medias M oveis . . . . . . . . . . . . . . . . 28
4.4 Ajustando Processos ARMA . . . . . . . . . . . . . . . . . . . . . 29
4.5 Modelos Sazonais . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.6 Adequa c ao do Modelo . . . . . . . . . . . . . . . . . . . . . . . . 31
4.6.1 An alise dos Resduos . . . . . . . . . . . . . . . . . . . . . 31
4.6.2 Testes sobre os resduos . . . . . . . . . . . . . . . . . . . 32
5 Previs ao 37
5.1 Metodos Univariados de Previs ao . . . . . . . . . . . . . . . . . . 37
5.1.1 Alisamento Exponencial Simples . . . . . . . . . . . . . . 37
5.1.2 Metodo de Holt-Winters . . . . . . . . . . . . . . . . . . . 40
5.2 Previs ao em Modelos ARMA . . . . . . . . . . . . . . . . . . . . 42
5.3 Performance Preditiva . . . . . . . . . . . . . . . . . . . . . . . . 46
ii
SUM

ARIO iii
5.4 Criterios de Informa c ao . . . . . . . . . . . . . . . . . . . . . . . 47
5.5 Previs oes Usando Todos os Modelos . . . . . . . . . . . . . . . . 52
5.6 Modelando a Vari ancia . . . . . . . . . . . . . . . . . . . . . . . . 54
5.6.1 Modelos GARCH . . . . . . . . . . . . . . . . . . . . . . . 59
5.6.2 Adequa c ao . . . . . . . . . . . . . . . . . . . . . . . . . . 60
6 Modelos Lineares Din amicos 63
6.1 Introdu c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
6.2 Modelos Polinomiais . . . . . . . . . . . . . . . . . . . . . . . . . 64
6.2.1 An alise Sequencial e Previs oes . . . . . . . . . . . . . . . 65
6.2.2 Vari ancias de Evolu c ao e das Observa c oes . . . . . . . . . 68
6.3 Modelo de Crescimento Linear . . . . . . . . . . . . . . . . . . . 70
6.4 Modelos Sazonais . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
6.4.1 Modelos sem Crescimento . . . . . . . . . . . . . . . . . . 71
6.4.2 Modelos com Crescimento . . . . . . . . . . . . . . . . . . 72
6.5 Representa c ao de Fourier . . . . . . . . . . . . . . . . . . . . . . 72
6.6 Ilustra c ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
6.7 Modelos de Regress ao . . . . . . . . . . . . . . . . . . . . . . . . 74
6.8 Monitoramento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
A Lista de Distribui c oes 78
A.1 Distribui c ao Normal . . . . . . . . . . . . . . . . . . . . . . . . . 78
A.2 Distribui c ao Gama . . . . . . . . . . . . . . . . . . . . . . . . . . 78
A.3 Distribui c ao Gama Inversa . . . . . . . . . . . . . . . . . . . . . . 79
A.4 Distribui c ao Beta . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
A.5 Distribui c ao de Dirichlet . . . . . . . . . . . . . . . . . . . . . . . 79
A.6 Distribui c ao t de Student . . . . . . . . . . . . . . . . . . . . . . 79
A.7 Distribui c ao F de Fisher . . . . . . . . . . . . . . . . . . . . . . . 80
A.8 Distribui c ao Binomial . . . . . . . . . . . . . . . . . . . . . . . . 80
A.9 Distribui c ao Multinomial . . . . . . . . . . . . . . . . . . . . . . 80
A.10 Distribui c ao de Poisson . . . . . . . . . . . . . . . . . . . . . . . 81
A.11 Distribui c ao Binomial Negativa . . . . . . . . . . . . . . . . . . . 81
References 82
Captulo 1
Introdu cao
Uma serie temporal e uma cole c ao de observa c oes feitas sequencialmente ao
longo do tempo. A caracterstica mais importante deste tipo de dados e que
as observa c oes vizinhas s ao dependentes e estamos interessados em analisar e
modelar esta dependencia. Enquanto em modelos de regress ao por exemplo a
ordem das observa c oes e irrelevante para a an alise, em series temporais a ordem
dos dados e crucial. Vale notar tambem que o tempo pode ser substituido por
outra vari avel como espa co, profundidade, etc.
Como a maior parte dos procedimentos estatsticos foi desenvolvida para
analisar observa c oes independentes o estudo de series temporais requer o uso
de tecnicas especcas. Dados de series temporais surgem em v arios campos
do conhecimento como Economia (pre cos di arios de a c oes, taxa mensal de de-
semprego, produ c ao industrial), Medicina (eletrocardiograma, eletroencefalo-
grama), Epidemiologia (n umero mensal de novos casos de meningite), Meteo-
rologia (precipita c ao pluviometrica, temperatura di aria, velocidade do vento),
etc.
Algumas caractersticas s ao particulares a este tipo de dados, por exemplo,
Observa c oes correlacionadas s ao mais difceis de analisar e requerem
tecnicas especcas.
Precisamos levar em conta a ordem temporal das observa c oes.
Fatores complicadores como presen ca de tendencias e varia c ao sazonal ou
cclica podem ser difceis de estimar ou remover.
A sele c ao de modelos pode ser bastante complicada, e as ferramentas
podem ser de difcil interpreta c ao.


E mais difcil de lidar com observa c oes perdidas e dados discrepantes
devido ` a natureza sequencial.
Terminologia
Uma serie temporal e dita ser contnua quando as observa c oes s ao feitas con-
tinuamente no tempo ou discreta quando as observa c oes s ao feitas em tempos
1
2 CAP

ITULO 1. INTRODUC

AO
especcos, geralmente equiespa cados. Note que estes termos n ao se referem ` a
vari avel observada, esta pode assumir valores discretos ou contnuos.
Por outro lado, series temporais discretas podem surgir de v arias formas.
Series contnuas podem ser discretizadas, i.e. seus valores s ao registrados a cer-
tos intervalos de tempo. Series de valores agregados ou acumulados em inter-
valos de tempo, por exemplo exporta c oes medidas mensalmente ou quantidade
de chuva medida diariamente. Finalmente, algumas series s ao inerentemente
discretas, por exemplo dividendos pagos por uma empresa aos seus acionistas
em anos sucessivos.
Objetivos
Em algumas situa c oes o objetivo pode ser fazer previs oes de valores futuros
enquanto em outras a estrutura da serie ou sua rela c ao com outras series pode
ser o interesse principal. De um modo geral, os principais objetivos em se
estudar series temporais podem ser os seguintes,
Descri c ao: propriedades da serie, e.g. o padr ao de tendencia, existencia
de varia c ao sazonal, outliers, altera c oes estruturais, etc.
Explica c ao: usar a varia c ao em uma serie para explicar a varia c ao em
outra serie.
Predi c ao: predizer valores futuros com base em valores passados.
Controle de processos: por exemplo controle estatstico de qualidade.
Abordagens
Tecnicas Descritivas: gr acos, identica c ao de padr oes, etc.
Modelos probabilsticos: sele c ao de modelos, estima c ao, predi c ao. Ferra-
menta b asica e a fun c ao de autocorrela c ao.
An alise espectral.
Metodos n ao parametricos (alisamento ou suaviza c ao).
Outras abordagens: modelos de espa co de estados, modelos n ao linea-
res, series multivariadas, estudos longitudinais, processos de longa de-
pendencia, volatilidade estoc astica, etc.
Captulo 2
Tecnicas Descritivas
Ao se analisar uma ou mais series temporais a representa c ao gr aca dos dados
sequencialmente ao longo do tempo e fundamental e pode revelar padr oes de
comportamento importantes. Tendencias de crescimento (ou decrescimento),
padr oes cclicos, altera c oes estruturais, observa c oes aberrantes, etc. s ao muitas
vezes facilmente identicados. Sendo assim, o gr aco temporal deve ser sempre
o primeiro passo e antecede qualquer an alise. Outras ferramentas ser ao descritas
ao longo deste captulo.
2.1 Decomposi cao Classica
Muitas das propriedades observadas em uma serie temporal X
t
podem ser cap-
tadas assumindo-se a seguinte forma de decomposi c ao
X
t
= T
t
+C
t
+R
t
onde T
t
e uma componente de tendencia, C
t
e uma componente cclica ou
sazonal e R
t
e uma componente aleat oria ou rudo (a parte n ao explicada,
que espera-se ser puramente aleat oria). A componente cclica se repete a cada
intervalo xo s, i.e.
= C
t2s
= C
ts
= C
t
= C
t+s
= C
t+2s
= . . . .
Assim, varia c oes peri odicas podem ser captadas por esta componente.
2.1.1 Series com Tendencia
N ao existe uma deni c ao precisa de tendencia e diferentes autores usam este
termo de diferentes formas. Podemos pensar em tendencia como uma mudan ca
de longo prazo no nvel medio da serie. A diculdade aqui e denir longo prazo.
A forma mais simples de tendencia e
X
t
= +t +
t
(2.1)
onde e s ao constantes a serem estimadas e
t
denota um erro aleat orio com
media zero. O nvel medio da serie no tempo t e dado por m
t
= + t que e
3
4 CAP

ITULO 2. T

ECNICAS DESCRITIVAS
algumas vezes chamado de termo de tendencia. Porem alguns autores preferem
chamar a inclina c ao de tendencia, ou seja a mudan ca no nvel da serie por
unidade de tempo j a que = m
t
m
t1
.
Note que a tendencia na equa c ao (2.1) e uma fun c ao determinstica do tempo
e algumas vezes e chamada de tendencia global (i.e. vale para toda a serie), em
oposi c ao a tendencia local.
De um modo geral, uma forma de se lidar com dados n ao sazonais que
contenham uma tendencia consiste em ajustar uma fun c ao polinomial (linear,
quadr atica, etc.), uma curva Gompertz, i.e.
log x
t
= a +br
t
onde a, b e r s ao par ametros com 0 < r < 1, ou uma curva Logstica, i.e.
x
t
= a/(1 +be
ct
)
onde a, b e c s ao par ametros. Estas duas ultimas s ao chamadas curvas S e se
aproximam de uma assntota quando t . Neste caso o ajuste pode levar a
equa c oes n ao lineares.
Seja qual for a curva utilizada, a fun c ao ajustada fornece uma medida da
tendencia da serie, enquanto os resduos (valores observados-valores ajustados)
fornecem uma estimativa de utua c oes locais.
Filtragem
Outro procedimento para analisar series com tendencia e atraves de ltros line-
ares. Um ltro linear converte uma serie {x
t
} em outra {y
t
} atraves da seguinte
opera c ao linear
y
t
=
s

j=q
a
j
x
t+j
onde {a
j
} e um conjunto de pesos. Alem disso, como queremos estimar a
media local os pesos devem ser tais que

s
j=q
a
j
= 1, garantindo assim que
min{x
t
} < y
t
< max{x
t
}. Neste caso a opera c ao e chamada media m ovel.
Medias m oveis s ao em geral simetricas com s = q e a
r
= a
r
. Por exemplo,
se s = q = 2 temos que
y
t
= a
2
x
t2
+a
1
x
t1
+a
0
x
t
+a
1
x
t+1
+a
2
x
t+2
.
O caso mais simples e quando todos os pesos a
j
tem o mesmo valor e devido ` a
restri c ao de soma 1 segue que a
j
= 1/(2q + 1), para j = q, . . . , q. Neste caso,
o valor suavizado de x
t
e dado por
y
t
=
1
2q + 1
q

j=q
x
t+j
Exemplo 2.1 : A Figura 2.1 apresenta a serie com os totais mensais de passa-
geiros de linhas aereas internacionais nos EUA, entre 1949 e 1960 (Box, Jenkins
2.1. DECOMPOSIC

AO CL

ASSICA 5
and Reinsel, 1976) juntamente com a tendencia estimada superimposta. Fo-
ram aplicados ltros lineares com medias m oveis aproximadamente trimestrais
(q = 2) e medias m oveis aproximadamente anuais (q = 5). Os seguintes coman-
dos do R foram usados.
q = 2
coefs = rep(1/(2*q+1),2*q+1) # vetor de coeficientes do filtro
y = filter(x, coefs, sides=2, method="conv")
plot(x,xlab=Anos, ylim=c(0,650), ylab=N umero de passageiros (em milhares))
lines(y,col=red)
q = 5
coefs = rep(1/(2*q+1),2*q+1)
y = filter(x, coefs, sides=2, method="conv")
lines(y,col=blue)
legend(1958,160,legend=c(q=2,q=5), col=c(red,blue), lty=c(1,1))
Anos
N

m
e
r
o

d
e

p
a
s
s
a
g
e
ir
o
s

(
e
m

m
ilh
a
r
e
s
)
1950 1952 1954 1956 1958 1960
0
1
0
0
2
0
0
3
0
0
4
0
0
5
0
0
6
0
0
dados
Media Movel q=2
Media Movel q=5
Figura 2.1: Totais mensais de passageiros de linhas aereas internacionais nos EUA,
com a tendencia superimposta aplicando medias m oveis aproximadamente trimestrais
(q = 2) e medias m oveis aproximadamente anuais (q = 5).
Note que, para a aplica c ao de qualquer ltro simetrico os valores suavizados
s o podem ser calculados para t = q +1, . . . , nq e assim a serie suavizada ter a
n 2q valores. Em algumas situa c oes no entanto e importante obter valores
suavizados ate o perodo t = n e uma alternativa e utilizar um ltro assimetrico
6 CAP

ITULO 2. T

ECNICAS DESCRITIVAS
que usa apenas os valores atual e passados de x
t
. Por exemplo na tecnica
conhecida como alisamento exponencial os valores suavizados s ao dados por
y
t
=

j=0
(1 )
j
x
tj
onde 0 < < 1. Note como, embora todas as observa c oes passadas sejam
usadas no ltro, os pesos (1 )
j
decaem geometricamente com j. Quanto
mais pr oximo de 1 estiver mais peso ser a dado ` as observa c oes mais recentes
e quanto mais pr oximo de zero mais os pesos estar ao distribuidos ao longo da
serie. Por exemplo se = 0, 90 a serie ltrada ca y
t
= 0, 9x
t
+ 0, 09x
t1
+
0, 009x
t2
+. . . enquanto que para = 0, 1 temos que y
t
= 0, 1x
t
+0, 09x
t1
+
0, 081x
t2
+. . . .
Diferencia cao
Um tipo especial de ltro, muito util para remover uma componente de
tendencia, consiste em diferenciar a serie ate que ela se torne estacion aria (este
conceito ser a formalizado no Captulo 3). Para dados n ao sazonais, a primeira
diferen ca e em geral suciente para induzir estacionariedade aproximada. A
nova serie y
2
, . . . , y
n
e formada a partir da serie original x
1
, . . . , x
n
como
y
t
= x
t
x
t1
= x
t
.
Diferencia c ao de primeira ordem e a mais utilizada sendo que ocasional-
mente uma diferencia c ao de segunda ordem pode ser requerida, i.e.
y
t
=
2
x
t
= (x
t
x
t1
) = x
t
2x
t1
+x
t2
.
Alem disso, independente do seu uso para induzir estacionariedade, a di-
ferencia c ao pode ser muito util como ferramenta explorat oria. Observa c oes
discrepantes por exemplo podem ter um efeito dram atico na serie diferenciada
e uma representa c ao gr aca e em geral suciente para identicar tais pontos.
2.1.2 Series Sazonais
Uma forma bastante simples de eliminar o efeito sazonal e simplesmente tomar
medias sazonais. Por exemplo, em dados mensais com sazonalidade anual, as
medias anuais estar ao livres do efeito sazonal. Embora este procedimento esteja
correto muitos dados ser ao perdidos e ao inves disto pode-se recorrer mais uma
vez ` as medias m oveis.
2.2 Autocorrela cao
Uma importante ferramenta para se identicar as propriedades de uma serie
temporal consiste de uma serie de quantidades chamadas coecientes de auto-
correla c ao amostral. A ideia e similar ao coeciente de correla c ao usual, i.e.
2.2. AUTOCORRELAC

AO 7
para n pares de observa c oes das vari aveis x e y o coeciente de correla c ao
amostral e dado por
r =
n

i=1
(x
i
x)(y
i
y)

i=1
(x
i
x)
2
n

i=1
(y
i
y)
2
. (2.2)
Aqui no entanto queremos medir a correla c ao entre as observa c oes de
uma mesma vari avel em diferentes horizontes de tempo, i.e. correla c oes en-
tre observa c oes defasadas 1, 2, . . . perodos de tempo. Assim, dadas n ob-
serva c oes x
1
, . . . , x
n
de uma serie temporal discreta podemos formar os pares
(x
1
, x
2
), . . . , (x
n1
, x
n
). Considerando x
1
, . . . , x
n1
e x
2
, . . . , x
n
como duas va-
ri aveis o coeciente de correla c ao entre x
t
e x
t+1
e dado por
r
1
=
n1

t=1
(x
t
x
1
)(x
t+1
x
2
)

n1

t=1
(x
t
x
1
)
2
n1

t=1
(x
t+1
x
2
)
2
(2.3)
onde as medias amostrais s ao
x
1
=
n1

t=1
x
t
/(n 1) e x
2
=
n

t=2
x
t
/(n 1).
Como o coeciente r
1
mede as correla c oes entre observa c oes sucessivas ele e
chamado de coeciente de autocorrela c ao ou coeciente de correla c ao serial.

E usual simplicar a equa c ao (2.3) utilizando-se a media de todas as ob-


serva c oes, i.e. x =
n

t=1
x
t
/n j a que x
1
x
2
, e assumindo vari ancia constante.
Assim, a vers ao simplicada de (2.3) ca
r
1
=
n1

t=1
(x
t
x)(x
t+1
x)
(n 1)
n

t=1
(x
t
x)
2
/n
(2.4)
sendo que alguns autores ainda retiram o termo n/(n 1) que e pr oximo de
1 para n n ao muito pequeno. Esta ultima forma simplicada, sem o termo
n/(n 1) ser a utilizada neste texto.
A equa c ao (2.4) pode ser generalizada para calcular a correla c ao entre ob-
serva c oes defasadas de k perodos de tempo, i.e.
r
k
=
nk

t=1
(x
t
x)(x
t+k
x)
n

t=1
(x
t
x)
2
(2.5)
8 CAP

ITULO 2. T

ECNICAS DESCRITIVAS
fornece o coeciente de correla c ao de ordem k. Assim como o coeciente de
correla c ao usual, as autocorrela c oes s ao adimensionais e 1 < r
k
< 1.
Na pr atica e mais usual calcular primeiro os coecientes de autocovari ancia
{c
k
}, denidos por analogia com a f ormula usual de covari ancia, i.e.
c
k
=
nk

t=1
(x
t
x)(x
t+k
x)/n.
Os coecientes de autocorrela c ao s ao ent ao obtidos como r
k
= c
k
/c
0
.
2.2.1 O Correlograma
Um gr aco com os k primeiros coecientes de autocorrela c ao como fun c ao de k e
chamado de correlograma e pode ser uma ferramenta poderosa para identicar
caractersticas da serie temporal. Porem isto requer uma interpreta c ao ade-
quada do correlograma, i.e. devemos associar certos padr oes do correlograma
como determinadas caractersticas de uma serie temporal. Esta nem sempre e
uma tarefa simples e a seguir s ao dadas algumas indica c oes.
Series aleat orias
A primeira quest ao que podemos tentar responder atraves do correlograma e se
uma serie temporal e aleat oria ou n ao. Para uma serie completamente aleat oria
os valores defasados s ao n ao correlacionados e espera-se que r
k
= 0.
Suponha que x
1
, . . . , x
n
sejam vari aveis aleat orias independentes e identi-
camente distribuidas com media arbitr arias. Ent ao, pode-se mostrar que o
coeciente de autocorrela c ao amostral r
k
e assintoticamente normalmente dis-
tribuido, com media e vari ancia dados por
E(r
k
) 1/n e V ar(r
k
) 1/n.
(ver Kendall, Stuart, and Ord 1983, Captulo 48). Portanto, limites de conan ca
aproximados de 95% s ao dados por 1/n 1, 96/

n, que s ao frequentemente
ainda mais aproximados para 1, 96/

n.
Isto ilustra uma das diculdades de interpretar o correlograma j a que,
mesmo para uma serie completamente aleat oria, espera-se que 1 em cada 20
coecientes r
k
esteja fora destes limites. Por outro lado, um valor muito grande
de r
k
tem menos chance de ter ocorrido ao acaso do que um valor que est a
apenas ligeiramente fora dos limites.
A Figura 2.2 mostra uma serie temporal com 100 observa c oes independen-
tes e identicamente distribuidas geradas no computador juntamente com o seu
correlograma. Neste caso os limites de conan ca de 95% s ao aproximadamente
2/

100 = 0,2 e podemos notar que 2 dentre as 20 primeiras autocorrela c oes


est ao ligeiramente fora destes limites. No entanto isto ocorre em defasagens apa-
rentemente arbitr arias (12 e 18) e podemos concluir que n ao h a evidencia para
rejeitar a hip otese de que as observa c oes s ao independentes.
2.2. AUTOCORRELAC

AO 9
tempo
o
b
s
e
r
v
a

e
s
0 20 40 60 80 100

1
0
1
2
(a)
0 5 10 15 20

0
.2
0
.0
0
.2
0
.4
0
.6
0
.8
1
.0
defasagem
a
u
t
o
c
o
r
r
e
la

o
e
s
(b)
Figura 2.2: (a) 100 observa c oes simuladas independentes e identicamente distribuidas.
(b) 20 primeiras autocorrela c oes amostrais.
10 CAP

ITULO 2. T

ECNICAS DESCRITIVAS
Correla cao de curto-prazo
Uma serie temporal na qual uma observa c ao acima da media tende a ser
seguida por uma ou mais observa c oes acima da media, similarmente para ob-
serva c oes abaixo da media, e dita ter correla c ao de curto-prazo. Um correlo-
grama desta serie dever a exibir um valor relativamente grande de r
1
seguido
por valores que tendem a car sucessivamente menores. A partir de uma certa
defasagem k os valores de r
k
tendem a ser aproximadamente zero.
Na Figura 2.3 temos 50 observa c oes geradas de acordo com o processo x
t
=
0, 7x
t1
+
t
juntamente com o seu correlograma.
tempo
o
b
s
e
r
v
a

e
s
0 10 20 30 40

1
0
1
2
3
(a)
0 5 10 15

0
.2
0
.0
0
.2
0
.4
0
.6
0
.8
1
.0
defasagem
a
u
t
o
c
o
r
r
e
la

o
e
s
(b)
Figura 2.3: (a) 50 observa c oes simuladas com autocorrela c oes de curto-prazo. (b) 16
primeiras autocorrela c oes amostrais.
2.2. AUTOCORRELAC

AO 11
Correla cao negativa
Se os valores de uma serie temporal tendem a se alternar acima e abaixo de um
valor medio, o correlograma desta serie tambem tende a se alternar. O valor
de r
1
ser a negativo enquanto o valor de r
2
ser a positivo j a que as observa c oes
defasadas de 2 perodos tendem a estar do mesmo lado da media. Esta ca-
racterstica est a ilustrada na Figura 2.4 aonde temos 30 observa c oes simuladas
com autocorrela c oes negativas juntamente com as 14 primeiras autocorrela c oes
amostrais.
tempo
o
b
s
e
r
v
a

e
s
0 5 10 15 20 25 30

2
0
2
(a)
0 2 4 6 8 10 12 14

0
.5
0
.0
0
.5
1
.0
defasagem
a
u
t
o
c
o
r
r
e
la

o
e
s
(b)
Figura 2.4: (a) 30 observa c oes simuladas com autocorrela c oes negativas. (b) 14 pri-
meiras autocorrela c oes amostrais.
12 CAP

ITULO 2. T

ECNICAS DESCRITIVAS
Series nao estacionarias
Para uma serie temporal com tendencia os valores de r
k
n ao decair ao para
zero a n ao em defasagens grandes. Intuitivamente, isto ocorre porque uma
observa c ao de um lado da media tende a ser seguida por um grande n umero
de observa c oes do mesmo lado (devido ` a tendencia). Neste caso, pouca ou
nenhuma informa c ao pode ser extraida do correlograma j a que a tendencia
dominar a outras caractersticas. Na verdade, como veremos em outros captulos
a fun c ao de autocorrela c ao s o tem um signicado para series estacion arias, sendo
assim qualquer tendencia deve ser removida antes do c alculo de {r
k
}.
A Figura 2.5 mostra uma serie temporal com 50 observa c oes geradas se-
gundo o modelo x
t
= x
t1
+
t
, juntamente com o seu correlograma. Note
que a n ao estacionariedade da serie ca evidenciada no correlograma j a que as
autocorrela c oes amostrais decaem muito lentamente.
Varia cao sazonal
Um padr ao sazonal e em geral facilmente identicado no correlograma. De
fato, se uma serie temporal contem utua c oes sazonais o correlograma ir a exibir
oscila c oes na mesma frequencia. Por exemplo, com observa c oes mensais r
6
ser a
grande e negativo enquanto r
12
ser a grande e positivo.
Na verdade, se o padr ao sazonal j a for evidente no gr aco da serie original
o correlograma trar a pouca ou nenhuma informa c ao adicional.
Observa c oes discrepantes
Se uma serie temporal contem uma ou mais observa c oes discrepantes (ou-
tliers) o correlograma pode ser seriamente afetado. No caso de uma unica
observa c ao discrepante o gr aco de x
t
contra x
t+k
ter a pontos extremos o que
pode viesar os coecientes de correla c ao para zero. Com dois valores discre-
pantes o efeito pode ser ainda mais devastador, alem de gerar uma correla c ao
esp uria quando k e igual ` a dist ancia entre os valores.
2.2. AUTOCORRELAC

AO 13
tempo
o
b
s
e
r
v
a

e
s
0 10 20 30 40 50

0
.8

0
.6

0
.4

0
.2
0
.0
(a)
0 5 10 15

0
.2
0
.0
0
.2
0
.4
0
.6
0
.8
1
.0
defasagem
a
u
t
o
c
o
r
r
e
la

o
e
s
(b)
Figura 2.5: (a) 50 observa c oes simuladas segundo um passeio aleat orio. (b) 20 pri-
meiras autocorrela c oes amostrais.
Captulo 3
Modelos Probabilsticos
3.1 Introdu cao
Neste captulo ser ao descritos v arios modelos adequados para dados de series
temporais. Tais modelos s ao chamados de processos estoc asticos.
Matematicamente um processo estoc astico pode ser denido como uma
cole c ao de vari aveis aleat orias ordenadas no tempo e denidas em um conjunto
de pontos T, que pode ser contnuo ou discreto. Iremos denotar a vari avel
aleat oria no tempo t por X(t) no caso contnuo (usualmente < t < ), e
por X
t
no caso discreto (usualmente t = 0, 1, 2, . . . ). O conjunto de possveis
valores do processo e chamado de espa co de estados que pode ser discreto (e.g.
o n umero de chamadas que chegam a uma central telef onica a cada 2 horas) ou
contnuo (e.g. a temperatura do ar em uma localidade observada em intervalos
de 1 hora).
Em an alise de series temporais a situa c ao e bem diferente da maioria dos
problemas estatsticos. Embora seja possvel variar o tamanho da serie obser-
vada, usualmente ser a impossvel fazer mais do que uma observa c ao em cada
tempo. Assim, tem-se apenas uma realiza c ao do processo estoc astico e uma
unica observa c ao da vari avel aleat oria no tempo t denotada por x(t) no caso
contnuo e x
t
, para t = 1, . . . , N no caso discreto.
Uma maneira de descrever um processo estoc astico e atraves da distribui c ao
de probabilidade conjunta de X(t
1
), . . . , X(t
k
) para qualquer conjunto de tem-
pos t
1
, . . . , t
k
e qualquer valor de k. Esta e uma tarefa extremamente complicada
e na pr atica costuma-se descrever um processo estoc astico atraves das fun c oes
media, vari ancia e autocovari ancia. Estas fun c oes s ao denidas a seguir para o
caso contnuo sendo que deni c oes similares se aplicam ao caso discreto.
media (t) = E[X(t)]
vari ancia
2
(t) = V ar[X(t)]
autocovari ancia (t
1
, t
2
) = E[X(t
1
) (t
1
)][X(t
2
) (t
2
)]
Note que a fun c ao de vari ancia e um caso especial da fun c ao de autocovari ancia
quando t
1
= t
2
. Momentos de ordem mais alta do processo tambem ser denidos
mas s ao raramente utilizados na pr atica e as fun c oes (t) e (t
1
, t
2
) s ao em geral
sucientes.
14
3.2. PROCESSOS ESTACION

ARIOS 15
3.2 Processos Estacionarios
Uma importante classe de processos estoc asticos s ao os chamados processos
estacion arios. A ideia intuitiva de estacionariedade foi introduzida no captulo
anterior e aqui ser a apresentada a deni c ao formal.
Uma serie temporal e dita estritamente estacion aria se a distribui c ao de
probabilidade conjunta de X(t
1
), . . . , X(t
k
) e a mesma de X(t
1
+), . . . , X(t
k
+
). Ou seja, o deslocamento da origem dos tempos por uma quantidade n ao
tem efeito na distribui c ao conjunta que portanto depende apenas dos intervalos
entre t
1
, . . . , t
k
.
Em particular, para k = 1 a estacionariedade estrita implica que a dis-
tribui c ao de X(t) e a mesma para todo t de modo que, se os dois primeiros
momentos forem nitos, temos que
(t) = e
2
(t) =
2
s ao constantes que n ao dependem de t.
Para k = 2 a distribui c ao conjunta de X(t
1
) e X(t
2
) depende apenas da
dist ancia t
2
t
1
, chamada defasagem. A fun c ao de autocovari ancia (t
1
, t
2
)
tambem depende apenas de t
2
t
1
e pode ser escrita como () onde
() = E[X(t) ][X(t +) ] = Cov[X(t), X(t +)]
e chamado de coeciente de autocovari ancia na defasagem .
Note que o tamanho de () depende da escala em que X(t) e medida.
Portanto, para efeito de interpreta c ao, e mais util padronizar a fun c ao de au-
tocovari ancia dando origem a uma fun c ao de autocorrela c ao
() = ()/(0)
que mede a correla c ao entre X(t) e X(t +). No captulo anterior foi apresen-
tado o seu equivalente emprico para series discretas r
k
. Note tambem que o
argumento ser a discreto se a serie temporal for discreta e contnuo se a serie
temporal for contnua.
Na pr atica e muito difcil usar a deni c ao de estacionariedade estrita e
costuma-se denir estacionariedade de uma forma menos restrita.
Deni c ao 3.1 Um processo estoc astico {X(t), t T} e dito ser estacion ario
de segunda ordem ou fracamente estacion ario se a sua fun c ao media e constante
e sua fun c ao de autocovari ancia depende apenas da defasagem, i.e.
E[X(t)] = e Cov[X(t), X(t +)] = ().
Nenhuma outra suposi c ao e feita a respeito dos momentos de ordem mais alta.
Alem disso, fazendo = 0 segue que V ar[X(t)] = (0), ou seja a vari ancia do
processo assim como a media tambem e constante. Note tambem que tanto a
media quanto a vari ancia precisam ser nitos.
Esta deni c ao mais fraca de estacionariedade ser a utilizada daqui em di-
ante j a que muitas propriedades dos processos estacion arios dependem apenas
16 CAP

ITULO 3. MODELOS PROBABIL

ISTICOS
da estrutura especicada pelo primeiro e segundo momentos. Uma classe im-
portante de processos aonde isto se verica e a classe de processos normais ou
Gaussianos aonde a distribui c ao conjunta de X(t
1
), . . . , X(t
k
) e normal multi-
variada para todo conjunto t
1
, . . . , t
k
. A distribui c ao normal multivariada ca
completamente caracterizada pelo primeiro e segundo momentos, i.e. por (t) e
(t
1
, t
2
), assim estacionariedade fraca implica em estacionariedade estrita para
processos normais. Por outro lado, e () podem n ao descrever adequada-
mente processos que sejam muito n ao-normais.
3.3 A Fun cao de Autocorrela cao
Foi visto na Se c ao 2.2 que os coecientes de autocorrela c ao amostral de uma
serie temporal observada s ao uma ferramenta importante para descrever a serie.
Analogamente, a fun c ao de autocorrela c ao te orica (fac) de um processo es-
toc astico estacion ario e uma ferramenta importante para assessar suas propri-
edades. A seguir ser ao apresentadas propriedades gerais da fun c ao de autocor-
rela c ao.
Se um processo estoc astico estacion ario X(t) tem media e vari ancia
2
ent ao
() = ()/(0) = ()/
2
e portanto (0) = 1. As seguintes propriedades s ao facilmente veric aveis.
1. A correla c ao entre X(t) e X(t +) e a mesma que entre X(t) e X(t ),
ou seja () = ().
2. 1 < () < 1.
3. Embora um processo estoc astico tenha uma estrutura de autocovari ancia
unica o contr ario n ao e verdadeiro em geral.

E possvel encontrar v arios
processos com a mesma fun c ao de autocorrela c ao, o que diculta ainda
mais a interpreta c ao do correlograma.
3.4 Alguns Processos Estocasticos
Nesta se c ao ser ao apresentados alguns processos estoc asticos que s ao utilizados
com frequencia na especica c ao de modelos para series temporais.
3.4.1 Sequencia Aleat oria
Um processo em tempo discreto e chamado puramente aleat orio se consiste
de uma sequencia de vari aveis aleat orias {X
t
} independentes e identicamente
distribuidas. Ou seja a media e a vari ancia s ao constantes e
(k) = Cov(X
t
, X
t+k
) = 0, k = 1, 2, . . . .
Como a media e a fun c ao de autocovari ancia n ao dependem do tempo o processo
e estacion ario em segunda ordem. A fun c ao de autocorrela c ao e simplesmente
(k) =

1, k = 0
0, k = 1, 2, . . . .
3.4. ALGUNS PROCESSOS ESTOC

ASTICOS 17
Um processo puramente aleat orio e as vezes chamado de rudo branco e pode
ser util por exemplo na constru c ao de processos mais complicados.
3.4.2 Passeio Aleat orio
Seja {
t
} um processo discreto puramente aleat orio com media e vari ancia

. Um processo {X
t
} e chamada de passeio aleat orio se
X
t
= X
t1
+
t
.
Fazendo-se substitui c oes sucessivas obtem-se que
X
t
= X
t2
+
t1
+
t
= X
t3
+
t2
+
t1
+
t
.
.
.
= X
0
+
t

j=1

j
e iniciando o processo em X
0
= 0 n ao e difcil vericar que E(X
t
) = t e
V ar(X
t
) = t
2

. Como a media e a vari ancia dependem de t este processo e n ao


estacion ario.
No entanto, e interessante notar que a primeira diferen ca de um passeio
aleat orio e estacion aria j a que
X
t
= X
t
X
t1
=
t
.
Os exemplos mais conhecidos de series temporais que se comportam como
um passeio aleat orio s ao os pre cos de a c oes em dias sucessivos.
3.4.3 Processos de Media M oveis
Seja {
t
} um processo discreto puramente aleat orio com media zero e vari ancia

. Um processo {X
t
} e chamada de processo de medias m oveis de ordem q,
ou MA(q), se
X
t
=
t
+
1

t1
+ +
q

tq
. (3.1)
N ao e difcil vericar que
E(X
t
) = 0 e V ar(X
t
) = (1 +
2
1
+ +
2
q
)
2

.
Alem disso, como Cov(
t
,
s
) =
2

para t = s e Cov(
t
,
s
) = 0 para t = s, a
fun c ao de autocovari ancia e dada por
(k) = Cov(X
t
, X
t+k
)
= Cov(
t
+
1

t1
+ +
q

tq
,
t+k
+
1

t+k1
+ +
q

t+kq
)
=

0 k > q

qk

j=0

j+k
k = 0, . . . , q
(k) k < 0
(3.2)
18 CAP

ITULO 3. MODELOS PROBABIL

ISTICOS
onde
0
= 1. Como a media e a vari ancia s ao constantes e (k) n ao de-
pende de t o processo e (fracamente) estacion ario para todos os possveis valo-
res de
1
, . . . ,
q
. Alem disso, se os
t
s forem normalmente distribuidos os X
t
s
tambem ser ao e portanto o processo ser a estritamente estacion ario.
A fun c ao de autocorrela c ao pode ser facilmente obtida de (3.2) como
(k) =

1 k = 0
qk

j=0

j+k

j=0

2
j
k = 1, . . . , q
0 k > q
(k) k < 0.
Note que a fun c ao tem um ponto de corte na defasagem q, i.e. (k) = 0 para
k > q. Esta e uma caracterstica especca de processos medias m oveis e ser a
util na especica c ao do valor de q na pr atica (Box and Jenkins 1970, p. 170).
Vamos analisar agora com mais detalhes o caso particular do processo
MA(1). A fun c ao de autocorrela c ao ca
(k) =

1 k = 0

1
/(1 +
2
1
) k = 1
0 k > 1.
(3.3)
O processo e estacion ario para qualquer valor de
1
mas em geral e desej avel
impor restri c oes para que ele satisfa ca uma condi c ao chamada inversibilidade.
Considere os seguintes processos MA(1)
X
t
=
t
+
t1
X
t
=
t
+
1

t1
.
Substituindo em (3.3) n ao e difcil vericar que estes dois processos diferen-
tes tem exatamente a mesma fun c ao de autocorrela c ao. Assim, n ao e possvel
identicar um processo MA(1) unico a partir da fun c ao de autocorrela c ao. Por
outro lado, podemos fazer substitui c oes sucessivas e reescrever estes dois pro-
cessos colocando
t
em fun c ao de X
t
, X
t1
, . . . , i.e.

t
= X
t
X
t1
+
2
X
t2

3
X
t3
+. . .

t
= X
t

X
t1
+
1

2
X
t2

3
X
t3
+. . .
Se || < 1 a primeira serie converge e o modelo e dito ser inversvel mas a
segunda n ao converge e o modelo e n ao inversvel. Ou seja, a condi c ao de
inversibilidade (neste caso || < 1) garante que existe um unico processo MA(1)
para uma dada fun c ao de autocorrela c ao. Outra consequencia da inversibilidade
e que o processo MA(1) pode ser reescrito como uma regress ao de ordem innita
nos seus pr oprios valores defasados.
Para um processo MA(q) esta condi c ao pode ser melhor expressa usando-se
o operador de retardo, denotado por B e denido como
B
j
X
t
= X
tj
, para todo j.
3.4. ALGUNS PROCESSOS ESTOC

ASTICOS 19
A equa c ao (3.1) pode ent ao ser reescrita como
X
t
= (1 +
1
B +
2
B
2
+ +
q
B
q
)
t
= (B)
t
onde (B) e um polin omio de ordem q em B. Um processo MA(q) e inversvel
se as razes da equa c ao
(B) = 1 +
1
B +
2
B
2
+ +
q
B
q
= 0
estiverem fora do crculo unit ario. Teremos ent ao 2
q
modelos com a mesma
fun c ao de autocorrela c ao mas somente um deles ser a inversvel.
Finalmente, vale notar que uma constante qualquer pode ser adicionada
ao lado direito de (3.1) dando origem a um processo com media . O processo
continuar a sendo estacion ario com E(X
t
) = e em particular a fun c ao de
autocorrela c ao n ao ser a afetada.
3.4.4 Processos Autoregressivos
Suponha que {
t
} seja um processo puramente aleat orio com media zero e
vari ancia
2

. Um processo {X
t
} e chamada de processo autoregressivo de ordem
p, ou AR(p), se
X
t
=
1
X
t1
+ +
p
X
tp
+
t
. (3.4)
Note a similaridade com um modelo de regress ao m ultipla, onde os valores
passados de X
t
fazem o papel das regressoras. Assim, processos AR podem ser
usados como modelos se for razo avel assumir que o valor atual de uma serie
temporal depende do seu passado imediato mais um erro aleat orio.
Por simplicidade vamos come car estudando em detalhes processos de pri-
meira ordem, AR(1), i.e.
X
t
= X
t1
+
t
. (3.5)
Note que existe uma estrutura Markoviana no processo AR(1) no sentido de que,
dado X
t1
, X
t
n ao depende de X
t2
, X
t3
, . . . . Fazendo subtitui c oes sucessivas
em (3.5) obtemos que
X
t
= (X
t2
+
t1
) +
t
=
2
X
t2
+
t1
+
t
=
2
(X
t3
+
t2
) +
t1
+
t
=
3
X
t3
+
2

t2
+
t1
+
t
.
.
.
=
r+1
X
tr1
+
r

j=0

tj
.
Se X
t
for estacion ario com vari ancia nita
2
X
podemos escrever que
E[X
t

j=0

tj
]
2
=
2r+2
E(X
2
tr1
) =
2r+2

2
X
20 CAP

ITULO 3. MODELOS PROBABIL

ISTICOS
e se || < 1 temos que
2r+2
0 quando r . Portanto, esta condi c ao nos
permite escrever X
t
como o seguinte processo MA innito,
X
t
=
t
+
t1
+
2

t2
+. . .
e assim || < 1 e uma condi c ao suciente para que X
t
seja estacion ario. Neste
caso, reescrevendo o processo k perodos ` a frente, i.e.
X
t+k
=
t+k
+
t+k1
+ +
k

t
+. . .
note como o efeito de
t
sobre X
t+k
diminui a medida que k aumenta e por isso
e chamado efeito transit orio.
Podemos tambem usar o operador de retardo reescrevendo a equa c ao (3.5)
como
(1 B)X
t
=
t
ou equivalentemente
X
t
=
1
(1 B)

t
= (1 +B +
2
B
2
+. . . )
t
=
t
+
t1
+
2

t2
+. . .
Escrevendo o processo AR(1) neste formato de MA innito ca f acil ver que a
sua media e vari ancia s ao dados por
E(X
t
) = 0 e V ar(X
t
) =
2

(1 +
2
+
4
+. . . ) =

2

1
2
.
A fun c ao de autocovari ancia pode ser obtida usando os resultados acima e
para || < 1 pode-se mostrar que
(k) = E(X
t
X
t+k
) =
k

2

1
2
=
k

2
X
.
Portanto, a fun c ao de autocorrela c ao e (k) =
k
para k = 0, 1, 2, . . . . Assim,
como a media e a vari ancia s ao constantes e (k) n ao depende de t o processo
AR(1) com || < 1 e estacion ario.
Na Figura 3.1 s ao mostradas gracamente as autocorrela c oes te oricas de um
processo AR(1) ate a defasagem k = 10 para igual a 0,8, -0,8 e 0,2. Note
como a fun c ao de autocorrela c ao decai rapidamente para zero quando = 0, 2 e
se alterna entre valores positivos e negativos quando = 0, 8. Ou seja sempre
h a um decaimento exponencial para zero mas este decaimento depende do sinal
e magnitude de .
Generalizando os resultados acima para um processo AR(p) escrevemos no-
vamente X
t
como um processo MA innito com coecientes
0
,
1
, . . . , i.e.
X
t
=
0

t
+
1

t1
+
2

t2
+ = (
0
+
1
B +
2
B
2
+. . . )
t
= (B)
t
.
e em analogia com o caso AR(1) segue que o processo ser a estacion ario se

j

2
j
< .
Usando agora o operador de retardo a equa c ao (3.4) ca
(1
1
B
2
B
2

p
B
p
)X
t
=
t
ou (B)X
t
=
t
3.4. ALGUNS PROCESSOS ESTOC

ASTICOS 21
0 2 4 6 8 10
0
.2
0
.4
0
.6
0
.8
1
.0
defasagem (k)
a
u
t
o
c
o
r
r
e
la

o
(a)
0 2 4 6 8 10

0
.5
0
.0
0
.5
1
.0
defasagem (k)
a
u
t
o
c
o
r
r
e
la

o
(b)
0 2 4 6 8 10
0
.0
0
.2
0
.4
0
.6
0
.8
1
.0
defasagem (k)
a
u
t
o
c
o
r
r
e
la

o
(c)
Figura 3.1: As 10 primeiras autocorrela c oes te oricas de um processo AR(1) com (a)
= 0, 8, (b) = 0, 8 e (c) = 0, 2.
22 CAP

ITULO 3. MODELOS PROBABIL

ISTICOS
e portanto o processo AR(p) pode ser escrito como
X
t
= (B)
1

t
= (B)
t
.
Assim, os coecientes
j
podem ser obtidos a partir dos coecientes
j
fazendo-
se
(1
1
B
2
B
2

p
B
p
)(
0
+
1
B +
2
B
2
+. . . ) = 1
e o efeito de
t
sobre X
t+k
e dado por
k
, k = 1, 2, . . . .
Pode-se mostrar que (ver por exemplo Box, Jenkins, and Reinsel 1994) a
condi c ao de estacionariedade do processo X
t
e que todas as razes de (B) = 0
estejam fora do crculo unit ario. Em particular, para p = 1 temos que (B) =
1 B = 0 implica que B = 1/ e a condi c ao de estacionariedade ca || < 1
conforme j a haviamos vericado.
Para obter a fun c ao de autocorrela c ao de um processo AR(p) e algebri-
camente mais simples assumir a priori que o processo e estacion ario com
E(X
t
) = 0, V ar(X
t
) =
2
X
e Cov(X
t
, X
tk
) = (k). Neste caso, multiplicando
a equa c ao (3.4) por X
tk
, i.e
X
t
X
tk
=
1
X
t1
X
tk
+ +
p
X
tp
X
tk
+
t
X
tk
.
e tomando o valor esperado obtemos que
E(X
t
X
tk
) = (k) =
1
E(X
t1
X
tk
) + +
p
E(X
tp
X
tk
)
=
1
(k 1) + +
p
(k p), k > 0.
Dividindo-se ambos os lados pela vari ancia constante
2
X
obtem-se que
(k) =
1
(k 1) + +
p
(k p), k > 0
chamadas equa c oes de Yule-Walker.
Por exemplo, para um processo AR(1) com coeciente segue que (1) = ,
(2) = (1) =
2
, . . . , (k) =
k
como j a haviamos vericado. Para um
processo AR(2) com coecientes
1
e
2
segue que
(1) =
1
(0) +
2
(1) (1) =
1
/(1
2
)
e as outras autocorrela c os s ao obtidas iterativamente como
(k) =
1
(k 1) +
2
(k 2), k 2
Autocorrela c oes Parciais
Para um processo AR(p), o ultimo coeciente
p
mede o excesso de correla c ao
na defasagem p que n ao e levado em conta por um modelo AR(p 1). Este
e chamado de p-esimo coeciente de autocorrela c ao parcial. Assim, variando
k = 1, 2, . . . temos a chamada fun c ao de autocorrela c ao parcial (FACP).
Por outro lado, em um processo AR(p) n ao existe correla c ao direta entre
X
t
e X
tp1
, X
tp2
, . . . e substituindo k = p + 1, p + 2, . . . nas equa c oes de
3.4. ALGUNS PROCESSOS ESTOC

ASTICOS 23
Yule-Walker obtem-se que todos os coecientes de correla c ao parcial ser ao nulos
para k > p. Por exemplo, substituindo-se k = p + 1 segue que
(p + 1) =
1
(p) + +
p
(1) +
p+1
.
O fato de que a facp e igual a zero para k > p e sugerido em Box and Jenkins
(1970, p. 170) como uma ferramenta para determinar a ordem p do processo
autoregressivo para series temporais observadas.
3.4.5 Modelos Mistos ARMA
Combinando-se modelos AR e MA pode-se obter uma representa c ao adequada
com um n umero menor de par ametros. Processos autoregressivos medias m oveis
(ARMA) formam um classe de modelos muito uteis e parcimoniosos para des-
crever dados de series temporais. O modelo ARMA(p, q) e dado por
X
t
=
1
X
t1
+ +
p
X
tp
+
t
+
1

t1
+ +
q

tq
onde {
t
} e um processo puramente aleat orio com media zero e vari ancia
2

.
Note que, modelos AR ou MA podem ser obtidos como casos especiais quando
p = 0 ou q = 0. Usando o operador diferen ca o modelo pode ser reescrito como
(1
1
B
2
B
2

p
B
p
)X
t
= (1 +
1
B +
2
B
2
+ +
q
B
q
)
t
ou
(B)X
t
= (B)
t
.
Os valores de
1
, . . . ,
p
que tornam o processo estacion ario s ao tais que as
razes de (B) = 0 est ao fora do crculo unit ario. Analogamente, os valores de

1
, . . . ,
q
que tornam o processo inversvel s ao tais que as razes de (B) = 0
est ao fora do crculo unit ario.
Vale notar que as fun c oes de autocorrela c ao e autocorrela c ao parcial cam
consideravelmente mais complicadas em processos ARMA. De um modo geral,
para um processo ARMA(p, q) estacion ario a fun c ao de autocorrela c ao tem um
decaimento exponencial ou oscilat orio ap os a defasagem q enquanto que a facp
tem o mesmo comportamento ap os a defasagem p (Box and Jenkins 1970, p. 79).
Em princpio este resultado pode ser utilizado para auxiliar na determina c ao da
ordem (p, q) do processo mas na pr atica pode ser bastante difcil distinguir entre
decaimentos exponenciais e oscilat orios atraves das estimativas destas fun c oes.
A Tabela 3.1 mostra as propriedades te oricas das fun c oes de autocorrela c ao
e autocorrela c ao parcial para alguns processos estacion arios como auxiliar na
identica c ao do modelo.
3.4.6 Modelos ARMA Integrados
Os modelos discutidos ate agora s ao apropriados para series temporais esta-
cion arias. Assim, para ajustar estes modelos a uma serie temporal observada
e necess ario remover as fontes de varia c ao n ao estacion arias. Por exemplo,
se a serie observada for n ao estacion aria na media pode-se tentar remover a
24 CAP

ITULO 3. MODELOS PROBABIL

ISTICOS
Tabela 3.1: Propriedades te oricas da fac e facp.
Processo FAC FACP
serie aleat oria 0 0
AR(1), > 0 decaimento exponencial 0, k 2
AR(1), < 0 decaimento oscilat orio idem
AR(p) decaimento para zero 0, k > p
MA(1) 0, k > 1 decaimento oscilat orio
ARMA(p, q) decaimento a partir de q decaimento a partir de p
tendencia tomando-se uma ou mais diferen cas (esta abordagem e muito utili-
zada em Econometria).
Um modelo ARMA no qual X
t
e substituido pela sua d-esima diferen ca

d
X
t
e capaz de descrever alguns tipos de series n ao estacion arias. Denotando
a serie diferenciada por
W
t
=
d
X
t
= (1 B)
d
X
t
o processo autoregressivo integrado medias m oveis denotado ARIMA(p, d, q) e
dado por
W
t
=
1
W
t1
+ +
p
W
tp
+
t
+
1

t1
+ +
q

tq
ou, equivalentemente
(B)(1 B)
d
X
t
= (B)
t
. (3.6)
Da equa c ao (3.6) acima pode-se notar que o modelo para X
t
e claramente
n ao estacion ario j a que o polin omio autoregressivo (B)(1B)
d
tem exatamente
d razes sobre o crculo unit ario. Um processo que se torna estacion ario ap os d
diferen cas e dito n ao estacion ario homogeneo.
Na pr atica valores pequenos s ao em geral especicados para d, sendo d = 1
o valor mais frequentemente utilizado e excepcionalmente d = 2. Note tambem
que o passeio aleat orio pode ser considerado um processo ARIMA(0,1,0).
Vale notar que para dados reais um modelo ARIMA (e de fato qualquer
modelo) e no m aximo uma aproxima c ao para o verdadeiro processo gerador
dos dados. Na pr atica pode ser bem difcil distinguir entre um processo es-
tacion ario com mem oria longa (e.g. AR(1) com 1) e um processo n ao
estacion ario homogeneo. Existe uma vasta literatura econometrica sobre tes-
tes de raz unit aria (ver por exemplo Hamilton 1994 e Bauwens, Lubrano, and
Richard 1999). Mais recentemente, modelos da classe ARFIMA (ou ARIMA
fracion arios) tem sido utilizados para analisar series com mem oria longa. Es-
tes t opicos n ao ser ao abordados aqui e o leitor interessado pode consultar por
exemplo Brockwell and Davis (1991).
Exerccios
Nos exerccios a seguir {
t
} e um processo discreto puramente aleat orio com
media zero e vari ancia
2

.
3.4. ALGUNS PROCESSOS ESTOC

ASTICOS 25
1. Encontre a fac do processo X
t
=
t
+ 0, 7
t1
0, 2
t2
.
2. Encontre a fac do processo X
t
= 0, 7(X
t1
) +
t
.
3. Se X
t
= +
t
+
t1
mostre que a fac do processo n ao depende de .
4. Reescreva cada um dos modelos abaixo em termos de operador de retardo
B e verique se o modelo e estacion ario e/ou inversvel:
(a) X
t
= 0, 3X
t1
+
t
.
(b) X
t
=
t
1, 3
t1
+ 0, 4
t2
.
(c) X
t
= 0, 5X
t1
+
t
1, 3
t1
+ 0, 4
t2
.
(d) X
t
= 0, 3 X
t1
+
t
0, 6
t1
5. Mostre que o processo X
t
= X
t1
+cX
t2
+
t
e estacion ario se 1 < c < 0
e obtenha a fac para c = 3/16.
6. Mostre que o processo X
t
= X
t1
+cX
t2
cX
t3
+
t
e n ao estacion ario
para qualquer valor de c.
7. Descreva como deve se comportar a fun c ao de autocorrela c ao te orica para
os seguintes processos,
(a) AR(1) estacion ario, para = 0, 1, = 0, 75 e = 0, 99.
(b) Medias m oveis de ordem q.
(c) Como deveriam car as fun c oes de autocorrela c ao e autocorrela c ao
parcial amostrais que identicam os processos acima?
8. Descreva como deveriam se comportar as fun c oes de autocorrela c ao e
autocorrela c ao parcial amostrais para processos AR, MA e ARMA n ao
sazonais.
9. Para o modelo (1B)(10, 2B)X
t
= (10, 5B)
t
, identique os valores
de p, q, e d e verique se o processo e estacion ario e inversvel.
10. Mostre que a fun c ao de autocovari ancia de um processo AR(1) esta-
cion ario com vari ancia
2
X
e dada por
k

2
X
(Sugest ao: use a express ao
(3.2) com q )
11. Verique se X
t
=

t
j=1

t
e estacion ario.
Captulo 4
Estima cao
No captulo anterior foram estudados modelos probabilsticos que podem ser
utilizados para descrever dados de series temporais. Neste captulo ser a discu-
tido o problema de ajustar um modelo aos dados observados. A inferencia ser a
baseada na fun c ao de autocorrela c ao.
4.1 Autocovariancia e autocorrela cao
O coeciente de autocovari ancia amostral de ordem k foi denido na Se c ao 2.2
como
c
k
=
nk

t=1
(x
t
x)(x
t+k
x)/n
que e o estimador usual do coeciente de autocovari ancia te orico (k). As pro-
priedades deste estimador n ao ser ao detalhadas aqui mas podem ser encontradas
por exemplo em Priestley (1981).
Ap os obter as estimativas de (k) os coecientes de autocorrela c ao s ao ent ao
estimados como r
k
= c
k
/c
0
, k = 1, 2, . . . .
Aqui ser ao consideradas apenas as propriedades de r
k
quando a amostra vem
de um processo puramente aleat orio (propriedades gerais podem ser obtidas
em Kendall, Stuart, and Ord 1983, Captulo 48). Vimos na Se c ao 2.2.1 que
o coeciente de autocorrela c ao amostral r
k
e assintoticamente normalmente
distribuido, com media e vari ancia dados por
E(r
k
) 1/n e V ar(r
k
) 1/n.
e os limites de conan ca aproximados de 95% frequentemente utilizados s ao
dados por 1, 96/

n.
Interpretando o correlograma
No captulo 2 foram vistos alguns exemplos de correlogramas associados a ca-
ractersticas de series temporais observadas. O correlograma e util tambem na
identica c ao do tipo de modelo ARIMA que fornece a melhor representa c ao
de uma serie observada. Um correlograma como o da Figura 2.5 por exem-
plo, aonde os valores de r
k
decaem para zero de forma relativamente lenta,
26
4.2. AJUSTANDO PROCESSOS AUTOREGRESSIVOS 27
indica n ao estacionariedade e a serie precisa ser diferenciada. Para series esta-
cion arias o correlograma e comparado com as autocorrela c oes te oricas de v arios
processos ARMA para auxiliar na identica c ao daquele mais apropriado. Por
exemplo, se r
1
e signicativamente diferente de zero e todos os valores subse-
quentes r
2
, r
3
, . . . s ao pr oximos de zero ent ao um modelo MA(1) e indicado j a
que sua fun c ao de autocorrel c ao te orica se comporta assim. Por outro lado, se
r
1
, r
2
, r
3
, . . . parecem estar decaindo exponencialmente ent ao um modelo AR(1)
pode ser apropriado.
Vale notar entretando que a interpreta c ao de correlogramas e um dos as-
pectos mais difceis da an alise de series temporais. A fun c ao de autocorrela c ao
parcial e um importante coadjuvante nesta etapa de identica c ao se houver
termos autoregressivos no modelo j a que seus valores estimados tendem a car
pr oximos de zero ap os a defasagem p.
Vimos que para um processo ARMA(p, q) estacion ario a fun c ao de auto-
correla c ao ter a um decaimento exponencial ou oscilat orio ap os a defasagem q
enquanto que a facp ter a o mesmo comportamento ap os a defasagem p. Mas
na pr atica esta distin c ao entre decaimentos exponenciais e oscilat orios atraves
das estimativas destas fun c oes pode ser bastante difcil.
4.2 Ajustando Processos Autoregressivos
Para um processo AR de ordem p com media dado por
X
t
=
1
(X
t1
) + +
p
(X
tp
) +
t
,
e dadas n observa c oes x
1
, . . . , x
n
, os par ametros ,
1
, , . . . ,
p
podem ser es-
timados pelo metodo de mnimos quadrados, i.e. minimizando-se a soma de
quadrados
S =
n

t=p+1
[(x
t
)
1
(x
t1
)
p
(x
tp
)]
2
com respeito a ,
1
, , . . . ,
p
. Note que o somat orio e de t = p + 1 em diante,
mas esta pequena perda de informa c ao n ao ser a importante se a serie n ao for
muito curta. Alem disso, se o processo
t
tiver distribui c ao normal ent ao as
estimativas de mnimos quadrado coincidem com as estimativas de m axima
verossimilhan ca condicionada nas p primeiras observa c oes.
Alternativamente, dois metodos aproximados podem ser utilizados
tomando-se = x. O primeiro ajusta os dados ao modelo
X
t
x =
1
(X
t1
x) +. . .
p
(X
tp
x) +
t
,
como se fosse um modelo de regress ao linear m ultipla.
No segundo metodo os coecientes de autocorrela c ao (k) s ao substituidos
pelas suas estimativas r
k
nas p primeiras equa c oes de Yule-Walker. Ou seja,
estamos usando o metodos dos momentos e por isto os estimadores resultantes
28 CAP

ITULO 4. ESTIMAC

AO
s ao assintoticamente equivalentes aos estimadores de m axima verossimilhan ca.
Assim, temos um sistema com p equa c oes e p inc ognitas
1
, . . . ,
p
, i.e.
r
1
=
1
+
2
r
1
+ +
p
r
p1
r
2
=
1
r
1
+
2
+ +
p
r
p2
.
.
.
r
p
=
1
r
p1
+
2
r
p2
+ +
p
Como o custo computacional de estimar modelos AR n ao e t ao grande uma
abordagem alternativa para determina c ao de p consiste em estimar modelos de
ordem progressivamente mais alta e calcular a soma de quadrados residual para
cada valor de p. Pode ser possvel encontrar o valor de p para o qual a inclus ao
de termos extras n ao melhora sensivelmente o ajuste. Como vimos na Se c ao
3.4.4 este procedimento d a origem ` a fun c ao de autocorrela c ao parcial.
4.3 Ajustando Processos Medias M oveis
O problema de estima c ao dos par ametros em modelos MA e bem mais com-
plicado do que em modelos AR. Os erros
t
s ao agora fun c oes n ao lineares
complicada dos par ametros
1
, . . . ,
q
e express oes analticas para os estimado-
res n ao podem ser obtidas. Assim, metodos computacionais iterativos precisam
ser utilizados para minimizar a soma de quadrados residual.
Dado um modelo MA(q)
X
t
= +
t
+
1

t1
+ +
q

tq
e uma serie observada x
1
, . . . , x
n
o procedimento iterativo consiste basicamente
em xar os valores de ,
1
, . . . ,
q
e calcular os resduos
x
t

1

t

q

tq
sequencialmente para t = 1, . . . , n assumindo que
0
=
1
= =
q+1
= 0.
Dados estes resduos pode-se calcular a soma de quadrados residual. Repetindo
este procedimento para ,
1
, . . . ,
q
variando em uma grade de pontos pode-se
escolher os valores que minimizam a soma de quadrados. Este procedimento
requer o uso de algoritmos ecientes de otimiza c ao numerica e nada garante a
sua convergencia para um mnimo global.
Alem das estimativas pontuais, se o processo {
t
} tem distribui c ao normal
ent ao Box and Jenkins (1970), p. 228 descrevem regi oes de conan ca para os
par ametros do modelo.
Em termos pr aticos, se o procedimento de otimiza c ao utilizado levar mui-
tas itera c oes para convergir ou mesmo n ao convergir deve-se desconar das
estimativas. Neste caso as estimativas podem ser inst aveis no sentido de que
adicionando-se ou removendo-se uma ou duas observa c oes pode-se obter valores
muito diferentes. Nesta situa c ao pode ser computacionalmente mais vantajoso
ajustar um modelo AR aos dados mesmo que o modelo resultante tenha mais
par ametros do que o modelo MA sugerido pela fun c ao de autocorrela c ao.
4.4. AJUSTANDO PROCESSOS ARMA 29
4.4 Ajustando Processos ARMA
Os problemas de estima c ao para modelos ARMA s ao similares aqueles para
modelos MA no sentido de que um procedimento iterativo precisa ser utilizado.
Isto ocorre porque os erros {
t
} s ao fun c oes n ao lineares complicadas de to-
dos os coecientes
1
, . . . ,
p
,
1
, . . . ,
q
. Portanto os mesmos coment arios da
se c ao anterior s ao v alidos para procedimentos que levam muitas itera c oes para
convergir, i.e deve-se desconar das estimativas.
Outra diculdade, especca de modelos ARMA, e o problema de cancela-
mento de razes. Por exemplo considere o modelo ARMA(2,1)
X
t
= 2X
t1

2
X
t2

t1
+
t
que pode ser reescrito em termos do operador de retardo como
(1 B)
2
X
t
= (1 B)
t
.
Note como = implica em um modelo AR(1) X
t
= X
t1
+
t
, ou seja ambos
os modelos implicam exatamento no mesmo comportamento para a serie tem-
poral X
t
. Este e um problema de identica c ao que ca ainda mais complicado
em modelos de ordem mais alta.
Em termos pr aticos e difcil identicar o problema de cancelamento de razes
a n ao ser, como j a foi dito, que o procedimento iterativo dever a ter convergencia
lenta. No caso particular de um modelo ARMA(1,1) deve-se desconar
quando as estimativas de e s ao muito similares. Para outros valores de
p e q a unica susgest ao para tentar minimizar o problema e n ao incluir muitos
par ametros no modelo.
4.5 Modelos Sazonais
Muitas series temporais contem uma componente peri odica sazonal que se re-
pete a cada s observa c oes (s > 1). Por exemplo, com dados mensais e s = 12
tipicamente espera-se que X
t
dependa de X
t12
e talvez de X
t24
alem de
X
t1
, X
t2
, . . . .
Neste caso, tomar a primeira diferen ca x
t
x
t1
n ao e suciente para tornar
a serie (aproximadamente) estacion aria. A forma apropriada de diferenciar
dados com padr ao sazonal acentuado e tomar diferen cas no perodo sazonal.
Por exemplo, para dados mensais a primeira diferen ca sazonal e

12
x
t
= (1 B
12
)x
t
= x
t
x
t12
e ter a variabilidade menor do que a primeira diferen ca n ao sazonal x
t
=
x
t
x
t1
, sendo portanto mais f acil de identicar e estimar.
Em geral, uma diferen ca sazonal e denotada por
s
onde s e o perodo
sazonal. A D-esima diferen ca sazonal e ent ao denotada por
D
s
. Combinando-
se os dois tipos de diferencia c ao obtem-se o operador
d

D
s
. Por exemplo,
tomando-se 1 diferen ca simples e 1 sazonal em uma serie mensal tem-se que

12
x
t
= x
t
x
t1
x
t12
+x
t13
30 CAP

ITULO 4. ESTIMAC

AO
Box and Jenkins (1970) generalizaram o modelo ARIMA para lidar com sa-
zonalidade e deniram um modelo ARIMA sazonal multiplicativo, denominado
SARIMA, dado por
(B)(B
s
)W
t
= (B)(B
s
)
t
(4.1)
onde
(B) = (1
1
B
p
B
p
)
(B
s
) = (1
s
B
s

P
B
Ps
)
W
t
=
d

D
s
X
t
(B) = (1 +
1
B + +
q
B
q
)
(B
s
) = (1 +
s
B
s
+ +
Q
B
Qs
).
Este modelo e chamado SARIMA multiplicativo de ordem
(p, d, q)(P, D, Q)
s
e parece extremamente complicado ` a primeira vista
mas na pr atica os valores de d e D em geral n ao ser ao maiores do que 1 e um
n umero pequeno de coecientes ser a suciente. Por exemplo, com P = 1 temos
que
(B
s
) = (1
s
B
s
)
o que signica simplesmente que W
t
depende de W
ts
. A serie W
t
e formada a
partir da serie original tomando-se diferen cas simples para remover a tendencia
e diferen cas sazonais para remover a sazonalidade.
Para xar ideias considere o modelo SARIMA(1,0,0) (0, 1, 1)
12
para dados
mensais. Ou seja temos um termo autoregressivo e um termo media m ovel
sazonal modelando a primeira diferen ca sazonal. O modelo pode ser escrito
como
(1 B)(1 B
12
)X
t
= (1 B
12
)
t
e desenvolvendo os produtos obtemos que
X
t
= X
t12
+(X
t1
X
t13
) +
t
+
t12
.
Assim, X
t
depende de X
t1
, X
t12
e X
t13
alem do erro no tempo t 12.
Para nalizar, ao ajustar um modelo sazonal aos dados a primeira tarefa
e especicar os valores de d e D que tornam a serie (aproximadamente) esta-
cion aria e remove a maior parte da sazonalidade. Como j a foi dito, estes valores
raramente ser ao maiores do que 1. Posteriormente os valores de p, P, q e Q de-
vem ser especicados com base nas fun c oes de autocorrela c ao e autocorrela c ao
parcial da serie diferenciada. Os valores de P e Q s ao especicados basicamente
a partir de r
k
, k = s, 2s, . . . . Por exemplo, para dados mensais se r
12
e grande
mas r
24
e pequeno isto sugere que um termo media m ovel sazonal pode ser
adequado.
Ap os ter identicado, por tentativa, o que parece ser um modelo SARIMA
razo avel os par ametros ser ao estimados por algum procedimento iterativo si-
milar ` aqueles propostos para modelos ARMA. Detalhes sobre as rotinas de
estima c ao destes modelos n ao ser ao abordados aqui e podem ser obtidos em
Box and Jenkins (1970).
4.6. ADEQUAC

AO DO MODELO 31
4.6 Adequa cao do Modelo
Todos os modelos s ao errados mas alguns s ao uteis (George Box)
Ap os identicar a ordem e estimar ecientemente os par ametros de um
modelo e necess ario vericar sua adequa c ao antes de utiliz a-lo por exemplo
para fazer previs oes. Pode-se fazer testes de sobreajustamento, que consistem
em incluir par ametros extras no modelo e vericar sua signic ancia estatstica.
No caso de modelos ARMA deve-se incluir um par ametro de cada vez para
evitar o problema de cancelamento de razes mencionado na Se c ao 4.4.
4.6.1 Analise dos Resduos
Ap os um modelo ter sido ajustado a uma serie temporal deve-se vericar se ele
fornece uma descri c ao adequada dos dados. Assim como em outros modelos
estatsticos a ideia e vericar o comportamento dos resduos onde
residuo = observa c ao - valor ajustado.
Para os modelos vistos aqui o valor ajustado e a previs ao 1 passo a frente de
modo que o resduo ca denido como o erro de previs ao 1 passo a frente. Por
exemplo, em um modelo AR(1) se e a estimativa do coeciente autoregressivo
ent ao o valor ajustado no tempo t e x
t1
e o resduo correspondente e e
t
=
x
t
x
t1
.
Se o modelo tiver um bom ajuste espera-se que os resduos se distribuam
aleatoriamente em torno de zero com vari ancia aproximadamente constante e
sejam n ao correlacionados. Se a vari ancia dos resduos for crescente uma trans-
forma c ao logartmica nos dados pode ser apropriada. O fen omeno de n ao
const ancia na vari ancia e denominado de volatilidade na literatura de series
temporais e pode ser tratado atraves de transforma c oes nos dados (e.g. trans-
forma c oes de Box-Cox)
1
.
Alem disso, em modelos de series temporais os resduos est ao ordenados
no tempo e e portanto natural trat a-los tambem como uma serie temporal.

E
particularmente importante que os resduos de um modelo estimado sejam seri-
almente (i.e. ao longo do tempo) n ao correlacionados. Evidencia de correla c ao
serial nos resduos e uma indica c ao de que uma ou mais caractersticas da serie
n ao foi adequadamente descrita pelo modelo.
Consequentemente, duas maneiras obvias de vericar a adequa c ao do mo-
delo consistem em representar gracamente os resduos e o seu correlograma.
O gr aco temporal poder a revelar a presen ca de dados discrepantes, efeitos de
autocorrela c ao ou padr oes cclicos enquanto que o correlograma permite uma
an alise mais detalhada da estrutura de autocorrela c ao indicando possveis ter-
mos faltantes no modelo.
Ou seja, assim como em outros modelos estatsticos, a ideia e que os resduos
poder ao identicar caractersticas que n ao foram adequadamente modeladas.
Por exemplo, autocorrela c oes residuais signicativas nas defasagens 1 ou 2, ou
1
Uma tendencia mais recente no entanto consiste em tentar modelar simultaneamente a
media e a vari ancia ao inves de usar transforma c oes.
32 CAP

ITULO 4. ESTIMAC

AO
em defasagens sazonais (e.g. 12 para dados mensais) s ao uma indica c ao de que
mais termos medias m oveis devem ser incluidos no modelo. Por outro lado,
um valor de r
k
ligeiramente fora dos limites de conan ca em defasagens sem
signicado obvio (e.g. k=5) n ao e indica c ao suciente para se rejeitar o modelo.
O mesmo coment ario vale para as autocorrela c oes parciais dos resduos no que
diz respeito ` a inclus ao de termos autoregressivos (sazonais e n ao sazonais).
4.6.2 Testes sobre os resduos
Ao inves de olhar para as autocorrel c oes residuais individualmente pode-se tes-
tar se um grupo de autocorrela c oes e signicativamente diferente de zero atraves
das chamadas estatsticas Q. Para modelos ARMA Box and Jenkins (1970) su-
geriram o uso do teste de Box-Pierce onde a estatstica de teste e dada por
Q = n
m

k=1
r
2
k
.
Na pr atica o n umero m de autocorrela c oes amostrais e tipicamente escolhido
entre 15 e 30. Se o modelo ajustado for apropriado ent ao Q ter a distribui c ao
aproximadamente qui-quadrado com m p q graus de liberdade. Assim,
valores grandes de Q fornecem indica c ao contra a hip otese de que as autocor-
rela c oes s ao todas nulas, em favor da hip otese de que ao menos uma delas e
diferente de zero.
O teste de Box-Pierce n ao tem bom desempenho em amostras pequenas ou
moderadas no sentido de que a distribui c ao se afasta da qui-quadrado. V arios
testes alternativos foram sugeridos na literatura e o mais conhecido e o teste de
Ljung-Box, aonde a estatstica de teste e dada por
Q = n(n + 2)
m

k=1
r
2
k
n k
.
Sua distribui c ao amostral tambem e aproximadamente qui-quadrado com
mp q graus de liberdade.
Exemplo 4.1 : Considere novamente a serie AirPassengers do R e fa ca trans-
forma c ao logaritmica nos dados (esta transforma c ao e sugerido na literatura).
Fa ca os gr acos da FAC amostral da serie original, 1
a
diferen ca e 1
a
diferen ca
sazonal. Os comandos abaixo podem ser utilizados e obtem-se os gr acos da
Figura 4.1.
data(AirPassengers)
y = log(AirPassengers)
par(mfrow=c(3,2))
z = cbind(y,diff(y),diff(y,lag=12))
yl=c(No de passageiros,Variacao mensal,Variacao anual)
par(mfrow=c(3,2))
4.6. ADEQUAC

AO DO MODELO 33
for (i in 1:3){
plot(z[,i],main=,xlab=Anos,ylab=yl[i],cex.lab=2,cex.axis=1.5)
m = acf(z[,i],lag.max=36, plot=F,na.action=na.pass)
m$lag = m$lag*12
plot(m,main=,xlab=defasagem,ylab=FAC,cex.lab=2,cex.axis=1.5)
}
Os gr acos anteriores indicam que precisamos tomar 1 diferen ca simples
mais 1 diferen ca sazonal para tentar induzir estacionariedade aproximada.
z=diff(diff(y),lag=12)
plot(z,main=serie com 1 diferenca simples e 1 sazonal,xlab=Anos,
ylab=)
m = acf(z, lag.max=36, plot=F); m$lag = m$lag*12
plot(m, main=)
Note que h a valores grandes nas defasagens 1, 3, 12 e 23 do ultimo gr aco.
Isto pode ser uma indica c ao de que termos MA sazonais e n ao sazonais devem
ser incluidos no modelo. Um modelo candidato para o logaritmo da serie e
SARIMA(0,1,1)x(0,1,1).
m = arima(y,order=c(0,1,1),seasonal=list(order=c(0,1,1)))
m
Call:
arima(x = y, order = c(0, 1, 1), seasonal = list(order = c(0, 1, 1)))
Coefficients:
ma1 sma1
-0.4018 -0.5569
s.e. 0.0896 0.0731
sigma^2 estimated as 0.001348: log likelihood = 244.7, aic = -483.4
Como primeiro verica c ao da adequa c ao do modelo vamos usar a fun c ao
tsdiag() que retorna os gracos dos residuos padronizados, o correlograma e os
p-valores do teste de Ljung-Box para autocorrela c oes de ordem 1,2, ... Compare
estes p-valores com o resultado da fun c ao Box.test() que calcula as estatisticas
de Box-Pierce e Ljung-Box para a hip otese nula de independencia.
tsdiag(m)
for (i in 1:10){
b = Box.test(m$residuals,i,type=Ljung-Box)$p.value
print(b)
}
3
4
C
A
P
I
T
U
L
O
4
.
E
S
T
I
M
A
C

A
O
A
n
o
s
No de passageiros
1
9
5
0
1
9
5
4
1
9
5
8
5.0 5.5 6.0 6.5
0
5
1
0
1
5
2
0
2
5
3
0
3
5
0.2 0.2 0.4 0.6 0.8 1.0
d
e
f
a
s
a
g
e
m
FAC
A
n
o
s
Variacao mensal
1
9
5
0
1
9
5
4
1
9
5
8
0.2 0.1 0.0 0.1 0.2
0
5
1
0
1
5
2
0
2
5
3
0
3
5
0.2 0.2 0.6 1.0
d
e
f
a
s
a
g
e
m
FAC
A
n
o
s
Variacao anual
1
9
5
0
1
9
5
4
1
9
5
8
0.0 0.1 0.2 0.3
0
5
1
0
1
5
2
0
2
5
3
0
3
5
0.2 0.2 0.6 1.0
d
e
f
a
s
a
g
e
m
FAC
F
i
g
u
r
a
4
.
1
:
4.6. ADEQUAC

AO DO MODELO 35
[1] 0.8610206
[1] 0.9452508
[1] 0.4829255
[1] 0.3663101
[1] 0.4320234
[1] 0.4883209
[1] 0.539204
[1] 0.6328112
[1] 0.5096084
[1] 0.5502513
As outras verica c oes usuais sobre os residuos tambem devem ser feitas.
Por exemplo, um histograma com curva normal superposta, o gr aco de proba-
bilidades normais e um teste de normalidade. Os comandos abaixo podem ser
utilizados no R.
par(mfrow=c(2,2))
z=m$residuals
hist(z,freq=F)
d = seq(range(z)[1]-3*sd(z),range(z)[2]+3*sd(z),0.001)
lines(d,dnorm(d,0,sd(z)))
qqnorm(z)
qqline(z)
shapiro.test(z)
Shapiro-Wilk normality test
data: z
W = 0.9864, p-value = 0.1674
text(-0.5,0.02, Shapiro-Wilk normality test)
text(-0.5,0.01, p-value = 0.1674)
Exerccios
1. Fa ca um esbo co do correlograma para uma serie com estrutura MA(Q)
puramente sazonal, i.e. n ao existe dependencia dentro de um perodo
sazonal.
2. Para uma serie mensal observada foi identicado e estimado o modelo
SARIMA(1,1,0)(0,1,0).
(a) Escreva o modelo em termos de operador de retardo.
36 CAP

ITULO 4. ESTIMAC

AO
(b) Descreva como deve ter sido o comportamento das fun c oes de auto-
correla c ao e autocorrela c ao parcial da serie original e da serie dife-
renciada.
(c) Como deve ser o comportamento esperado dos resduos em termos
de suas autocorrela c oes para que o modelo seja adequado?
(d) O que se deve fazer no caso de autocorrela c oes residuais signicativas
nas defasagens 1, 8 e 12 ?
Captulo 5
Previsao
Uma das formas de utiliza c ao de um modelo ajustado e para fazer previs oes
de valores futuros. Assim, se t e o perodo corrente estamos interessados em
prever os valores de X
t+1
, X
t+2
, . . . . A previs ao de X
t+k
, para k = 1, 2, . . . ser a
denotada por x
t
(k) e e denida como a esperan ca condicional de X
t+k
dados
todos os valores passados, i.e.
x
t
(k) = E(X
t+k
|x
t
, x
t1
, . . . ).
A equa c ao acima e chamada de fun c ao de previs ao e o inteiro k e chamado
de horizonte de previs ao. Pode-se mostrar que esta previs ao tem o menor erro
quadr atico medio.
Note que se temos uma serie temporal observada x
1
, . . . , x
n
as previs oes po-
dem ser feitas dentro do perodo amostral e comparadas com os valores observa-
dos. Esta e uma pr atica bastante comum para checar a performance preditiva
do modelo. A diferen ca entre os valores previsto e observado, x
t
(k) x
t+k
, e
chamada de erro de previs ao k passos ` a frente e ser a denotado por e
t+k
.
5.1 Metodos Univariados de Previsao
Os metodos descritos nesta se c ao tem um forte apelo intuitivo, decompondo
uma serie temporal em componentes de f acil interpreta c ao. Dados os recursos
computacionais disponveis atualmente eles tambem tem a vantagem de serem
extremamente simples de programar e sua utiliza c ao ter um custo computaci-
onal muito pequeno. Vamos come car com o caso mais simples, adequado para
series localmente constantes.
5.1.1 Alisamento Exponencial Simples
Dada uma serie temporal x
1
, . . . , x
n
, n ao sazonal e sem tendencia sistem atica, e
razo avel tomar a estimativa de x
n+1
como uma soma ponderada das observa c oes
passadas, i.e.
x
n
(1) = a
0
x
n
+a
1
x
n1
+. . .
onde {a
j
} s ao os pesos. Parece razo avel tambem dar um peso maior ` as ob-
serva c oes mais recentes do que ` as observa c oes mais distantes no passado, i.e.
37
38 CAP

ITULO 5. PREVIS

AO
a
0
> a
1
> . . . . Neste procedimento s ao adotados pesos que decaem geometri-
camente a uma taxa constante dados por
a
j
= (1 )
j
, j = 0, 1, . . .
onde 0 < < 1 e chamada de constante de alisamento. Assim, a previs ao 1
passo ` a frente em t = n ca
x
n
(1) = x
n
+(1 )x
n1
+(1 )
2
x
n2
+. . . . (5.1)
Naturalmente que na pr atica haver a um n umero nito de observa c oes passadas
e a soma acima ser a tambem nita. A ideia de que o conte udo informativo de
uma observa c ao decai com a sua idade e bastante intuitivo e o par ametro
est a controlando o grau de envelhecimento deste conte udo.
A equa c ao (5.1) costuma ser reescrita em forma de equa c ao recursiva. Colo-
cando-se (1 ) em evidencia obtem-se que
x
n
(1) = x
n
+ (1 )[x
n1
+(1 )x
n2
+(1 )
2
x
n3
+. . . ]
= x
n
+ (1 ) x
n1
(1) (5.2)
i.e. uma media ponderada entre a observa c ao mais recente e a previs ao anterior.
A equa c ao (5.1) pode ainda ser reescrita na forma de corre c ao de erro. Denindo
e
n
= x
n
x
n1
(1) o erro de previs ao 1 passo ` a frente no tempo n ent ao
x
n
(1) = x
n1
(1) +e
n
.
Ou seja, a previs ao para t = n + 1 e igual ` a previs ao para t = n que foi feita
em t = n 1 mais uma propor c ao do erro cometido.
Previs oes Dentro da Amostra
Usando x
0
(1) = x
1
como previs ao inicial em t = 0 e denindo e
t
= x
t

x
t1
(1) os erros de previs ao 1 passo ` a frente, a equa c ao (5.2) pode ser usada
recursivamente para obter as previs oes, i.e.
x
t
(1) = x
t
+ (1 ) x
t1
(1), t = 1, 2, . . .
Na forma de corre c ao de erro as recurs oes cam
x
t
(1) = x
t1
(1) +e
t
, t = 1, 2, . . .
Especica cao de
Vale notar que o valor de n ao depende da escala em que as observa c oes
foram medidas, mas sim das propriedades da serie temporal. O valor de
deve ser especicado de modo a reetir a inuencia das observa c oes passadas
nas previs oes. Valores pequenos produzem previs oes que dependem de muitas
observa c oes passadas. Por outro lado, valores pr oximos de 1 levam a previs oes
que dependem das observa c oes mais recentes e no caso extremo = 1 a previs ao
e simplesmente a ultima observa c ao. O valor de tambem pode ser estimado
5.1. M

ETODOS UNIVARIADOS DE PREVIS

AO 39
a partir dos dados e o criterio utilizado e a minimiza c ao da soma de quadrados
dos erros de previs ao. Ou seja, dado um valor xo de e usando a equa c ao
(5.2), calcule
x
0
(1) = x
1
,
x
1
(1) = x
1
+ (1 ) x
0
(1), e
2
= x
2
x
1
(1)
x
2
(1) = x
2
+ (1 ) x
1
(1), e
3
= x
3
x
2
(1)
.
.
.
x
n1
(1) = x
n1
+ (1 ) x
n2
(1), e
n
= x
n
x
n1
(1)
e calcule

n
t=2
e
2
t
. Repita o procedimento para valores de variando entre 0 e
1 (digamos com incrementos de 0,1) e selecione o valor que minimiza esta soma
de quadrados. Na pr atica, o valor mnimo pode ocorrer muito pr oximo de um
dos extremos do intervalo de varia c ao de . Isto pode ocorrer quando a soma
de quadrados varia muito pouco na regi ao em torno do mnimo. Neste caso faz
mais sentido utilizar valores n ao t ao extremos.
Exemplo 5.1 : No banco de dados do R, a serie lh contem as quantidades
de um tipo de horm onio em amostras de sangue coletadas a cada 10 minutos
de uma pessoa do sexo feminino (Diggle, 1990). Vamos aplicar o metodo de
alisamento exponencial simples ` a esta serie fazendo primeira a sele c ao do valor
de que minimiza a soma dos quadrados dos erros de previs ao 1 passo a frente.
Na Figura 5.1 temos o gr aco desta soma de quadrados como fun c ao de e o
gr aco das previs oes 1 passo ` a frente juntamente com a serie observada.
O valor otimo obtido foi = 0, 945 com a soma de erros quadrados igual a
11,86 e os seguintes comandos do R podem ser utilizados para a sele c ao de .
AES = function(x,interval){
e=NULL
for (alfa in interval){
e2=0; prev = x[1]
for (i in 2:length(x)){
prev = c(prev,alfa*x[i-1] + (1-alfa)*prev[i-1])
e2 = e2 + (x[i]-prev[i])**2
}
e=c(e,e2)
}
plot(interval,e,type=l,xlab=expression(alpha),
ylab=Soma de quadrados dos erros,cex=2,cex.axis=2,cex.lab=2)
e.min=min(e)
alfa=interval[e==e.min]
prev = x[1]
for (i in 2:length(x)){
prev = c(prev,alfa*x[i-1] + (1-alfa)*prev[i-1])
}
return(list(alfa=alfa,sq2=e.min,prev=prev))
}
40 CAP

ITULO 5. PREVIS

AO
0.2 0.4 0.6 0.8 1.0
1
2
.
0
1
3
.
0
1
4
.
0

S
o
m
a

d
e

q
u
a
d
r
a
d
o
s

d
o
s

e
r
r
o
s
0 10 20 30 40
1
.
5
2
.
0
2
.
5
3
.
0
3
.
5
Amostra
H
o
r
m
o
n
i
o
Figura 5.1: Soma dos quadrados dos erros de previs ao 1 passo a frente em fun c ao
de . Valores observados (pontos) e previs oes 1 passo a frente (linhas) usando o valor
otimo de .
Os gr acos da Figura 5.1 foram obtidos com os comandos abaixo.
data(lh)
data=1871:1970
m = AES(lh,seq(0.1,0.99,0.001))
plot(1:48,m$prev,ylab=Hormonio,xlab=Amostras,type=l)
points(lh)
Exemplo 5.2 : O procedimento do Exemplo 5.1 foi repetido para a serie de
medidas anuais de vaz oes do Rio Nilo entre 1871 e 1970, tambem do banco de
dados do R. Os resultados est ao na Figura 5.2.
5.1.2 Metodo de Holt-Winters
O procedimento de alisamento exponencial pode ser generalizado para series
que contenham tendencia e varia c ao sazonal. Suponha por exemplo que as
observa c oes s ao mensais e sejam L
t
, T
t
e I
t
o nvel, a tendencia e o ndice
sazonal no tempo t. Assim, T
t
e o aumento ou redu c ao esperada por mes no
nvel atual da serie.
5.1. M

ETODOS UNIVARIADOS DE PREVIS

AO 41
0.2 0.4 0.6 0.8 1.0
2
1
0
0
0
0
0
2
5
0
0
0
0
0

S
o
m
a

d
e

q
u
a
d
r
a
d
o
s

d
o
s

e
r
r
o
s
1880 1900 1920 1940 1960
6
0
0
1
0
0
0
1
4
0
0
Anos
V
a
z
o
e
s
Figura 5.2: Soma dos quadrados dos erros de previs ao 1 passo a frente em fun c ao
de . Valores observados (pontos) e previs oes 1 passo a frente (linhas) usando o valor
otimo de
Suponha que no tempo t os termos (L
1
, T
1
, I
1
), . . . , (L
t1
, T
t1
, I
t1
) sejam
conhecidos. Ent ao, ap os observar x
t
os termos L
t
, T
t
e I
t
s ao atualizados
via alisamento exponencial. Se a varia c ao sazonal for multiplicativa, i.e. com
amplitudes que tendem a crescer ao longo do tempo, as equa c oes de atualiza c ao
na forma de recorrencia s ao dadas por
L
t
= (x
t
/I
t12
) + (1 )(L
t1
+T
t1
)
T
t
= (L
t
L
t1
) + (1 )T
t1
I
t
= (x
t
/L
t
) + (1 )I
t12
e as previs oes k perodos ` a frente s ao dadas por
x
t
(k) = (L
t
+kT
t
)I
t12+k
, k = 1, 2, . . . .
No caso de sazonalidade aditiva as equa c oes de atualiza c ao para o nvel e o
ndice sazonal s ao modicadas para
L
t
= (x
t
I
t12
) + (1 )(L
t1
+T
t1
)
I
t
= (x
t
L
t
) + (1 )I
t12
e as previs oes k perodos ` a frente cam
x
t
(k) = L
t
+kT
t
+I
t12+k
, k = 1, 2, . . . .
42 CAP

ITULO 5. PREVIS

AO
Aqui temos par ametros de alisamento, , e , para cada componente
da serie que s ao em geral escolhidos no intervalo (0,1) e podem ser estima-
dos minimizando-se a soma de quadrados dos erros de previs ao como na se c ao
anterior. Aqui vale tambem o coment ario sobre valores pr oximos aos extre-
mos devido ` a soma de quadrados variar pouco nesta regi ao. Alem disso, estes
par ametros n ao dependem da escala das observa c oes mas sim das propriedades
temporais do nvel, tendencia e sazonalidade da serie. Valem os mesmos co-
ment arios sobre estes valores reetindo a inuencia das observa c oes passadas
nas previs oes de cada componente.
Para o caso particular de series sem varia c ao sazonal basta utilizar as
equa c oes para L
t
e T
t
acima (sem o ndice I
t12
). A previs ao k passos ` a frente
no tempo t e simplesmente L
t
+kT
t
.
5.2 Previsao em Modelos ARMA
Em modelos ARMA as previs oes podem ser obtidas usando-se diretamente a
equa c ao do modelo. Assumindo que a equa c ao do modelo seja conhecida a
previs ao x
n
(k) e obtida substituido valores futuros dos erros por zero, valo-
res futuros da serie X
n+1
, X
n+2
, . . . pela sua esperan ca condicional, e valores
passados de X e de pelos seus valores observados.
Tomemos como exemplo o modelo SARIMA(1, 0, 0) (0, 1, 1)
12
. A equa c ao
do modelo e dada por
(1 B)(1 B
12
)X
t
= (1 +B
12
)
t
ou equivalentemente
X
t
= X
t12
+(X
t1
X
t13
) +
t
+
t12
.
Neste caso, as previs oes 1 e 2 passos ` a frente cam
x
n
(1) = x
n11
+(x
n
x
n12
) +
n11
x
n
(2) = x
n10
+( x
n
(1) x
n11
) +
n10
.
Note como o valor futuro X
n+1
foi substitudo na segunda equa c ao pela sua
esperan ca condicional x
n
(1), i.e. a previs ao feita em t = n para t = n + 1.
Previs oes para horizontes maiores podem ser obtidas recursivamente.
No caso de modelos autoregressivos AR(p) n ao e difcil vericar como ca
a fun c ao de previs ao.
x
t
(1) =
1
x
t
+ +
p
x
tp+1
x
t
(2) =
1
x
t
(1) + +
p
x
tp+2
.
.
.
x
t
(p + 1) =
1
x
t
(p) + +
p
x
t
(1)
de modo que as previs oes para horizontes maiores do que p usam apenas as
previs oes anteriores.
5.2. PREVIS

AO EM MODELOS ARMA 43
Para modelos medias m oveis MA(q) tambem n ao e difcil vericar que a
equa c ao de previs ao ca
x
t
(1) =
1

t
+ +
q

tq+1
x
t
(2) =
2

t
+ +
q

tq+2
.
.
.
x
t
(q) =
q

t
x
t
(q +j) = 0, j = 1, 2, . . .
Atualiza cao das Previs oes

E interessante notar tambem como as previs oes podem ser atualizadas conforme
novas observa c oes da serie forem obtidas. Suponha por exemplo que o valor
x
n+1
foi observado. Neste caso a previs ao para t = n + 2 car a condicionada
em x
1
, . . . , x
n
, x
n+1
e pode ser facilmente atualizada para a nova origem n +1.
Para o modelo SARIMA visto acima a previs ao ca
x
n+1
(1) = E(X
n+2
|x
n+1
, . . . , x
1
)
= x
n10
+(x
n+1
x
n11
) +
n10
. (5.3)
Somando e subtraindo x
n
(1) no lado direito de (5.3) obtemos que
x
n+1
(1) = x
n10
+( x
n
(1) x
n11
) +(x
n+1
x
n
(1)) +
n10
= x
n
(2) +(x
n+1
x
n
(1))
ou seja, a previs ao atualizada e a previs ao anterior mais uma propor c ao do erro
de previs ao 1 passo ` a frente em t = n + 1.
Previs oes usando a forma MA
As previs oes tambem podem ser obtidas reescrevendo-se o modelo como um
processo medias m oveis de ordem innita. Neste caso temos que
X
n+k
=
n+k
+
1

n+k1
+ +
k

n
+
k+1

n1
+. . .
e ca claro que a previs ao k passos ` a frente e dada por
x
n
(k) =
k

n
+
k+1

n1
+. . . . (5.4)
Note que apenas os valores
n
,
n1
, . . . foram utilizados j a que a esperan ca
dos valores futuros e igual a zero. Esta forma e particularmente util para o
c alculo da vari ancia do erro de previs ao. Da equa c ao (5.4) obtemos que o erro
de previs ao k passos ` a frente e dado por
x
n+k
x
n
(k) =
n+k
+
1

n+k1
+ +
k1

n+1
e portanto a vari ancia do erro de previs ao e dada por
V ar(e
t+k
) = (1 +
2
1
+ +
2
k1
)
2

.
44 CAP

ITULO 5. PREVIS

AO
O ponto importante a se notar aqui e que, para
2

xo, a vari ancia do erro


de previs ao aumenta com o horizonte de previs ao. Na pr atica, isto signica ter
mais conan ca em previs oes de curto prazo do que em previs oes de longo prazo.
Ate agora n ao haviamos assumido nenhuma distribui c ao de probabilidade
para os erros. Assumindo tambem que a sequencia {
t
} seja normalmente distri-
buida pode-se construir intervalos de conan ca para X
t+k
simetricos em torno
das previs oes. Estes s ao chamados intervalos de previs ao e s ao dados por
x
t
(k) z
/2

1 +
k1

j=1

2
j

E claro que neste caso a hip otese de normalidade precisa ser checada.
Finalmente, vale notar que na pr atica os par ametros do modelo n ao s ao
conhecidos de forma exata e precisam ser estimados. Os valores passados dos
erros
t
tambem precisam ser estimados como erros de previs ao um passo ` a
frente. Assim, por exemplo para o modelo SARIMA(1, 0, 0) (0, 1, 1)
12
visto
acima teremos que
x
n
(1) = x
n11
+ (x
n
x
n12
) +


n11
onde o erro de previs ao 1 passo ` a frente em n 11 e dado por

n11
= x
n11
x
n12
(1).
Exemplo 5.3 : A Figura 5.3 mostra uma serie temporal com os totais mensais
de mortes por acidente nos Estados Unidos entre janeiro de 1973 e dezembro
de 1978. Suponha que foi identicado o modelo SARIMA(0,1,1)x(0,1,1). Ap os
a estima c ao, an alise de resduos e verica c ao da adequa c ao do modelo foram
feitas previs oes para o ano de 1979, i.e. previs oes 1, 2, . . . , 12 passos ` a frente.
Em julho de 1979 os valores para os primeiros 6 meses daquele ano foram
disponibilizados e aparecem na Figura 5.4 juntamente com as previs oes. Note
como os valores observados caram dentro dos intervalos de previs ao fornecendo
assim indica c ao de que o modelo teve uma boa performance preditiva. Sendo
assim, uma estrategia inicial para o segundo semestre de 1979 consiste em
simplesmente atualizar as previs oes.
Os comandos do R para este exemplo s ao dados a seguir.
data(USAccDeaths)
fit = arima(USAccDeaths, order = c(0,1,1),
seasonal = list(order=c(0,1,1)))
pacc = predict(fit, n.ahead = 12, se.fit=T)
plot(ts(c(USAccDeaths,pacc$pred), frequency=12, start=c(1973,1)))
abline(v=1979-1/12, lty=2)
lines(pacc$pred + 1.96*pacc$se, col=2)
lines(pacc$pred - 1.96*pacc$se, col=2)
obs79 = c(7798, 7406, 8363, 8460, 9217, 9316)
points(1979+(0:5)/12, obs79, pch=*,cex=2,col="blue")
5.2. PREVIS

AO EM MODELOS ARMA 45
Anos
N
u
m
e
r
o

d
e

m
o
r
t
e
s
1973 1974 1975 1976 1977 1978 1979
7
0
0
0
8
0
0
0
9
0
0
0
1
0
0
0
0
1
1
0
0
0
Figura 5.3: Totais mensais de mortes por acidente nos Estados Unidos entre janeiro
de 1973 e dezembro de 1978.
Transforma c oes
Em muitas aplica c oes a serie modelada e na verdade uma transforma c ao dos
dados originais, sendo a transforma c ao logaritmica a mais usual. Assim, tanto
as previs oes pontuais quanto os intervalos de previs ao s ao obtidos para a serie
transformada e estes valores precisam ser transformados novamente para a es-
cala original. A abordagem mais simples (e geralmente adotada) consiste sim-
plesmente em tomar a transforma c ao inversa, por exemplo se um modelo foi
ajustado para a serie X
t
= log Y
t
ent ao y
n
(k) = exp( x
n
(k)) e a previs ao k passos
a frente da serie original. No entanto deve-se ter em mente que estas previs oes
via transforma c ao inversa s ao em geral viesadas. Felismente os intervalos de
previs ao tem boas propriedades e por exemplo quanto se toma o anti-logaritmo
dos limites
x
n
(k) z
/2

var(e
n+k
)
obtem-se um intervalo (geralmente assimetrico) de 100(1)% para a previs ao
pontual y
n
(k).
Exemplo 5.4 : Considere novamente a serie AirPassengers e fa ca trans-
forma c ao logaritmica nos dados (conforme sugerido na literatura). Estime um
modelo SARIMA(0,1,1)x(0,1,1) usando os dados ate dezembro de 1960 e fa ca
previs oes de 1 ate 12 meses ` a frente para o ano de 1961 nas 2 escalas. As pre-
vis oes e intervalos de previs ao na escala transformada s ao dados na Tabela 5.1,
enquanto as previs oes, intervalos de previs ao e suas semi-amplitudes na escala
original s ao dadas na Tabela 5.2.
46 CAP

ITULO 5. PREVIS

AO
Anos
N
u
m
e
r
o

d
e

m
o
r
t
e
s
1973 1975 1977 1979
7
0
0
0
8
0
0
0
9
0
0
0
1
0
0
0
0
1
1
0
0
0
*
*
*
*
*
*
Figura 5.4: Previs oes para 1979 com observa c oes do primeiro semestre incluidas.
5.3 Performance Preditiva
A ideia de vericar a adequa c ao de um modelo em termos dos erros de pre-
vis ao um passo ` a frente foi apresentada na Se c ao 4.6. Na pr atica e preciso
vericar se os resduos se comportam de maneira aleat oria (ou imprevisvel) em
torno de zero e com vari ancia aproximadamente constante, alem de serem n ao
correlacionados ao longo do tempo.
Alem disso, dois ou mais modelos podem ser comparados segundo a sua
performance preditiva, ou seja construindo-se medidas baseadas nos erros de
previs ao. A maioria dos metodos de previs ao baseia-se na ideia de minimi-
zar somas de quadrados ou de valores absolutos dos erros de previs ao e esta e
tambem uma medida usada para comparar a adequa c ao de modelos alternati-
vos. A ideia ent ao e comparar o erro quadr atico medio

e
2
t
/(n m) ou erro
absoluto medio

|e
t
|/(n m) para diferentes modelos, onde m e o n umero de
par ametros a serem estimados.
Uma estrategia simples de se fazer previs oes consiste em tomar a observa c ao
mais recente como a melhor previs ao de um valor futuro da serie, i.e. x
t
(1) = x
t
.
Note que esta e a previs ao 1 passo ` a frente de um passeio aleat orio. Assim, uma
forma de medir a capacidade preditiva de um model consiste em comparar seus
erros de previs ao com aqueles do passeio aleat orio. Isto pode ser feito atraves
da chamada estatstica U de Theil denida como
U =

n1
t=1
(x
t+1
x
t
(1))
2

n1
t=1
(x
t+1
x
t
)
2
.
5.4. CRIT

ERIOS DE INFORMAC

AO 47
Tabela 5.1: Previs oes e limites inferior (li) e superior (ls) dos intervalos de previs ao.
previs ao li ls
Jan 1961 6.110186 6.036754 6.183617
Fev 1961 6.053775 5.968209 6.139341
Mar 1961 6.171715 6.075533 6.267896
Abr 1961 6.199300 6.093564 6.305037
Mai 1961 6.232556 6.118059 6.347053
Jun 1961 6.368779 6.246145 6.491412
Jul 1961 6.507294 6.377031 6.637556
Ago 1961 6.502906 6.365438 6.640375
Set 1961 6.324698 6.180382 6.469014
Out 1961 6.209008 6.058156 6.359860
Nov 1961 6.063487 5.906370 6.220604
Dez 1961 6.168025 6.004883 6.331166
Note que valores maiores do que 1 s ao uma indica c ao de que globalmente
os erros de previs ao tendem a ser grandes em rela c ao aos erros de um passeio
aleat orio. Esta n ao e uma boa caracterstica e gostariamos que o valor de U
fosse sempre menor do que 1. Vale notar tambem que neste caso os erros de
previs ao est ao sendo avaliados independente da escala dos dados.
Finalmente, vale notar que todas as medidas de capacidade preditiva citadas
podem ser estendidas para erros de previs ao k passos a frente.
Outra pr atica comum em series temporais consiste em estimar o modelo
excluindo algumas observa c oes nais e usar o modelo estimado para fazer pre-
vis oes. Neste caso as previs oes podem ser comparadas com os valores obser-
vados. Por exemplo, para uma serie mensal observada ao longo de 5 anos
poderia-se estimar o modelo identicado usando os primeiros 4 anos e meio (54
observa c oes) e fazer previs oes para os ultimos 6 meses.
5.4 Criterios de Informa cao
Em muitas aplica c oes v arios modelos podem ser julgados adequados em ter-
mos do comportamento dos resduos. Uma forma de discriminar entre estes
modelos competidores e utilizar os chamados criterios de informa c ao que levam
em conta n ao apenas a qualidade do ajuste mas tambem penalizam a inclus ao
de par ametros extras. Assim, um modelo com mais par ametros pode ter um
ajuste melhor mas n ao necessariamente ser a prefervel em termos de criterio
de informa c ao. A regra b asica consiste em selecionar o modelo cujo criterio de
informa c ao calculado seja mnimo.
A regra mais utilizada em series temporais e o chamado criterio de in-
forma c ao de Akaike, denotado por AIC. A deni c ao mais comumente utilizada
48 CAP

ITULO 5. PREVIS

AO
Tabela 5.2: Previs oes, limites inferior (li) e superior (ls) e semi-amplitudes dos inter-
valos de previs ao.
prev li ls prev-li ls-prev
Jan 1961 450.4224 418.5325 484.7421 31.88989 34.31973
Feb 1961 425.7172 390.8053 463.7479 34.91191 38.03070
Mar 1961 479.0068 435.0815 527.3668 43.92531 48.35996
Apr 1961 492.4045 442.9974 547.3219 49.40709 54.91741
May 1961 509.0550 453.9826 570.8081 55.07236 61.75316
Jun 1961 583.3449 516.0199 659.4539 67.32507 76.10897
Jul 1961 670.0108 588.1790 763.2276 81.83178 93.21682
Aug 1961 667.0776 581.3992 765.3821 85.67843 98.30451
Sep 1961 558.1894 483.1767 644.8476 75.01262 86.65824
Oct 1961 497.2078 427.5862 578.1656 69.62164 80.95777
Nov 1961 429.8720 367.3703 503.0072 62.50164 73.13521
Dec 1961 477.2426 405.4037 561.8114 71.83882 84.56888
e
AIC = 2 log verossimilhan ca maximizada + 2m
1
onde m e o n umero de par ametros (em modelos ARMA(p, q) m = p + q +
1). Para dados normalmente distribuidos e usando-se estimativas de m axima
verossimilhan ca para os par ametros pode-se mostrar que
AIC = nlog(
2

) + 2m
onde
2

= (1/n)


2
t
.
Existem outros criterios de informa c ao que s ao basicamente modica c oes
do AIC na forma de penalizar a inclus ao de par ametros extras. O mais famoso
deles e o criterio de informa c ao Bayesiano, denotado por BIC e dado por
BIC = 2 log verossimilhan ca maximizada +m+mlog n.
Note como este criterio penaliza bem mais a inclus ao de par ametros do que o
AIC.

E sempre bom lembrar que estas medidas n ao tem nenhum signicado


quando olhadas individualmente, i.e. considerando-se um unico modelo. Assim,
tanto o AIC quanto o BIC podem assumir valores quaisquer, inclusive valores
negativos, j a que eles dependem da forma da fun c ao de verossimilhan ca.
Vale lembrar tambem que ao usar tais criterios para comparar modelos a
estima c ao precisa ser feita no mesmo perodo amostral de modo que os modelos
sejam compar aveis. Note tambem que aumentando-se o n umero de termos
autoregressivos e/ou medias m oveis, o valor de k aumenta. Assim se a inclus ao
de termos adicionais no modelo n ao melhorar sensivelmente o ajuste, ent ao o
AIC e o BIC (e qualquer outro criterio) ser ao maiores.
Para uma revis ao geral destes e outros criterios de informa c ao no contexto
de series temporais ver por exemplo Priestley (1981), Captulo 5.
1
O fator 2 e somente uma conven c ao e n ao ir a alterar a sele c ao do modelo.
5.4. CRIT

ERIOS DE INFORMAC

AO 49
Identica cao Revisitada
Vimos que as duas ferramentas b asicas para identica c ao de modelos da classe
ARIMA s ao as autocorrela c oes e autocorrela c oes parciais amostrais. Esta etapa
envolve algum grau de arbitrariedade por parte do pesquisador ao interpretar
estas fun c oes, i.e. comparar subjetivamente seus valores amostrais com os cor-
respondentes valores te oricos.
Uma abordagem alternativa consiste em usar os criterios de informa c ao de
um forma mais abrangente. Neste caso, um conjunto de possveis modelos com-
petidores e denido a priori e aquele que minimiza o AIC ou BIC e selecionado.
Por exemplo, modelos ARMA(p, q) podem ser estimados sequencialmente va-
riando os valores de p e q entre 0 e 3 digamos. Note que neste caso teremos
16 possveis modelos sendo comparados e os criterios de informa c ao s ao agora
fun c oes de p e q. Analogamente, para modelos AR(p) podemos variar o valor
de p, digamos entre 0 e 10.
Na pr atica este procedimento pode ser aplicado de forma semi-autom atica j a
que muitos pacotes estatsticos fornecem estes valores. Porem ap os um modelo
ser selecionado a an alise residual ainda deve ser feita antes de se passar ` a etapa
das previs oes.
Outro problema de ordem pr atica e que pode haver dois ou mais modelos
com AIC e/ou BIC muito similares de modo que n ao seja trivial discriminar
entre eles. Nestas situa c oes Burnham and Anderson (1998), Se c ao 4.2, sugerem
o uso de pesos que s ao obtidos subtraindo-se o valor associado com o melhor
modelo. Os pesos relativos ao AIC s ao dados por
w
k
exp(AIC(k)/2)
onde AIC(k) = AIC(k)min(AIC) e k e a ordem do modelo. Estes pesos s ao
ent ao normalizados para somarem 1 de modo que 0 < w
k
< 1 e a compara c ao
entre os modelos ca mais f acil. Se M e o n umero total de modelos a compara c ao
e ent ao baseada em
w

i
=
w
i

M
j=1
w
j
, i = 1, . . . , M.
Por exemplo, para modelos AR(p) os pesos relativos ao AIC s ao dados por
w
p
exp(AIC(p)/2), p = 0, . . . , p
max
onde AIC(p) = AIC(p) min(AIC).
Exemplo 5.5 : Na Figura 5.5 e apresentada a serie com os totais anuais de
linces canadenses capturados em armadilhas entre 1821 e 1934. Estes dados tem
sido modelados na literatura ap os uma transforma c ao que consiste em tomar
o logaritmo na base 10 e subtrair a media dos dados transformados. Vamos
ajustar modelos AR(p) com p variando de 1 ate 5 e calcular os criterios de
informa c ao e os respectivos pesos para cada modelo. Os resultados est ao na
Tabela 5.3. Note que h a falta de concord ancia entre os criterios de informa c ao
quanto ao melhor modelo. Isto pode ser uma indica c ao de que na verdade h a 2
50 CAP

ITULO 5. PREVIS

AO
modelos descrevendo bem os dados. Outro problema e que o AIC seleciona um
modelo com o valor m aximo de p e isto pode indicar a necessidade de considerar
mais termos autoregressivos. Repetindo o exercicio com p variando de 1 a 15
obteve-se a Tabela 5.4.
0 20 40 60 80 100
-
1
.
0
-
0
.
5
0
.
0
0
.
5
1
.
0
Figura 5.5: Totais anuais de linces canadenses capturados em armadilhas entre 1821
e 1934.
Tabela 5.3: Criterios de informa c ao AIC e BIC e respectivos pesos para modelos
AR(p) ajustados a serie Lynx.
p AIC pesos AIC BIC pesos BIC
1 242.3913 0.000 234.9189 0.000
2 333.0988 0.106 321.8902 0.814
3 332.7283 0.088 317.7835 0.104
4 335.6596 0.380 316.9786 0.070
5 335.8881 0.426 313.4709 0.012
5.4. CRIT

ERIOS DE INFORMAC

AO 51
Tabela 5.4: Criterios de informa c ao AIC e BIC e respectivos pesos para modelos
AR(p) ajustados a serie Lynx.
p AIC pesos AIC BIC pesos BIC
1 242.3913 0.0000 234.9189 0.0000
2 333.0988 0.0000 321.8902 0.8100
3 332.7283 0.0000 317.7835 0.1039
4 335.6596 0.0000 316.9786 0.0695
5 335.8881 0.0000 313.4709 0.0120
6 334.4484 0.0000 308.2950 0.0009
7 338.8427 0.0001 308.9531 0.0013
8 338.8505 0.0001 305.2247 0.0002
9 338.3849 0.0001 301.0229 0.0000
10 341.8678 0.0006 300.7696 0.0000
11 354.5690 0.3581 309.7346 0.0019
12 354.7117 0.3846 306.1411 0.0003
13 353.0609 0.1685 300.7541 0.0000
14 351.0895 0.0629 295.0465 0.0000
15 349.2335 0.0249 289.4543 0.0000
52 CAP

ITULO 5. PREVIS

AO
Os comandos do R utilizados no exemplo 5.5 seguem abaixo.
data(lynx)
y = log10(lynx)
x = y-mean(y)
p = 1:15
n = length(x)
crit = matrix(0, nrow = length(p), ncol=5)
colnames(crit) = c("p", "AIC", "pesos AIC", "BIC", "pesos BIC")
crit[,1] = p
for (k in p){
ar = arima(x, order = c(k,0,0), include.mean=F)
crit[k,2] = n*log(ar$sigma2) + 2*(k+1)
crit[k,4] = n*log(ar$sigma2) + (k+1)+(k+1)*log(n)
}
aicp = exp(-(crit[,2]-min(crit[,2]))/2)
bicp = exp(-(crit[,4]-min(crit[,4]))/2)
crit[,3] = aicp/sum(aicp)
crit[,5] = bicp/sum(bicp)
round(crit,4)
Finalmente vale notar que se o n umero de modelos candidatos for muito
grande e a serie analisada muito longa o custo computacional deste metodo
pode ser muito alto. Pox exemplo, em modelos SARIMA com p
max
= q
max
= 5,
P
max
= Q
max
= 2 e d
max
= D
max
= 2 teremos mais de 500 modelos candida-
tos, sem contar possveis transforma c oes nos dados, diferentes distribui c oes dos
erros, presen ca de dados discrepantes, altera c oes estruturais, etc.
5.5 Previs oes Usando Todos os Modelos
Suponha que existem k modelos candidatos denotados por M
1
, M
2
, . . . , M
k
e deseja-se fazer a previs ao de X
n+h
. Tratando tanto X
n+h
quanto M
i
como
vari aveis aleat orias ent ao pelas regras de esperan ca condicional segue que
E(X
n+h
|x) =
k

i=1
E(X
n+h
|x, M
i
)P(M
i
|x).
A mesma l ogica se aplica a qualquer fun c ao de X
n+h
, em particular
E(X
2
n+h
|x) =
k

i=1
E(X
2
n+h
|x, M
i
)P(M
i
|x).
5.5. PREVIS

OES USANDO TODOS OS MODELOS 53


que pode ser usado para quanticar a incerteza sobre X
n+h
.
Um procedimento para fazer previs oes usando todos os modelos estimados
consiste em substituir as probabilidades P(M
i
|x) pelos pesos w
i
padronizados.
Por exemplo, para modelos autoregressivos se k
max
e o n umero m aximo de
defasagens ent ao
E(X
n+h
|x) =
kmax

i=1
E(X
n+h
|x, AR(i))w
i
.
Exerccios
1. Seja o modelo MA(1), X
t
=
t
+
t1
.
(a) Obtenha a previs ao 1 passo ` a frente em t = n e mostre que as
previs oes k passos ` a frente para k = 2, 3, . . . s ao iguais a zero.
(b) Mostre que a vari ancia do erro de previs ao k passos ` a frente e dada
por
2

para k = 1 e (1 +
2
)
2

para k 2.
2. Seja o modelo AR(1), X
t
= X
t1
+
t
.
(a) Mostre que a previs ao k passos ` a frente feita em t = n e dada por

k
x
n
.
(b) Mostre que a vari ancia do erro de previs ao k passos ` a frente e dada
por
2

(1
2k
)/(1
2
).
3. Para o modelo SARIMA(0, 0, 1)(1, 1, 0)
12
obtenha as previs oes no tempo
t = n para ate 12 perodos ` a frente em termos das observa c oes e residuos
ate o tempo t = n.
4. Seja o modelo (1 B)(1 0, 2B)X
t
= (1 0, 5B)
t
.
(a) Obtenha as previs oes 1 e 2 passos ` a frente.
(b) Mostre que as previs oes 3 ou mais passos ` a frente s ao dadas pela
equa c ao recursiva x
n
(k) = 1, 2 x
n
(k 1) 0, 2 x
n
(k 2).
(c) Obtenha a vari ancia dos erros de previs ao 1, 2 e 3 passos ` a frente.
(d) Obtenha a previs ao x
n
(2) e o erro padr ao do erro de previs ao sabendo
que
n
= 1, x
n
= 4, x
n1
= 3 e
2

= 2.
5. Seja o modelo ARIMA(1,0,1) para uma serie X
t
com media zero.
(a) Reescreva o modelo na forma de choques aleat orios, i.e.
X
t
=
t
+
1

t1
+
2

t2
+. . .
obtendo uma express ao geral para os coecientes
j
.
(b) Escreva a express ao da vari ancia do erro de previs ao e
t
(k) = x
t+k

x
t
(k).
(c) Obtenha as previs oes x
t
(k) para horizontes k = 1 e k > 1.
54 CAP

ITULO 5. PREVIS

AO
6. Sabe-se que se Y N(,
2
) ent ao X = exp(Y ) tem distribui c ao log-
normal com E(X) = exp( +
2
/2) e V ar(X) = exp(2 +
2
)(exp(
2
)
1). Se foram obtidas as previs oes k passos ` a frente de Y
t
= log(X
t
) e
assumindo que Y
t
e normal mostre que as previs oes na escala original s ao
dadas por

X
t
(k) = exp(

Y
t
(k) +V
y
(k)/2)
com vari ancia
exp(2

Y
t
(k) +V
y
(k)) [exp(V
y
(k)) 1].
7. Deseja-se ajustar um modelo ARMA a uma serie temporal estacion aria
mas os gr acos das fun c oes de autocorrela c ao e autocorrela c ao parcial s ao
pouco informativos. Descreva um procedimento de identica c ao alterna-
tivo (voce tem um pacote estatstico para fazer as contas).
5.6 Modelando a Variancia
Nos modelos vistos ate aqui a vari ancia dos erros foi assumida constante ao
longo do tempo, i.e. V ar(
t
) = E(
2
t
) =
2

. Muitas series temporais no entanto


exibem perodos de grande volatilidade seguidos de perodos de relativa tran-
quilidade. Neste casos, a suposi c ao de vari ancia constante (homocedasticidade)
pode n ao ser apropriada. Na verdade, embora a vari ancia incondicional dos
erros ainda possa ser assumida constante, sua vari ancia condicional pode estar
mudando ao longo do tempo.
Alem disso, em muitas situa c oes pr aticas tem-se interesse em prever a
vari ancia condicional da serie alem da serie propriamente dita. Por exemplo,
no mercado de a c oes o interesse e n ao apenas prever a taxa de retorno mas
tambem a sua vari ancia ao longo de um certo perodo. Esta vari ancia condici-
onal e tambem chamada de volatilidade.
Exemplo 5.6 : Na Figura 5.6 os gr acos da esquerda apresentam as taxas
de c ambio di arias da Libra Esterlina, Dolar Canadense, Marco Alem ao e Iene
Japones, em rela c ao ao Dolar Americano, enquanto nos gr acos da direita est ao
os logaritmos das taxas de varia c ao (retornos di arios). O perodo amostral vai
de janeiro de 1991 a dezembro de 1998. Uma caracterstica comum nestes
retornos e que embora as medias pare cam ser aproximadamente constantes as
vari ancias mudam ao longo do tempo.
A ideia aqui e tentar modelar simultaneamente a media e a vari ancia de
uma serie temporal. Para xar ideias, suponha que um modelo AR(1), X
t
=
X
t1
+
t
foi estimado e deseja-se fazer previs oes 1 passo ` a frente,
x
t
(1) = E(X
t+1
|x
t
) = x
t
.
A vari ancia condicional de X
t+1
e dada por
V ar(X
t+1
|x
t
) = V ar(
t+1
|x
t
) = E(
2
t+1
|x
t
).
5.6. MODELANDO A VARI

ANCIA 55
0
.
5
0
0
.
5
5
0
.
6
0
0
.
6
5
0
.
7
0
y
.
B
R
I
T
P
U
S
1
.
2
1
.
3
1
.
4
1
.
5
y
.
C
D
N
D
L
U
S
1
.
4
1
.
5
1
.
6
1
.
7
1
.
8
1
.
9
y
.
G
E
R
M
D
U
S
8
0
9
0
1
0
0
1
1
0
1
2
0
1
3
0
1
4
0
y
.
J
A
P
Y
N
U
S
0 500 1000 1500 2000

0
.
0
3

0
.
0
1
0
.
0
0
0
.
0
1
0
.
0
2
0
.
0
3
z
.
B
R
I
T
P
U
S

0
.
0
1
5

0
.
0
0
5
0
.
0
0
5
0
.
0
1
5
z
.
C
D
N
D
L
U
S

0
.
0
3

0
.
0
2

0
.
0
1
0
.
0
0
0
.
0
1
0
.
0
2
0
.
0
3
z
.
G
E
R
M
D
U
S

0
.
0
4

0
.
0
2
0
.
0
0
0
.
0
2
z
.
J
A
P
Y
N
U
S
0 500 1000 1500 2000
Figura 5.6: Taxas de c ambio e retornos di arios em rela c ao ao Dolar Americano da
Libra Esterlina, Dolar Canadense, Marco Alem ao e Iene Japones, entre janeiro de 1991
a dezembro de 1998.
Ate agora assumimos que E(
2
t+1
|x
t
) =
2

, mas suponha que a vari ancia condi-


cional n ao seja constante, i.e. E(
2
t+1
|x
t
) =
2
t
. Uma possvel causa disto e que
os dados se distribuem com caudas muito longas.
Exemplo 5.7 : Na Figura 5.7 est ao os histogramas com uma curva normal
superimposta para os mesmos dados (retornos) do exemplo anterior. Pode-se
notar que muitos valores aparecem nas caudas das distribui c oes e este fato deve
ser levado em conta pelo modelo.
O Modelo ARCH(1)
Existem v arias formas de especicar como a vari ancia condicional (volatilidade)
varia com o tempo. Uma estrategia utilizada para modelar
2
t
, proposta em
Engle (1982), consiste em assumir que ela depende dos quadrados dos erros
56 CAP

ITULO 5. PREVIS

AO
0.03 0.01 0.01 0.02 0.03
0
2
0
4
0
6
0
8
0
0.015 0.005 0.005 0.015
0
5
0
1
0
0
1
5
0
0.03 0.01 0.01 0.02 0.03
0
2
0
4
0
6
0
0.06 0.04 0.02 0.00 0.02
0
1
0
2
0
3
0
4
0
5
0
6
0
Figura 5.7: Histogramas dos retornos di arios do Exemplo 5.6.
passados,
t1
,
t2
, . . . atraves de uma autoregress ao. No caso mais simples,
faz-se

t
= v
t

c +
2
t1
(5.5)
onde {v
t
} e uma serie puramente aleat oria com media zero e vari ancia igual a
1 e v
t
e
t
s ao independentes. Segue que a esperan ca condicional e zero e a
vari ancia condicional e dada por

2
t
= E(
2
t
|
t1
) = c +
2
t1
. (5.6)
Neste caso dizemos que a vari ancia segue um processo autoregressivo condicio-
nalmente heteroced astico de ordem 1, ARCH(1). Note que e necess ario impor
as restri c oes c > 0 e 0 para que
2
t
seja sempre positiva. Quando = 0
a vari ancia condicional e constante e
t
e um processo condicionalmente homo-
ced astico.
Alem disso queremos garantir a estacionariedade da autoregress ao de modo
que a restri c ao imposta e 0 < < 1. Note tambem que (5.6) n ao inclui um
5.6. MODELANDO A VARI

ANCIA 57
termo de erro e portanto n ao e um processo estoc astico.
Exemplo 5.8 : Para ilustra c ao a Figura 5.8 apresenta dois processos ARCH
de ordem 1 simulados a partir de uma sequencia {v
t
} de 100 n umeros aleat orios
i.i.d. gerados de uma distribui c ao N(0, 1). A sequencia {
t
} foi construida
usando a equa c ao (5.5) com c = 1 e = 0, 8. Note como a sequencia {
t
}
continua tendo media zero mas parece ter tido um aumento de volatilidade
em alguns perodos. Em um modelo AR(1), a forma como esta estrutura nos
erros afeta a serie original depende do valor do par ametro autoregressivo e
duas possveis situa c oes s ao mostradas nos gr acos inferiores da gura. Na
Figura 5.9 temos o histograma dos valores {
t
} gerados, com uma curva normal
superimposta, alem do gr aco de probabilidades normais (QQ-plot normal).
Note como h a um excesso de valores nas caudas ocorrendo com uma frequencia
maior do que seria esperado na distribui c ao normal.
processo aleatrio
0 20 60 100

5
0
5
1
0
(t) = v(t) 1 + 0.8(t 1)
2
0 20 60 100

5
0
5
1
0
x(t) = 0.5x(t 1) + (t)
0 20 60 100

5
0
5
1
0
x(t) = 0.9x(t 1) + (t)
0 20 60 100

5
0
5
1
0
Figura 5.8: Processos autoregressivos com erros ARCH(1) simulados.
Basicamente a equa c ao (5.6) nos diz que erros grandes (ou pequenos) em
valor absoluto tendem a ser seguidos por erros grandes (ou pequenos) em valor
absoluto. Portanto o modelo e adequado para descrever series aonde a volatili-
dade ocorre em grupos.
58 CAP

ITULO 5. PREVIS

AO
d
e
n
s
i
d
a
d
e
s
10 5 0 5 10
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
0
.
2
0
2 1 0 1 2

5
0
5
1
0
QQ plot Normal
quantis teoricos
q
u
a
n
t
i
s

a
m
o
s
t
r
a
i
s
Figura 5.9: Caracteristicas de um processo ARCH(1) simulado.
Alem disso, na equa c ao (5.6) somando
2
t
e subtraindo
2
t
de ambos os lados
obtemos que

2
t
= c +
2
t1
+
t
com
t
=
2
t

2
t
=
2
t
(v
2
t
1). Ou seja, o modelo ARCH(1) pode ser reescrito
como um AR(1) estacion ario para
2
t
com erros n ao normais (v
2
t

2
1
) que tem
media zero e vari ancia n ao constante.
Se o processo ARCH(1) for estacion ario pode-se mostrar que o coeciente
de curtose e dado por
=
3(1
2
)
1 3
2
que e sempre maior do que 3 (a curtose da distribui c ao normal). Ou seja,
processos ARCH(1) tem caudas mais pesadas do que a distribui c ao normal e
s ao portanto adequados para modelar series temporais com esta caracterstica.
5.6. MODELANDO A VARI

ANCIA 59
O Modelo ARCH(p)
Estas ideias podem ser generalizadas para processos mais gerais ARCH(p) em
que a vari ancia condicional depende dos quadrados de p erros passados, i.e.

t
= v
t

c +
1

2
t1
+ +
p

2
tp
(5.7)
e ent ao a vari ancia condicional e modelada como,

2
t
= E(
2
t
|
t1
, . . . ,
tp
) = c +
1

2
t1
+ +
p

2
tp
.
Neste caso, para garantir que
2
t
seja sempre positiva e necess ario impor a
seguintes restri c oes c > 0 e
1
0, . . . ,
p
0 e para garantir estacionariedade
e necess ario tambem que as razes de 1
1
B
p
B
p
= 0 estejam fora do
crculo unit ario. Juntando estas restri c oes equivale a impor a restri c ao c > 0 e

p
i=1

i
< 1.
Analogamente podemos reescrever o modelo ARCH(p) como um modelo
AR(p) para
2
t
denindo os erros
t
como anteriormente, i.e.

2
t
= c +
1

2
t1
+ +
p

2
tp
+
t
.
As previs oes para a volatilidade podem ser obtidas recursivamente
utilizando-se o modelo ARCH(p). Por exemplo, a previs ao 1 passo ` a frente
no tempo t e dada por

2
t
(1) = c +
1

2
t
+ +
p

2
tp+1
Identica cao
A caracterstica chave dos modelos ARCH e que a vari ancia condicional dos
erros
t
se comporta como um processo autoregressivo. Portanto deve-se esperar
que os resduos de um modelo ARMA ajustado a uma serie temporal observada
tambem sigam este padr ao caracterstico. Em particular, se o modelo ajustado
for adequado ent ao a fac e a facp dos resduos devem indicar um processo
puramente aleat orio, no entanto se a fac dos quadrados dos resduos,
2
t
, tiver
um decaimento caracterstico de uma autoregress ao isto e uma indica c ao de
que um modelo ARCH pode ser apropriado. A ordem p do modelo pode ser
identicada atraves da facp dos quadrados dos resduos.
5.6.1 Modelos GARCH
Uma generaliza c ao natural dos modelos ARCH consiste em assumir que a
vari ancia condicional se comporta como um processo ARMA, i.e. depende
tambem de seus valores passados. Fazendo
t
= v
t

h
t
onde
h
t
= c +
p

i=1

2
ti
+
q

j=1

j
h
tj
segue que a esperan ca condicional de
t
e zero e a vari ancia condicional e

2
t
= h
t
. Este modelo e chamado ARCH generalizado, ou GARCH, de ordem
60 CAP

ITULO 5. PREVIS

AO
(p, q). Aqui as restri c oes impostas sobre os par ametros s ao dadas por c > 0 e

p
i=1

i
+

q
j=1

j
< 1.
Embora a primeira vista pare ca um modelo mais complexo, sua vantagem
sobre os modelos ARCH e basicamente a parcim onia. Assim como um modelo
ARMA pode ser mais parcimonioso no sentido de apresentar menos par ametros
a serem estimados do que modelos AR ou MA, um modelo GARCH pode ser
usado para descrever a volatilidade com menos par ametros do que modelos
ARCH.
Em termos de identica c ao dos valores de p e q as ferramentas b asicas s ao
mais uma vez a fac e a facp dos quadrados dos resduos. Assim, se o modelo
ajustado for adequado a fac e a facp dos resduos devem indicar um processo
puramente aleat orio, no entanto quando estas fun c oes s ao aplicadas aos quadra-
dos dos resduos elas devem indicar um processo ARMA(p, q). A identica c ao
pode n ao ser muito f acil em algumas aplica c oes embora na maioria dos casos um
modelo GARCH(1,1) seja suciente. Na pr atica recomenda-se tambem tentar
outros modelos de ordem baixa como GARCH(1,2) e GARCH(2,1).
As previs oes da volatilidade em modelos GARCH s ao obtidas de forma
similar a de um modelo ARMA. Por exemplo, ap os estimar os par ametros de
um modelo GARCH(1,1) e assumindo-se que
0
= h
0
= 0 pode-se construir as
sequencias
1
, . . . ,
t
e h
1
, . . . , h
t
e a previs ao 1 passo ` a frente da volatilidade
ca

2
t
(1) = c +
2
t
+h
t
5.6.2 Adequa cao
Se um modelo ARCH ou GARCH foi ajustado a uma serie X
t
n ao correlacionada
ent ao os resduos padronizados s ao dados por

X
t
=
X
t

h
t
e formam uma sequencia i.i.d. com distribui c ao normal padr ao. Assim, a ade-
qua c ao do modelo pode ser vericada aplicando os testes usuais de normalidade
a estes residuos padronizados e os testes de aleatoriedade (Box-Pierce e Ljung-
Box) aos quadrados dos resduos.
Exemplo 5.9 : Na parte superior da Figura 5.10 est ao os pre cos di arios no
fechamento de um indice de mercado da Alemanha (DAX), entre 1991 e 1998.
O interesse e em analisar os chamados retornos dados por log(x
t
/x
t1
) e estes
est ao no gr aco inferior da Figura 5.10. Existe evidencia na literatura que
modelos GARCH(1,1) conseguem captar bem os movimentos caractersticos
dos retornos.
Usando a fun c ao garch no pacote tseries do R o modelo ajustado obtido
foi
Y
t
= v
t

h
t
, v
t
N(0, 1)
h
t
= 0.000005 + 0.068Y
2
t1
+ 0.889h
t1
5.6. MODELANDO A VARI

ANCIA 61
D
A
X
1992 1993 1994 1995 1996 1997 1998
2
0
0
0
3
0
0
0
4
0
0
0
5
0
0
0
6
0
0
0
R
e
t
o
r
n
o
s

D
A
X
1992 1993 1994 1995 1996 1997 1998

0
.
1
0

0
.
0
5
0
.
0
0
0
.
0
5
Figura 5.10: Pre cos di arios no fechamento de um indice de mercado da Alemanha
(DAX), entre 1991 e 1998 e respectivos retornos.
sendo todos os coecientes signicativos. O teste de Ljung-Box aplicado nos
quadrados dos residuos indicou aleatoriedade (p-valor = 0,71), no entanto o
teste de normalidade de Jarque-Bera aplicado aos residuos rejeitou a hip otese
nula (p-valor<0,001). Assim a hip otese de normalidade condicional parece estar
sendo violada.
Na Figura 5.11 est ao os histogramas, gr acos de probabilidades normais dos
retornos e resduos do modelo GARCH(1,1) estimado, alem dos correlogramas
dos quadrados dos retornos e resduos.
Exerccios
1. Um modelo ARIMA foi identicado e estimado para uma serie temporal
observada mas h a indica c ao de que a vari ancia condicional deve ser mo-
delada por um processo GARCH(1,1). Explique como se chegou a esta
conclus ao.
2. Refa ca o exemplo da Figura 5.8 e estime um modelo AR(1) para a serie X
t
.
Verique se existe estrutura autoregressiva nos quadrados dos resduos e
identique um modelo ARCH para os erros.
62 CAP

ITULO 5. PREVIS

AO
DAX
0.10 0.05 0.00 0.05
0
1
0
2
0
3
0
Residuos
10 5 0 5
0
.
0
0
.
1
0
.
2
0
.
3
3 1 0 1 2 3

0
.
1
0
0
.
0
0
0
.
1
0
DAX
3 1 0 1 2 3

5
0
5
Residuos
0 5 10 15 20 25 30
0
.
0
0
.
4
0
.
8
DAX^2
0 5 10 15 20 25 30
0
.
0
0
.
4
0
.
8
Residuos
Figura 5.11: Histogramas e probabilidades normais dos retornos do indice de mercado
da Alemanha (DAX) e resduos do modelos GARCH(1,1) e correlogramas dos seus
quadrados.
Captulo 6
Modelos Lineares Dinamicos
A classe de modelos lineares din amicos (MLD), tambem conhecidos como mo-
delos de espa co de estados tem sido utilizada com sucesso em an alise e previs ao
de series temporais. Neste captulo ser ao apresentadas as formas mais comu-
mente utilizadas de MLD, maiores detalhes podem ser obtidos em West and
Harrison (1997) e Pole, West, and Harrison (1994).
6.1 Introdu cao
Um modelo linear din amico pode ser caracterizado pelo seguinte par de equa c oes
y
t
= F

t
+
t

t
= G
t1
+
t
(6.1)
chamadas equa c oes de observa c ao e evolu c ao respectivamente, onde
t
denota
o vetor de estados no tempo t, F e um vetor de constantes conhecidadas ou
regressores, G e uma matrix de evolu c ao conhecida. Os erros
t
e
t
s ao
geralmente assumidos n ao correlacionados em todos os perodos de tempo e
serialmente n ao correlacionados. Em muitas aplica c oes pr aticas pode-se assumir
tambem que
t
N(0,
2

) e
t
tem distribui c ao normal multivariada com media
zero e matriz de vari ancia-covari ancia W
t
.
A ideia aqui e que a idade da informa c ao que se tem sobre seja levada
em conta no sentido de que nossa incerteza a respeito de deve aumentar com o
passar do tempo. Neste sentido, a forma do modelo e apropriada apenas local-
mente no tempo e e necess ario caracterizar algum tipo de evolu c ao temporal
de . O que se tem ent ao e uma sequencia de modelos ou um modelo din amico
parametrizado por
t
(o estado do processo no tempo t).
Considere um modelo em que uma vari avel y est a relacionada a uma outra
vari avel X de acordo com a seguinte forma parametrica
y = X +.
Alem disso, a incerteza do pesquisador em rela c ao ao par ametro e descrita
em termos de uma distribui c ao de probabilidades p().
63
64 CAP

ITULO 6. MODELOS LINEARES DIN

AMICOS
Em um perodo t qualquer, D
t
representa o conjunto de informa c oes dis-
ponveis sobre . Neste sentido, D
0
representa toda a informa c ao inicial rele-
vante sobre incluindo a pr opria deni c ao do modelo.
No tempo t 1, ap os observar y
1
, . . . , y
t1
, toda a informa c ao sobre o es-
tado do processo est a resumida probabilisticamente na distribui c ao a posteriori
p(
t1
|D
t1
). No tempo t, antes de observar y
t
, toda a informa c ao hist orica
D
t1
est a resumida probabilisticamente na distribui c ao a priori de
t
obtida
como
p(
t
|D
t1
) =

p(
t
|
t1
)p(
t1
|D
t1
)d
t1
que e atualizada ap os observar y
t
para a posteriori
t
, combinando-se com o
modelo amostral p(y
t
|
t
) via teorema de Bayes
p(
t
|D
t
) =
p(y
t
|
t
)p(
t
|D
t1
)
p(y
t
)
onde
p(y
t
) =

p(y
t
|
t
)p(
t
|D
t1
)d
t
e a distribui c ao preditiva de y
t
.
Estas equa c oes fornecem um sistema de aprendizado sequencial sobre os
par ametros do processo (n ao observ aveis) e tambem uma sequencia de distri-
bui c oes preditivas (1 passo a frente) para as quantidades observ aveis. Porem
a sua implementa c ao pr atica envolve a resolu c ao de integrais que pode ser um
problema de difcil solu c ao em casos mais gerais. Um caso particular, onde
as equa c oes podem ser escritas em forma fechada, e o de modelos lineares
din amicos (MLD) normais onde a distribui c ao amostral e denida pela
equa c ao das observa c oes y
t
= X
t

t
+
t
,
t
N(0, V
t
)
e os par ametros se relacionam em perodos sucessivos atraves da
equa c ao do sistema
t
= G
t1
+
t
,
t
N(0, W
t
)
onde as sequencias
t
e
t
s ao independentes, mutuamente independentes e
ambas s ao independentes da informa c ao inicial
0
|D
0
N(m
0
, C
0
). A matriz
G descreve a evolu c ao (determinstica) dos par ametros. Modelos nesta classe
ser ao analisados nas pr oximas se c oes.
6.2 Modelos Polinomiais
No MLD mais simples as observa c oes s ao representadas por
y
t
=
t
+
t
,
t
N(0, V
t
)
onde
t
e o nvel da serie no tempo t. A evolu c ao do nvel e modelada como
um passeio aleat orio simples, i.e.

t
=
t1
+
t
,
t
N(0, W
t
).
6.2. MODELOS POLINOMIAIS 65
Estas equa c oes podem ser reescritas como
y
t
|
t
N(
t
, V
t
)

t
|
t1
N(
t1
, W
t
)
e a informa c ao inicial e
0
|D
0
N(m
0
, C
0
). Vamos assumir por enquanto que
as vari ancias V
t
e W
t
s ao conhecidas. Este modelo pode ser pensado como uma
aproxima c ao de Taylor de 1
a
ordem para uma fun c ao suave do tempo (t) de
modo que
(t +t) = (t) + termos de ordem mais alta
e o modelo descreve os termos de ordem mais alta simplesmente como rudos
de media zero. Como saber ent ao se este modelo e adequado a uma particular
aplica c ao?
No tempo t, o valor esperado da serie k perodos a frente condicional ao
nvel atual e
E(Y
t+k
|
t
) = E(
t+k
|
t
) = E(
t
+
k

i=1

t+i
|
t
) =
t
e denotando a media da distribui c ao a posteriori de
t
por m
t
ent ao a fun c ao
de previs ao e constante
f
t
(k) = E(Y
t+k
|D
t
) = E[E(Y
t+k
|
t
, D
t
)] = E(
t
|D
t
) = m
t
, k > 0.
Assim, este modelo e util para previs oes de curto prazo, particularmente quando
a varia c ao das observa c oes (medida por V
t
) e muito maior do que a varia c ao do
nvel (medida por W
t
).
Exemplo 6.1 : Foram gerados 100 valores de um modelo polinomial de pri-
meira ordem com vari ancias constantes (V
t
= V e W
t
= W). Na Figura 6.1
est ao os valores gerados com as rela c oes V/W iguais a 20, 2 e 0,2. Seguem os
comandos do R para produ c ao dos gr acos.
mld.sim = function(n,V,W,mu0) {
mu = mu0 + cumsum (rnorm(n,sd=sqrt(W)))
obs = mu + rnorm (n,sd=sqrt(V))
ts(cbind(obs,mu))
}
w=c(0.05,0.5,5); g=list(col=1:2,xlab=tempo,ylab=y)
par(mfrow=c(2,2))
for (i in w) ts.plot(mld.sim(100,1,i,25),gpars=g,main=paste(V/W=,1/i))
6.2.1 Analise Sequencial e Previs oes
A media inicial m
0
e uma estimativa pontual do nvel da serie e a vari ancia ini-
cial C
0
mede a incerteza associada. Assumindo que
t1
|D
t1
N(m
t1
, C
t1
),
66 CAP

ITULO 6. MODELOS LINEARES DIN

AMICOS
V/W=20
tempo
y
0 20 40 60 80 100
2
3
2
4
2
5
2
6
2
7
2
8
2
9
3
0
(a)
V/W=2
tempo
y
0 20 40 60 80 100
1
4
1
6
1
8
2
0
2
2
2
4
(b)
V/W=0.2
tempo
y
0 20 40 60 80 100
2
0
3
0
4
0
5
0
6
0
(c)
Figura 6.1: 100 valores simulados do modelo polinomial de 1a ordem com (a) V/W =
20, (b) V/W = 2, (c) V/W = 0, 2.
6.2. MODELOS POLINOMIAIS 67
ent ao condicionalmente a D
t1
,
t
e a soma de 2 quantidades normais e inde-
pendentes
t1
e
t
e portanto e tambem normal com media e vari ancia dadas
por
E(
t
|D
t1
) = E(
t1
|D
t1
) +E(
t
|D
t1
) = m
t1
V ar(
t
|D
t1
) = V ar(
t1
|D
t1
) +V ar(
t
|D
t1
) = C
t1
+W
t
= R
t
Y
t
|D
t1
e tambem a soma de quantidades normais independentes e portanto
tem distribui c ao normal com
E(Y
t
|D
t1
) = E(
t
|D
t1
) +E(
t
|D
t1
) = m
t1
V ar(Y
t
|D
t1
) = V ar(
t
|D
t1
) +V ar(
t
|D
t1
) = R
t
+V
t
= Q
t
Ap os observar y
t
, a distribui c ao atualizada do nvel e obtida via teorema de
Bayes combinando-se a verossimilhan ca
p(y
t
|
t
, D
t1
) = (2V
t
)
1/2
exp{(y
t

t
)
2
/2V
t
}
com a priori
p(
t
|D
t1
) = (2R
t
)
1/2
exp{(
t
m
t1
)
2
/2R
t
}
de modo que
p(
t
|D
t
) exp

1
2

(y
t

t
)
2
V
t
+
(
t
m
t1
)
2
R
t

exp

1
2

2
t
(V
1
t
+R
1
t
) 2
t
(V
1
t
y
t
+R
1
t
m
t1
)

exp

C
1
t
2
(
2
t
2
t
)

exp

C
1
t
2
(
t
m
t
)
2

onde
m
t
= C
t
(V
1
t
y
t
+R
1
t
m
t1
)
C
1
t
= V
1
t
+R
1
t
e todos os termos que n ao dependem de
t
foram colocados na constante de
proporcionalidade. Portanto,
t
|D
t
N(m
t
, C
t
).
A media a posteriori pode ser reescrita de 2 formas alternativas denindo-se
o coeciente adaptativo A
t
= C
t
V
1
t
= R
t
/Q
t
(0, 1) e o erro de previs ao 1
passo a frente e
t
= y
t
m
t1
. Assim
m
t
= (1 A
t
)m
t1
+A
t
y
t
= m
t1
+A
t
e
t
.
A vari ancia a posteriori tambem pode ser reescrita como fun c ao do coeciente
adaptativo
C
t
= R
t
A
2
t
Q
t
.
68 CAP

ITULO 6. MODELOS LINEARES DIN

AMICOS
Podemos utilizar as equa c oes das observa c oes e de evolu c ao para obter a dis-
tribui c ao preditiva k passos a frente. Fazendo substitui c oes sucessivas obtemos
que

t+k
=
t
+
k

j=1

t+j
Y
t+k
=
t
+
k

j=1

t+j
+
t+k
e como todos os termos s ao normais e independentes segue que Y
t+k
e tambem
normal com
E(Y
t+k
|D
t
) = E(
t
|D
t
) = m
t
V ar(Y
t+k
|D
t
) = C
t
+
k

j=1
W
t+j
+V
t+k
6.2.2 Variancias de Evolu cao e das Observa c oes
Tipicamente, W
t
e desconhecida. Sua estima c ao entretanto leva a uma intra-
tabilidade analtica que pode ser evitada atraves de sua especica c ao subjetiva
(para uma proposta de estima c ao baseada em simula c ao ver por exemplo (?) e
Lopes, Moreira & Schmidt, 1999).
O fator de desconto e o par ametro b asico que controla o grau de envelheci-
mento da informa c ao de uma observa c ao. Por exemplo, podemos quanticar
o envelhecimento da informa c ao sobre o par ametro
t
como um aumento de 5%
em sua vari ancia a priori (no tempo t), i.e.
V ar(
t
|D
t1
) = (1 +)V ar(
t1
|D
t1
)
com = 0.05. Por outro lado, informa c ao e em geral medida em termos de
precis ao (o inverso da vari ancia) e podemos escrever
Precis ao(
t
|D
t1
) = (1 +)
1
Precis ao(
t1
|D
t1
).
Nesta escala, o fator de desconto = (1 + )
1
varia entre 0 e 1 e = 5%
implica em 0.95. Vale notar que o fator de desconto n ao depende da escala
na qual as observa c oes s ao medidas.
Se = 1 ent ao n ao existe mudan ca ao longo do tempo no nvel da serie
e quanto menor e o valor de maiores s ao as altera c oes esperadas e maior
e a perda de informa c ao contida em observa c oes mais antigas (para mais
detalhes ver Harrison & Johnston, 1984 and Ameen & Harrison, 1985).
Assim, para um valor xo do fator de desconto temos que
R
t
= C
t1
/
ou equivalentemente
W
t
= C
t1

= C
t1
.
6.2. MODELOS POLINOMIAIS 69
Como R
t
= C
t1
+ W
t
podemos interpretar esta especica c ao intuitivamente
como um aumento de incerteza, ao evoluir de t 1 para t, quanticado como
uma propor c ao de C
t1
.
A sequencia de vari ancias V
t
tambem e, em geral, desconhecida embora o
pesquisador possa ter alguma informa c ao a priori sobre caractersticas desta
sequencia. Por exemplo, V
t
= V (vari ancia constante e desconhecida), V
t
=
V k
t
onde os pesos k
t
s ao conhecidos, V
t
= V k(
t
) onde k() e uma fun c ao de
vari ancia do nvel da serie ou em particular V
t
= V
p
t
.
Impondo-se uma particular estrutura para a sequencia W
t
e para a in-
forma c ao inicial obtem-se um procedimento de atualiza c ao sequencial para V
alem de
t
. Para isto redene-se o modelo, agora condicionalmente em V , como
y
t
=
t
+
t
,
t
N(0, V ),

t
=
t1
+
t
,
t
N(0, V W

t
),

0
|D
0
N(m
0
, V C
0
)
|D
0
Gama(n
0
/2, n
0
S
0
/2) ou n
0
S
0

2
n
0
onde m
0
, C

0
, n
0
e S
0
s ao conhecidos e = V
1
. Surgiu assim mais um item
na informa c ao inicial com
E(|D
0
) =
n
0
/2
n
0
S
0
/2
=
1
S
0
e S
0
e a estimativa pontual a priori da vari ancia V . Com esta deni c ao pode-se
mostrar que a distribui c ao inicial marginal de
0
e

0
|D
0
t
n
0
(m
0
, C
0
)
onde C
0
= S
0
C

0
.
Se a distribui c ao a posteriori (incondicional) do nvel em t 1 e

t1
|D
t1
t
n
t1
(m
t1
, C
t1
)
ent ao pode-se mostrar que as distribui c oes a priori, preditiva e a posteriori no
tempo t s ao dadas por

t
|D
t1
t
n
t1
(m
t1
, R
t
)
Y
t
|D
t1
t
n
t1
(m
t1
, Q
t
)

t
|D
t
t
nt
(m
t
, C
t
)
onde os par ametros atualizados s ao
Q
t
= R
t
+S
t1
m
t
= m
t1
+A
t
e
t
C
t
= (S
t
/S
t1
)(R
t
A
2
t
Q
t
)
n
t
= n
t1
+ 1
n
t
S
t
= n
t1
S
t1
+S
t1
e
2
t
/Q
t
.
70 CAP

ITULO 6. MODELOS LINEARES DIN

AMICOS
6.3 Modelo de Crescimento Linear
Considere agora que a descri c ao local mais apropriada e uma tendencia po-
linomial de 2
a
ordem. Um modelo um pouco mais elaborado e ent ao obtido
criando-se um par ametro extra para descrever o crescimento do nvel do pro-
cesso observado. A equa c ao das observa c oes ca inalterada, i.e.
y
t
=
t
+
t
,
t
N(0, V
t
)
e a evolu c ao do nvel e do crescimento e modelada como

t
=
t1
+
t1
+
1t

t
=
t1
+
2t
.
Usando a representa c ao matricial temos que o vetor de regress ao e a matriz
de evolu c ao s ao dados por
X
t
= ( 1 0 ) e G =

1 1
0 1

.
Nesta nota c ao, denindo
t
= (
t
,
t
)

obtemos os momentos das distribui c oes


a priori e preditiva como
E(
t
|D
t1
) = a
t
= GE(
t1
|D
t1
) = Gm
t1
= (m
t1
+b
t1
, b
t1
)

V ar(
t
|D
t1
) = R
t
= GC
t1
G

+W
t
E(Y
t
|D
t1
) = f
t
= X
t
a
t
= m
t1
+b
t1
V ar(Y
t
|D
t1
) = Q
t
= X
t
R
t
X

t
+S
t1
.
Os momentos da distribui c ao a posteriori de
t
s ao uma generaliza c ao ma-
tricial daqueles obtidos para o modelo anterior,
E(
t
|D
t
) = m
t
= a
t
+A
t
e
t
V ar(
t
|D
t
) = C
t
= (S
t
/S
t1
)(R
t
A
t
A

t
Q
t
)
N ao e difcil vericar que a fun c ao de previs ao e dada por f
t
(k) = X
t
G
k
m
t
=
m
t
+kb
t
onde m
t
e b
t
s ao as estimativas pontuais do nvel
t
e do crescimento

t
. Portanto, assim como no caso anterior, este modelo tambem e apropriado
para previs oes de curto prazo.
As vari ancias W
t
s ao mais uma vez especicadas indiretamente atraves de
um fator de desconto . Neste caso,
R
t
= GC
t1
G

/
implica que
W
t
= GC
t1
G

(
1
1).
6.4. MODELOS SAZONAIS 71
6.4 Modelos Sazonais
Um comportamento peri odico ou cclico pode ser encontrado em v arias series
temporais.

E importante que se consiga descrever o padr ao sazonal da serie
atraves de quantidades que possam ser estimadas incluindo-se assim este padr ao
na fun c ao previs ao. Nos modelos aqui analisados dene-se um componente
sazonal descrevendo desvios sazonais em torno de um nvel dessazonalizado ou
tendencia.
6.4.1 Modelos sem Crescimento
A ideia aqui e fazer a superposi c ao de um modelo polinomial de 1
a
ordem (para
o nvel dessazonalizado) com um modelo de efeitos sazonais. As equa c oes das
observa c oes e de evolu c ao s ao dadas por
y
t
=
t
+
t0
+
t
,
t
N(0, V
t
)

t
=
t1
+
t

tr
=
t1,r+1
+
t,r
, r = 0, , p 2

t,p1
=
t1,0
+
t,p1
com a restri c ao

p1
r=0

tr
= 0, t e onde p e o perodo sazonal da serie. Por
exemplo, p = 12 para uma serie com observa c oes mensais e p = 4 para ob-
serva c oes trimestrais.
Para xar ideias, considere uma serie trimestral e suponha que t 1 e
o segundo trimestre de um determinado ano. Ent ao o vetor de par ametros
consiste de 4 efeitos sazonais, um para cada trimestre,

t1
=

t0

t1

t2

t3

trim. 2
trim. 3
trim. 4
trim. 1

e ao passar de t1 para t ocorre simplesmente uma rota c ao nos elementos deste


vetor,

t
=

t0

t1

t2

t3

trim. 3
trim. 4
trim. 1
trim. 2

.
A fun c ao de previs ao assume a forma f
t
(k) = m
t
+ h
tj
onde m
t
e o valor
esperado do nvel dessazonalizado no tempo t + k e h
tj
e o desvio sazonal
esperado em torno deste nvel. O desvio utilizado na fun c ao de previs ao e tal
que j e o resto da divis ao k/p. Por exemplo, se p = 12, e
t0
refere-se ao
mes de janeiro ent ao a previs ao 1 passo a frente (k = 1) feita em dezembro e
m
t
+E(
t0
|D
t
), com j = 1. Se o horizonte de previs ao for k = 2 ent ao j = 2 e
o desvio sazonal refere-se a fevereiro, i.e. f
t
(2) = m
t
+E(
t1
|D
t
).
72 CAP

ITULO 6. MODELOS LINEARES DIN

AMICOS
6.4.2 Modelos com Crescimento
Novamente a ideia e fazer a superposi c ao de um modelo para os efeitos sazonais
mas agora com um modelo polinomial de 2
a
ordem onde se tem um par ametro
que representa o crescimento do nvel dessazonalizado.
O modelo pode ser escrito como
y
t
=
t
+
t0
+
t
,
t
N(0, V
t
)

t
=
t1
+
t1
+
t

t
=
t1
+

tr
=
t1,r+1
+
t,r
, r = 0, , p 2

t,p1
=
t1,0
+
t,p1
com a restri c ao

p1
r=0

tr
= 0, t. A fun c ao de previs ao agora assume a seguinte
forma
f
t
(k) = m
t
+kb
t
+h
tj
, com
p1

j=0
h
tj
= 0
onde h
tj
tem a mesma interpreta c ao anterior.
6.5 Representa cao de Fourier
Uma forma alternativa de se representar padr oes cclicos e atraves de com-
bina c oes lineares de fun c oes peri odicas. Em particular a utiliza c ao de fun c oes
trigonometricas leva a representa c oes de Fourier da sazonalidade.
O modelo (com crescimento) e representado pelas seguintes equa c oes
y
t
=
t
+
p/2

j=1

j,t
+
t
,
t
N(0, V
t
)

t
=
t1
+
t1
+
t
,

t
=
t1
+

t
,

j,t

j,t

cos 2j/p sin 2j/p


sin 2j/p cos 2j/p


j,t1

j,t1

w
j,t
w

j,t

, j = 1, . . . , p/2 1
e
j,t
=
j,t1
+
j,t
para j = p/2. A fun c ao de previs ao e dada por
f
t
(k) =
p/2

j=1
S
jk
=
p/2

j=1
[a
t,j
cos(2jk/p) +a

t,j
sen(2jk/p)
onde a
t,j
e a

t,j
s ao as estimativas pontuais de coecientes de Fourier
t,j
e

t,j
.
Como no captulo anterior, as vari ancias dos erros de evolu c ao s ao especi-
cadas indiretamente atraves de um fator de desconto. A estrategia recomendada
em (Pole, West, and Harrison 1994) e West and Harrison (1997) consiste em
especicar um fator de desconto para cada componente do modelo. No modelo
6.6. ILUSTRAC

AO 73
com uma tendencia polinomial mais um componente sazonal teremos ent ao 2
fatores de desconto.
Em geral, o fator de desconto do componente sazonal e maior do que o da
tendencia. Neste sentido estamos assumindo que o padr ao sazonal da serie,
embora possa estar sujeito a altera c oes, e mais est avel do que a sua tendencia.
6.6 Ilustra cao
A Figura ?? apresenta o total de vendas trimestrais (em milhares) de perus na
Irlanda entre o primeiro trimestre de 1974 e o terceiro trimestre de 1982. A
serie exibe um crescimento sistem atico ao longo de todo o perodo juntamente
com um padr ao sazonal acentuado. Outra caracterstica interessante e que a
forma do padr ao sazonal se alterou a partir de 1978. Vamos fazer a estima c ao
sequencial de um modelo para os efeitos sazonais superpostos a uma tendencia
de crescimento linear e vericar o comportamento das previs oes 1 passo a frente.
Suponha que a informa c ao a priori foi acessada examinando-se as vendas
dos anos anteriores a 1974. Esta informa c ao est a resumida na Tabela 6.1. Note
a restri c ao de soma zero na especica c ao a priori dos efeitos sazonais e tambem
que a especica c ao equivalente em termos de fatores sazonais seria 11, 19, 19 e
11 para os fatores e (11+19+19+11)/4 = 15 para o nvel.
Tabela 6.1: Informa c ao a priori.
Componente Media (Desvio padr ao)
Nvel 15 (0.75)
Crescimento 0 (0.3)
Efeito sazonal 1 -4 (0.5)
Efeito sazonal 2 4 (0.5)
Efeito sazonal 3 4 (0.5)
Efeito sazonal 4 -4 (0.5)
D.P. das observa c oes 1 com 1 g.l.
A performance preditiva do modelo foi investigada para fatores de desconto
variando nos intervalos (0.9,1.0) para a tendencia e (0.6,1.0) para os fatores
sazonais. Estes intervalos est ao coerentes com a ideia de que espera-se um
padr ao sazonal mais est avel do que a tendencia. Entretanto os valores encon-
trados ap os esta busca foram 0.90 para a tendencia e 0.80 para os fatores
sazonais. Uma ideia intuitiva e a altera c ao no padr ao sazonal ocorrida em 1978
deve ter contribuido para este resultado atpico.
Os 2 gr acos a seguir apresentam as previs oes pontuais (1 passo a frente)
juntamente com intervalos de 90% de probabilidade e os valores observados
da serie. O primeiro gr aco refere-se ao modelo est atico (ambos os fatores de
desconto iguais a 1). Note que a mudan ca no padr ao sazonal ocorre muito
lentamente no modelo est atico e no nal da serie o padr ao estimado e apenas
74 CAP

ITULO 6. MODELOS LINEARES DIN

AMICOS
ligeiramente diferente do padr ao inicial. J a no modelo din amico o padr ao sazo-
Tabela 6.2:
Descontos EQM DAM LLIK
0.90 e 0.80 3.11 1.34 -71.1
1.00 e 1.00 4.23 1.64 -77.6
nal evolui para uma forma completamente diferente melhorando a performance
preditiva. Este fato pode ser notado por inspe c ao visual e e conrmado pelos
indicadores na Tabela 6.2.
A explica c ao intuitiva para este fato, lembrando da deni c ao de fator de
desconto, e que no modelo din amico um peso maior e dado para as observa c oes
mais recentes ao fazer previs oes. Com isto a altera c ao no padr ao sazonal e
incorporada mais rapidamente do que no modelo est atico. As previs oes de
vendas para o quarto trimestre de 1982 e para 1983 tambem levar ao em conta
os diferentes padr oes sazonais do nal da serie.
6.7 Modelos de Regressao
Para completar o nosso modelo din amico podemos pensar em incluir na equa c ao
das observa c oes efeitos de vari aveis regressoras. Considere por exemplo a
regress ao linear da var avel y
t
em uma cole c ao de p vari aveis independentes
X
1t
, . . . , X
pt
. Se um termo constante for incluido no modelo ent ao X
1t
= 1, t.
Denotando o vetor de regress ao e o vetor de coecientes de regress ao no tempo t
por X
t
= (X
1t
, . . . , X
pt
) e
t
= (
1t
, . . . ,
pt
)

respectivamente ent ao as equa c oes


do modelo s ao dadas por
y
t
= X
t

t
+
t
,
t
N(0, V
t
)

t
=
t1
+
t
,
t
N(0, W
t
).
Assim, os coecientes da regress ao evoluem segundo um passeio aleat orio,
como no modelo polinomial de 1
a
ordem, i.e., a matriz de evolu c ao G = I
p
. O
vetor de regress ao e formado pelas pr oprias vari aveis regressoras e note que a
equa c ao das observa c oes pode ser reescrita como
y
t
=
p

i=1

it
X
it
+
t
de modo que o modelo pode ser visto como uma superposi c ao de p regress oes
simples pela origem.
Todas as distribui c oes envolvidas s ao an alogas aos casos anteriores e as
equa c oes dadas na Se c ao 2.3 podem ser utilizadas para obter os momentos das
6.8. MONITORAMENTO 75
distribui c oes a priori, preditiva e a posteriori fazendo-se G = I
p
. Assim,
a
t
= m
t1
R
t
= C
t1
+W
t
f
t
= X
t
m
t1
e as outras equa c oes permanecem inalteradas.

E interessante notar como ca a fun c ao de previs ao f


t
(k) neste caso. Pri-
meiro reescreva a equa c ao de evolu c ao para
t+k
fazendo k substitui c oes suces-
sivas obtendo

t+k
=
t
+
k

j=1

t+j
de modo que
a
t+k
= m
t
R
t+k
= C
t
+
k

j=1
W
t+j
.
Ent ao, usando a equa c ao das observa c oes obtemos que
f
t
(k) = X
t+k
m
t
Q
t+k
= X
t+k
R
t+k
X

t+k
+S
t
.
Assim, a previs ao pontual k passos a frente e a pr opria fun c ao de regress ao
avaliada na estimativa dos coecientes no tempo t e nos valores futuros dos
regressores (que nem sempre est ao disponveis).
A sequencia de vari ancias W
t
e mais uma vez estruturada usando um fator
de desconto.
6.8 Monitoramento
Ao comparar sequencialmente as previs oes com os valores observados pode-se
julgar a adequa c ao relativa de modelos alternativos com base em sua perfor-
mance preditiva.
Observa c oes ocorrendo nas caudas da distribui c ao preditiva s ao sempre
possveis por deni c ao porem improv aveis. Quanto mais afastada em uma das
caudas mais improv avel e a observa c ao.

E preciso ent ao estabelecer um criterio
para julgar que tipo de inconsistencia entre observa c ao e previs ao deve ser si-
nalizada pelo sistema. No entanto, sinalizar uma observa c ao como improv avel
apenas indica uma possvel deciencia geral do modelo.

E preciso saber em
que sentido o modelo e deciente, i.e. vericar que modelos alternativos, com
diferentes distribui c oes preditivas, teriam uma performance melhor. O fator de
Bayes, denido a seguir, e a ferramenta utilizada para fazer esta compara c ao
de modelos.
76 CAP

ITULO 6. MODELOS LINEARES DIN

AMICOS
Se p
A
(y
t
|D
t1
) e a densidade preditiva 1 passo a frente de um modelo al-
ternativo ent ao o fator de Bayes e denido como
H
t
=
p(y
t
|D
t1
)
p
A
(y
t
|D
t1
)
,
i.e. a raz ao das densidades preditivas avaliadas no valor observado y
t
.
Outra forma de comparar a performance preditiva de dois modelos e consi-
derer um grupo de observa c oes ao inves de uma unica e se basear no fator de
Bayes acumulado
H
t
(k) =
p(y
t
, . . . , y
tk+1
|D
tk
)
p
A
(y
t
, . . . , y
tk+1
|D
tk
)
=
p(y
t
|D
t1
)p(y
t1
, . . . , y
tk+1
|D
tk
)
p
A
(y
t
|D
t1
)p
A
(y
t1
, . . . , y
tk+1
|D
tk
)
= H
t
H
t1
(k 1) =
k1

j=0
H
tj
.
Pode-se assim sinalizar evidencias de altera c ao lenta na estrutura da serie. A
ideia e que, individualmente, estas evidencias n ao s ao sucientes para se ques-
tionar as previs oes do modelo em uso mas quando consideradas conjuntamente
a evidencia acumulada pode ser grande e deve ser sinalizada. A quest ao agora
e como construir um sistema de monitoramento autom atico da serie a partir
destas ideias intuitivas.
Quando as observa c oes est ao cada vez mais afastadas das previs oes ent ao
um fator de Bayes individual H
t
pode n ao ser sucientemente pequeno e precisa
ser acumulado para indicar alguma evidencia contra o modelo padr ao. Neste
caso, o monitor identica o grupo mais discrepante de observa c oes consecutivas
calculando V
t
and l
t
da seguinte forma,
V
t
= min
1kt
H
t
(k) = H
t
(l
t
)
sendo calculado sequencialmente com as seguintes recurs oes,
V
t
= H
t
min{1, L
t1
} e l
t
=

l
t1
+ 1, se L
t1
< 1
1, se L
t1
1
conforme mostrado em West (1986).
O modelo padr ao e aceito como sendo satisfat orio ate a ocorrencia de um
valor L
t
menor do que um valor pre-especicado < 1 (o limite inferior para
aceita c ao de L
t
) quando a ocorrencia de uma descontinuidade na serie e sina-
lizada. Se l
t
= 1 ent ao uma unica observa c ao discrepante e identicada como
a causa mais prov avel de falha, embora o incio de uma mudan ca tambem seja
uma possibilidade. Por outro lado, l
t
> 1 indica que uma mudan ca come cou a
ocorrer l
t
periods atr as em t l
t
+ 1. Alem disso, se uma mudan ca estrutural
lenta est a ocorrendo na serie as observa c oes mais recentes indicar ao evidencia
contra o modelo padr ao que n ao ser a suciente para fazer L
t
< . Assim, para
aumentar a sensibilidade do monitor a estas mudan cas uma descontinuidade
deve ser sinalizada se l
t
> 3 ou 4.
6.8. MONITORAMENTO 77
Para especicar o modelo alternativo assume-se que as densidades preditivas
s ao normais com media comum f
t
e vari ancias Q
t
e Q
t
/ onde 0 < < 1, de
modo que o fator de Bayes ca
H
t
=

exp

(y
t
f
t
)
2
2Q
t
(1 )

exp

1
2
(1 )e
2
t

onde e
t
e o erro de previs ao um passo a frente padronizado.
A escolha de pode ser facilitada reescrevendo-se o fator de Bayes como
H
t
= exp(0.5 log + (1 )e
2
t
).
Claramente H
t
= 1 ou equivalentemente e
2
t
= (log )/(1 ) indica nenhuma
evidencia para discriminar entre os modelos. O valor de , pode ser escolhido de
modo a fornecer o valor m aximo de |e
t
| que n ao indica evidence contra o modelo
padr ao. Por exemplo, (0.1, 0.3) implica que a evidencia contra o modelo
padr ao deve ser acumulada para 1.3 < |e
t
| < 1.6 que s ao aproximadamente os
percentil 0.90 e 0.95 distribui c ao normal padr ao.

E claro que para xo, a evidencia contra o modelo padr ao aumenta com
|e
t
|. West and Harrison (1997) ilustraram como a escolha de tem pouca in-
uencia quando o erro se torna muito grande em rela c ao ao modelo alternativo.
Este pode ser visto como um modelo geral no sentido de levar em conta v arios
tipos de mudan cas alem de observa c oes discrepantes. Essencialmente, este pro-
cedimento pode ser visto como um metodo explorat orio gerando informa c ao
sobre o tipo e o perodo mais prov avel de mudan ca estrutural.
Apendice A
Lista de Distribui c oes
Neste apendice s ao listadas as distribui c oes de probabilidade utilizadas no texto
para facilidade de referencia. S ao apresentadas suas fun c oes de (densidade)
de probabilidade alem da media e vari ancia. Uma revis ao exaustiva de dis-
tribui c oes de probabilidades pode ser encontrada em Johnson et al. (1994),
Johnson et al. (1995) e Johnson et al. (1992).
A.1 Distribui cao Normal
X tem distribui c ao normal com par ametros e
2
, denotando-se X N(,
2
),
se sua fun c ao de densidade e dada por
p(x|,
2
) = (2
2
)
1/2
exp[(x )
2
/2
2
], < x < ,
para < < e
2
> 0. Quando = 0 e
2
= 1 a distribui c ao e chamada
normal padr ao. A distribui c ao log-normal e denida como a distribui c ao de e
X
.
No caso vetorial, X = (X
1
, . . . , X
p
) tem distribui c ao normal multivariada
com vetor de medias e matriz de vari ancia-covari ancia , denotando-se X
N(, ) se sua fun c ao de densidade e dada por
p(x|, ) = (2)
p/2
||
1/2
exp[(x )

1
(x )/2]
para R
p
e positiva-denida.
A.2 Distribui cao Gama
X tem distribui c ao Gama com par ametros e , denotando-se X Ga(, ),
se sua fun c ao de densidade e dada por
p(x|, ) =

()
x
1
e
x
, x > 0,
para , > 0.
E(X) = / e V (X) = /
2
.
Casos particulares da distribui c ao Gama s ao a distribui c ao de Erlang, Ga(, 1),
a distribui c ao exponencial, Ga(1, ), e a distribui c ao qui-quadrado com graus
de liberdade, Ga(/2, 1/2).
78
A.3. DISTRIBUIC

AO GAMA INVERSA 79
A.3 Distribui cao Gama Inversa
X tem distribui c ao Gama Inversa com par ametros e , denotando-se
X GI(, ), se sua fun c ao de densidade e dada por
p(x|, ) =

()
x
(+1)
e
/x
, x > 0,
para , > 0.
E(X) =

1
e V (X) =

2
( 1)
2
( 2)
.
N ao e difcil vericar que esta e a distribui c ao de 1/X quando X Ga(, ).
A.4 Distribui cao Beta
X tem distribui c ao Beta com par ametros e , denotando-se X Be(, ),
se sua fun c ao de densidade e dada por
p(x|, ) =
( +)
()()
x
1
(1 x)
1
, 0 < x < 1,
para , > 0.
E(X) =

+
e V (X) =

( +)
2
( + + 1)
.
A.5 Distribui cao de Dirichlet
O vetor aleat orio X = (X
1
, . . . , X
k
) tem distribui c ao de Dirichlet com
par ametros
1
, . . . ,
k
, denotada por D
k
(
1
, . . . ,
k
) se sua fun c ao de densi-
dade conjunta e dada por
p(x|
1
, . . . ,
k
) =
(
0
)
(
1
), . . . , (
k
)
x

1
1
1
. . . x

k
1
k
,
k

i=1
x
i
= 1,
para
1
, . . . ,
k
> 0 e
0
=

k
i=1

i
.
E(X
i
) =

i

0
, V (X
i
) =
(
0

i
)
i

2
0
(
0
+ 1)
, e Cov(X
i
, X
j
) =

i

2
0
(
0
+ 1)
Note que a distribui c ao Beta e obtida como caso particular para k = 2.
A.6 Distribui cao t de Student
X tem distribui c ao t de Student (ou simplesmente t) com media , par ametro
de escala e graus de liberdade, denotando-se X t

(,
2
), se sua fun c ao
de densidade e dada por
p(x|, ,
2
) =
(( + 1)/2)
/2
(/2)

+
(x )
2

(+1)/2
, x R,
80 AP

ENDICE A. LISTA DE DISTRIBUIC



OES
para > 0, R e
2
> 0.
E(X) = , para > 1 e V (X) =

2
, para > 2.
Um caso particular da distribui c ao t e a distribui c ao de Cauchy, denotada por
C(,
2
), que corresponde a = 1.
A.7 Distribui cao F de Fisher
X tem distribui c ao F com
1
e
2
graus de liberdade, denotando-se X
F(
1
,
2
), se sua fun c ao de densidade e dada por
p(x|
1
,
2
) =
((
1
+
2
)/2)
(
1
/2)(
2
/2)

1
/2
1

2
/2
2
x

1
/21
(
2
+
1
x)
(
1
+
2
)/2
x > 0, e para
1
,
2
> 0.
E(X) =

2

2
2
, para
2
> 2 e V (X) =
2
2
2
(
1
+
2
2)

1
(
2
4)(
2
2)
2
, para
2
> 4.
A.8 Distribui cao Binomial
X tem distribui c ao binomial com par ametros n e p, denotando-se X bin(n, p),
se sua fun c ao de probabilidade e dada por
p(x|n, p) =

n
x

p
x
(1 p)
nx
, x = 0, . . . , n
para n 1 e 0 < p < 1.
E(X) = np e V (X) = np(1 p)
e um caso particular e a distribui c ao de Bernoulli com n = 1.
A.9 Distribui cao Multinomial
O vetor aleat orio X = (X
1
, . . . , X
k
) tem distribui c ao multinomial com
par ametros n e probabilidades
1
, . . . ,
k
, denotada por M
k
(n,
1
, . . . ,
k
) se sua
fun c ao de probabilidade conjunta e dada por
p(x|
1
, . . . ,
k
) =
n!
x
1
!, . . . , x
k
!

x
1
1
, . . . ,
x
k
k
, x
i
= 0, . . . , n,
k

i=1
x
i
= n,
para 0 <
i
< 1 e

k
i=1

i
= 1. Note que a distribui c ao binomial e um caso
especial da multinomial quando k = 2. Alem disso, a distribui c ao marginal de
cada X
i
e binomial com par ametros n e
i
e
E(X
i
) = n
i
, V (X
i
) = n
i
(1
i
), e Cov(X
i
, X
j
) = n
i

j
.
A.10. DISTRIBUIC

AO DE POISSON 81
A.10 Distribui cao de Poisson
X tem distribui c ao de Poisson com par ametro , denotando-se X Poisson(),
se sua fun c ao de probabilidade e dada por
p(x|) =

x
e

x!
, x = 0, 1, . . .
para > 0.
E(X) = V (X) = .
A.11 Distribui cao Binomial Negativa
X tem distribui c ao de binomial negativa com par ametros r e p, denotando-se
X BN(r, p), se sua fun c ao de probabilidade e dada por
p(x|r, p) =

r +x 1
x

p
r
(1 p)
x
, x = 0, 1, . . .
para r 1 e 0 < p < 1.
E(X) = r(1 p)/p e V (X) = r(1 p)/p
2
.
Um caso particular e quando r = 1 e neste caso diz-se que X tem distribui c ao
geometrica com par ametro p.
Referencias
Bauwens, L., M. Lubrano, and J. Richard (1999). Bayesian Inference in
Dynamic Econometric Models. Oxford University Press.
Box, G. E. P. and G. M. Jenkins (1970). Time Series Analysis, Forecasting
and Control. Holden-Day, San Francisco, California.
Box, G. E. P., G. M. Jenkins, and G. C. Reinsel (1994). Time Series Analysis:
Forecasting and Control (Third ed.). Englewood Clis NJ: Prentice-Hall.
Brockwell, P. and R. Davis (1991). Time Series: Theory and Methods (2nd
ed.). New York: Springer-Verlag.
Burnham, K. P. and D. R. Anderson (1998). Model Selection and Inference:
A Practical Information-Theoretic Approach. Springer: New York.
Diggle, P. (1990). Time Series: A Biostatistical Introduction. Oxford Univer-
sity Press: New York.
Engle, R. F. (1982). Autoregressive conditional heteroscedasticity with es-
timates of the variance of united kingdom ination. Econometrica 50,
9871007.
Hamilton, J. D. (1994). Time Series Analysis. Princeton University Press.
Johnson, N. L., S. Kotz, and N. Balakrishnan (1994). Continuous Univariate
Distributions (2nd ed.), Volume 1. John Wiley, New York.
Johnson, N. L., S. Kotz, and N. Balakrishnan (1995). Continuous Univariate
Distributions (2nd ed.), Volume 2. John Wiley, New York.
Johnson, N. L., S. Kotz, and A. W. Kemp (1992). Univariate Discrete Dis-
tributions (2nd ed.). John Wiley, New York.
Kendall, M. G., A. Stuart, and J. K. Ord (1983). Advanced theory of statistics
(4th ed.), Volume 3. Grin: London.
Morettin, P. A. and T. C. M. (2004). An alise de Series Temporais. Edgard
Bl ucher, S ao Paulo.
Pole, A., M. West, and J. Harrison (1994). Applied Bayesian Forecasting and
Time Series Analysis. Texts in Statistical Sciences. Chapman & Hall.
Priestley, M. B. (1981). Spectral Analysis and Time Series. London: Acade-
mic Press.
West, M. and P. J. Harrison (1997). Bayesian Forecasting and Dynamic Mo-
dels. Springer Verlag, New York.
82