Escolar Documentos
Profissional Documentos
Cultura Documentos
(4-1)
t+1 = Tt t + ct + Rt t , t W N (0, Qt )
(4-2)
33
Uma vez que o modelo e colocado na forma de espaco de estado, podera fazer
uso do filtro de Kalman para sua estimacao. A seguir apresentamos os detalhes
deste processo.
4.2.1
Filtragem
O processo de filtragem tem como objetivo a atualizacao do conhecimento
sobre t a cada observacao yt que ingressa no sistema em estudo. Particularizando
as equacoes do modelo em espaco de estado linear (4-1 e 4-2), assumimos que t
e t sao independentes e normalmente distribudos.
yt = Zt t + dt + t , t N (0, Ht )
t+1 = Tt t + ct + Rt t , t N (0, Qt )
(4-3)
1 N (a1 , P1 )
diSeja Yt1 = {y1 , . . . , yt1 } o conjunto de observacoes passadas. E
reto ver que da equacao (4-3) temos que p(yt |1 , . . . , t , Yt1 ) = p(yt |t ) e
p(t+1 |t , . . . , 1 , Yt ) = p(t+1 |t ). A tabela (4.1) mostra as dimensoes dos vetores e matrizes do modelo dado em (4-3).
Considerando a seguinte notacao at = E(t |Yt1 ) e Pt = V ar(t |Yt1 ),
temos as equacoes de filtragem explicitadas em (4-4) para t = 1, . . . , n e as
dimensoes dos vetores e matrizes do filtro na tabela 4.2.
34
t = yt Zt at dt
0
Ft = Zt Pt Zt + Ht
0
Kt = Tt Pt Zt Ft1
(4-4)
Lt = Tt Kt Zt
at+1 = Tt at + ct + Kt t
0
Pt+1 = Tt Pt Lt + Rt Qt Rt
A deducao Gaussiana do filtro, apresentada em Durbin & Koopman (2001),
nao e a mais simples, no entanto ela evidencia que o processo de atualizacao (de
t ) ocorre devido a inovacao t que contem a informacao yt que nao esta presente
em (Yt1 )1 .
As equacoes (4-4) sao validas ainda quando a hipotese de normalidade e
relaxada, pois em ausencia de normalidade as expressoes do filtro de Kalman
representam estimadores lineares otimos (Brockwell e Davis, 2002; Shumway e
Stoffer, 2006).
4.2.2
Suavizac
ao
O processo de suavizacao considera a estimacao de t dado y, onde
0
0 0
y = (y1 , . . . , yn ) , sendo n o tamanho da amostra. Fazendo uso da notacao
1
(Yt ) e a -Algebra
gerada pelo vetor de observacoes Yt .
35
rt1 = Zt Ft1 t + Lt rt
Nt1 = Zt Ft1 Zt + Lt Nt Lt
(4-5)
t = at + Pt rt1
Vt = Pt Pt Nt1 Pt
Esses estimadores sao chamados de suavizadores (Shumway & Stoffer, 2006)
porque os graficos de linha no tempo das correspondentes estimativas sao mais
suavesdo que as estimativas da filtragem. Uma prova da obtencao dessas
equacoes, baseada na abordagem de Jong (1989) pode ser encontrada em Durbin
y1,1
..
.
..
.
y1,p
,...,
yi1,1
..
.
..
.
yi1,p
...
..
.
,...,
yi,p
yn,1
..
.
..
.
yn,p
onde yt = Wt yt e o vetor que contem somente os dados presentes observados, sendo Wt uma matriz de selecao com as linhas de Ip correspondentes `as
coordenadas observadas de yt . Desta forma, a equacao (4-1) com as informacoes
parciais e dada por:
yt = Zt t + dt + t , t W N (0, Ht )
na qual
Zt = Wt Zt , dt = Wt dt , t = Wt t e Ht = Wt Ht Wt .
0
(4-6)
36
Pt+1 = Tt Pt Tt + Rt Qt Rt
(4-7)
rt1 = Tt rt
0
Nt1 = Tt Nt Tt
t = at + Pt rt1
(4-8)
Vt = Pt Pt Nt1 Pt
Os dados faltantes sao obtidos a partir do vetor de estado suavizado, tal que:
yt,i = Zt,i
t + dt,i + t,i
onde t,i = 0 se yt,i for uma observacao faltante. Quando a observacao estiver
presente yt,i = yt,i e nesse caso nao necessariamente t,i = 0.
A previsao no arcabouco dos modelos em espaco de estado com filtro
de Kalman tem como objetivo prever o estado em n+h e yt+h a partir das
informacoes y1 , . . . , yn . De forma pratica, para fazer previsoes h passos `a frente,
basta considerar as observacoes yn+1 , . . . , yn+h como faltantes e rodar o filtro ate
yn+h fazendo uso das equacoes com essa especificidade (4-7)2 .
Para que este procedimento seja viavel, todas as matrizes do sistema precisam
estar disponveis ate t = n + h, caso contrario nao e possvel fazer previsao mais
de um passo `a frente para um modelo condicionalmente Gaussiano.
4.4
Tratamento Univariado para S
eries Multivariadas
A principal motivacao que sugere o uso do tratamento univariado para series
multivariadas, e a eficiencia computacional, pois e bem mais simples trabalhar com
valores escalares do que matrizes. O exemplo mais ilustrativo deste ganho fica
aparente considerando um processo de otimizacao com inicializacao difusa, pois
2
Para o caso em que h = 1, o problema ja foi resolvido pelo filtro de Kalman (4-4).
37
y1,1
y2,1
yn,1
. .
.. , .. , . . . , ...
(4-9)
y1,p1
y2,p2
yn,pn
como se as coordenadas yt,i , i = 1, . . . , pt ; t N chegassem uma de cada
vez, tendo como serie univariada correspondente:
y1,1 , y1,2 , . . . , y1,p1 , y2,1 , . . . , y2,p2 , . . . , yn,1 , . . . , yn,pn
(4-10)
i = 1, . . . , pt , t = 1, . . . , n
(4-11)
t,i+1 = t,i ; i = 1, . . . , pt 1
t+1,1 = Tt t,pt + ct + Rt t,pt ; t,pt (0, Qt )
(4-12)
1,1 = 1
Onde Tt , ct , Rt e Qt sao as matrizes do sistema correspondentes ao modelo
3
Para os casos em que Ht nao e diagonal sugere-se adicionar t ao vetor de estado ou
fazer uma decomposicao em Ht , tal que seja possvel adicionar a estrutura de dependencia
na equacao de medidas (Ht cheia).
38
1
Kt,i = Pt,i Zt,i Ft,i
t,i = yt,i Zt,i at,i dt,i
at,i+1 = at,i + Kt,i t,i
0
Pt,i+1 = Pt,i Kt,i Ft,i Kt,i
end for
at+1,1 = Tt at,pt +1 + ct
0
0
Pt+1,1 = Tt Pt,pt +1 Tt + Rt Qt Rt
end for
um algoritmo alternativo pode ser dado por:
Algoritmo 2
a1 a1
P1 P1
P
for t = 1 to nj=1 pj do
if t then
Tt = Tt ; ct = ct ; Qt = Qt
else
Tt = I; ct = 0; Qt = 0
end if
0
Ft = Zt Pt Zt + t2
0
Kt = Tt Pt Zt Ft1
Lt = Tt Kt Zt
t = yt Zt at dt
at+1 = Tt at + ct + Kt t
0
Pt+1 = Tt Pt Lt Rt Qt Rt
end for
para = {p1 , p1 + p2 , . . . ,
Pn
j=1
pj }.
39
a partir do algoritmo 2. Observe que no algoritmo 1 e feito o calculo t,pt +1 , dispensado no segundo algoritmo. Por outro lado, no algoritmo alternativo impoe-se
a presenca de Tt quando esta e matriz identidade e de ct e Qt quando estas sao
matrizes nulas, o que poderia ser substitudo eficientemente pela omissao de tais
matrizes em Kt , Lt , at+1 e Pt+1 . Entretanto, os calculos em excesso do algoritmo
2 geram menores perdas de eficiencia computacional dada a simplicidade das
matrizes envolvidas.
Observe tambem que este segundo algoritmo e construdo com apenas um
1
rt,i1 = Zt,i Ft,i
t,i + Lt,i rt,i
0
0
1
Nt,i1 = Zt,i Ft,i Zt,i + Lt,i Nt,i Lt,i
40
end for
0
rt1,pt = Tt1 rt,0
0
Nt1,pt = Tt1 Nt,0 Tt1
end for
e o algoritmo de suavizacao correspondente ao algoritmo de filtragem 2 e o
seguinte:
Algoritmo 4
rPnj=1 pj = 0
NPnj=1 pj = 0
P
for t = nj=1 pj to 1 do
if t then
Tt = Tt
else
Tt = Im
end if
Lt = Tt Kt Zt
0
rt1 = Zt Ft1 t + Lt rt
0
0
Nt1 = Zt Ft1 Zt + Lt Nt Lt
t = at + Pt rt1
Vt = Pt Pt Nt1 Pt
end for
4.5
Inicializac
ao do Filtro de Kalman
Nas secoes anteriores supos-se o conhecimento, a priori, de a1 e P1 , o que
nem sempre e factvel. O problema da inicializacao surge quando o vetor de estado
tem pelo menos uma coordenada nao estacionaria, de forma que incide grande
incerteza sobre a media e variancia dessa coordenada, o que implica em dificuldade
para fixacao de a1 e P1 . Decompondo o vetor de estado em t = 1 como a soma de
dois termos, um contendo as coordenadas estacionarias(m q) e o outro as nao
estacionarias(q).
1 = a + A + R0 0 , 0 N (0, Q0 )
(4-13)
41
(4-14)
de (4-13) e (4-14)
a1 = E(1 ) = a
0
P1 = V ar(1 ) = AA + R0 Q0 R0 = P + P
Se o comportamento do i-esimo elemento de 1 esta descrito por um
processo estacionario, entao o i-esimo elemento de a e a media incondicional do
dito processo e zero se o processo for nao estacionario. A matriz P e a matriz de
variancias e covariancias dos processos estacionarios de 1 ; o problema surge na
obtencao da matriz P .
Se for pre-especificado num valor numericamente grande (diga-se 104
a 109 ) de certa forma estaria refletindo uma grande incerteza sobre as coordenadas nao estacionarias de 1 (Harvey and Phillips, 1979). Esta alternativa de
inicializacao e chamada big e a implementacao e muito simples, mas esta
alternativa nao tem um sustentacao teorica satisfatoria. Alem disso pode gerar
problemas computacionais numericos, tais como diferentes resultados na filtragem
para diferentes valores de e dificuldades de convergencia numerica no processo
de estimacao de parametros.
A outra alternativa para tratar o problema de inicializacao das coordenadas
nao estacionarias e chamada de inicializac
ao exata, a qual faz uso da expansao
de matrizes como series de potencia de 1 considerando somente os dois ou tres
primeiros termos, e quando fazemos obtemos o termo dominante. Esta
ideia foi introduzida por Ansley e Kohn (1985), e depois foram considerados em
forma mais claros por Koopman (1997), Durbin & Koopman (2001). Quando o
vetor de estado tem pelo menos uma coordenada nao estacionaria, o processo de
inicializacao e chamada de inicializacao difusa. Da mesma forma vai existir um
d N, onde P,t 6= 0; t d considerada como a parte difusa da filtragem.
As recursoes de filtragem mudam para t d e para valores t > d, passando da
parte difusa do filtro para o filtro normal em t = d + 1. Mas tambem ha que
ter em consideracao o problema que acontece quando a matriz de variancias e
covariancias das inovacoes e singular na parte difusa (F,t = 0), pois ela pode
ser zero ainda quando P,t 6= 0. Para isso a filtragem na parte difusa se divide
42
F,t = Zt P,t Zt
0
F,t = Zt P,t Zt + Ht
0
M,t = P,t Zt
0
M,t = P,t Zt
Para P,t 6= 0: para F,t 6= 0
(1)
1
= F,t
(2)
1
1
= F,t
F,t F,t
(0)
= Tt M,t Ft
(1)
= Tt M,t Ft
(0)
(0)
Ft
Ft
Kt
Kt
(1)
(2)
(1)
+ Tt M,t Ft
Lt = Tt Kt Zt
PUC-Rio - Certificao Digital N 0812165/CA
(1)
(1)
Lt = Kt Zt
(0)
(0)
(0)
= yt Zt at dt
(0)
(0) (0)
at+1 = Tt at + Kt t + ct
(1)0
P,t+1 = Tt P,t Lt
(0)0
+ Tt P,t Lt
+ Rt Qt Rt
(0)0
P,t+1 = Tt P,t Lt
: para F,t = 0
(0)
(0)
Lt = Tt Kt Zt
(1)
(1)
Lt = Kt Zt
0
P,t+1 = Tt P,t Tt
(0)0
P,t+1 = Tt P,t Lt
+ Rt Qt Rt
Quando P,t 6= 0 a filtragem passa da parte difusa para a nao difusa e as recursoes
de filtragem e suavizacao para t > d sao as mesmas dadas em (4-4) e (4-5), onde
(0)
(0)
Pt = P,t , at = at e t = t .
43
rd = rd
(0)
N d = Nd
(1)
rd = 0
(1)
Nd = 0
(2)
Nd = 0
(0)
(0)0 (0)
(1)
(0)
(0)0
(1)
(1)
(0)0
(1)
(0)
(1)0
(2)
(2)
(0)0
(2)
(0)
(0)0
rt1 = Lt rt
(0)0 (1)
(1) (0)
(0)0 (0)
rt1 = Zt Ft t + Lt rt + Lt rt
(0)
Nt1 = Lt Nt Lt
(0)
(0)0
(0)
(0)
(1)
Nt1 = Zt Ft Zt + Lt Nt Lt + Lt Nt Lt + Lt Nt Lt
Nt1 = Zt Ft Zt + Lt Nt Lt + Lt
(0)
(0)
(0)0
(1)
(1)
(1)0
(0)
(1)
(1)0
(1)
(1)
(1)
(2)
Vt = P,t P,t Nt1 P,t P,t Nt1 P,t P,t Nt1 P,t P,t Nt1 P,t
Como foi dito d e a quantidade de dados necessarios ate estabilizar o
processo de filtragem. Nao e possvel assegurar de forma geral que a quantidade
d num modelo em espaco de estado multivariado com estados nao estacionarios e
o mesmo quando se faz um tratamento univariado para series multivariadas.
importante mencionar que o valor d geralmente e diferente, dependendo
E
se se faz um tratamento univariado ou um tratamento multivariado, pois e
simplesmente observar que d depende do valor que tome P,t e esta matriz tem
uma evolucao no tempo que muda de um tratamento para outro dependendo do
valor que tome a matriz Tt , Zt etc; vide exemplo no apendice.
4.6
Estimac
ao por m
axima verossimilhanca
Nas secoes anteriores foram descritos a estrutura de um modelo em espaco
de estado e a inicializacao do processo de filtragem. Ate esse ponto foi considerado
que os parametros dos quais depende a estrutura e comportamento do modelo sao
conhecidos. Nesta secao sera tratada uma das metodologias usada para a estimacao
dos parametros, que consiste na maximizacao da verossimilhanca como funcao do
vetor de parametros fixos do modelo ou hiperparametros.
4.6.1
(1)
(0)
+ Lt Nt Lt + Lt Nt Lt + Lt Nt Lt
44
Evaluac
ao da verossimilhanca
Seja Yt = (y1 , . . . , yt ), um vetor de parametros e considerando o ponto
de inicializacao do filtro a1 () e P1 (). A verossimilhanca do modelo esta definida
por4 :
L(y, ) = p(y1 , . . . , yn ; ) = p(y1 )
n
Y
p(yt |Yt1 ; )
t=2
n
X
(4-15)
t=1
onde p(y1 |Y0 ) = p(y1 ). Para o modelo (4-3) a verossimilhanca e dada por:
n
log L(y, ) =
np
1 X
log 2
log |Ft | + t0 Ft1 t
2
2 t=1
(4-16)
onde t e Ft sao obtidas do processo de filtragem. A equacao de verossimilhanca (4ao difusa (o vetor de estado so tem processos estacionarios),
16) e valida na parte n
enquanto que a verossimilhanca difusa (o vetor de estado tem processos nao
estacionarios) e dada por:
d
n
np
1X
1 X
log Ld (y, ) = log 2
t
log |Ft | + t0 Ft1 t
2
2 t=1
2 t=d+1
(4-17)
onde:
(
t =
log |F,t |,
se F,t e definido positivo
(0)0 1 (0)
log |F,t | + t F,t t
se F,t = 0
(4-18)
Considerando d = 0 podemos ter que Ld (y, ) = L(y, ). Entao pode-se dizer que
a equacao (4-18) e generalizada para os modelos com estados estacionarios e nao
estacionarios.
4
45
46
4.7
Diagn
osticos e medidas de ader
encia
4.7.1
An
alise de resduos
(p)
Plot no tempo
FAC e FACP (nvel ou quadrado)
Media e variancia amostrais
Histograma e QQ-plot
4.7.2
Medidas de ader
encia
As medidas de aderencia sao calculadas para valorar a qualidade de ajuste
do modelo, as medidas consideradas sao as seguintes:
Pn
yt yt|t1
100
MAPE = nd
t=d+1
yt
2
Pn
1
MSE = nd
y
t
t|t1
t=d+1
2
2 2
Pseudo R (R ) = Corr(yt , yt|t1 )
+ (q + w) log n
BIC = n1 2 log Ld ()
47
4.8
Modelos do preco de petr
oleo em forma de espaco de estado
4.8.1
Modelo SS padr
ao
O modelo SS padrao em forma de espaco de estado para as 13 maturidades
com as quais se fara a estimacao, esta representado pelas seguintes equacoes:
Equacao de Medidas
A (1 )
ln Ft,1
ln Ft,2 A (2 )
=
..
..
.
.
A (13 )
ln Ft, 13
e1
e2
..
.
1
1
..
.
e13 1
t,1
t,2
..
.
t,13
(4-19)
Equacao de Estado
!
!
!
!
!
t
0
et 0
tt
1,t
=
+
+
(4-20)
t
t
0
1
tt
2,t
Consideramos t,1 , . . . , t,13 descorrelatados. Isso nao quer dizer que as
series de precos a diversas maturidades sejam descorrelatadas, pois elas sao funcao
do mesmo vetor de estado, e assim isso faz com que elas conservem a correlacao
capturada pelos fatores. O seguinte comportamento para os erros da equacao de
medidas.
t,1
t,2
.
.
.
t,13
0
0
..
.
0
21
0
..
.
22
..
.
0
..
.
0
..
.
...
213
As estimacao dos parametros fixos do modelo e efetuada sobre os seguintes subespacos parametricos.
Tabela 4.3: Espacos parametricos
Smbolo Espaco parametrico
R+
R+
R
1
< 0, 12
>
[0, 1]
R
i
R+ , i = 1, . . . , 13
48
ln Ft,1
ln Ft,2
..
.
ln Ft,13
e 1 1
2
e
1
+
..
..
.
.
B (13 )
e 13 1
B (1 )
B (2 )
..
.
1e 1
1e 2
..
.
1e 13
t +
t,1
t,2
..
.
t,13
Equacao de estado
t
t
e
0
0
tt
1,t
0
1
t tt + 2,t
t =
t
0
0 e t
tt
3,t
assumida a seguinte
onde 1,t = z , 2,t = z e 3,t = z . E
distribuicao para o vetor de erros da equacao de estado.
t
0
2 t
0
1,t
2 t
0
2,t N 0 , t
0
0
2 t
0
3,t
49
4.8.3
Modelo multivariado para o petr
oleo e derivados
Consideremos d derivados com hi precos futuros, i = 1, . . . , d e r com preco
spot. O modelo em forma de espaco de estado sera dado pelas seguintes equacoes:
Equacao de Medidas
Yt = B + At + t
(4-21)
onde:
(1)
ln Ft,1
..
ln F (1)
t,h1
..
(d)
ln Ft,1
,B =
Yt =
..
(d)
ln F
t,
hd
ln St(d+1)
..
(d+r)
ln St
1,1 eX 1
1,2
.
..
..
X h1
1,2
1,1 e
.
..
..
.
d,1 eX 1
d,2
A=
..
..
.
.
eX hd
d,2
d,1
d+1,1
d+1,2
..
..
.
.
d+r,1
d+r,2
Equacao
Xt
Et
Ut
de Estado
t
e X
0
0
1
=
0
(1)
t,1
B1 (1 )
..
..
.
.
(1)
B1 (h1 )
t,h1
.
..
..
.
(d)
Bd (1 )
, t = t,1
..
..
.
.
(d)
Bd (hd )
t,hd
(d+1)
t
d+1,0
..
..
.
.
(d+r)
d+r,0
t
(1 eU 1 )
..
1,2
U h1
(1
e
)
..
X
t
d,2
(1 eU 1 )
U
, t =
Et
..
.
Ut
d,2
U hd
(1 e
)
U
..
0
1,2
U
0
t
0 eU t
w1,t
Xtt
Ett + w2,t
w3,t
Utt
(4-22)
50
2
w1,t
0
X
t
XE X E t
0
E2 t
0
w2,t N 0 , XE X E t
0
0
U2 t
0
w3,t
2
futuro com maturidade do derivado i. Enquanto que ,i
e a variancia do erro
correspondente ao preco spot do derivado i.