Escolar Documentos
Profissional Documentos
Cultura Documentos
1 O PROBLEMA DE PESQUISA
1.1 INTRODUO
A rea de Finanas, por exemplo, vem, ao longo das ltimas duas dcadas,
modificando-se e se transformando em uma cincia eminentemente quantitativa, em que
so usadas ferramentas como Estatstica, Matemtica e Cincia da Computao para que
o processamento das informaes fornea resultados mais precisos e confiveis,
principalmente ligados aos modelos de previso (ZOU; YANG, 2004).
Atualmente, uma nova metodologia para decomposio de sries via ondaletas, visando
anlise de sries temporais, surgiu como uma rea da Matemtica Aplicada em rpido
desenvolvimento e com diversas aplicaes em vrios ramos da cincia e da
Administrao. Ondaletas so funes que consistem em fracionar a srie temporal
original em duas subsries, uma relativa as altas freqncias e a outra s baixas
freqncias (GENAY; SELUK; WHITCHER, 2002).
J crescente o nmero de pesquisas que esto se desenvolvendo com o uso desta nova
metodologia nos indicadores de bolsa de valores, como tratam Tak (1995), Lee (1999) e
Wong et al. (2003). No Brasil, ainda so poucos os trabalhos, como Chiann (1997) e
Homsy, Portugal e Arajo (2000).
Este trabalho visa explorar a melhoria da qualidade das previses com o uso da
decomposio da srie temporal via ondaletas, com o uso dos modelos j tradicionais de
previso, com os modelos j conceituados como a metodologia de Box e Jenkins e redes
neurais, para sucesses cronolgicas lineares e no-lineares simuladas.
15
Segundo Harrison e Stevens (1976), uma previso adequada deve dar suporte a uma
deciso minimizadora de risco por parte dos agentes tomadores de decises. Para
Shalizi et al. (2002), o futuro sempre desconhecido e, at certo ponto, imprevisvel e
uma previso sempre imperfeita, mas no intil.
Hanke e Reitsch (1995), ao explicarem o porqu de se fazer previso, afirmam que toda
previso uma tentativa de prognosticar o futuro atravs do exame do passado. Consiste
em gerar previses no enviesadas da magnitude de alguma varivel, como um ndice
de Bolsa, com base no conhecimento presente e passado acumulado em bases de dados
e na experincia dos gestores e outros profissionais envolvidos.
O surgimento da teoria de decomposio via ondaletas, a partir de meados dos anos 80,
que consiste em fracionar a srie temporal original em duas subsries, sendo uma
relativa s altas freqncias e a outra s baixas freqncias, por meio de formas de
ondas especficas, fez com que alguns autores comeassem a incorporar o uso desta
teoria em conjunto com outras tcnicas j convencionais para fins de previso
(GENAY; SELUK; WHITCHER, 2002).
Muitos algoritmos neurais para processamento temporal tm sido propostos, entre estes
destacam-se o algoritmo de retropropagao atravs do tempo (BPTT, back propagation
through time), aprendizado recorrente em tempo real (RTRL, real-time recurrent
learning ) e os algoritmos de redes recorrentes utilizando o filtro de Kalman.
V-se, ento, uma lacuna na literatura sobre previso existente no mercado brasileiro,
que o estudo conjunto da utilizao dos modelos ARMA-GARCH e de redes neurais,
dentro das subsries decompostas por meio de uma ondaleta especfica e que, aps a
previso feita dentro destas subsries, reconstruda a srie original pela mesma
ondaleta. A exemplo da pesquisa de Tak (1995) e Homsy, Portugal e Arajo (2000), o
presente estudo investiga a decomposio na srie original via uso de formas de
ondaletas especficas e tambm na reconstruo da srie original para obteno da
previso futura.
O diferencial deste trabalho est na realizao das previses dentro das subsries
decompostas por uma ondaleta em at dois nveis, e obtendo-se a previso da srie
original via reconstruo da srie para modelos construdos por processos geradores de
18
A anlise de ondaletas tem se mostrado, a partir de meados dos anos 80, uma
metodologia de bastante utilidade em vrios campos do conhecimento como Fsica,
Matemtica, e, na presente dcada, em Economia e Administrao, podendo-se
ressaltar, em econometria, sua utilizao como procedimento auxiliar para ajuste e
previso de sries de tempo (GENAY; SELUK; WHITCHER, 2002).
2 FUNDAMENTAO TERICA
Existindo informaes disponveis suficientes sobre o sistema que est em estudo, ento
uma abordagem matemtica pode ser desejvel, sendo que as equaes construdas
modelam os mecanismos responsveis pela gerao das sries temporais e como o seu
comportamento evolui.
1
Processos estocsticos so processos cuja evoluo no tempo gerado por leis probabilsticas.
22
para projetar o que provvel que ocorra durante algum curto perodo de tempo. Este
processo chamado de previso, isto , uma extrapolao feita para alm do processo
temporal conhecido. A juno destes dois processos o que se chama de anlise de
sries temporais. A estatstica , ento, utilizada para se estimar os parmetros e testar
estatisticamente estes modelos. Vale ressaltar que, na regresso, so feitas previses
dentro do domnio no qual a sucesso cronolgica foi observada.
Se os valores futuros de uma srie temporal forem determinados exatamente por alguma
funo matemtica, ento esta srie denominada determinstica. Caso os valores
futuros possam ser descritos apenas em termos de uma distribuio de probabilidade, a
srie temporal chamada de no-determinstica ou estocstico. Um fenmeno
estatstico que envolva leis da probabilidade no tempo chamado de processo
estocstico.
Nesta parte do trabalho, feita uma reunio das tcnicas, buscando uma organizao do
que se deseja fazer em relao previso, usando modelos de sucesses cronolgicas
no-lineares simuladas.
A previso de uma srie temporal a determinao dos provveis valores que sero
assumidos pela varivel de previso, dentro de um horizonte mximo de tempo. A
previso pode ser classificada como de curto, mdio e longo prazo, dependendo do
valor associado ao horizonte mximo de previso (DINIZ , 1999).
Souza (1989) ressalta que qualquer que seja o horizonte de previso (curto, mdio ou
longo prazo), no existe uma maneira clara de definir o horizonte mximo. Este
24
depender do grau de previsibilidade da srie, que, por sua vez, est associado ao erro
de previso.
Em relao s previses feitas para o IBOVESPA, alguns autores como Correia e Perera
(1997) e Morais e Portugal (1999) fizeram previses no curtssimo prazo (um passo
frente).
Souza (1989) frisa que foi, a partir dos trabalhos de Box e Jenkins, nos anos 70, que a
rea de previso comeou a despertar grande interesse. Quase que simultaneamente
surge, em 1971, a abordagem bayesiana dos modelos de previso propostos por
Harrison e Stevens (1971). Assim, tanto do lado conhecido, tambm chamado clssico,
como o lado bayesiano, toda a dcada de 70 foi dedicada implementao prtica dos
modelos propostos e as conseqentes melhorias metodolgicas sugeridas pela aplicao
real destes mtodos.
Em pesquisa feita por Mentzer e Cox (1984) sobre familiaridade com mtodos
qualitativos e quantitativos, 39% dos respondentes usavam tcnicas qualitativas em seus
negcios, contra 61% que afirmavam conhecer pelo menos uma tcnica quantitativa de
previso. Na pesquisa de Sanders e Manrodt (1994), o nmero de pessoas que j
trabalhavam com tcnicas quantitativas subiu para 76%, contra 24% das tcnicas
qualitativas. Em recente pesquisa de Jan (2003), apenas 13,95% dos respondentes
estavam empregando tcnicas qualitativas, 19,69% usavam modelos de causa e efeito
(regresso e modelos economtricos) e 63,08% utilizavam tcnicas quantitativas
(modelos de sries temporais) e 3,28% dos respondentes, utilizavam-se de outros
mtodos.
Jan (2003) comprovou, ainda, que 66,09% dos que usam modelos de sries temporais
so aplicados pelas empresas para previses no mercado financeiro.
Lawrence et al. (2000) sugerem alguns motivos pelos quais as previses subjetivas,
mesmo sendo realizadas por analistas experientes e com informaes contextuais do
mercado, no possuem bom desempenho:
as informaes contextuais podem no ter valor preditivo;
26
Dada a baixa capacidade preditiva das tcnicas qualitativas, esta pesquisa est focada
em tcnicas quantitativas de previso, e, portanto, apenas apresenta brevemente algumas
das tcnicas qualitativas mais utilizadas, sem detalhar seu funcionamento.
Para Yim (2001), os modelos estruturais propostos por Harvey (1989) so aqueles que
pressupem que uma srie de tempo resulta da combinao dos seguintes componentes:
tendncia, cclica, sazonal e irregular.
A previso com uso de sries temporais trata o sistema como uma caixa preta, sem
tentar descobrir os fatores que causam os comportamentos observados (WINKLHOFER
et al.,1996).
Segundo Makridakis et al. (1983), existem duas razes bsicas para tratar um sistema
como uma caixa preta:
1. o sistema no pode ser compreendido, ou mesmo que possa, difcil
medir o relacionamento entre as variveis que governam seu
comportamento; e
2. a preocupao pode ser simplesmente prever, com algum grau de
preciso, o que vai acontecer ou no.
28
Para Makridakis et al. (1983), a acurcia (previso em termos pontuais) vista como o
critrio primordial na anlise para seleo do melhor modelo de previso. A palavra
acurcia refere-se a o quo bem ajustado o modelo, isto , quanto o modelo
capaz de reproduzir os dados j conhecidos.
Et [ X t +1 ] = 0 + 1 X t (2.1)
29
dado por I t = { X t , X t 1, ...} . Segundo Enders (2003), pode-se definir o erro de previso j
X t + j e o previsor condicionado:
et ( j ) X t + j Et X t + j (2.2)
t = et 1 (1) = X t Et 1 [ X t ] (2.3)
E ainda, para encontrar o erro de previso para dois passos frente, tem-se:
et (2) X t + 2 Et [ X t + 2 ] (2.4)
sendo que X t + 2 = 0 + 1 X t +1 + t + 2 e
Et [ X t + 2 ] = 0 + 1 Et [ X t +1 ] (2.5)
Assim:
et (2) X t + 2 Et [ X t + 2 ] = et (2) = 0 + 1 X t +1 + t + 2 0 1 Et [ X t +1 ]
30
et (2) = 1 ( X t +1 Et [ X t +1 ]) + t + 2
et (2) = 1 t +1 + t + 2 . (2.6)
Generalizando:
et ( j ) = t + j + 1 t + j 1 + 12 t + j 2 + + 1j 1 t +1 (2.7)
Como se tem uma srie temporal com n perodos de tempo, logo ter-se-o n termos de
erro, e ento se pode calcular:
h
i (2.8)
Xi =1
MAPEh = i
100 % MAPE 0
h
h (2.9)
(X i X )( X i X )
rh = i =1
[ 1;1]
S X S X
(inclusive).
31
i
2
TICh = i =1
[ 0,1]
h h
X X
(2.10)
i
2
+ i
2
i =1 i =1
Outras medidas de acurcia das previses pontuais ainda podem ser definidas, apesar de
no serem to comuns na prtica. A escolha do critrio a ser utilizado para medir a
acurcia dos modelos no arbitrria e deve ser feita baseada nas caractersticas do
problema e das medidas citadas (HARDIE; FADER; WISNIEWSKI, 1998).
No caso das sucesses cronolgicas, diversos autores como Toloi (1980), Winklofer,
Witt e Diamatopoulos (1996), Diniz (1999) e Yim (2001), utilizaram o RMSE (raz do
32
erro quadrtico mdio) e o MAPE, indicando preferencialmente este ltimo por ser
computado por medidas absolutas (e no quadradas) e em porcentagem do valor
previsto.
DGP Simulado ou
sucesso
cronolgica real
Pr-Processamento
Teste Estacionariedade
- Teste de D.Pantulla
Teste Independncia
- Teste de BDS (sobre a srie bruta ou
pr-processada)
Independncia Dependncia
Se no Normal Se Normal
Ps-Processamento
Teste Independncia
- Teste de BDS (sobre os resduos)
Independncia Dependncia
Teste Normalidade
- Teste de JB
No Normal Normal
Identificar distribuio
Dizer que uma srie temporal estacionria, dizer que ela se desenvolve no tempo
aleatoriamente ao redor de uma mdia constante (reverso mdia), refletindo
alguma forma de equilbrio dinmico estvel.
C X (t ), X (t + k ) = ( k ) se t t + k .
Box e Pierce (1970, apud MORETTIN, 2002) sugerem um teste para detectar as
autocorrelaes dos resduos, que, apesar de no detectar quebras especficas no
comportamento de rudo branco, pode indicar se esses valores so muito altos. Um
aperfeioamento deste teste foi feito por Ljung e Box (1978), baseados na funo de
autocorrelao (FAC). A FAC, no lag k, indicada por k , definida como:
n
(X t X )( X t + k X )
(2.11)
k = t =1
n
(X
t =1
t X )2
que nada mais do que a covarincia do ativo na defasagem k, dividido pela varincia
do ativo. Como, tanto a covarincia como a varincia apresentam as mesmas unidades,
k no tem unidade. Oscila entre 1 e 1 e o grfico feito colocando k contra k
A estatstica teste :
m
k2 (2.12)
LB = n(n + 2) ~ m
k =1 n k
2
36
que segue uma distribuio qui-quadrado com m graus de liberdade ( m2 ), sendo que k
o tamanho da defasagem e m a defasagem mxima considerada.
k > q:
( )
1 (2.13)
V ( k ) = 1 + 2 12 + + 2 q2
n
para k = q + 1, q + 2, .
Vandaele (1983) sugere uma regra prtica: se para k maior do que cinco, o valor do
coeficiente de autocorrelao ainda for maior que 0,7, em mdulo, a srie deve ser
considerada no-estacionria. Da calcula-se a primeira diferena e aplica-se a regra at
que se obtenha uma srie estacionria.
autocorrelao parcial (FACP), obtida pelas estimaes do valor kk como uma funo
de k
M k* (2.14)
kk =
Mk
Empiricamente, pode-se dizer atravs da anlise do grfico da FAC que a srie temporal
ser no estacionria se o correlograma apresentar uma queda demorada, e ainda,
podendo ser regular e contnua, o que d indcios de no apresentar sazonalidade. Caso
essa queda demorada seja descontnua com picos irregulares por um perodo ou padro
cclico, indicativo de presena de sazonalidade.
Enders (2003) afirma que se pode utilizar os critrios AIC (Akaikes Information
Criteria), proposto por AKAIKE (1973, 1974) e BIC (Bayesian Information Criteria)
proposto por GEWEKE e MEESE (1981), apud Cromwell, Labys e Terraza (1994).
Esses processos so baseados na estimao da varincia do t , no tamanho da amostra h
( )
BIC = n ln 2t (n p q ) ln 1
p+q
+
n
2
1 x
(2.16)
+ ( p + q ) ln(n) + ( p + q ) ln ( p + q ) 1
2
t
Escolhe-se aquela especificao que apresentar o menor valor para AIC ou BIC. Os
autores recomendam ainda que os critrios AIC e BIC sejam considerados apenas como
procedimentos complementares e no alternativos, as FAC e FACP.
H 0 : 2 RU
H1 :1RU
H 0 :1RU
H1 : 0 RU
A estatstica do teste ADF tem a mesma distribuio assinttica que a estatstica de DF,
de modo que podem ser usados os mesmos valores crticos, conforme a Tabela 1 do
Apndice A.
O teste mais comum aplicado para verificar a normalidade o teste de Jarque e Bera
(1987), que um teste assinttico, isto , para grandes amostras. A estatstica de clculo
:
A 2 (C 3) 2
JB = n + (2.17)
6 24
40
3 (X
A = ( X t X )3 e C representa a curtose dado por C = X )4 .
n t =1 n 4
t
t =1
zero
A hiptese nula H 0 : a srie normal, tem distribuio qui-quadrado com dois graus
Assim, para testar a normalidade de uma sucesso cronolgica, basta estimar os valores
de A e C , calcular a estatstica JB e comparar com o valor tabelado dado um nvel de
significncia previamente adequado. Outra forma analisar o nvel de significncia
adotado do teste, sendo que se o p-valor for suficientemente baixo, rejeita-se
H 0 ,caso contrrio se o p-valor for razoavelmente alto, no se rejeita H 0 , ou seja,
Segundo Cromwell, Labys e Terraza (1994), a independncia estatstica requer que uma
distribuio de probabilidade de uma sucesso cronolgica, para um conjunto de
variveis aleatrias, possa ser escrita como um produto das distribuies marginais para
cada uma das variveis aleatrias. Por exemplo, f ( x1 , x2 ) = f ( x1 ) f ( x2 ) . Na prtica, o
O teste para independncia pode ser aplicado para testar se a sucesso cronolgica
apresenta independncia estatstica, pois, se for, esto o processo estatisticamente um
rudo branco independente, que ser definido a seguir.
{ X t }t =1 = { X t n+1 , , X t } ,
n
dados em vetores n-dimensionais como sendo que o
Cn (k ) lim Cn ,T (k ) (2.18)
T
T T
k st
Cn ,T (k ) s =1 t = s
(2.19)
T (T 1) / 2
1, se max X s i X t 1 < k
k st = (2.20)
0, caso contrrio
Cn (k ) = C1n (k ) (2.21)
Cn +1 (k )
= Pr max X s i X t 1 < k max X s i X t 1 < k = Pr X s X t < k max X s i X t 1 < k
Cn ( k ) i = 0,1,, n i =1,, n i =1,, n
pode ser interpretada como uma probabilidade condicionada. Fixando
Cn +1 (k ) / Cn (k ) = C1 (k ) para todo n positivo, obtm-se a equao (2.21).
Cn ,T (k ) C1,nT (k )
J n ,T (k ) = T (2.22)
n ,T (k )
sendo que:
1
n 1 2
n ,T (k ) = 4 wn + 2 wn j c 2 j + (n 1) 2 c 2 n n 2 wc 2 n 2 em que
j =1
c = C1, n (k )
6 n n n (2.23)
w= hk ( X t , X s , X r )
n(n 1)(n 2) t =1 s =t +1 r = s +1
1
hk (i, j , k ) = ki , j k j , w + ki , w k w, j + k j ,i ki , w (2.24)
3
Entretanto, nos resultados dos testes subseqentes, que ficar claro que a rejeio da
hiptese de que as variveis aleatrias que compem uma sucesso cronolgica
apresentam distribuio independente e est mais fortemente associada existncia de
dependncia linear ou no-linear nas sucesses cronolgicas simuladas.
43
Vale lembrar que foi atravs das pesquisas em torno da Teoria do Caos determinstica
que se agregaram procedimentos teis para tratamento da no-linearidade,
especialmente no teste BDS para verificao de no-linearidade em sucesses
cronolgicas (CORREA; PEREIRA, 1997).
nk
(X
j =1
2
j 2 )( X 2j + k 2 )
X (k ) =
2 n
(2.25)
(X
j =1
2
j )
2 2
44
X
j =1
2
j
em que 2 = .
n
{ }
n
com n graus de liberdade se a seqncia X t2 no correlacionada.
t =1
t = r + 1, , n . A estatstica de teste
S = nR 2 (2.26)
que segue uma distribuio assinttica 2 (r ) com r graus de liberdade em que n o
q
t2 = 0 + t t2 s + t , sendo {t } um processo de rudo branco.
s =1
Uma vez estabelecido que existe algum tipo de no-linearidade em uma sucesso
cronolgica, preciso filtrar o tipo de no-linearidade existente. Hsieh (1989) props
um teste para detectar os dois tipos diferentes de no-linearidade: aditiva (no-
linearidade na mdia) ou multiplicativa (no-linearidade na varincia).
E[ X t X t 1 , , X t k ] = 0 .
O teste segue assintoticamente uma distribuio normal padro N(0,1), sendo que, por
exemplo, o valor (i, j ) < 1,96 com 95% de confiana no se rejeita a hiptese nula de
Muitas das idias hoje conhecidas nos modelos ARIMA foram desenvolvidas, nos anos
70, por George Box e Gwilym Jenkins2 e por estas razes os modelos ARIMA so
chamados de modelagem ou metodologia Box-Jenkins. Vale lembrar que uma srie de
tempo pode conter os trs filtros ou apenas um subconjunto destes, resultando a em
vrias alternativas de construo dos modelos passveis de anlise pela metodologia de
Box e Jenkins (1976).
2
Para mais detalhes vide BOX, JENKINS e REINSEL, 1994.
3
H uma certa confuso ocasionada pela nomenclatura dada para ARIMA. Existem duas ambigidades:
1) O termo Integrated, representado pela letra I no nome da tcnica, refere-se ao processo de diferena
fintia, a srie pelo fato dela no ser estacionria, e no pela inteno de integrar a srie; 2) o termo
moving average mdias mveis tem neste mtodo um significado diferente daquele usado nos
47
Para Enders (2003), um modelo ARIMA pode ter qualquer componente, ou ambos os
componentes sazonais e no sazonais. Existem diferentes tipos de modelos ARIMA e a
forma geral para se descrever um modelo de esperana condicionada o SARIMA (p, d,
q):(P, D, Q)S onde, ao primeiro parnteses, cabe a parte no sazonal e o segundo a parte
sazonal do modelo que pode ser aditivo ou multiplicativa. No caso dos modelos com a
parte sazonal, estes costumam ser encontrados na literatura com o nome de SARIMA,
sendo que o S representa periodicidade sazonal. E ainda:
p se refere ordem do processo AR auto-regressivo, no sazonal, incorporado
no modelo ARIMA, e P se refere ordem do processo AR sazonal;
d se refere ordem de integrao ou diferenciao da parte no sazonal e D a
parte sazonal da integrao ou diferenciao;
q se refere ordem do processo de mdias mveis, no sazonal, incorporado no
modelo e Q a ordem da parte sazonal de mdias mveis.
A construo dos modelos estocsticos discretos para sries temporais feita via rudo
branco. A seqncia { t }t =1 dita ser um rudo branco se cada valor da seqncia tiver
n
Formalmente, pode-se definir, segundo Hamilton (1994), rudo branco (RB) como uma
{E [ ] = 0}
n
t t =1
(2.28)
(ii) Os erros entre instantes de tempo distintos so no correlacionados e
todas as suas varincias so iguais (homocedasticidade):
mtodos de suavizao, referindo-se srie dos termos dos erros em diferentes perodos de tempo
considerados: Yt = + b1et 1 + b2 et 2 + + bk et k + et .
4
Entende-se por filtragem ou tratamento, um caminho antes de analisar os dados, visando melhorias na
interpretao e utilizao dos dados alm de resumir os efeitos na autocovarincia (HAMILTON, 1994).
48
C [ t ; s ] = 0, s t
n
V [ t ] = t =1
2
{ t }t =1 ~ RB
n
(2.29)
Pode-se definir ainda rudo branco independente (RBI) como uma srie de erros
estocsticos { t }t =1 se:
n
{E [ ] = 0}
n
t t =1
(2.30)
(ii) os erros so estocasticamente independentes entre instantes de tempo
distintos:
t = et R
f1 ; 2 ;; n e1 ; e2 ; ; en = ft et
n
t =1
{ t }t =1 ~ RBI
n
(2.31)
Define-se rudo branco independente normal (RBIN) como uma srie de erros
estocsticos { t }t =1 se:
n
{E [ ] = 0}
n
t t =1
(2.32)
(ii) os erros so estocasticamente independentes e normalmente distribudos
entre instantes de tempo distintos:
{ N ( 0; 2 ) }
n
t
t =1
t = et R
1 e
2
1
ft et = exp t 2
2 2
n
f1 ; 2 ;; n e1 ; e2 ; ; en = ft ( et )
t =1
49
2 0 0
1 0
n = ~ N n ;
0 0
0 0
n 0
2
0 0
= N n 0 ; 2 I n
n1
{ t }t =1 ~ RBIN
n
(2.33)
Segundo Box, Jenkins e Reinsel (1994), a parte auto-regressiva dos modelos ARMA
usa variveis independentes para predizer a varivel dependente. O termo auto-
regressivo indica que as sries de valores a serem previstos provem dos valores
passados para predizer o valor futuro quando h autocorrelao entre as observaes.
Quando se cita ordem do modelo, faz-se referncia diferena entre o valor a ser
previsto e o nmero de defasagens usadas como preditores. Se a srie de valores utilizar
2 valores passados para prever o valor atual, tem-se um modelo auto-regressivo de
segunda ordem, indicado por AR(2), isto , o valor X t da srie depender dos valores
X t 1 e X t 2 .
bem como a componente do erro t ~ N (0, 2 ) , que indica o erro ou o termo aleatrio
no, correlacionado com mdia aritmtica zero e varincia constante. Respeitadas aqui
as condies de estacionariedade do modelo.
X t = 1 X t 1 + 2 X t 2 + + p X t p + t (2.35)
sendo que,
X t 1 X t 1 2 X t 2 p X t p = t (2.39)
(2.40)
X t 1 LX t 2 L2 X t p Lp X t = t
X t (1 1 L 2 L2 p Lp ) = t (2.41)
p ( L) X t = t (2.42)
De acordo com Box, Jenkins e Reinsel (1994), os termos de mdias mveis dos
modelos ARIMA representam as defasagens dos valores dos erros passado e presente,
muitas vezes, chamado de rudo branco5, usado quando h autocorrelao entre os
resduos. Pode-se interpretar tambm os termos de mdias mveis como eventos
externos ou choques no sistema, isto , uma mudana nos valores no previstos no
ambiente pode influenciar tanto os valores passados como os valores futuros. Assim, o
5
O termo do erro chamado de rudo branco se ele possui mdia zero, varincia constante 2 e no
autocorrelacionado. Ao se estimar um modelo, deseja-se que o erro seja um rudo branco.
51
X t = t q ( L) (2.46)
observveis e tm de ser estimadas, usando a amostra de dados disponvel. Para que isso
no cause problemas, usual manter o valor de q o tanto menor quanto possvel. Na
prtica, esse valor de q freqentemente tomado como sendo 0, 1 ou 2. primeira
vista, pode parecer que X t no depende de seu prprio passado quando um modelo
e, assim, sucessivamente.
A metodologia proposta por Box e Jenkins (1976) define trs passos para a construo
do modelo de previso:
Caso contrrio, a srie ser estacionria, o valor de d ser zero e passa-se para a
identificao dos demais filtros AR e MA. Cabe ressaltar aqui, que nem sempre a
diferenciao suficiente para estacionarizar a srie, sendo que se esta tiver tendncia
determinstica, dever ser removida antes ou se usar outro modelo. Se a no
estacionariedade estiver associada varincia da srie, pode-se optar por usar
transformaes como logaritmo neperiano ou raiz-quadrada (VASCONCELLOS e
ALVES, 2000).
2) estimao:o segundo passo consiste em estimar os parmetros p, d e q do
modelo e a varincia do rudo branco 2 , observando sempre a minimizao dos
critrios AIC e BIC6.
3) verificao: consiste em verificar a eficcia da estimao dos parmetros do
modelo. Caso falhe na eficcia dos parmetros, o processo refeito desde a
identificao para se obter o ajuste timo do modelo.
Ou ainda:
X t 1 X t 1 2 X t 2 p X t p = t + 1 t 1 + 2 t 2 + + q t q (2.49)
X t 1 LX t 2 L2 X t p Lp X t = t + 1 L t + 2 L2 t + + q Lq t (2.50)
Ou, simplesmente:
6
Critrios AIC (Akaikes Information Criteria) proposto por AKAIKE (1973, 1974) e BIC (Bayesian
Information Criteria) proposto por GEWEKE e MEESE(1981), apud Cromwell, Labys e Terraza (1994).
54
p ( L) X t = t q ( L) (2.51)
X
sendo Yt = ln t = ln( X t ) e
X t 1
p ( L)
tARIMA( p ,1,q ) = Yt = p ( L) q1 ( L) ln X t
q ( L) (2.52)
tARIMA( p ,1,q ) ~ RB
Poderia ter-se ainda caso a srie seja no estacionria, definir uma nova varivel Z t
Z t = X t X t 1 = X t (2.54)
Z t = 1 d X t 1 + 2 d X t 2 + + p d X t p + t 1 t 1 2 t 2 q t q (2.57)
Indicando Wt = d X t tem-se:
(1 L + L ) w = (1 L L )
1 p
p
t 1 q
q
t
(2.59)
Wt = (1 L) d X t (2.60)
(1 L) d p ( L) = q ( L) t (2.61)
55
RB.
Para Enders (2003), a teoria econmica sugere que um grande nmero de sucesses
cronolgicas econmico-financeiras fornea evidncias de exibir um comportamento
no-linear, conforme sugerido por Morettin (2002), visto que, as sries financeiras
apresentam instabilidades no tempo e peculiaridades institucionais que fazem com que
os modelos de coeficientes fixos lineares e gaussianos sejam inadequados para
aproximar tais sries. O objetivo passa a ser ento, modelar o que se chama de
volatilidade, que a varincia condicional de uma varivel, comumente um retorno.
Tsay (2002) define um modelo no-linear como sendo aquele em que a condio de
primeira ordem para a estimao dos parmetros por mnimos quadrados gera funes
no-lineares nos parmetros. Dessa forma, a no-linearidade definida em termos das
tcnicas necessrias para estimar os parmetros, e no da forma funcional da regresso.
Xt = f ({ } ) = f ( ,
s s =t t t 1 , t 2 , ) (2.62)
sendo que se assume que os choques possuem esperana nula e varincia unitria, t
(2.63)
X t = f ( t , t 1 , t 2 ,) + ( t t0 ) f ( t , t 1 , t 2 ,) +
t = 0
t t
2
+ ( t t0 ) f ( t , t 1 , t 2 ,)
2
+
t2
t = t0
57
centrado condicionado de ordem p, e definindo g ( t 1 , t 2 ,) Et 1 [ X t ] , pois
(2.64)
X t f ( 0, t 1 , t 2 ,) + t f ( 0, t 1 , t 2 ,)
t
E ( X t Et 1 [ X t ]) = Vt 1 [ X t ] = h 2 (.) E t2
2
(2.66)
Vt 1 [ X t ] = h 2 (.) 1 (2.67)
h(.) = Vt 1 [ X t ] (2.68)
X t Et 1 [ X t ] t Vt 1 [ X t ] (2.70)
et 1 (1) X t Et 1 [ X t ] = t Vt 1 [ X t ] (2.71)
(2.72)
et 1 (1) t Vt 1 [ et 1 (1) ]
58
Para Enders (2003), os modelos ARCH e GARCH so muito aplicados a estes tipos de
dados por captarem os fatos estilizados citados pelos autores acima. Existem ainda
outras classes de modelos no-lineares como o modelo de volatilidade estocstica que
modela a varincia atravs de um processo no observado, tentando captar a notcia que
chega ao mercado, os modelos TAR (Limiar Auto-regressivo) que incluem no-
linearidades na esperana e os bilineares.
(agrupamentos). O autor frisa, ainda, que uma abordagem para tratar esta situao e
explorar o fato de que os outliers aparecem em clusters e tentar construir um modelo de
srie temporal para estes prprios outliers. Ou seja, devido presena de conjuntos de
valores discrepantes, a varincia das sries temporais financeiras devero variar em
funo do tempo e, conseqentemente, os intervalos de previso tambm devero para
cada nvel. Logo, os modelos no-lineares so aplicados quando as sries so no
serialmente correlacionadas, mas dependentes.
Para os modelos da equao (2.65) vista anteriormente, pode-se gerar, existe uma
grande variedade de modelos no-lineares disponveis na literatura. Destacam-se, a
seguir, alguns destes modelos. Para mais detalhes, ver Tsay (2002).
Segundo Morettin e Toloi (2004), esta uma expanso envolvendo termos lineares,
bilineares etc. dos t .
Segundo Cromwell, Labys e Terraza (1994), a idia bsica da classe dos modelos
lineares por partes, tambm chamados de modelos TAR (threshold autoregressive)
a linearizao por partes por meio da introduo de limiares.
limiar d. Segundo Morettin (2004), os modelos com quebras estruturais podem ser
includos nessa classe de modelos e um dos objetivos estimar os pontos de mudanas
de regimes.
{ ( ( X ) )
} { ( ( X ) )
}X
2 2
X t = 1 + 1e t 1
X t 1 + ... + p + p e t p
t p + t (2.77)
( p1) i =
inclusive.
p ( L)
tARIMA( p ,1,q ) = Yt = p ( L) q1 ( L) ln X t da equao (2.56) definido a partir da
q ( L)
equao (2.72):
t t Vt 1 [ t ] (2.78)
sendo que:
{ t }t =1 RBIN ( 0;1) e { t } RB
n
{ t } e { t } independentes
+ j ( t2 j )
GARCH ( r,s )
s r
Vt 1 tARIMA(p,1,q) + i Vt i 1 tARIMA(p,1,q)
i >0
i =1 j =1
Br ( L) Vt 1 [ t ] = As ( L) ( t2 )
GARCH ( r,s )
(2.79)
>0
i > 0, i = 1, 2, , r (parmetros GARCH) (2.80)
j > 0, j = 1, 2, , s (parmetros ARCH)
V tARIMA(p,1,q) = r s
= 2 > 0 (2.81)
1 i i
i =1 i =1
r s
1 i i > 0 V tARIMA(p,1,q) < (2.82)
i =1 i =1
X t Et 1 [ X t ] vt Vt 1 tARIMA(p,1,q) (2.83)
ARIMA GARCH
63
p ( L ) q1 ( L ) ln X t (
vt Br1 ( L ) As ( L ) tARIMA(p,1,q) )
2
(
p2 ( L ) q2 ( L )( ln X t ) vt2 Br1 ( L ) As ( L ) tARIMA(p,1,q) )
2 2
(2.84)
( )
GARCH(r,s)
ARIMA(p,1,q) 2 vt2 p2 ( L ) 2q ( L ) Br ( L ) As1 ( L ) ( ln X t )
2
t
E ainda:
Et 1 tARIMA(p,1,q) = E tARIMA(p,1,q) = 0
Vt 1 tARIMA(p,1,q) = Et 1 ( tARIMA(p,1,q) )
2
(2.85)
E Vt 1 tARIMA(p,1,q) = E E t 1 ( tARIMA(p,1,q) ) = 2
2
Bollerslev, Chou e Kroner (1992) mostraram que, na prtica, tpico encontrar que o
modelo GARCH (1,1) produz uma descrio adequada de muitas sries temporais
financeiras.
64
(2.68) podem ser geradas, mostrando que um modelo GARCH (r,s) pode descrever
sries temporais com seqncias de grandes observaes, tanto positivas quanto
negativas. A FAC de t2 pode ser encontrada, aplicando as mesmas tcnicas dos
modelos ARCH (BOLLERSLEV, 1997).
Diniz (1999) utilizou modelos ARIMA na modelagem da srie dos retornos dirios dos
preos mnimo e mximo da Telebrs, no perodo de 01/08/94 a 13/03/97. Obteve
melhores resultados nas previses um passo-a-frente. Estudou as funes FAC para
identificao dos modelos e chegou em ARIMA (1,1,0) para a srie dos preos mnimo
e ARIMA (2,1,0) para os valores mximo. Mediu a acurcia dos modelos pelo MAPE,
que forneceu 2,29% para os valores mnimos e 1,97% para os valores mximos.
sinais de entrada, atribuindo pesos aos sinais; o segundo estgio consiste da aplicao de
uma funo de sada, chamada de funo de ativao (HILL; OCONNOR;
REMUS,1996).
wk0 = bk
Entrada ( i )
Fixa x0 = wk0
1
x1 wk1
Potencial
de Funo de
x2 wk Ativao
Sinais de Ativao
v Sada
k
Entrada (.) yk
Juno
aditiva
x wk
Pesos
sinpticos
Figura 2: Modelo de um neurnio artificial
Fonte: HAYKIN, 2001.
yk = ( uk + bk ) (2.87)
O modelo linear tem a propriedade til de ter uma soluo de forma fechada para
resolver o problema de uma regresso, ou seja, de minimizar a diferena quadrtica
entre oi e o valor previsto p i . Para a previso de um perodo curto, o modelo linear
A rede neural uma alternativa aos modelos lineares e a algumas abordagens no-
paramtricas para a aproximao de sistemas no-lineares. A razo para o uso de uma
rede neural simples e direta. O objetivo encontrar uma abordagem ou mtodo o qual
realize bem previses para dados gerados para processos que, freqentemente, so
desconhecidos e altamente no-lineares, com uma quantidade pequena de parmetros e
o qual seja mais fcil de estimar que os modelos no-lineares paramtricos (DE
OLIVEIRA, 2003).
camada de sada
W 2kj
camada intermediria
W 1 jn
camada de entrada
Usando I para indicar a camada de entrada (input) e O para sada (output), e ainda o
sobrescrito i para camada de entrada, h (hidden) para intermediria e o para camada de
sada, onde se poder indicar I h , denotando a entrada do neurnio da camada
intermediria, O i indicando a sada do neurnio da camada de entrada.
A camada de entrada mostra que estes ns que recebem os valores dos dados de
entrada. As linhas de interconexo indicam que o valor de sada de um neurnio que
passado ao longo desta linha at o prximo neurnio. Quando todos os dados da camada
de entrada tiverem passado atravs da ltima camada, conhecida como camada de sada,
um ciclo ou poca ter sido realizado. Cada linha de interconexo tem um valor,
chamado de peso, os pesos so parmetros que operam sobre os dados associados a cada
linha (ou seja, realizada uma multiplicao do valor do dado pelo peso). Estes pesos
so incrementalmente ajustados durante a fase de treinamento de tal forma a alcanar o
resultado de sada desejado para um determinado dado de entrada. Inicializaes tpicas
para estes pesos encontram-se no intervalo de [-1;1] ou menos.
2- todos esses dados que foram multiplicados pelos pesos so somados dentro do
neurnio;
3- o valor total dessa soma passado atravs de uma funo de transferncia, cuja sada
representa o valor de sada do neurnio.
1
E ( w) = [T O ]
2
(2.90)
2
E
= (T O ) (2.91)
O
sendo que a soma em (2.89) realizada sobre os padres e os neurnios de sada o, T
o valor alvo e O a sada observada da rede, uma funo dos pesos da rede w. A
expresso (2.89) significa que se deve minimizar o erro de todos os processadores da
camada de sada para todos os padres que so apresentados rede.
1
Considerando a funo logstica ( x ) = que facilmente derivvel:
1 + e x
d e x
= ( x) = = ( x) (1 ( x) ) (2.92)
dx (1 + e x ) 2
5. Calculando o erro:
n n
1
E = (T O o ) = E = T o (2.95)
t =1 t =1 1 + e I
As derivadas so importantes porque se conhecerem as derivadas parciais do erro com
respectivos pesos, conhecer-se- o caminho que os pesos deveriam percorrer para
reduzir o erro.
E
W 2 = (2.96)
W 2
E E I o
= o.
W 2 I W 2
e (2.97)
E E O o
= . = (T O o ) ( I o )
I o
O W 2
o
E I o
Usando (2.92): = (T O o
)O o
(1 O o
) = o
, e ainda = Oh (2.98)
I o
W 2
E
E assim: W 2 = = o O h (2.99)
W 2
E E I h
= h.
W 1 I W 1
e (2.101)
E E O h
= . = O o (1 O o ) oW 2 = h
I h
O W 1
h
I h
e ainda = Oi (2.102)
W 1
E
E assim: W 1 = = hO i (2.103)
W 1
8. Ajustando W 1 :
W 1(t + 1) = W 1(t ) = hO i + (W 1(t ) W 1(t 1)) (2.105)
Uma rede neural pode ser classificada, de acordo com a arquitetura da rede. A forma
mais simples de rede a rede alimentada adiante feedforward. Essas redes constituem-
se de mltiplas camadas, onde a entrada de cada camada a sada da camada
predecessora e a interconexo dos neurnios acclica.
As redes recorrentes tendem a ser mais difceis de treinar do que as redes alimentadas
adiante, principalmente em funo dos ciclos. As redes recorrentes mais utilizadas so a
rede de Jordan, a rede de Elman e a rede de Elman estendida, conforme podem ser
vistas nas figuras a seguir (DE OLIVEIRA, 2003).
y (k )
vis
-1
bias
y ( k 1)
-1 -1
x ( k 1) x ( k p + 1) x (k p)
x (k )
y (k )
vis
-1 -1 -1
vis
-1 -1
x (k p)
x (k ) x ( k 1) x ( k p + 1)
y (k )
vis
-1
-1 -1 -1
vis y ( k 1)
-1
-1
x (k p)
x (k ) x ( k 1) x ( k p + 1)
A rede de Elman pode ser treinada com qualquer algoritmo de aprendizagem para
MLPs, tal como o retropropagao. De forma semelhante rede de Jordan, a rede de
Elman pertence classe das redes recorrentes simples (SRN simple recurrent
networks). Embora ela contenha conexes de realimentao ela no pode ser vista como
um sistema dinmico nas quais as ativaes so espalhadas indefinidamente. Em vez
disso, as ativaes para cada camada so computadas, apenas uma vez, a cada passo de
tempo (cada apresentao de um vetor de seqncias).
descrevem a relao mais simples que pode ocorrer em uma srie temporal.
De Oliveira e Siqueira (2003) justificam o uso de redes neurais para previso de sries
financeiras, principalmente por dois motivos: primeiro, a utilizao de camadas
intermedirias de neurnios que capturam todas as relaes indiretas entre variveis
explanatrias e variveis dependentes; segundo, a aplicao de uma funo de ativao
que possibilita a aproximao de qualquer funo no-linear.
Essa afirmao tambm encontrada em Vojinovic, Kecman e Seidel (2001) que frisa,
ainda, que com o uso de redes neurais, um conhecimento, a priori, da relao entre as
variveis no requerido j que elas so auto adaptativas, ou seja, elas so capazes de
gerar modelos no-lineares, sem um conhecimento prvio sobre os relacionamento entre
as variveis de entrada e sada, podendo ser, portanto, mais genricas e flexveis que
metodologias estatsticas tradicionais.
Yang (1999) concorda com a viso anterior, afirmando ter conseguido resultados
promissores na previso de sucesses cronolgicas financeiras, com o uso de redes
neurais probabilsticas, que so conceitualmente construdas com base na classificao
dos mtodos bayesianos.
Diniz (1999) tambm usou as redes neurais, para efeitos de previso um passo frente
das aes dos preos mnimo e mximo. Testou diversas combinaes de atrasos das
camadas intermediria e de sada, e a melhor rede MLP selecionada possua dois
neurnios na camada de entrada e apenas um neurnio, tanto na camada de entrada
quanto na de sada. Os erros medidos pelo MAPE indicaram para os a srie dos valores
mnimos 1,09% e para os valores mximo 1,83%.
78
Yim (2001) encontrou resultados que mostram os modelos ARIMA melhores no curto
prazo (um passo frente) do que os modelos de redes neurais, chegando concluso de
que, embora as redes neurais tenham acompanhado melhor a direo dos valores reais
observados nos retornos do IBOVESPA, para todas as freqncias, a hiptese de que os
modelos de redes neurais superior aos modelos economtricos tradicionais, no pode
ser verificada, pois os resultados das estatsticas de previso medidos pelo MAPE
ficaram muito prximos aos obtidos nos modelos de sries temporais.
Moshiri e Cameron (2000) compararam o uso das redes neurais MLP com algoritmo de
retropropagao, na comparao da previso da inflao canadense com os modelos
ARIMA e estruturais. Os dados utilizados foram mensais de janeiro de 1970 a dezembro
de 1994 e divididos em duas partes: inicialmente de janeiro de 1970 a dezembro de
1990, para estimao e treinamento, e o restante para previso. O perodo de estimao
comeava com baixas taxas de inflao, em torno de 5% e terminava com altas taxas de
inflao. O perodo de previso coincide com perodos de mais baixas taxas de inflao.
De maneira geral, a diferena no trabalho destes autores que utilizaram a estratgia de
previso recursiva, isto , realizaram a previso para um perodo (um ms), re-
estimavam o modelo, e faziam novas previses para mais um perodo frente. O
processo foi repetido para trs perodos (um trimestre) de previso e para doze (um ano)
perodos de previso. O procedimento para medir a acurcia dos modelos foi o MAE e
os modelos gerados no Eviews e Matlab . Os resultados mostraram que as redes
neurais foram superiores aos modelos ARIMA, nos perodos de longo prazo (1 ano). No
caso das previses de um e trs passos frente, os modelos ARIMA levaram uma
pequena vantagem sobre as redes neurais. Os piores resultados foram todos para os
modelos estruturais.
satisfatrio, no que concerne aproximao dos valores futuros dada uma seqncia
histrica de dados.
O autor tambm explica que as previses foram realizadas atravs de modelos ARIMA-
GARCH e redes neurais artificiais (RNAs) que utilizam o algoritmo de aprendizagem
recorrente em tempo real (ARTR). As metodologias estudadas foram aplicadas
separadamente para cada srie. Assim se pode avaliar que a seqncia empregada no
modelamento ARIMA-GARCH dispe, por construo, de rigor estatstico, em cada
etapa do processo, para realizar a previso, no caso das redes neurais, do trabalho
principal constitui-se basicamente na implementao de um algoritmo de otimizao.
Uma vez que o algoritmo da rede neural foi transformado em um programa de
computador, os dados de entrada so inseridos e tem-se um valor de resposta, ou seja,
uma sada. Em muitos casos, uma determinada rede neural implementada pode ser
utilizada para a tarefa de previso de sries temporais com comportamentos distintos,
por exemplo, tanto para sries de alta, quanto de baixa freqncia. Ou seja, no existem
critrios bem definidos para escolha do tipo de rede neural que deve ser utilizada para
previso de sries temporais que apresentam comportamentos especficos.
Uma diferena significativa que deve ser destacada entre as RNAs recorrentes e os
modelos ARIMA-GARCH a capacidade das RNA de capturar padres no-lineares
subjacentes ao comportamento da srie, enquanto que isso no acontece na modelagem
ARIMA-GARCH.
Outros autores como Kutsurelis (1998), Leung, Daouk e Chen (2000) utilizaram outras
tcnicas de modelagem de sries temporais, tomando como base os modelos ARIMA,
sugeridos por Box e Jenkins (1976) e com uso de redes neurais voltados para o ndice
S&P 500, indicando boa performance para as redes neurais e modelos ARIMA em
detrimento de outras tcnicas tradicionais como alisamento exponencial.
A anlise de sries temporais, para efeitos de previso, o enfoque deste trabalho, por
isso, dada maior nfase a estas tcnicas. Uma viso destes modelos apresentada, a
seguir, com a discusso dos trabalhos encontrados na literatura sobre previso.
Chiann (1997) afirma que a anlise de Fourier fundamental em reas onde o interesse
bsico a procura de periodicidades nos dados. Para muitas sries, a anlise de Fourier
extremamente usada porque a freqncia contm grande importncia no estudo e
apropriada para processos estacionrios.
82
Fourier acreditava ser possvel representar os mais diferentes tipos de funes atravs da
soma das funes seno e cosseno. Dessa forma, pode-se observar que uma funo
genrica f ( x) pode ser representada da seguinte forma:
f ( x) = A + a1 cos(1x) + a2 cos(2 x) + a3 cos(3x) +
(2.106)
+ b1sen(1x) + b2 sen(2 x) + b3 sen(3 x) +
ou ainda, pode-se representar a equao (2.106) por:
f ( x) = A + ak cos(kx)bk sen(kx) (2.107)
k =1
Todavia, surge ento a seguinte questo: dada uma funo f ( x) , definida em um certo
intervalo, quais seriam os valores dos coeficientes A, ak e bk de modo que a equao
(2.107) a represente?
Esses valores foram encontrados por Fourier para uma funo definida no intervalo
[ ; ] .
Tem-se:
f ( x)dx = A + ak cos(kx)bk sen(kx) dx (2.108)
k =1
ou ainda:
f ( x)dx = Adx +
a
k =1
k cos(kx)bk sen(kx)dx (2.109)
f ( x)dx = Adx + ak cos(kx)bk sen(kx)dx (2.110)
k =1
Donde:
1 1
f ( x)dx =A ( x )
+ ak sen(kx) bk cos(kx) (2.111)
k =1
k k
83
1 1 1 1
f ( x)dx = A( ( )) + ak sen(k ) bk cos(k ) ak sen( k ) + bk cos( k )
k =1
k k k k
(2.112)
Como a funo seno uma funo mpar ( sen( x) = sen( x) ) e a funo cosseno par
( cos( x) = cos( x) ), portanto:
1 1 1 1
f ( x)dx = 2 A + ak sen(k ) bk cos(k ) + ak sen(k ) bk cos(k )
k =1
k k k k
(2.113)
f ( x)dx =2 A + 0
(2.114)
e assim:
1
A=
2 f ( x)dx
(2.115)
Os valores de ak e bk ficariam:
1
ak =
f ( x) cos(kx)dx
(2.116)
bk = f ( x) sen(kx)dx (2.117)
Cabe ressaltar ainda que: para funes pares tem-se ak 0 e bk = 0 para funes
mpares ak = 0 e bk 0 .
1 L
2 L L
A= f ( x)dx (2.119)
1 L k x
ak =
L L
f ( x) cos
L
dx (2.120)
1 L k x
bk =
L L
f ( x) sen
L
dx (2.121)
freqncia amplitude, sendo a freqncia indo de zero a infinito, para toda freqncia
ter-se- uma amplitude. Em outras palavras, a FT d a informao de freqncia do
sinal, a qual significa que se tem o quanto de cada freqncia existe no sinal, mas isso
no nos diz quando no tempo estas componentes freqncias existem, isto , a FT
fornece quais os componentes de freqncia (componentes espectrais) que existem no
sinal.
Segundo Shiavi (1999), na maioria das vezes, uma informao que no pode ser lida no
domnio do tempo pode ser extrada no domnio da freqncia. Um exemplo disso o
eletrocardiograma, onde qualquer alterao na forma de onda conhecida pode indicar a
presena de alguma patologia clnica. Os cardiologistas usam os sinais do
eletrocardiograma no domnio do tempo, os quais so registrados e analisados
posteriormente para possveis constataes de outras patologias.
Todavia, a anlise de Fourier tem uma sria desvantagem, pois quando transforma a
srie para o domnio da freqncia, a informao do tempo perdida. Ao se observar a
transformada de Fourier de uma srie impossvel de se saber quando determinado
evento ocorreu (GENAY; SELUK; WHITCHER, 2002).
Segundo Misiti et al. (1997), Dennis Garbor (1946) adaptou a transformada de Fourier
para analisar apenas uma pequena seo da srie no tempo, que chamou de Short-time
Fourier Transform (STFT), que conseguia mapear a srie com uma funo de duas
dimenses: o tempo e a freqncia. Essa transformada conseguiria captar algumas
informaes, tanto no tempo, como na freqncia, porm com certa limitao, pois a
janela que era criada para se fazer a anlise era de um tamanho fixo, captando, assim,
sempre a mesma freqncia, como se observa na figura a seguir:
85
Dessa forma, o prximo passo ento era obter uma janela de anlise com tamanho
flexvel, e as ondaletas conseguem esse feito, pois, em um mesmo intervalo de tempo,
conseguem detectar informaes de baixa e de alta freqncia, que podem assim ser
mais bem ajustadas em cada trecho da srie. A figura, a seguir, ajuda a ilustrar o papel
da ondaleta:
Diante desses pressupostos, a contrapartida a ser usada seriam as ondaletas, vistas como
um mecanismo para quebrar a srie em duas partes constituintes, permitindo-nos
analisar os dados em diferentes domnios de freqncia. Dessa forma, apresenta-se, a
seguir, uma discusso sobre a teoria das ondaletas.
A primeira meno sobre o termo ondaletas foi dada em 1909, por Alfred Haar. O
conceito de ondaletas, na forma atual, foi primeiramente proposto por Jean Morlet e sua
equipe no Marseille Theoretical Physics Center, trabalhando em Alex Grossmann, na
Frana (MISITI et al., 1997).
Para Torrence e Compo (1998), a vantagem das ondaletas sobre os mtodos tradicionais
de Fourier, que a base das funes de Fourier so dependentes da freqncia, mas no
do tempo, ou seja, pequenas alteraes no domnio da freqncia produzem alteraes
em todo o domnio do tempo. Segundo os autores, as ondaletas so dependentes de
ambos os domnios, da freqncia (via dilao) e do tempo (via translao), o que uma
vantagem em diversos casos. Por muitas dcadas, os cientistas procuraram funes mais
apropriadas do que senos e cossenos para anlise de sinais. As bases das funes de
Fourier so imprprias para o tratamento local de dados, pois so sries infinitas e no
se adaptam a anlise de dados descontnuos. As ondaletas no s se prestam a
aproximao de funes finitas, como tambm servem para anlise de dados
descontnuos.
Para Moura (2002), a anlise de Fourier consiste em quebrar uma srie em suas
componentes de senos e cossenos, em suas vrias freqncias. Similarmente anlise de
ondaleta, considera dilataes (compresses) e translaes de uma onda original,
chamada de ondaleta me.
De uma maneira geral, a filtragem dos dados via ondaletas, em contraste com a
filtragem via transformada de Fourier, no desloca nem deforma pontos notveis
(mximos, mnimos e inflexes) do sinal a ser filtrado, apresentando ainda a vantagem
quando a srie possui baixo fator de preenchimento (filling factor), isto , apresenta
picos alternados com regies de baixa intensidade (GALVO et al., 2001).
freqncia crtica para que formem uma Subsries { A}t2=1 relativa a baixas freqncias,
n
{D}t =1 ,
n
componentes formem outra Subsries relativa a altas freqncias, denotada 2
Para Misiti et al. (1997), este processo de decomposio que, a partir de uma srie X t ,
passando por um filtro de uma ondaleta, d origem a duas novas sries, uma chamada
aproximao (baixas freqncias) e outra detalhe (altas freqncias).O autor cita ainda
que o processo de decomposio da srie pode ser iterativo, com sucessivas
decomposies, formando uma rvore de decomposio com 2n caminhos diferentes
para a codificao da srie. A rvore de decomposio fica da seguinte forma:
89
baixa freq.
alta freq.
Figura 10: Decomposio via ondaletas
Fonte: MISITI et al., 1997.
O autor cita, ainda, que o processo de decomposio da srie pode ser iterativo, com
sucessivas decomposies, formando uma rvore de decomposio apresentada na
figura a seguir.
Srie
Original
A1 1 Nvel D1
Polikar (1994) afirma que, nas ondaletas, as altas freqncias so mais bem resolvidas
no tempo, e baixas freqncias so mais bem resolvidas em freqncia. Isto significa
que um certo componente de alta freqncia pode ser localizado melhor no tempo (com
menor erro relativo) que um componente de baixa freqncia. Do mesmo modo, um
componente de baixa freqncia pode ser localizado melhor em freqncia se
comparado ao componente de alta freqncia.
90
Galvo et al. (2001) frisam que, em cada nvel, cada subconjunto de dados passa por
uma nova diviso, de maneira a gerar novos coeficientes e assim sucessivamente.
Nesses casos, o resultado da transformada de ondaleta um conjunto de coeficientes
indexados por um fator de escala e por um fator de translao.
De acordo com a definio acima, a transformada contnua de ondaleta (CWT) pode ser
interpretada como o produto interno do sinal de teste com as funes base ( , s )(t ) :
1 t
onde , s = .
s s
Esta definio de CWT mostra que a anlise de ondaleta uma medida de similaridade
entre as funes base (ondaleta) e o prprio sinal. Aqui similaridade est no sentido de
7
Denota o conjunto de funes quadrticas integrveis no intervalo [a,b].
91
O objetivo, segundo o autor, estender essa funo para L2 ( ) , isto , gerar um espao,
a partir de uma funo , que pode ser conseguida por dilataes (parmetro a ) ou
compresses e translaes (parmetro b ) de , dada por:
1
xb (2.125)
a ,b ( x ) = a 2 , a, b IR, a 0
a
Uma maneira de gerar ondaletas pela funo escala, ou chamada de ondaleta pai, ,
que uma soluo da equao
(t ) = 2 l (2t k )
k
k
(2.127)
onde lk = 2 (t ) (2t k )dt
onde
hk = (1) k l1 k (2.130)
Segundo Genay, Seluk e Whitcher (2002), uma srie temporal financeira pode ser
decomposta por uma anlise de ondaletas, por uma seqncia de projees de ondaletas
pai e me, a partir das funes e , como seguem as equaes (2.126) e (2.128).
Xt = a k
j ,k j ,k (t ) + d
k
j ,k j ,k (t ) + dk
j 1, k j 1, k (t ) + + d
k
1, k 1,k (t ) (2.131)
Xt = a k
j ,k j ,k (t ) + d
i k
i ,k j i +1,k (t ) (2.132)
e
(2.134)
d j ,k = j ,k (t ). X t dt , chamada parte de detalhe
Para entender como a funo (2.126) atua, considere, por exemplo, a ondaleta mais
simples, chamada de ondaleta de Haar, cuja equao :
1, se 0 x < 1 2 (2.135)
( x) = -1, se 1 2 x <1
0, caso contrrio
93
Se j = k = 0 , de (2.126) tem-se:
0 (2.136)
( )
0,0 ( x) = 2 2 20 x 0 = ( x)
Se j = 1, k = 0 tem-se:
1 (2.137)
( )
1,0 ( x) = 2 21 x 0 = 2 (2 x)
2
e
1, se 0 2 x < 1 2 1, se 0 x < 1 4 (2.138)
(2x) = -1, se 1 2 2 x <1 = -1, se 1 4 x < 1 2
0, caso contrrio 0, caso contrrio
e assim:
2, se 0 x < 1 4 (2.139)
1,0 ( x) = 2 (2 x) = - 2, se 1 4 x < 1 2
0, caso contrrio
Se j = 2, k = 0 tem-se:
2 (2.140)
( )
2,0 ( x) = 2 22 x 0 = 2 (4 x)
2
e
1, se 0 4 x < 1 2 1, se 0 x < 18 (2.141)
(4 x) = -1, se 1 2 4 x <1 = -1, se 18 x < 1 4
0, caso contrrio 0, caso contrrio
e assim:
2, se 0 x < 18 (2.142)
2,0 ( x) = 2 (2 x) = -2, se 18 x < 1 4
0, caso contrrio
As ondaletas 0,0 ( x), 1,0 ( x) e 2,0 ( x) podem ser vistas na figura seguintes:
94
1,5 2 2,5
2
1,5
1 1,5
1 1
0,5 0,5 0,5
0
0
0 -0,5 0 0,5 1 1,5
0 0,5 1 1,5
0 0,2 0,4 0,6 0,8 1 1,2 -0,5 -1
-0,5 -1 -1,5
-2
-1,5
-1 -2,5
-2
-1,5
e assim:
1, se 1 x < 3 2 (2.145)
0,1 ( x) = ( x 1) = -1, se 3 2 x <2
0, caso contrrio
E ainda, para j = 0, k = 3
0 (2.146)
(
0,3 ( x) = 2 20 x 3 = ( x 3)
2
)
e
1, se 0 x 3< 1 2 1, se 3 x < 7 2 (2.147)
( x 1) = -1, se 1 2 x 3<1 = -1, se 7 2 x <4
0, caso contrrio 0, caso contrrio
e assim:
95
1, se 3 x < 7 2 (2.148)
0,3 ( x) = ( x 3) = -1, se 7 2 x <4
0, caso contrrio
As ondaletas 0,1 e 0,3 ficam:
1,5 1,5
1 1
0,5 0,5
0 0
0 1 2 3 0 2 4 6
-0,5 -0,5
-1 -1
-1,5 -1,5
0,1 ( x) 0,3 ( x)
Como visto anteriormente, a anlise de ondaletas usa as ondaletas como funes bases
para representar uma srie temporal.
p q
D1n = Di D1n 1 + Di D1,n i (2.150)
i =0 i =0
Considerando, agora, a ondaleta chapu mexicano e combinando com redes neurais com
algoritmo de retropropagao, por exemplo, tem-se:
x2
2
( x) = (1 x )e 2
,x (2.151)
e substituindo a equao (2.151), no neurnio da camada de entrada no
desenvolvimento de (2.89), tem-se:
96
2
x
3
x2
2 x 2
2
I = W 1 j ,1 (1 x )e
h 2
+ W 1 j ,2 1 e
(2.152)
j
3
E ainda:
1
O hj = x
2 (2.153)
2 3
x 2 2
2 x
W 1 j ,1 (1 x 2 ) e W 1 j ,2 1 e
3
1+ e
Assim, fazendo a decomposio como proposta na Figura 11, em 1o nvel, tem-se para
uma sucesso cronolgica X t :
1
Xt = 3 + (2.156)
W 2 j 1+ eW 1 j ,1 S ( t 1)+W 1 j ,2 S ( t2)
1
1+ e j =1
E usando a decomposio de ondaletas, usando duas redes neurais, uma para prever a
srie de aproximao ( A1 ) e outra para a parte detalhe ( D1 ):
1
A1 (t ) = 3 + (2.157)
W 2 j 1+ eW 1 j ,1 A1 ( t 1)+W 1 j ,2 A1 ( t 2 )
1
1+ e j =1
e
1
D1 (t ) = 3 + (2.158)
1
W 2j W 1 j ,1 D1 ( t 1)+W 1 j ,2 D1 ( t 2 )
1+ e
1+ e j =1
97
Torrence e Compo (1998) citam diferentes tipos de ondaletas a ,b ( x) , que podem ser
Tak (1995) desenvolveu, a partir dos dados mensais do ndice Standard and Poors 500
(S&P 500), de maio de 1980 a dezembro de 1990, baseado na metodologia de
decomposio via ondaletas, em dois subnveis, modelos de previso, dentro destas
sries, via modelos ARIMA e de redes neurais, fazendo posteriormente s previses, a
reconstruo da srie original. Seu objetivo foi de determinar se a decomposio da
srie traria ou no um melhor desempenho para as previses do que se fosse feito
diretamente na srie original.
O autor utilizou testes de Dickey-Fuller para razes unitrias, para testar estatisticamente
a existncia de estacionariedade das sries tanto na srie original como nas
decomposies das subsries. Observou que a decomposio no altera a
estacionariedade da srie, pois o S&P 500 era no estacionria, bem como suas duas
decomposies pelas ondaletas de Morlets e chapu mexicano. Como resultados, o
autor encontrou que as redes neurais com decomposio, via ondaletas, obteve 26,3%
de reduo dos erros medidos pelo MAPE. Para os modelos economtricos com
decomposio via ondaletas, a melhora foi de 17,3%, melhorando a qualidade das
previses.
passos frente. Utilizando os modelos ARIMA, na srie original, obteve erros medidos
pelo RMSE de 16,964%. Com a decomposio, via ondaletas pela ondaleta DAUB8
(Ondaleta de Daubechies), o erro caiu para 12,895%, quando fizeram as previses em
ambas as subsries pelos mesmos modelos e reconstruindo pela mesma onda.
Homsy, Portugal e Arajo (2000) comparam, sob forma de estudo de casos, previses
relativas a trs diferentes mtodos de modelagem de sries de tempo, os quais consistem
na aplicao da metodologia ARIMA, tanto da forma usual quanto amparada por dois
procedimentos auxiliares, baseados na anlise de ondaletas para as sries da produo
industrial, exportaes brasileiras, volume de pesca na Groelndia. Utilizou tambm o
procedimento de alisamento exponencial das sries. Com base na medida MAPE de
desempenho econmico, o autor mostrou que o procedimento de decomposio via
ondaletas mostrou-se superior em 3,25% contra 6,88% para a srie da produo
industrial; para a srie das exportaes, indicou 9,9% contra 15,52% e para a srie da
produo de pesca, indicou 17,47% contra 27,35% a favor, em todos os casos, da
decomposio via ondaletas. A forma de ondaleta utilizada foi a ondaleta de Haar. Isto
indica, segundo o autor, ser um indcio de que a modelagem em separado (ondaletas) de
subsries de baixas e altas freqncias contribui positivamente para a qualidade das
previses.
Incorporando dados mais recentes, Wong et al. (2003) trabalharam com a taxa de
cmbio para previses de dez passos frente e na construo dos modelos de tendncia,
utilizando uma amostra de 512 observaes de 1 de agosto de 1989 a 31 de julho de
1991. Utilizou a ondaleta de Daubechies (DAUB7), e comparando com os modelos
ARIMA, o menor erro, 0,95% ficou com a decomposio via ondaletas, contra 2,2%
para os modelos ARIMA, tambm medidos pelo MAPE.
Segundo Doornik e Hendry (2001), somente em alguns casos mais simples, a teoria
economtrica capaz de deduzir as propriedades estatsticas de uma distribuio
amostral. Na maior parte das vezes, a teoria forada a fazer uso da lgebra assinttica,
produzindo resultados que se aplicam apenas s grandes amostras. Mesmo que, em
alguns casos, estes resultados assintticos tenham apresentados boas aproximaes para
as distribuies amostrais associadas a amostras no muito grandes, ainda no se pode
ter certeza dos valores obtidos. Por este motivo, utilizam-se ferramentas computacionais
para encontrar as propriedades estatsticas da distribuio amostral em pequenas
amostras usando o chamado Mtodo de Simulao.
Para os autores, cabe salientar que, para assumir um gerador de dados especfico, a
verdadeira funo populacional nunca conhecida (pois se fosse, no precisaria ser
estimada). Portanto, um DGP nada mais do que um modelo que se espera caracterizar
com certa acurcia algumas caractersticas dos dados. Entretanto, a simulao visa
construir uma situao hipottica com propriedades conhecidas e ento comparar os
resultados com a verdade.
101
3 METODOLOGIA DA PESQUISA
3.1 METODOLOGIA
Utilizou-se dados de sries simuladas para maior controle dos dados, isto , trabalhou-se
com DGP, utilizando ondaletas em at dois nveis para obteno de um intervalo de
previso esttica para os modelos construdos. Para a etapa de construo dos DGPs,
foram construdos programas, que se encontram no Apndice C, no software
Mathematica 5.0, com rotinas auxiliares nas Packages, desenvolvidos pela Wolfram
102
A partir das sucesses cronolgicas simuladas, conduziu-se aos testes para confirmao
dos modelos, passando-se anlise dos dados propriamente dita. Trabalhou-se com
dados de sucesses cronolgicas lineares e no-lineares. razovel que, antes de se
utilizar metodologias para se lidar com sistemas no-lineares, seja comprovada a no-
linearidade subjacente aos dados da sucesso. As no-linearidades tambm podem ter
outras origens que no as no estacionariedades. Os algoritmos de deteco de no-
linearidades so utilizados para quantificar o nvel de interaes no-lineares
encontradas nos dados. Billings e Voon (1986 apud FREITAS, SECURATO e
ANDRADE NETO, 2004) afirmam que a relao:
( )
u ,u 2 ( ) = E ( ut E [ut ]) ut2 E ut2 = 0
(3.1)
vlida se e somente se o sistema original for linear. Assim, pode-se identificar no-
linearidades e, mais ainda, estabelecer os limites de um intervalo de confiana de, por
exemplo, 95% por meio da frmula 1.96n, sendo que n o comprimento do registro de
dados disponveis. A funo de correlao dada pela equao (3.1) pode ser estimada,
utilizando os dados disponveis. Logo, se os valores da funo sair fora dos limites
estabelecidos, o sistema que gerou os dados dever ser representado por um modelo
no-linear.
Freitas, Securato e Andrade Neto (2004) afirmam que um critrio relevante para a
escolha deste tipo de teste sua capacidade de discriminao. A capacidade de
discriminao do teste definida como a probabilidade de se rejeitar a hiptese nula
quando realmente a mesma falsa. Obviamente, tambm depende de como quo
intensamente os dados atuais se desviam da hiptese nula. Um indicador cujo poder de
discriminao particularmente eficiente para este fim o de deteco de no-
linearidades, via assimetrias, sob reverso no tempo, apresentado a seguir:
103
( X n X n )3
rev ( ) = n = +1
3
(3.2)
N
2
2
( X n X n )
n = +1
Segundo os autores, esta estatstica permite detectar possveis assimetrias sob reverso
no tempo. Schreiber e Schmitz (1999), compararam quantitativamente os testes mais
populares de no-linearidades e concluiu que esta mtrica apresenta melhores resultados
empricos.
3.2. PREVISO
yt = g ( X t ) (3.3)
O problema passa a ser, ento, buscar previses para X t + h , dado que se tem um modelo
yt + h = g ( X t + h ) (3.4)
(
yt + h = g X t + h ) (3.5)
e ento
e yt = eln( X t ) = X t (3.8)
X t = e yt +h (3.9)
Todavia, Granger e Newbold (1976) afirmam que as previses feitas com a equao
(3.7) conduzem a previses viciadas e, como conseqncia, o erro quadrtico mdio da
previso aumentar.
Prankratz e Dudley (1987) frisam que no caso de yt ser gaussiana, a previso tima
onde Var (h) = Varincia et (h) , sendo que, et (h) yt + h Et [ yt + h ] , conforme define
Enders (2003).
[h] .
95% ser yt (h) 1,96 Vy
Uma vez que um ou mais modelos de sries temporais foram selecionados, devemos
gerar previses 1-passo ou h-passos frente de previso para yt (onde yt denota um
No caso onde t observaes foram registradas para avaliar uma previso um passo
frente, avana-se o conjunto de informao com cada previso. Por exemplo, yt + 2
possvel, podemos tambm decidir estimar os parmetros para cada um dos conjuntos
de informao yt + h 1 . Alm disso, podemos ento deletar os primeiros h dados pontuais,
de tal forma que a amostra de estimao tem o mesmo tamanho para as m previses.
Finalmente, uma previso h-passos (ou dinmica) denota uma previso de yt + h (para h
DGP Simulado ou
sucesso
cronolgica real
Pr-Processamento
Teste Estacionariedade
- Teste de D.Pantulla
Teste Independncia
- Teste de BDS (sobre a srie bruta ou
pr-processada)
Independncia Dependncia
Se no Normal Se Normal
Ps-Processamento
Teste Independncia
- Teste de BDS (sobre os resduos)
Independncia Dependncia
Teste Normalidade
- Teste de JB
No Normal Normal
Identificar distribuio
4 RESULTADOS EXPERIMENTAIS
A pesquisa foi conduzida por meio de simulaes de dados atravs de DGPs gerados
pelo software MATHEMATICA 5.0 atravs de construo de pacotes para gerar os
dados que tambm foram usados para tratamento das decomposies e reconstrues,
via ondaletas e todo o tratamento das previses, dentro das subsries, via combinao
com pacotes especficos do prprio software. Usou-se tambm o EVIEWS 5.0, para
tratamento dos testes e previses. Tais programas se encontram no apndice C. Para as
redes neurais, utilizou-se o MATLAB 6.5, para as redes recorrentes e o software
Statistica da StatSoft 6.1, para as redes com retropropagao.
0 = 0, 06, 1 = 0, 04, 1 = 0, 7 .
Xt
1.5
0.5
t
200 400 600 800 1000 1200
-0.5
-1
-1.5
0 = 0, 06, 1 = 0, 04, 1 = 0, 7
Hipteses Estatstica de Teste Valores Crticos a 5%
H 0 : 3RU -69,47651 -2,76
H1 : 2 RU
H 0 : 2 RU -22,28469 -3,37
H1 :1RU -38,53137 -3,77
H 0 :1RU -31,02768 -3,42
H1 : 0 RU -14,84719 -3,80
-17,64252 -4,16
Modelo ARIMA-GARCH
Dimenso BDS Erro-padro Estatstica Z p-valor
2 -6,94E-06 1,46E-06 -4,769876 0,0000
3 -9,57E-07 3,60E-08 -26,56382 0,0000
4 -9,41E-09 6,70E-10 -14,04558 0,0000
5 -9,26E-11 1,09E-11 -8,491502 0,0000
6 -9,07E-13 1,65E-13 -5,509733 0,0000
90
Series: G
80 Sample 1 1000
70 Observations 1000
60 Mean 0.012916
Median 0.007344
50
Maximum 1.517590
40 Minimum -1.246590
Std. Dev. 0.468553
30 Skewness 0.072681
Kurtosis 2.892439
20
10 Jarque-Bera 1.362480
Probability 0.505989
0
-1.0 -0.5 0.0 0.5 1.0 1.5
Teste de McLeod-Li
O resultado da estatstica de teste calculado no Eviews 5.0 :
Modelo ARIMA-GARCH
Estatstica F 11,97598 p-valor 0,00000
112
Teste de Hsieh
Uma vez estabelecido que existe algum tipo de no-linearidade em uma sucesso
cronolgica, preciso identificar o tipo de no-linearidade existente, se na mdia ou na
varincia condicionadas.
Modelo ARIMA-GARCH
Coeficiente Estatstica de Hsieh p-valor
11 -0,0333 0,4867
12 -0,6631 0,2536
13 -2,4526 0,0071*
14 -0,8405 0,2003
15 0,5051 0,6933
22 0,408 0,6584
23 -1,6157 0,0531
24 -0,9803 0,1635
25 -2,2876 0,0111*
33 -0,0189 0,4925
34 2,1549 0,9844
35 1,828 0,9662
44 0,8702 0,8079
45 -1,7137 0,0433*
55 -0,5708 0,2841
Conforme se observa no quadro anterior, para quinze pares (i,j), os valores dos
coeficientes do teste de Hsieh amostrais para as duas subsries e o correspondente p-
valor para um nvel de confiana de 95%, apresenta apenas trs coeficientes
significantes (indicado com *), podendo-se dizer que, de maneira geral, no se rejeita a
hiptese nula dos coeficientes iguais a zero, o que indica uma no-linearidade na
varincia condicionada.
113
Atravs do programa 2 do apndice C, que foi desenvolvido para estas aplicaes, pode-
se gerar o pr-processamento do DGP gerado acima, em apenas um nvel de sub-
divises.
2 2
CAt CDt
1,5 1,5
1 1
0,5
0,5
0 t
0 t -0,5 0 200 400 600
-0,5 0 200 400 600 -1
-1 -1,5
-1,5 -2
-2
Para o teste de razes unitrias, foi utilizado o teste de DF aumentado, conhecido como
teste de Dikey-Pantula, que apresentou os seguintes resultados com 5% de significncia
para as subsries decompostas no pr-processamento:
114
Subsrie: CA Subsrie: CD
Hipteses Estatstica Valores Hipteses Estatstica Valores
de Teste Crticos a 5% de Teste Crticos a
5%
H 0 : 3RU -54,6783 -2,76 H 0 : 3RU -52,1822 -2,76
H1 : 2 RU H1 : 2 RU
H 0 : 2 RU -17,63888 -3,37 H 0 : 2 RU -17,22859 -3,37
H1 :1RU -29,18961 -3,77 H1 :1RU -29,60606 -3,77
H 0 :1RU -25,43932 -3,42 H 0 :1RU -25,43257 -3,42
H1 : 0 RU -9,790482 -3,80 H1 : 0 RU -9,322556 -3,80
-14,86584 -4,16 -15,29174 -4,16
Como visto anteriormente, o teste para independncia pode ser aplicado para ver se a
sucesso cronolgica apresenta independncia, pois, se for, esto o processo RBI.
Suas hipteses so:
Subsrie: CA Subsrie: CD
Dimenso BDS Erro Estatstica p-valor Dimenso BDS Erro Estatstica p-valor
Padro Z Padro Z
2 -3,00E-06 4,85E-05 -0,061797 0,9507 2 4,77E-05 3,97E-05 1,199797 0,2302
3 2,87E-05 5,75E-06 4,989138 0,0000 3 -1,82E-06 4,68E-06 -0,389464 0,6969
4 1,81E-05 5,12E-07 35,39495 0,0000 4 -6,13E-06 4,14E-07 -14,81243 0,0000
5 7,84E-06 3,99E-08 196,4425 0,0000 5 -3,04E-07 3,20E-08 -9,493997 0,0000
6 -1,52E-08 2,88E-09 -5,280915 0,0000 6 -1,49E-08 2,29E-09 -6,514062 0,0000
O software Eviews 5.0 calcula a estatstica BDS para todas as dimenses de dois at o
valor especificado, variando a dimenso de correlao para maximizar o poder do teste.
Neste caso, calculou-se at a sexta dimenso para os dados padronizados e concluiu-se
por rejeitar a hiptese nula ao nvel de significncia de 5%, indicando que os dados da
115
Teste de Normalidade
Subsrie: CA Subsrie: CD
60 50
Series: CA Series: CD
Sample 1 500 Sample 1 500
50 40 Observations 500
Observations 500
Teste de McLeod-Li
Subsrie: CA Subsrie: CD
Estatstica F 20,41297 p-valor 0,0000000 Estatstica F 13,87677 p-valor 0,000000
Dessa forma, o teste de McLedod-Li para 5 defasagens rejeitou a hiptese nula pelo fato
do p-valor ser inferior a 5%. Isto indica que ambas as subsries possuem
comportamento no-linear.
Matematicamente, este resultado pode ser entendido que a srie no pode ser escrita
({t i }t =1 ) = it i
como combinao linear dos termos de erro da forma X t = f ,
i =1
Freitas, Securato e Andrade Neto (2004) implementaram um algoritmo, com base nos
trabalhos de Billings e Voon (1986) e Scheiber (1998), para estudar o comportamento
de uma sucesso cronolgica ao longo de sua trajetria. Tal implementao ilustrada, a
seguir, indica que quando a sucesso cronolgica se encontra dentro da banda
construda, o seu comportamento tem caractersticas lineares e, fora desta banda,
comportamento no-linear.
Xt
CA-ARIMA-GARCH
0.3
0.2
0.1
t
-0.1
0 100 200 300 400 500 600
Xt
CD-ARIMA-GARCH
0.3
0.2
0.1
-0.1 t
-0.2
0 100 200 300 400 500 600
Teste de Hsieh
Uma vez estabelecido que existe algum tipo de no-linearidade, em uma sucesso
cronolgica, preciso identificar o tipo de no-linearidade existente, se na mdia ou na
varincia condicionadas.
Para a realizao do teste, fez-se o programa 4 que ir calcular os coeficientes (i,j) para
cada uma das subsries. Os resultados desta etapa vm a seguir:
Subsrie: CA Subsrie: CD
Coeficiente Estatstica de Hsieh p-valor Coeficiente Estatstica de Hsieh p-valor
11 -0,662 0,25399 11 0,6549 0,74373
12 -1,37 0,08534 12 -0,474 0,31775
13 -0,6574 0,25546 13 0,2844 0,61195
14 -2,5114 0,00601* 14 1,5583 0,94042
15 0,1633 0,56486 15 -0,0346 0,4862
22 0,6884 0,7544 22 0,1942 0,57699
23 0,3119 0,62244 23 0,5378 0,70464
24 0,0571 0,52277 24 -0,0107 0,49573
25 -0,0592 0,4764 25 -0,2428 0,40408
33 0,6083 0,72851 33 -0,1283 0,44896
34 1,9814 0,97623 34 -0,1268 0,44955
35 -0,7488 0,22699 35 -0,1189 0,45268
44 -0,028 0,48883 44 0,1248 0,54966
45 0,0619 0,52468 45 1,7597 0,96077
55 -0,2244 0,41122 55 0,097 0,53864
Conforme se observa, no quadro anterior, para quinze pares (i,j), os valores dos
coeficientes do teste de Hsieh amostrais para as duas subsries e o correspondente p-
valor para um nvel de confiana de 95%, apresenta apenas um coeficiente significante
(indicado com *), podendo-se dizer que, de maneira geral no se rejeita a hiptese nula
dos coeficientes iguais a zero, o que indica uma no-linearidade na varincia. Para a
sucesso de alta freqncia (CD), isto j no ocorre e todos os pares apontam pela
dependncia na varincia condicionada.
Aps a etapa de identificao e previso dos modelos nas subsries de baixa e alta
freqncia, tem-se, a seguir, as estatsticas de previso esttica feitas pelo para 100
passos frente dentro de cada subsrie. Na etapa do ps-processamento, como para
cada um valor previsto em cada sub-nvel, na juno novamente para obter a srie no
nvel via transformada inversa da ondaleta, resulta em 200 pontos na srie no nvel.
Como os erros ficaram demasiadamente grandes, considerou-se tambm a estatstica de
acurcia pontual para os dez primeiros elementos previstos, para fins de comparao. A
previso foi feita, da forma esttica, atravs do Eviews 5.0.
Para que os dados sejam inseridos na rede, foi utilizado o processo de normalizao
proposto por Azoff (1994), que considera um vetor de entrada de dimenso n, ou seja,
os elementos no vetor variam de i = 1, , n . Os elementos ti j , para a sinapse i e a
Yt min {Yt }t =1
N
Zt = [ 0;1]
max {Yt }t =1 min {Yt }t =1
N N
Dessa forma, os 500 pontos de cada subsrie da etapa de pr-processamento dos dados
do DGP do modelo ARIMA-GARCH so divididos em trs partes, a primeira com 200
valores que so utilizados para treinar os pesos sinpticos da rede, a segunda parte para
realizar a validao com 100 valores e a terceira para previso com 100 valores pelo
algoritmo de retropropagao.
Tem-se, a seguir, as estatsticas de previso esttica feitas pelo para 100 passos frente
em cada subsrie, que resulta em 200 pontos na srie no nvel e para apenas os 10
primeiros, via rede neural, com algoritmo de retropropagao:
121
Como foram simuladas 100 sucesses cronolgicas de 1200 observaes, foi feito todo
o trabalho descrito anteriormente para a primeira delas, isto , tomou-se a amostra dos
mil primeiros elementos para estimao e testada com as 200 observaes restantes,
construindo um intervalo de previso para as redes e para o modelo economtrico.
Posteriormente, fez-se o mesmo trabalho para as 99 restantes, com os respectivos
intervalos de confiana para os valores mximos e mnimos. Tomou-se, ento, a mdia
[ h ] e a mdia
dos 100 valores mnimos do intervalo de confiana LI = Yt (h) 1,96 VY
Figura 20: Intervalo de previso em 1 nvel para redes recorrentes para a amostra de
teste do modelo ARIMA-GARCH
-0,5 0 2 4 6 8 10
-1
-1,5
-2
Valor Real Valor Mnimo Valor Mximo
Figura 21: Intervalo de previso em 1 nvel para redes recorrentes para os primeiros
10 elementos do modelo ARIMA-GARCH.
0 t
-0,5 0 50 100 150 200
-1
-1,5
Valor real Valor Mnimo Valor Mximo
Figura 22: Intervalo de previso em 1 nvel feito por redes neurais com
retropropagao do modelo ARIMA-GARCH
123
0,5
t
Xt
0
0 2 4 6 8 10
-0,5
-1
Valor Real Valor Mnimo Valor Mximo
Figura 23: Intervalo de previso em 1 nvel para redes neurais com retropropagao
para os primeiros 10 elementos do modelo ARIMA-GARCH.
0 t
-0,5 0 50 100 150 200
-1
-1,5
Valor real Valor Mnimo Valor Mximo
Figura 24: Intervalo de previso em 1 nvel feito por um modelo ARIMA-GARCH
0
-0,5 0 2 4 6 8 10
-1
-1,5
Valor Real Valor Mnimo Valor Mximo
Nas figuras anteriores, valor real significa o valor simulado pelo DGP, o valor mnimo
o limite inferior da banda de previso e o valor mximo o correspondente limite
superior.
Porcentagem de Envelopamento
Modelo Percentual
Rede Neural Recorrente 96,45%
Rede Neural Retropropagao 93,74%
ARIMA-GARCH 48,42%
O resultado anterior mostra uma vantagem das redes recorrentes sobre os demais
modelos no critrio do envelopamento da sucesso cronolgica prevista.
CAA CDA
1,5
1,5
1
1
0,5 0,5
0 0
-0,5 -0,5
-1
-1
-1,5
-1,5
125
CAD CDD
2 1,5
1,5
1
1
0,5 0,5
0 0
-0,5 -0,5
-1
-1
-1,5
-2 -1,5
Teste de Normalidade
28 28
Series: CAA Series: CAD
24 Sample 1 250 24 Sample 1 250
Observations 250 Observations 250
20 20
Mean 0.111593 Mean 0.050047
Median 0.129708 16 Median 0.038743
16 Maximum 3.101749
Maximum 3.380836
Minimum -3.299709 Minimum -2.985643
12 12
Std. Dev. 1.271061 Std. Dev. 1.060927
Skewness -0.087580 Skewness 0.075547
8
8 Kurtosis 3.097902
Kurtosis 3.060266
4 Jarque-Bera 0.337649
4
Jarque-Bera 0.357424
Probability 0.844657
Probability 0.836347 0
0
-3 -2 -1 0 1 2 3
-2.50 -1.25 0.00 1.25 2.50
36 32
Series: CDA Series: CDD
32 Sample 1 250 28 Sample 1 250
28 Observations 250 Observations 250
24
24 Mean -0.025967 Mean 0.064845
Median -0.024640 20
Median 0.017853
20
Maximum 2.214664 Maximum 2.782300
16
16 Minimum -2.276417 Minimum -2.429397
Std. Dev. 0.775176 12 Std. Dev. 0.929946
12 Skewness 0.065554 Skewness 0.160388
Kurtosis 3.461628 8 Kurtosis 2.868702
8
4 Jarque-Bera 2.398856 4 Jarque-Bera 1.251419
Probability 0.301367 Probability 0.534882
0 0
-2 -1 0 1 2 -2 -1 0 1 2 3
Teste de McLeod-Li
CAA-ARIMA-GARCH CAD-ARIMA-GARCH
0.6 0.4
0.4 0.2
0.2 0
0 -0.2
-0.2 -0.4
0 100 200 300 0 100 200 300
CDA-ARIMA-GARCH CDD-ARIMA-GARCH
0.4 0.6
0.2 0.4
0 0.2
-0.2 0
-0.4 -0.2
0 100 200 300 0 100 200 300
Teste de Hsieh
Conforme se observa, na tabela anterior, para quinze pares i,j, os valores dos
coeficientes do teste de Hsieh amostrais para as quatro subsries e o correspondente p-
valor para um nvel de confiana de 95%, apresenta apenas um coeficiente significante
(indicado com *) em cada uma delas, podendo-se dizer que, de maneira geral, no se
rejeita a hiptese nula dos coeficientes iguais a zero, o que indica uma no-linearidade
na varincia condicionada.
Estimando a equao para a subsrie CAA, tem-se:
caat = 1caat 1 + 2 caat 2 + t
2 I t 1 ~ N (0, ht )
t
ht = 0 + 1 t21 + 1ht 1
2 I t 1 ~ N (0, ht )
t
ht = 0 + 1 t21 + 1ht 1
2 I t 1 ~ N (0, ht )
t
ht = 0 + 1 t21 + 1ht 1
2 I t 1 ~ N (0, ht )
t
ht = 0 + 1 t21 + 1ht 1
Subs Rede Desempenho Performance Performance Erro Erro Seleo Erro Teste Caractersticas
ries de treinam. Seleo Teste Treinamento
CAA MLP s5 1:5-8-1:1 0,999861 0,996576 0,994204 0,161463 0,175151 0,152884 BP100,CG4b
CAD MLP s5 1:5-8-1:1 0,999861 0,996576 0,994204 0,161463 0,175151 0,152884 BP100,CG4b
CDA MLP s5 1:5-2-1:1 0,972494 0,993032 1,028907 0,201680 0,209264 0,204046 BP100,CG21b
CDD MLP s5 1:5-8-1:1 0,981154 1,002502 0,990287 0,217439 0,242021 0,249169 BP67b
1,5
0,5
0 t
0 20 40 60 80 100 120 140 160 180 200
-0,5
-1
- 1,5
-2
Figura 29: Intervalo de previso em 2 nvel para redes recorrentes para a amostra de
teste do modelo ARIMA-GARCH
1,5
0,5
0 t
0 1 2 3 4 5 6 7 8 9 10
-0,5
-1
- 1,5
-2
Figura 30: Intervalo de previso em 2 nvel para redes recorrentes para os primeiros
10 elementos do modelo ARIMA-GARCH.
133
0,5
0 t
0 20 40 60 80 100 120 140 160 180 200
-0,5
-1
- 1,5
Figura 31: Intervalo de previso em 2 nvel feito por redes neurais com
retropropagao do modelo ARIMA-GARCH
0,5
0 t
0 1 2 3 4 5 6 7 8 9 10
-0,5
-1
- 1,5
Figura 32: Intervalo de previso em 2 nvel para redes neurais com retropropagao
para os primeiros 10 elementos do modelo ARIMA-GARCH.
0,5
0 t
0 20 40 60 80 100 120 140 160 180 200
-0,5
-1
- 1,5
0,5
0 t
0 1 2 3 4 5 6 7 8 9 10
-0,5
-1
- 1,5
Como visto anteriormente, o teste para independncia deve ser aplicado para ver se a
sucesso cronolgica apresenta independncia nos resduos. Suas hipteses so:
Teste de Normalidade
20 20
Series: RESGG1 Series: RESGG
Sample 1 200 Sample 1 200
16 Observations 200 16 Observations 200
1 Nvel 2 Nvel
Figura 35: Distribuio dos resduos do modelo ARIMA-GARCH previsto por um
modelo ARIMA-GARCH, em 1 e 2 nveis de pr-processamento.
136
100 24
Series: RESGB1 Series: RESGB
Sample 1 200 Sample 1 200
20
80 Observations 200 Observations 200
1 Nvel 2 Nvel
Figura 36: Distribuio dos resduos do modelo ARIMA-GARCH previsto por redes
neurais com retropropagao, em 1 e 2 nveis de pr-processamento
28
24 Series: RESGR1
Series: RESGR Sample 1 200
24
Sample 1 200
20 Observations 200
Observations 200
20
Mean 0.311580
16 Mean -7.65E-06
16 Median 0.309587
Median -0.030082
Maximum 1.301860
Maximum 1.463796
12 Minimum -0.461242
Minimum -1.225987 12
Std. Dev. 0.444179 Std. Dev. 0.184073
8 Skewness 0.233093 Skewness 1.017067
8
Kurtosis 3.214776 Kurtosis 11.93996
4 4
Jarque-Bera 2.195493 Jarque-Bera 700.5043
Probability 0.333622 Probability 0.000000
0 0
-1.0 -0.5 0.0 0.5 1.0 -0.5 0.0 0.5 1.0 1.5
1 Nvel 2 Nvel
Figura 37: Distribuio dos resduos do modelo ARIMA-GARCH previsto por redes
neurais recorrentes, em 1 e 2 nveis de pr-processamento
Observa-se que os dados dos resduos so normais pela estatstica de Jarque-Bera, com
exceo no primeiro nvel de pr-processamento das redes neurais com
retropropagao, e no segundo nvel das redes neurais recorrentes.
137
t
200 400 600 800 1000
-1
-2
-3
Figura 38: DGP para um modelo AR(1)
Modelo AR(1)
Hipteses Estatstica de Teste Valores Crticos a 5%
H 0 : 3RU -61,28628 -2,76
H1 : 2 RU
H 0 : 2 RU -25,32047 -3,37
H1 :1RU -31,97124 -3,77
H 0 :1RU -32,93413 -3,42
H1 : 0 RU -14,96314 -3,80
-16,43593 -4,16
138
Modelo AR(1)
Dimenso BDS Erro Padro Estatstica Z p-valor
2 -9,45E-06 1,62E-06 -5,826504 0,0000
3 -9,97E-07 4,06E-08 -24,53405 0,0000
4 -1,00E-08 7,65E-10 -13,11928 0,0000
5 -1,00E-10 1,26E-11 -7,930219 0,0000
6 -1,01E-12 1,93E-13 -5,243348 0,0000
Teste de Normalidade
A figura, a seguir, ilustra a distribuio da sucesso cronolgica.
100
Series: A
Sample 1 1000
80 Observations 1000
Mean 0.055796
60 Median 0.033190
Maximum 2.970780
Minimum -2.907510
40 Std. Dev. 1.024893
Skewness -0.036009
Kurtosis 2.786074
20
Jarque-Bera 2.122963
Probability 0.345943
0
-3 -2 -1 0 1 2 3
Teste de McLeod-Li
O resultado da estatstica de teste calculado no Eviews 5.0 :
Modelo AR(1)
Estatstica F 1,388241 p-valor 0,229348
139
Dessa forma, o teste de McLeod-Li para 5 defasagens no se rejeita a hiptese nula pelo
fato do p-valor ser inferior a 5%. Isto indica que o modelo apresenta um comportamento
linear
CA-1Nvel CD-1Nvel
4 4
2 2
0 0
0 100 200 300 400 500 0 100 200 300 400 500
-2 -2
-4 -4
Subsrie: CA Subsrie: CD
Hipteses Estatstica Valores Hipteses Estatstica Valores Crticos a
de Teste Crticos a 5% de Teste 5%
H 0 : 3RU -36,79883 -2,76 H 0 : 3RU -50,94641 -2,76
H1 : 2 RU H1 : 2 RU
H 0 : 2 RU -15,34845 -3,37 H 0 : 2 RU -14,25024 -3,37
H1 :1RU -20,82436 -3,77 H1 :1RU -24,79960 -3,77
H 0 :1RU -22,75377 -3,42 H 0 :1RU -20,90149 -3,42
H1 : 0 RU -6,216736 -3,80 H1 : 0 RU -7,698684 -3,80
-13,30905 -4,16 -12,44013 -4,16
Subsrie: CA Subsrie: CD
Dimenso BDS Erro Estatstica p-valor Dimenso BDS Erro Estatstica p-valor
Padro Z Padro Z
2 -3,00E-06 4,85E-05 -0,061797 0,9507 2 4,77E-05 3,97E-05 1,199797 0,2302
3 2,87E-05 5,75E-06 4,989138 0,0000 3 -1,82E-06 4,68E-06 -0,389464 0,6969
4 1,81E-05 5,12E-07 35,39495 0,0000 4 -6,13E-06 4,14E-07 -14,81243 0,0000
5 7,84E-06 3,99E-08 196,4425 0,0000 5 -3,04E-07 3,20E-08 -9,493997 0,0000
6 -1,52E-08 2,88E-09 -5,280915 0,0000 6 -1,49E-08 2,29E-09 -6,514062 0,0000
O teste BDS rejeita a hiptese de independncia das subsries; todos com 95% de
confiana, j que pelo menos um dos valores menor que 5%.
Teste de normalidade
Subsries: CA Subsries: CD
50 60
Series: CA Series: CD
Sample 1 400 Sample 1 400
40 Observations 400 50
Observations 400
Mean 0.110225 40 Mean -0.015633
30 Median 0.142537
Median -0.034499
Maximum 2.918894
Minimum -3.439481 30 Maximum 2.410167
20 Std. Dev. 1.131283 Minimum -2.649748
Skewness -0.016080 Std. Dev. 0.863606
Kurtosis 2.805492
20 Skewness 0.163645
10 Kurtosis 3.286729
Jarque-Bera 0.647794 10
Probability 0.723325 Jarque-Bera 3.155536
0 Probability 0.206435
-3 -2 -1 0 1 2 3 0
-2 -1 0 1 2
Teste de McLeod-Li
Subsrie: CA Subsrie: CD
Estatstica F 0,949063 p-valor 0,448828 Estatstica F 0,951046 p-valor 0,447565
141
0.2
0.1
-0.1
0 100 200 300 400 500 600 t
Xt CD-ARIMA-GARCH
0.3
0.2
0.1
-0.1
-0.2 t
0 100 200 300 400 500 600
CA CD
Modelo ARIMA(1,0,0) Modelo ARIMA(3,0,0)
FAC FAC
e e
FACP FACP
CAA CDA
4 3
2
2
1
0 0
0 50 100 150 200 250 -1 0 50 100 150 200 250
-2
-2
-4 -3
CAD CDD
4 4
2 2
0 0
0 50 100 150 200 250 0 50 100 150 200 250
-2 -2
-4 -4
Observa-se que, com 95% de confiana, ambas as quatro subsries definidas no pr-
processamento so estacionrias.
Teste de Normalidade
28 28
Series: CAA Series: CAD
24 Sample 1 250 24 Sample 1 250
Observations 250 Observations 250
20 20
Mean 0.111593 Mean 0.050047
16 Median 0.129708 16 Median 0.038743
Maximum 3.380836 Maximum 3.101749
12 Minimum -3.299709 Minimum -2.985643
12
Std. Dev. 1.271061 Std. Dev. 1.060927
Skewness -0.087580 Skewness 0.075547
8 8
Kurtosis 3.060266 Kurtosis 3.097902
4 Jarque-Bera 0.357424 4
Jarque-Bera 0.337649
Probability 0.836347 Probability 0.844657
0 0
-2.50 -1.25 0.00 1.25 2.50 -3 -2 -1 0 1 2 3
36 32
Series: CDA Series: CDD
32 Sample 1 250 28 Sample 1 250
28 Observations 250 Observations 250
24
24 Mean -0.025967 Mean 0.064845
Median -0.024640 20
20 Median 0.017853
Maximum 2.214664 Maximum 2.782300
16 Minimum -2.276417 16
Minimum -2.429397
Std. Dev. 0.775176
12 12 Std. Dev. 0.929946
Skewness 0.065554
Skewness 0.160388
8 Kurtosis 3.461628
8 Kurtosis 2.868702
4 Jarque-Bera 2.398856
4 Jarque-Bera 1.251419
Probability 0.301367
0 Probability 0.534882
-2 -1 0 1 2 0
-2 -1 0 1 2 3
O mesmo ocorre com o teste de normalidade dos dados, o que indica que todas as
subsries apresentam comportamento estatisticamente normal.
147
Teste de McLeod-Li
Pelo teste, aceita-se a hiptese nula que indica que o modelo linear.
Xt
CA-ARIMA-GARCH
0.3
0.2
0.1
-0.1 t
0 100 200 300 400 500 600
Xt CD-ARIMA-GARCH
0.3
0.2
0.1
-0.1
-0.2 t
0 100 200 300 400 500 600
MODELO ARIMA
Estatsticas de Previso Valor Estatsticas de Previso Valor
Pontual para os 200 pontos Pontual para os 10 primeiros
pontos
TIC 0,97 TIC 0,91
MAPE 99,68% MAPE 9,19%
Correlao 0,11 Correlao -0,36
Nota-se que a previso feita para o curto prazo apresenta menos oscilaes nas
estatsticas pontuais, e que as redes neurais recorrentes tambm apresentam um
signiticativo comportamento, principalmente em relao correlao.
1,5
1
0,5
0
-0,5 1 2 3 4 5 6 7 8 9 10
-1
-1,5
real previsto
Figura 49: Previso dos primeiros 10 pontos para o 2 nvel para o DGP
do modelo AR(1)
Fazendo a troca da ondaleta de Daubesch, nmero um, pela ondaleta biortogonal 3.1,
tem-se o seguinte resultado:
MODELO ARIMA
Estatsticas Valor Valor Estatsticas Valor Valor
de Previso 1 nvel de pr- 2 nveis de de Previso 1 nvel de pr- 2 nveis de
Pontual processamento pr- Pontual processamento pr-
para os 200 processamento para os 10 processamento
pontos primeiros
pontos
TIC 1 0,99 TIC 0,92 0,62
Correlao -0,04 0,08 Correlao -0,27 0,29
MAPE 100,00% 100,23% MAPE 10,55% 15,01%
Como visto anteriormente, o teste para independncia deve ser aplicado para ver se a
sucesso cronolgica apresenta independncia nos resduos. Suas hipteses so:
Resduos Modelo ARIMA Previsto pelo AR(1) Resduos Modelo ARIMA Previsto pelo AR(1)
com 1 Nvel de pr-processamento com 2 Nveis de pr-processamento
Dimenso BDS Erro Estatstica p-valor Dimenso BDS Erro Estatstica p-valor
Padro Z Padro Z
2 -3,24E-06 1,07E-06 -3,011273 0,2625 2 -2,73E-06 9,36E-07 -2,916037 0,3522
3 -5,65E-09 1,44E-08 -0,393125 0,6942 3 -4,35E-09 1,23E-08 -0,354429 0,7230
4 -9,66E-12 1,45E-10 -0,066870 0,9467 4 -6,77E-12 1,21E-10 -0,055943 0,9554
5 -1,77E-14 1,27E-12 -0,013934 0,9889 5 -1,03E-14 1,04E-12 -0,009815 0,9922
6 -2,96E-17 1,04E-14 -0,002848 0,9977 6 -1,33E-17 8,36E-15 -0,001590 0,9987
Teste de Normalidade
20 20
Series: RAR1 Series: RAR2
Sample 1 200 Sample 1 200
16 Observations 200 16 Observations 200
1 Nvel 2 Nvel
Figura 50: Distribuio dos resduos do modelo AR(1) previsto por um modelo
ARIMA, em 1 e 2 nveis de pr-processamento.
9 Xt
8
7
6
5
4
3
2
1
0 t
111
166
221
276
331
386
441
496
551
606
661
716
771
826
881
936
991
56
1
Movimento Browniano
Hipteses Estatstica de Teste Valores Crticos a 5%
H 0 : 3RU -56,15525 -2,76
H1 : 2 RU
H 0 : 2 RU -31,81716 -3,37
H1 :1RU -22,45761 -3,77
H 0 :1RU -31,80359 -3,42
H1 : 0 RU -22,43190 -3,80
-0,324796* -4,16
Teste de Normalidade
A figura, a seguir, ilustra a distribuio da sucesso cronolgica do movimento
browniano geomtrico.
100
Series: BROW
Sample 1 1000
80 Observations 1000
Mean 0.055796
60 Median 0.033190
Maximum 2.970780
Minimum -2.907510
40 Std. Dev. 1.024893
Skewness -0.036009
Kurtosis 2.786074
20
Jarque-Bera 2.122963
Probability 0.345943
0
-3 -2 -1 0 1 2 3
12 0,3
10 0,2
8 0,1
6
0
4
142
189
236
283
330
377
424
471
48
95
1
-0,1
2
0 -0,2
133
177
221
265
309
353
397
441
485
45
89
1
-0,3
Subsrie: CA Subsrie: CD
Hipteses Estatstica Valores Hipteses Estatstica Valores
de Teste Crticos a 5% de Teste Crticos a
5%
H 0 : 3RU -30,08746 -2,76 H 0 : 3RU -50,20512 -2,76
H1 : 2 RU H1 : 2 RU
H 0 : 2 RU -18,06209 -3,37 H 0 : 2 RU -13,58794 -3,37
H1 :1RU -14,72879 -3,77 H1 :1RU -26,37183 -3,77
H 0 :1RU -17,97134 -3,42 H 0 :1RU -19,45983 -3,42
H1 : 0 RU -14,70409 -3,80 H1 : 0 RU -9,214053 -3,80
0,546188* -4,16 -11,54976 -4,16
Subsries: CA Subsries: CD
Dimenso BDS Erro Estatstica p-valor Dimenso BDS Erro Estatstica p-valor
Padro Z Padro Z
2 -3,30E-08 4,93E-08 -0,668203 0,5040 2 -1,77E-08 3,91E-08 -0,452892 0,6506
3 -6,07E-12 2,93E-10 -0,020752 0,9834 3 -2,40E-12 2,28E-10 -0,010519 0,9916
4 -8,58E-16 1,30E-12 -0,000659 0,9995 4 -3,27E-16 9,92E-13 -0,000329 0,9997
5 -1,50E-19 5,06E-15 -2,97E-05 1,0000 5 -2,80E-20 3,78E-15 -7,39E-06 1,0000
6 -2,67E-23 1,82E-17 -1,46E-06 1,0000 6 -3,54E-24 1,33E-17 -2,65E-07 1,0000
156
Teste de normalidade
Subsrie: CA Subsrie: CD
60 80
Series: CA Series: CD
Sample 1 500 70 Sample 1 500
50
Observations 500 Observations 500
60
40 Mean 0.010801 Mean -0.067182
Median 0.047498 50
Median -0.036666
30 Maximum 3.624622 Maximum 2.554869
40
Minimum -4.116832 Minimum -2.987428
Std. Dev. 1.227793 30 Std. Dev. 0.837480
20 Skewness -0.054964 Skewness -0.046020
Kurtosis 2.967464 20 Kurtosis 3.245717
10
Jarque-Bera 0.273812 10 Jarque-Bera 1.434332
Probability 0.872052 Probability 0.488134
0 0
-3.75 -2.50 -1.25 0.00 1.25 2.50 3.75 -3 -2 -1 0 1 2
20 0,4
0,3
15 0,2
0,1
10
0
5 -30-0,1 20 70 120 170 220 270
-0,2
0 -0,3
-30 20 70 120 170 220 270 -0,4
157
0,3 0,3
0,2 0,2
0,1 0,1
0 0
-30-0,1 20 70 120 170 220 270 -30- 0,1 20 70 120 170 220 270
-0,2 - 0,2
-0,3 - 0,3
Figura 55: Pr-processamento em 2 nvel do movimento browniano geomtrico
Considere agora um DGP para o modelo bilinear da equao (2.76) com a seguinte
equao: X t = 0.3 X t 1 + 0.8 X t 1 t 1 + t . O DGP possui um grande coeficiente associado
tenham influncia no comportamento do modelo. Seu grfico com 1000 pontos pode ser
visto a seguir:
40
Xt 30
20
10
t
0
0 200 400 600 800 1000
-10
-20
Modelo Bilinear
Hipteses Estatstica de Teste Valores Crticos a 5%
H 0 : 3RU -55,61291 -2,76
H1 : 2 RU
H 0 : 2 RU -24,91645 -3,37
H1 :1RU -31,05414 -3,77
H 0 :1RU -30,14238 -3,42
H1 : 0 RU -18,63510 -3,80
-13,32537 -4,16
Modelo Bilinear
Dimenso BDS Erro Padro Estatstica Z p-valor
2 0,074498 0,003227 23,08473 0,0000
3 0,119117 0,005131 23,21576 0,0000
4 0,139180 0,006114 22,76362 0,0000
5 0,144287 0,006378 22,62265 0,0000
6 0,138812 0,006156 22,54743 0,0000
Teste de Normalidade
A figura, a seguir, ilustra a distribuio da sucesso cronolgica.
120
Series: BILINEAR3
Sample 1 1000
100
Observations 1000
80 Mean 0.030273
Median 0.007079
60 Maxim um 3.276033
Minim um -3.439481
Std. Dev. 1.025965
40 Skewness 0.061754
Kurtosis 3.225912
20
Jarque-Bera 2.762103
Probability 0.251314
0
-2.50 -1.25 0.00 1.25 2.50
Observa-se, pelo p-valor, que a distribuio da sucesso cronolgica bilinear segue uma
distribuio normal pela no rejeio da hiptese nula.
Teste de McLeod-Li
O resultado da estatstica de teste calculado no Eviews 5.0 :
Modelo Bilinear
Estatstica F 205,6457 p-valor 0,00000
161
Dessa forma, o teste de McLeod-Li para 5 defasagens rejeitou a hiptese nula pelo fato
do p-valor ser inferior a 5%. Isto indica que a sucesso cronolgica do modelo bilinear
possui estatisticamente comportamento no-linear.
Teste de Hsieh
Uma vez estabelecido que existe algum tipo de no-linearidade em uma sucesso
cronolgica, preciso identificar o tipo de no-linearidade existente, se na mdia ou na
varincia condicionadas.
Para a realizao do teste, fez-se o programa 4 que ir calcular os coeficientes (i,j) para
cada uma das subsries. Os resultados desta etapa vem a seguir:
Modelo Bilinear
Coeficiente Estatstica de Hsieh p-valor
11 -1,8707 0,0307
12 -1,406 0,0799*
13 -2,6029 0,0046
14 -1,7474 0,0403
15 -1,9897 0,0233
22 -2,4454 0,0072
23 -1,689 0,0456
24 -1,9339 0,0266
25 -1,688 0,0457
33 -1,6685 0,0476
34 -1,9953 0,0230
35 -2,1541 0,0156
44 -2,2459 0,0124
45 1,0084 0,8434*
55 3,0644 0,9989*
Conforme se observa no quadro anterior, para quinze pares (i,j), os valores dos
coeficientes do teste de Hsieh amostrais para o modelo bilinear e o correspondente p-
valor para um nvel de confiana de 95%, apresenta apenas trs coeficientes
significantes (indicado com *), podendo-se dizer que, de maneira geral, rejeita-se a
hiptese nula dos coeficientes iguais a zero, o que indica uma no-linearidade na
esperana condicionada.
162
CA - 1 Nvel CD - 1 Nvel
40 25
30 20
20 15
10 10
0 5
-10 0 100 200 300 400 500 0
-20 -5 0 100 200 300 400 500
-30 -10
Subsries: CA Subsries: CD
Hipteses Estatstica Valores Hipteses Estatstica Valores Crticos a
de Teste Crticos a 5% de Teste 5%
H 0 : 3RU -40.14459 -2.76 H 0 : 3RU -50.94260 -2.76
H1 : 2 RU H1 : 2 RU
H 0 : 2 RU -15.48948 -3.37 H 0 : 2 RU -14.33825 -3.37
H1 :1RU -25.77090 -3.77 H1 :1RU -30.38486 -3.77
H 0 :1RU -18.97206 -3.42 H 0 :1RU -22.40184 -3.42
H1 : 0 RU -15.03338 -3.80 H1 : 0 RU -8.158893 -3.80
-9.008961 -4.16 -14.47807 -4.16
Subsrie: CA Subsrie: CD
Dimenso BDS Erro Estatstica p-valor Dimenso BDS Erro Estatstica p-valor
Padro Z Padro Z
2 0,000507 9,04E-05 5,611479 0,0000 2 0,000311 6,40E-05 4,853707 0,0000
3 0,000114 1,16E-05 9,821680 0,0000 3 7,86E-05 7,78E-06 10,10195 0,0000
4 2,43E-05 1,12E-06 21,75208 0,0000 4 1,52E-06 7,10E-07 2,137668 0,0325
5 -4,33E-07 9,46E-08 -4,577848 0,0000 5 -3,32E-07 5,69E-08 -5,833533 0,0000
6 -2,34E-08 7,43E-09 -3,151588 0,0016 6 -1,65E-08 4,22E-09 -3,903729 0,0001
163
O teste de BDS rejeita a hiptese de independncia das subsries todos com 95% de
confiana, o que tambm implica na existncia de no-linearidade.
Teste de normalidade
Subsries: CA Subsries: CD
250 160
Series: CA Series: CD
Sample 1 500 Sample 1 500
200 Observations 500 Observations 500
120
Mean 1.583806 Mean -0.002040
150 Median 0.812568 Median -0.163276
Maximum 31.06392 80 Maximum 19.01008
Minimum -18.32724 Minimum -5.560301
100 Std. Dev. 3.484153 Std. Dev. 2.115571
Skewness 2.698546 Skewness 3.799245
Kurtosis 22.29655 40 Kurtosis 31.94698
50
Jarque-Bera 8364.276 Jarque-Bera 18659.68
Probability 0.000000 Probability 0.000000
0 0
-20 -10 0 10 20 30 -5 0 5 10 15 20
Teste de McLeod-Li
Subsrie: CA Subsrie: CD
Estatstica F 31.90431 p-valor 0.000000 Estatstica F 40.08631 p-valor 0.0000000
Xt CA-bilinear
0.4
0.2
-0.2
-0.4 t
0 50 100 150 200 250 300 350 400 450 500
Xt CD-bilinear
0.2
-0.2
-0.4
-0.6 t
0 50 100 150 200 250 300 350 400 450 500
Teste de Hsieh
Uma vez estabelecido que existe algum tipo de no-linearidade, em uma sucesso
cronolgica, preciso filtrar o tipo de no-linearidade existente, se na mdia ou na
varincia.
Subsrie: CA Subsrie: CD
Coeficiente Estatstica de Hsieh p-valor Coeficiente Estatstica de Hsieh p-valor
11 0,069 0,5275 11 -0,7257 0,23401
12 0,0386 0,5154 12 13,2497* 0,00000
13 1,94 0,0674 13 1,6951 0,95497
14 5,474* 0,0000 14 -4,8641* 0,00000
15 -8,125* 0,0000 15 -5,2335* 0,00000
22 0,0044 0,5018 22 0,1219 0,54851
23 -1,997* 0,0000 23 7,4856* 0,00000
24 -2,423* 0,0000 24 2,1278* 0,00000
25 -2,4157* 0,0000 25 -6,646* 0,00000
165
Subsrie: CA Subsrie: CD
33 -1,748 0,0847 33 1,1512 0,87517
34 1,434 0,4145 34 4,4668* 0,00000
35 7,145* 0,0000 35 4,2653* 0,00000
44 -1,435 0,0756 44 0,6609 0,74566
45 4,095* 0,0000 45 6,3659* 0,00000
55 -4,567* 0,0000 55 1,072 0,85814
Conforme se observa, no quadro anterior, para quinze pares i,j, os valores dos
coeficientes do teste de Hsieh amostrais para as duas subsries e o correspondente p-
valor para um nvel de confiana de 95%, apresenta nove coeficientes significantes
(indicados com *) na srie CD e oito na srie CA, podendo-se dizer que, de maneira
geral, rejeita-se a hiptese nula dos coeficientes iguais a zero, o que indica uma no-
linearidade na esperana condicionada.
8
6
4
2
0
-2 0 2 4 6 8 10
-4
Previsto Real
5
4
3
2
1
0
-1 0 2 4 6 8 10
-2
Previsto Real
30 30
20 20
10
10
0
0 -10 0 50 100 150 200 250
0 50 100 150 200 250
-10 -20
30 20
15
20
10
10 5
0 0
-5 0 50 100 150 200 250
-10 0 50 100 150 200 250
-10
-20 -15
Observa-se, que com 95% de confiana, ambas as quatro subsries definidas no pr-
processamento so estatisticamente estacionrias.
169
Teste de Normalidade
70 60
Series: CAA Series: CAD
60 Sample 1 250 Sample 1 250
50
Observations 250 Observations 250
50
Mean 2.239840 40 Mean 0.282411
40 Median 1.374118 Median -0.009956
Maximum 27.12474 Maximum 27.40234
30
Minimum -6.084255 Minimum -11.46908
30
Std. Dev. 3.718403 Std. Dev. 3.228125
Skewness 3.046540 20 Skewness 2.857894
20
Kurtosis 16.79327 Kurtosis 25.50139
10 10
Jarque-Bera 2368.541 Jarque-Bera 5614.402
Probability 0.000000 Probability 0.000000
0 0
-5 0 5 10 15 20 25 -10 -5 0 5 10 15 20 25
50 80
Series: CDA Series: CDD
Sample 1 250 70 Sample 1 250
40 Observations 250 Observations 250
60
Mean -0.002885 Mean 0.094880
50
30 Median -0.133439 Median 0.086971
Maximum 14.32439 40 Maximum 13.74855
Minimum -13.03960
Minimum -4.285253
20 30 Std. Dev. 2.299533
Std. Dev. 1.916343
Skewness 0.575560
Skewness 3.154921
20 Kurtosis 15.87190
Kurtosis 22.55069
10
10 Jarque-Bera 1739.697
Jarque-Bera 4396.288 Probability 0.000000
Probability 0.000000 0
0 -10 -5 0 5 10
0 5 10
O mesmo ocorre com o teste de normalidade dos dados, o que indica que todas as
subsries apresentam comportamento no normal.
Teste de McLeod-Li
Xt
CA-bilinear
0.4
0.2
-0.2
-0.4 t
0 50 100 150 200 250 300 350 400 450 500
Xt
CD-bilinear
0.2
-0.2
-0.4
-0.6
0 50 100 150 200 250 300 350 400 450 500 t
Subs Redes Performance Performance Performance Erro Erro Seleo Erro Teste Caractersticas
ries de treinam. Seleo Teste Treinamento
CAA MLP s5 1:5-6-2-1:1 0,846273 1,065622 1,209212 0,084252 0,082395 0,093471 BP100,CG21b
CAD MLP s5 1:5-1-1:1 0,960315 0,959103 1,044380 0,095606 0,074169 0,079927 BP100,CG21b
CDA MLP s3 1:3-1-1:1 0,966962 0,992191 0,980613 0,078589 0,105044 0,100650 BP100,CG25b
CDD MLP s5 1:5-1-1:1 0,962363 0,992466 0,971795 0,078215 0,105076 0,099702 BP100,CG39b
25
20
15
10
5
0
-5 0 20 40 60 80 100 120 140 160 180 200
-10
Valor no nvel Mnimo Mximo
Figura 66: Intervalo de previso em 1 nvel para o DGP do modelo bilinear via
RN com retropropagao.
10
8
6
4
2
0
-2 0 20 40 60 80 100 120 140 160 180 200
-4
-6
Valor no nvel Mnimo Mximo
Figura 67: Intervalo de previso em 2 nvel para o DGP do modelo bilinear via
redes neurais com retropropagao.
Como visto anteriormente, o teste para independncia deve ser aplicado para ver se a
sucesso cronolgica apresenta independncia nos resduos. Suas hipteses so:
173
Resduos Modelo Bilinear Previsto RN com Resduos Modelo Bilinear Previsto RN com
retrop. com 1 Nvel de pr-processamento retrop. com 2 Nveis de pr-processamento
Dimenso BDS Erro Estatstica p-valor Dimenso BDS Erro Estatstica p-valor
Padro Z Padro Z
2 0,014389 0,006935 2,074836 0,0880 2 6,61E-05 3,39E-06 19,52304 0,1540
3 0,018640 0,011068 1,684062 0,0922 3 -1,71E-07 7,47E-08 -2,288941 0,2104
4 0,016867 0,013241 1,273817 0,2027 4 -9,13E-10 1,24E-09 -0,736845 0,4612
5 0,018619 0,013868 1,342564 0,1794 5 -5,07E-12 1,80E-11 -0,281401 0,7784
6 0,023703 0,013441 1,763576 0,0778 6 -2,53E-14 2,43E-13 -0,104304 0,9169
Teste de Normalidade
20
60 Series: B2
Series: B1 Sample 1 200
Sample 1 200 16 Observations 200
50
Observations 200
Mean -0.000767
40 Mean -0.023173 12 Median 0.174602
Median -0.373131 Maximum 14.21010
30 Maximum 18.68739 Minimum -14.84325
Minimum -4.660504 8 Std. Dev. 6.911067
Std. Dev. 2.703207 Skewness -0.028217
20 Skewness 3.243801 Kurtosis 1.672477
Kurtosis 19.32679 4
10 Jarque-Bera 14.71251
Jarque-Bera 2572.108 Probability 0.000639
Probability 0.000000 0
0
-15 -10 -5 0 5 10 15
-5 0 5 10 15
1 Nvel 2 Nvel
Figura 68: Distribuio dos resduos do modelo Bilinear previsto por redes neurais com
retropropagao, em 1 e 2 nveis de pr-processamento.
35 32
Series: R1 Series: R2
30 Sample 1 200 28 Sample 1 200
Observations 200 Observations 200
24
25
Mean 0.090783 Mean 0.603279
20
Median -0.036827 Median 0.547461
20 Maximum 7.185526
Maximum 6.538352 16
Minimum -4.071368 Minimum -3.786141
15 12 Std. Dev. 1.448040
Std. Dev. 1.376810
Skewness 0.754154
Skewness 0.700653
10 8 Kurtosis 5.196029
Kurtosis 5.347744
5 4 Jarque-Bera 59.14612
Jarque-Bera 62.29632
0
1 Nvel Probability 0.000000 0 2 Nvel
Probability 0.000000
-4 -2 0 2 4 6
-4 -2 0 2 4 6
Figura 69: Distribuio dos resduos do modelo bilinear previsto redes neurais
recorrentes, em 1 e 2 nveis de pr-processamento.
Quadro 4: Resumo das estatsticas da qualidade da previso pontual e do envelopamento das sucesses modelo ARIMA-GARCH
PREVISO ESTTICA FEITA COM MODELO ARIMA-GARCH
Sem pr-processamento Com pr-processamento Com pr-processamento
Estatstica de em 1 nvel em 2 nveis
MODELO Anlise Previso de Previso de Previso de Previso de Previso de Previso de
SIMULADO 200 pontos 10 pontos 200 pontos 10 pontos 200 pontos 10 pontos
TIC 1,00 0,96 0,99 0,83 0,99 0,96
MAPE 100% 9,49% 110,00% 10,0,% 99,99% 11,37%
Correlao -0,02 0,18 -0,11 0,16 -0,07 -0,47
Envelopamento 48,06% 48,42% 48,15%
PREVISO ESTTICA FEITA COM REDE NEURAL RETROPROPAGAO
TIC 0,93 0,97 0,86 0,75 0,99 0,86
ARIMA- MAPE 98,12% 9,25% 72,76% 3,39% 98,46% 13,05%
GARCH Correlao 0,01 0,10 -0,47 -0,04 -0,11 -0,28
Envelopamento 49,44% 93,74% 91,59%
PREVISO ESTTICA FEITA COM REDE NEURAL RECORRENTE
TIC 0,60 0,82 0,77 0,85 0,69 0,14
MAPE 98,90% 9,60% 26,22% 1,14% 89,40% 5,80%
Correlao -0,02 0,36 -0,18 0,01 0,37 0,96
Envelopamento 50,87% 96,45% 93,62%
176
Quadro 5: Resumo das estatsticas da qualidade da previso pontual e do envelopamento das sucesses modelo AR(1).
PREVISO ESTTICA FEITA COM MODELO ARIMA
MODELO Sem pr-processamento Com pr-processamento Com pr-processamento
SIMULADO Estatstica de em 1 nvel em 2 nveis
Anlise Previso de Previso de Previso de Previso de Previso de Previso de
200 pontos 10 pontos 200 pontos 10 pontos 200 pontos 10 pontos
TIC 1,00 0,95 1,00 0,90 0,97 0,91
ARIMA MAPE 99,09% 9.54% 100% 10,90% 99,68% 9,19%
Correlao 0,18 0,22 -0,05 -0,34 0,11 -0,36
Envelopamento 45,54% 92,67% 90,96%
Quadro 6: Resumo das estatsticas da qualidade da previso pontual e do envelopamento das sucesses modelo bilinear com rede neural e
retropropagao.
PREVISO ESTTICA FEITA COM MODELO BILINEAR COM REDE NEURAL
MODELO Retropropagao
SIMULADO Sem pr-processamento Com pr-processamento Com pr-processamento
Estatstica de em 1 nvel em 2 nveis
Anlise Previso de Previso de Previso de Previso de Previso de Previso de
200 pontos 10 pontos 200 pontos 10 pontos 200 pontos 10 pontos
TIC 1,00 0,82 0,63 0,68 0,62 0,71
BILINEAR MAPE 100% 9,60% 342,27% 81,86% 346,47% 86,93%
Correlao 0,03 0,36 -0,03 -0,66 -0,07 -0,50
Envelopamento 40,54% 90,35% 91,11%
177
Quadro 7: Resumo das estatsticas da qualidade da previso pontual e do envelopamento das sucesses modelo bilinear com redes recorrentes.
PREVISO ESTTICA FEITA COM MODELO BILINEAR COM REDE NEURAL
MODELO RECORRENTE
SIMULADO Sem pr-processamento Com pr-processamento Com pr-processamento
Estatstica de em 1 nvel em 2 nveis
Anlise Previso de Previso de Previso de Previso de Previso de Previso de
200 pontos 10 pontos 200 pontos 10 pontos 200 pontos 10 pontos
TIC 0,49 0,68 0,52 0,24 0,85 0,65
BILINEAR MAPE 146,08% 113,48% 91,15% 128,70% 199,69% 118,56%
Correlao 0,43 0,51 0,32 0,91 0,16 -0,41
Envelopamento 92,47% 96,38% 95,29%
178
4.5 TESTE PARA O IBOVESPA
30000
25000
20000
15000
10000
5000
0
28/ 8/ 1999 15/ 3/ 2000 1/ 10/ 2000 19/ 4/ 2001 5/ 11/ 2001 24/ 5/ 2002 10/ 12/ 2002 28/ 6/ 2003 14/ 1/ 2004 1/ 8/ 2004 17/ 2/ 2005
0,1
0,08
0,06
0,04
0,02
0 v
-0,02 0 200 400 600 800 1000 1200
-0,04
-0,06
-0,08
-0,1
-0,12
Ibovespa
Hipteses Estatstica de Teste Valores Crticos a 5%
H 0 : 3RU -68,24733 -2,76
H1 : 2 RU
H 0 : 2 RU -22,38750 -3,37
H1 :1RU -38,46974 -3,77
H 0 :1RU -31,44229 -3,42
H1 : 0 RU -14,39437 -3,80
-18,01330 -4,16
IBOVESPA
Dimenso BDS Erro Padro Estatstica Z p-valor
2 0,001521 0,000486 3,132866 0,0017
3 0,005164 0,001038 4,975060 0,0000
4 0,009762 0,001660 5,879685 0,0000
5 0,015237 0,002324 6,557137 0,0000
6 0,020615 0,003008 6,852887 0,0000
Teste de Normalidade
A figura, a seguir, ilustra a distribuio da sucesso cronolgica.
120
Series: IBOV
Sample 1 1000
100
Observations 1000
80 Mean 0.000346
Median 0.000671
60 Maximum 0.073353
Minimum -0.096342
Std. Dev. 0.019729
40 Skewness -0.201926
Kurtosis 3.867565
20
Jarque-Bera 38.15693
Probability 0.000000
0
-0.10 -0.05 0.00 0.05
Teste de McLeod-Li
O resultado da estatstica de teste calculado no Eviews 5.0 :
Modelo IBOVESPA
Estatstica F 11,01762 p-valor 0,00000
181
Dessa forma, o teste de McLeod-Li para 5 defasagens rejeitou a hiptese nula pelo fato do p-
valor ser inferior a 5%. Isto indica que a sucesso cronolgica do modelo IBOVESPA possui
estatisticamente comportamento no-linear.
Teste de Hsieh
Uma vez estabelecido que existe algum tipo de no-linearidade em uma sucesso cronolgica,
preciso identificar o tipo de no-linearidade existente, se na mdia ou na varincia
condicionadas.
Para a realizao do teste, fez-se o programa 4 que calcula os coeficientes (i,j) para cada uma
das subsries. Os resultados desta etapa vm a seguir:
IBOVESPA
Coeficiente Estatstica de Hsieh p-valor
11 -0,1171 0,4534
12 0,7191 0,7640
13 0,1492 0,5593
14 0,1298 0,5516
15 -0,0195 0,4922
22 0,0744 0,5297
23 -0,5456 0,2927
24 0,3259 0,6277
25 -0,2027 0,4197
33 0,2956 0,6162
34 -0,6942 0,2438
35 -0,9021 0,1835
44 0,4649 0,6790
45 0,1655 0,5657
55 -0,0273 0,4891
Conforme se observa, no quadro anterior, para quinze pares (i,j), os valores dos coeficientes
do teste de Hsieh amostrais para o IBOVESPA e o correspondente p-valor para um nvel de
confiana de 95%, podendo-se dizer que no se rejeita a hiptese nula dos coeficientes iguais
a zero para nenhum valor, o que indica uma no-linearidade na varincia condicionada.
CD - 1 Nivel - Ibovespa
CA - 1 Nivel - Ibovespa
0,1
0,1
0,05
0,05
0
0
0 100 200 300 400 500
0 100 200 300 400 500 -0,05
-0,05
-0,1
-0,1
Subsrie: CA Subsrie: CD
Hipteses Estatstica Valores Hipteses Estatstica Valores Crticos a
de Teste Crticos a 5% de Teste 5%
H 0 : 3RU -50,35651 -2,76 H 0 : 3RU -52,92045 -2,76
H1 : 2 RU H1 : 2 RU
H 0 : 2 RU -16,23697 -3,37 H 0 : 2 RU -16,55276 -3,37
H1 :1RU -26,49827 -3,77 H1 :1RU -27,39209 -3,77
H 0 :1RU -23,13910 -3,42 H 0 :1RU -22,69907 -3,42
H1 : 0 RU -9,200660 -3,80 H1 : 0 RU -10,56710 -3,80
-13,32963 -4,16 -12,47816 -4,16
Subsrie: CA Subsrie: CD
Dimenso BDS Erro Estatstica p-valor Dimenso BDS Erro Estatstica p-valor
Padro Z Padro Z
2 5,32E-05 2,98E-06 17,82401 0,0000 2 5,53E-05 3,26E-06 16,98216 0,0000
3 -9,89E-07 8,18E-08 -12,09364 0,0000 3 -1,08E-06 9,16E-08 -11,82881 0,0000
4 -9,76E-09 1,68E-09 -5,791813 0,0000 4 -1,10E-08 1,93E-09 -5,682562 0,0000
5 -9,85E-11 3,04E-11 -3,240053 0,0012 5 -1,14E-10 3,58E-11 -3,194547 0,0014
6 -9,73E-13 5,09E-13 -1,912310 0,0008 6 -1,18E-12 6,14E-13 -1,923652 0,0044
183
O teste de BDS rejeita a hiptese de independncia das subsries, com 95% de confiana, o
que tambm implica na existncia de no-linearidade.
Teste de normalidade
Subsrie: CA Subsrie: CD
60 70
Series: CA Series: CD
Sample 1 500 60 Sample 1 500
50 Observations 500
Observations 500
50
Mean 0.003065
40 Mean 0.000490
40 Median 0.004510
Median 0.001589 Maximum 0.071744
30 Maximum 0.061117 Minimum -0.063928
30
Minimum -0.087604 Std. Dev. 0.019019
Std. Dev. 0.020202 Skewness 0.035139
20 20
Skewness -0.304385 Kurtosis 3.133655
Kurtosis 3.916711
10
Jarque-Bera 0.475057
10
Jarque-Bera 25.22829 Probability 0.788574
0
Probability 0.000003 -0.050 -0.025 0.000 0.025 0.050 0.075
0
-0.05 0.00 0.05
Teste de McLeod-Li
Subsries: CA Subsries: CD
Estatstica F 15,58455 p-valor 0,000000 Estatstica F 5,530925 p-valor 0,0000000
Dessa forma, o resultado do teste de McLedod-Li para 5 defasagens rejeitou a hiptese nula
pelo fato do p-valor ser inferior a 5%. Isto indica que ambas as subsries estatisticamente
possuem comportamento no-linear.
184
CA-ibov
0.4
0.2
-0.2
-0.4
0 50 100 150 200 250 300 350 400 450 500
CD-ibov
0.4
0.3
0.2
0.1
-0.1
0 50 100 150 200 250 300 350 400 450 500
Teste de Hsieh
Uma vez estabelecido que existe algum tipo de no-linearidade em uma sucesso cronolgica,
preciso filtrar o tipo de no-linearidade existente, se na mdia ou na varincia.
Subsrie: CA Subsrie: CD
Coeficiente Estatstica de Hsieh p-valor Coeficiente Estatstica de Hsieh p-valor
11 0,0199 0,5079 11 -0,7673 0,2215
12 -0,3985 0,3451 12 12,2915 1,0000
13 -0,5165 0,3028 13 5,8233 1,0000
14 -2,5064 0,00618 14 -1,0921 0,1374
15 1,1543 0,8758 15 -1,3654 0,0861
22 0,6902 0,7550 22 1,3649 0,9139
23 1,9596 0,9750 23 -1,1688 0,1212
24 0,3939 0,6532 24 -3,7453 0,0001*
25 -0,3271 0,3718 25 -1,4606 0,0721
33 -0,2684 0,3942 33 14,5133 1,0000
185
Subsrie: CA Subsrie: CD
34 0,1726 0,5685 34 3,3806 0,9996
35 0,045 0,5179 35 -2,4782 0,0066*
44 0,4792 0,6841 44 0,7403 0,7704
45 -1,3619 0,0866 45 2,6633 0,9961
55 -0,3465 0,3645 55 0,478 0,6837
Conforme se observa no quadro anterior, para quinze pares i,j, os valores dos coeficientes do
teste de Hsieh amostrais para as duas subsries e o correspondente p-valor para um nvel de
confiana de 95%, aceita-se a hiptese nula dos coeficientes iguais a zero, o que indica uma
no-linearidade na varincia condicionada. A subsrie de alta freqncia tem apenas dois
coeficientes significativos marcados com (*).
t2 I t 1 N ( 0; ht )
ht = 0 + 1 t21 + ht 1
t2 I t 1 N ( 0; ht )
ht = 0 + 1 t21 + ht 1
Trabalhando com redes neurais com retropropagao e com redes recorrentes, a rede
recorrente foi gerada com 10-2R-1, com funo de ativao do tipo sigmide, taxa de
aprendizagem de 0,005 e nmero de ciclos de treinamento de 20000. Para as redes com
retropropagao, tem-se:
Subs Redes Performance Performance Performance Erro Erro Seleo Erro Teste Caractersticas
rie de treinam. Seleo Teste Treinamento
0,1 0,06
0,04
0,05 0,02
0
0
-0,02 0 50 100 150 200 250
0 50 100 150 200 250
-0,05 -0,04
-0,06
-0,1 -0,08
0,04
0,05
0,02
0
0
-0,02 0 50 100 150 200 250
0 50 100 150 200 250
-0,04
-0,05
-0,06
-0,08
-0,1
Observa-se que, com 95% de confiana, ambas as quatro subsries definidas no pr-
processamento so estatisticamente estacionrias.
189
Teste de Normalidade
32 32
Series: CAD Series: CAA
28 Sample 1 250 28 Sample 1 250
Observations 250 Observations 250
24 24
Mean 0.000485 Mean 0.000693
20 20
Median 0.002111 Median 0.001929
16 Maximum 0.051960 16 Maximum 0.054344
Minimum -0.064707 Minimum -0.082371
12 Std. Dev. 0.020336 12 Std. Dev. 0.020102
Skewness -0.345198 Skewness -0.284393
8 Kurtosis 3.250787 8 Kurtosis 3.772535
O mesmo ocorre com o teste de normalidade dos dados, o que indica que as subsries de alta
freqncia da primeira decomposio e a baixa freqncia tambm da primeira decomposio
apresentam comportamento normal, as demais apresentam comportamento no normal.
Teste de McLeod-Li
Pelo teste, rejeita-se a hiptese nula, o que indica que o modelo estatisticamente no-
linear.
CAA-ibov CAD-ibov
0.6 0.6
0.4 0.4
0.2 0.2
0 0
-0.2 -0.2
0 100 200 300 0 100 200 300
CDA-ibov CDD-ibov
0.4 0.3
0.2
0.2
0.1
0
0
-0.2
-0.1
-0.4 -0.2
0 100 200 300 0 100 200 300
Subs Redes Performance Performance Performance Erro Erro Seleo Erro Teste Caractersticas
ries de treinam. Seleo Teste Treinamento
CAA MLP s5 1:5-1-1:1 0,997355 0,998706 0,998381 0,15345 0,15632 0,14804 BP100,CG21b
CAD MLP s5 1:5-8-1:1 1,005360 1,029760 1,013637 0,19837 0,18489 0,19656 BP8b
CDA MLP s5 1:5-1-1:1 0,992644 1,001492 1,007899 0,16622 0,18870 0,19275 BP100,CG21b
CDD MLP s5 1:5-1-2-1:1 0,983534 0,972308 1,035553 0,14664 0,11320 0,14462 BP100,CG23b
Embora o envelopamento tenha dado 83%, isso no significa que a previso seja adequada,
conforme as estatsticas de acurcia pontuais.
Como visto anteriormente, o teste para independncia deve ser aplicado para ver se a sucesso
cronolgica apresenta independncia nos resduos. Suas hipteses so:
Resduos IBOVESPA Previsto RN com retrop. Resduos IBOVESPA Previsto RN com retrop.
com 1 Nvel de pr-processamento com 2 Nveis de pr-processamento
Dimenso BDS Erro Estatstica p-valor Dimenso BDS Erro Estatstica p-valor
Padro Z Padro Z
2 0.014896 0.005151 2.891971 0.0888 2 0.01667 4.80E-05 34.72782 0.0950
3 0.018453 0.008213 2.246835 0.0747 3 0.03333 0.000107 31.09772 0.0814
4 0.020576 0.009810 2.097390 0.0560 4 0.05000 0.000179 27.90881 0.0762
5 0.019249 0.010256 1.876818 0.0605 5 0.06667 0.000262 25.44965 0.0774
6 0.017827 0.009920 1.796982 0.0723 6 0.08333 0.000354 23.52168 0.0969
193
Resduos IBOVESPA Previsto RN recorrentes Resduos IBOVESPA Previsto RN recorrentes
com 1 Nvel de pr-processamento com 2 Nveis de pr-processamento
Dimenso BDS Erro Estatstica p-valor Dimenso BDS Erro Estatstica p-valor
Padro Z Padro Z
2 0.002820 0.004442 0.634819 0.5255 2 -5.05E-07 5.33E-07 -0.947302 0.3435
3 0.010294 0.007040 1.462196 0.1437 3 -3.70E-10 6.89E-09 -0.053687 0.9572
4 0.014577 0.008359 1.743854 0.0812 4 -2.77E-13 6.68E-11 -0.004142 0.9967
5 0.014577 0.008687 1.678068 0.0933 5 -2.11E-16 5.66E-13 -0.000373 0.9997
6 0.013164 0.008352 1.576136 0.1150 6 -1.64E-19 4.45E-15 -3.70E-05 1.0000
Teste de Normalidade
30 32
Series: RESB2 Series: RESID
Sample 1 200 28 Sample 2 250
25
Observations 200 Observations 249
24
20 Mean -0.000561 Mean 0.000773
20
Median -0.000220 Median 0.002091
15 Maximum 0.045545 16 Maximum 0.054344
Minimum -0.058381 Minimum -0.082371
Std. Dev. 0.018781 12 Std. Dev. 0.020109
10 Skewness -0.261151 Skewness -0.292850
Kurtosis 3.199851 8 Kurtosis 3.785564
5
Jarque-Bera 2.606158 4 Jarque-Bera 9.961610
Probability 0.271694 Probability 0.006869
0 0
-0.06 -0.04 -0.02 0.00 0.02 0.04 -0.075 -0.050 -0.025 0.000 0.025 0.050
1 Nvel 2 Nvel
Figura 79: Distribuio dos resduos do IBOVESPA previsto por redes neurais com
retropropagao, em 1 e 2 nveis de pr-processamento.
70 1400
Series: RESREC Series: RESREC2
60 Sample 1 200 1200 Sample 2 1200
Observations 200 Observations 1199
50 1000
Mean -0.493070 Mean -5.79E-07
40 Median -0.015530
800 Median 0.000000
Maximum 0.045238
Maximum 0.000000
30 Minimum -1.459460
600 Minimum -0.000670
Std. Dev. 0.668478
Skewness -0.636407 Std. Dev. 1.94E-05
20 Skewness -34.51811
Kurtosis 1.422930 400
Kurtosis 1193.930
10
Jarque-Bera 34.22669 200
Probability 0.000000 Jarque-Bera 71094677
0 Probability 0.000000
-1.50 -1.25 -1.00 -0.75 -0.50 -0.25 0.00 0
-0.00050 -0.00025 -1.7E-19
1 Nvel 2 Nvel
Figura 80: Distribuio dos resduos do modelo IBOVESPA previsto por redes neurais
recorrentes, em 1 e 2 nveis de pr-processamento.
CONCLUSO
Nesta pesquisa, o objetivo principal foi o de explorar a possibilidade de usar uma metodologia
capaz de decompor uma sucesso cronolgica via ondaletas, conjuntamente com os modelos
economtricos e de redes neurais j existentes de previso e comparar a qualidade de
previses obtidas para sucesses cronolgicas lineares e no-lineares simuladas. Teve tambm
a proposta de traar um fluxograma para tratamento das previses e para propor um rigor
quantitativo mais adequado.
O diferencial deste trabalho est na realizao das previses dentro das subsries decompostas
por uma ondaleta em at dois nveis, obtendo-se a previso da srie original, via reconstruo
da srie para modelos construdos, por processos geradores de dados de sucesses
cronolgicas lineares e no-lineares.
Para os modelos de previso com redes neurais, ressalta-se uma diferena entre as redes
neurais recorrentes e as redes com algoritmo de retropropagao: a capacidade de previso
das redes recorrentes para dados no-lineares com 2 nveis de pr-processamento e para
previses de curto prazo. Todavia, para o critrio do envelopamento, o modelo ARIMA-
GARCH apresentou melhores resultados para o pr-processamento com 1 nvel e por rede
196
recorrente. Todos os dados tambm foram comparados com as previses feitas sem pr-
processamento, as quais se mostraram imprprias com MAPE, perto de 100% para previses
de longo prazo.
Na modelagem feita para a sucesso cronolgica AR(1), o melhor modelo ajustado, segundo o
TIC, foi com pr-processamento em uma etapa; mas as previses so melhores com duas
etapas. O envelopamento, para este processo, foi melhor com duas etapas de decomposio.
Com os dados do modelo bilinear, as redes recorrentes se mostraram mais adequadas tanto
para as previses de curto prazo, quanto para o envelopamento, muito embora, neste ltimo
caso, a diferena ficou pouco significativa na capacidade de envelopar.
Da anlise dos resduos resultantes dos modelos simulados, observou-se que, para os modelos
ARIMA-GARCH e AR(1), seus valores foram normais e independentes. J, nos dados do
modelo bilinear, detectou-se apenas a independncia dos resduos e a no normalidade dos
mesmos.
ARIO, M. A. Time series forecasts via ondaletas: an application to car sales in the spanish
market. Discussion Paper 95-30, ISDS, Duke University.
AZOFF, E. M. Neural network time series forecasting of financial markets. John Wiley &
Sons. 1994.
BILLINGS, S. A.; VOON, W. S. F. Correlation based model validity tests for nonlinear
models. International Journal of Control. v. 44, n. 1, p. 235-244, 1986.
BLACKMAN, R. B.; TUKEY, J. W. The measurement of power spectrum from the point
of view of communications engineering, New York: Dover, 1959.
BOX, G. E. P., JENKINS, G. M., REINSEL, G. C. Time series analysis: forecasting and
control. 3. ed. New York : Prentice Hall, 1994.
BOX, G. E. P., JENKINS, G. M. Time series analysis: forecasting e control. 3. ed. New
York: Prentice Hall, 1994.
CAO, L.; SOOFI, A. S. Non-linear deterministic forecasting of daily dollar exchange rates.
International Journal of Forecasting. Milwaukee, n. 15, p. 421430, 1999.
CHANG, C. Anlise de ondaletas em sries temporais. So Paulo: IME, 1997. 117 f. Tese
(Doutorado em Matemtica Aplicada) Instituto de Matemtica e Estatstica, Universidade
de So Paulo, 1997.
CHUI, C. K. Ondaletas: a tutorial in theory and aplicattions. Boston: Academic Press, 1992.
200
DEBOECK, G. J. Pre-processing and evaluation of neural nets for trading stocks. Advanced
Technology for Developers, USA, v. 1, p. 1-13, aug. 1992.
DE VEAUX, R.; SCHWEINSBERG, J.; SCHUMI, J.; UNGAR, L. H. Prediction intervals for
neural networks via nonlinear regression. Technometrics. v. 40, n. 4. p. 273-282, nov, 1998.
ENDERS, W. Applied econometric time series 2. ed. John Wiley & Sons, 2003.
FAMA, E. Efficient capital markets: a review of theory and empirical work. The Journal of
Finance. 25(1). p. 383-470, 1970.
________. Efficient capital markets II. The Journal of Finance. 46(5). p. 1575-1617, 1991.
FAMA, E.; FRENCH, K. Permanent and temporary components of stock prices. Journal of
Political Economy. v. 26, p. 246-273, 1988.
HANNAN, E. J. The estimation of the order of an ARMA process. The Annals of Statistics.
v. 8, p. 1071-1081. 1980.
HARVEY, A. C. Forecasting, structural time series models and the Kalman filter.
Cambridge: Cambridge Academic Press:1989.
HAYKIN, S. Redes neurais: princpios e prtica. 2. ed. Porto Alegre: Bookman, 2001.
HILL, T.; OCONNOR, M.; REMUS, W. Neural network models for time series forecasts.
Management Science. v. 42, n. 7, p. 1082 1092, jul. 1996.
HISIEH, D. Testing for nonlinear dependence in daily foreign exchange rates. Journal of
Business, 62, n. 3, p. 339-368, 1989.
KEIM, D.; STAMBAUGH, R. Predicting returns in stock and bond markets. Journal of
Financial Economics. v. 17, 1986, p. 357-390.
KLEIN, J. L. Statistical visions in time: a history of time series analysis, 1662-1938. New
York: Cambridge University Press, 1997.
LUDLOW, J.; ENDERS, W. Estimating non-linear ARMA models using Fourier coefficients.
International Journal of Forecasting. 16, 2000, p. 333 347.
203
McALEER, M., OXLEY, L. The econometrics of financial time series. Journal of Economic
Surveys. v. 16. n. 3, 2002. p. 237-249.
MCLEOD, A. J. e W. K. Li, Diagnostic checking ARMA times series models using squared
residuals correlations. Journal of Time Series Analysis, n. 4, 1983, p. 269-73.
MISITI, M. et al. Ondaleta toolbox: for use with Matlab. The Math Works, Inc. 1997.
Disponvel em: <http://www.mathworks.com> . Acesso em: 14 ago. 2003.
MILLS, T. C. The econometric modeling of financial time series. New York: Cambridge
Universisty Press, 1996.
MOODY, J. e SAFFELL, M. Reinforcement learning for trading system and portfolios. In:
AGRAWAL, R.; PIATETSKY-SHAPIRO, G. Ed. KDD98 - Proceedings of The Fourth
International Conference on Knowledge Discovery and Data Mining. AAAI Press,
California, 1998, p. 279-283.
OLIVEIRA, M. A.; FAVERO, L. P. L. Uma breve descrio de algumas tcnicas para anlise
de sries temporais: sries de Fourier, ondaletas, ARIMA, modelos estruturais para sries de
tempo e redes neurais. Anais do VI SEMEAD, So Paulo, 2003.
204
OSBORNE, M.F.M. Brownian motion in the stock market. Operations Research VII. 1959
PRIESTLEY, M.B. Spectral analysis and time series. London: Unknown, 1983.
QI, Min. Nonlinear predictability of stock returns using financial and economic variables.
Journal of Business & Economic Statistics. v. 64, n. 4, 1999, p. 419-429.
SHIAVI, R. Introduction to applied statistical signal analysis. 2.ed. San Diego: Academic
Press, 1999.
SIEGLER, W.; STEURER, E. Forecasting of the german stock index DAX with neural
networks: using daily data for experiments with input variable reduction and a modified Error
Function. p 265-273. In: EBECKEN, N. F. F. Editor. Proceedings of the international
conference on data mining, Rio de Janeiro, S&P. 1998. p. 265-273
TAK, B. A new method for forecasting stock prices using artificial neural network and
ondaleta theory. 1995. 107 f. Tese (Doutorado em Economia). Universidade de Pensilvnia,
Estados Unidos, 1995.
TSAY, R. S. Analysis of financial time series. Wiley series in probability and statistics.
2002.
VANDAELE, W. Applied time series and Box-Jenkins models. New York: Academic
Press, 1983.
WILLIAMS, R. J.; ZIPSER, D. A learning algorithm for continually running fully recurrent
neural networks. Neural Computation. v. 1, p. 270-280. 1989.
206
_________________________. Gradient-based learning algorithm for recurrent networks and
their computational complexity, 1995.
WONG, H., IP. W., XIE, Z., LUI, X.. Modelling and forecasting by ondaletas, and the
application to exchange rates. Journal of Applied Statistics, v. 30, n. 5, 2003. p. 537-553.
YIM, J. Previso de sries de tempo: modelos ARIMA, estruturais e redes neurais artificiais.
So Paulo: IME, 2001. 87 f. Dissertao (Mestrado em Matemtica Aplicada) Instituto de
Matemtica e Estatstica, Universidade de So Paulo, 2001.
ZHANG, G.; PATUWO, B. E.; HU, M. Y. Forecasting with artificial neural networks: the
state of the art. International Journal of Forecasting, Kent(Ohio) 14, p. 3562, 1998.
ZOU, H., YANG, Y. Combining time series models for forecasting. International Journal of
Forecasting. n. 20, p. 69-84.2004.
207
APNDICE A
Haar 1, se 0 x 1
haar
1.4
2 1.2
( x) = 1, se 1 x < 1 1
2
0.8
0.4
0.2
0
0 50 100 150 200 250 300
Daubechies
db2 db3 db4
2 2 2
1 1 1
0 0 0
-1 -1 -1
0 500 1000 0 1000 2000 0 1000 2000
2 2 2
db5 db6 db7
1 1 1
0 0 0
-1 -1 -1
0 2000 4000 0 2000 4000 0 2000 4000
2 1 1
db8 db9 db10
1 0.5 0.5
0 0 0
-1 -0.5 -0.5
0 2000 4000 0 5000 0 5000
209
Biorthogonal
bior1.3 bior1.5
2 2
0 0
-2 -2
0 500 1000 1500 0 500 1000 1500 2000 2500
bior2.2 bior2.4
10 2
0 0
-10 -2
0 500 1000 1500 0 500 1000 1500 2000 2500
bior2.6 bior2.8
2 2
0 0
-2 -2
0 1000 2000 3000 4000 0 1000 2000 3000 4000 5000
bior3.1 bior3.3
200 5
0 0
-200 -5
0 200 400 600 800 0 500 1000 1500 2000
bior3.5 bior3.7
2 2
0 0
-2 -2
0 1000 2000 3000 0 1000 2000 3000 4000
bior3.9
2 bior4.4
2
0
0
-2
0 1000 2000 3000 4000 5000 -2
0 500 1000 1500 2000 2500
bior5.5 bior6.8
1 2
0 0
-1 -2
0 1000 2000 3000 0 1000 2000 3000 4000 5000
Coiflets
210
coif1
2
-2
0 200 400 600 800 1000 1200 1400
2
coif2
0
-2
0 500 1000 1500 2000 2500 3000
2
coif3
0
-2
0 500 1000 1500 2000 2500 3000 3500 4000 4500
coif4
2
-2
0 1000 2000 3000 4000 5000 6000
coif5
2
-2
0 1000 2000 3000 4000 5000 6000 7000 8000
Symlets
211
sym2
2
-1
0 100 200 300 400 500 600 700 800
sym3
2
-1
0 200 400 600 800 1000 1200 1400
sym4
2
-1
0 200 400 600 800 1000 1200 1400 1600 1800
sym5
2
-1
0 500 1000 1500 2000 2500
sym6
2
-1
0 500 1000 1500 2000 2500 3000
sym7
2
-1
0 500 1000 1500 2000 2500 3000 3500
sym8
2
-1
0 500 1000 1500 2000 2500 3000 3500 4000
212
Morlet x
( x) = Ce 2 .cos(5 x)
sendo que C uma
constante.
Mexican Hat 2 14 x
( )
( x) = 1 x2 e 2
3
Meyer
213
APNDICE C
SeedRandom[4584715];
Dados=Table[x[i]=Table[TimeSeries[GARCHModel[{0.06,0.04},{0.7}],1200]],{i,1
,200}];TimeSeries[ARModel[{0.2,-0.5}],z,{0,0}]
ListPlot[x[1],PlotJoined->True]
writeMatrixSpreadSheet[filename_String, data_List] :=
Block[{file = OpenWrite[filename]},
Scan[(WriteString[file,First[#]];
Scan[WriteString[file,"\t",#]&,Rest[#]];
WriteString[file,"\n"]&,data];
Close[file]]
writeMatrixSpreadSheet["serieteste.txt",Transpose[dados]]
Deve-se carregar o pacote intitulado Ondaleta no Front End do Mathematica 5.0, que deve
estar salvo em um dos arquivos dos pacotes disponveis no caso, no de estatstica com o
comando:
<< Statistics/Ondaleta.m
BeginPackage["Ondaleta`"]
Ondaleta::usage =
"Ondaleta faz o pr-processamento de uma sucesso cronolgica
decompondo a srie em duas subsries, uma de baixa (ca) e outra
de alta (cd) frequencia."
ca::usage =
"ca faz o pr-processamento da parte de baixa frequencia da
decomposio em 1 nvel."
cd::usage =
"cd faz o pr-processamento da parte de alta frequencia da
decomposio em 1 nvel."
Needs["Wavelets`Wavelets`"];
Ondaleta[arquivo_]:=ListPlot[arquivo, PlotJoined -> True, AxesLabel
-> {"t", "X(t)"}];
(* Plota apenas o grfico do arquivo da sucesso cronolgica*)
ca[arquivo_]:=ListPlot[Flatten[Take[WaveletTransform[arquivo,
DaubechiesFilter[1], 1], 1]],
PlotJoined -> True]
(* Faz o pr-processamento da parte de baixa frequencia da
decomposio em 1 nvel*)
cd[arquivo_]:=ListPlot[Drop[Flatten[WaveletTransform[arquivo,Daubech
iesFilter[1], 1]],
Length[Flatten[WaveletTransform[arquivo, DaubechiesFilter[1],
1]]]/2], PlotJoined -> True]
(* Faz o pr-processamento da parte de alta frequencia da
decomposio em 1 nvel*)
EndPackage[ ]
Obs: O Pacote possui um help prprio. Caso o usurio queira saber o que , por exemplo ca,
basta digitar na linha de comando:
?ca << Shift Enter>>
215
Deve-se carregar o pacote intitulado Ondaletapos no Front End do Mathematica 5.0, que
deve estar salvo em um dos arquivos dos pacotes disponveis no caso, no de estatstica
com o comando:
<< Statistics/Ondaletapos.m
BeginPackage["Ondaletapos`"]
Ondaletapos::usage =
"Ondaletapos faz o ps-processamento de uma sucesso cronolgica em
primeiro nvel dadas as duas subsries, uma de baixa (ca) e outra
de alta (cd) frequencia."
Needs["Wavelets`Wavelets`"];
Ondaletapos[arquivo1_,arquivo2_]:=InverseWaveletTransform[{arquivo1,
arquivo2}, DaubechiesFilter[1]]
for i=1:n
soma=soma+valor(i);
end;
media=soma/n;
aux=0;
for i=1:q
soma5=0;soma6=0;
for j=i:q
for t=(i+j-aux):n
soma5=soma5+(nvalor(t))*(nvalor(t-i))*(nvalor(t-j));
soma6=soma6+(nvalor2(t))*(nvalor2(t-i))*(nvalor2(t-j));
x=(((1/(n))*soma5)/((1/(n))*soma3)^(3/2));
217
y=(((1/(n))*soma6)/((1/(n))*soma3)^(3));
end;
soma5=0;
soma6=0;
hsieh=sqrt(n)*x/y
%if((hsieh<=1.96) & (hsieh>=-1.96))
%disp ('Aceito Ho - nao linearidade na variancia')
%else
%disp ('Reiejto Ho - nao linearidade na media')
%end;
end;
aux=aux+1;
end;
clear
218
dados =Table[x[i]=TimeSeries[ARModel[{0.3},1],1200],{i,1,200}];
ListPlot[x[1],PlotJoined->True]
writeMatrixSpreadSheet[filename_String, data_List] :=
Block[{file = OpenWrite[filename]},
Scan[(WriteString[file,First[#]];
Scan[WriteString[file,"\t",#]&,Rest[#]];
WriteString[file,"\n"]&,data];
Close[file]]
writeMatrixSpreadSheet["serieteste.txt",Transpose[dados]]
erro[0] = 0;
x[0] = 0;
(* inicializao das variveis*)
writeMatrixSpreadSheet[filename_String, data_List] :=
Block[{file = OpenWrite[filename]},
Scan[(WriteString[file,First[#]];
Scan[WriteString[file,"\t",#]&,Rest[#]];
WriteString[file,"\n"]&,data];
Close[file]]
writeMatrixSpreadSheet["serieteste.txt",Transpose[dados]]
u=ca/max(ca);
t=length(u);
for dtau=1:t-1
soma1=0;soma2=0;
for dtau1=1:dtau
soma1=soma1+(u(t)-u(t-dtau1))^3;soma2=soma2+((u(t)-u(t-
dtau1))^2)*(3/2);
end
ft(dtau)= soma1/soma2;
lim_max(dtau) = (1.96/sqrt(t));lim_min(dtau) = -(1.96/sqrt(t));
end
t1=[1:t-1];
subplot(2,1,1)
plot(t1,ft,t1,lim_max,'-',t1,lim_min,'-')
title('CA-ARIMA-GARCH')
clear
u=cd/max(cd);
t=length(u);
for dtau=1:t-1
soma1=0;soma2=0;
for dtau1=1:dtau
soma1=soma1+(u(t)-u(t-dtau1))^3;soma2=soma2+((u(t)-u(t-
dtau1))^2)*(3/2);
end
ft(dtau)= soma1/soma2;
lim_max(dtau) = (1.96/sqrt(t));lim_min(dtau) = -(1.96/sqrt(t));
end
t1=[1:t-1];
subplot(2,1,2)
plot(t1,ft,t1,lim_max,'-',t1,lim_min,'-')
title('CD-ARIMA-GARCH')
221
PROGRAMA 8 Programa para rodar a rede recorrente. De Oliveira (2003).
% APRENDIZAGEM RECORRENTE EM TEMPO REAL (ARTR)
%
% ALGORITMO - ARTR
load c:\bilinear\Inputs.txt
load c:\bilinear\DesiredOutputs.txt
H = 4;InitialState = [0.0 zeros(1,H)];
sigmoid_type = 0;
alpha = 1.0;
learning_rate = 0.005;
epochs = 20000;epsilon = 0.001;Inputs = Inputs(801:1000);
DesiredOutputs = DesiredOutputs(801:1000);
[WeightMatrix] =
artr_treino(Inputs,DesiredOutputs,H,InitialState,sigmoid_type,alpha,
learning_rate,epochs,epsilon);
[Outputs] =
artr_perf(Inputs,InitialState,H,WeightMatrix,sigmoid_type,alpha);
[samples columns] = size(Inputs);
t = (1:samples)';
figure
hold on
plot(t,DesiredOutputs,'b-.');
plot(t,Outputs,'r');
legend('Valor Desejado','Valor Previsto',0)
xlabel('Janela de Previsao')
ylabel('Serie d(t) versus Serie y(t)')
figure
hold on
plot(t, DesiredOutputs - Outputs)
legend('Erro de previsao',0)
xlabel('Janela de Previsao')
ylabel('Erro de previsao, e(t)')
figure
hold on
plot(t, Outputs)
legend('Valores Previstos',0)
xlabel('Janela de Previsao')
ylabel('Valores Previstos, e(t)')
wk1write('c:\bilinear\bilinearrec',Outputs);
figure
hold on
histfit(DesiredOutputs - Outputs)
e = DesiredOutputs - Outputs
perf_mae = mae(e)
% perf2_mse = mse(e)
rmse = sqrt(mse(e))
eq = (DesiredOutputs - Outputs)*(DesiredOutputs - Outputs)'
dq = (DesiredOutputs)*(DesiredOutputs)'
oq = (Outputs)*(Outputs)'
deq = diag(eq)
ddq = diag(dq)
doq = diag(oq)
theil =
(sqrt(sum(diag(eq))/10))/((sqrt(sum(diag(oq))/10))+(sqrt(sum(diag(dq
))/10)))