Tese Fabiano

13
1 O PROBLEMA DE PESQUISA
1.1 INTRODUO
A rea de anlise e previso de sucesses cronolgicas (sries temporais ou crnicas),

hoje campo de pesquisa bem definido dentro dos Mtodos Quantitativos, tem sido uma
das reas-chave em Cincias Sociais Aplicadas.
Dadas as observaes passadas do comportamento de alguns sistemas, pressupondo

ergodicidade, surge a questo de como fazer um intervalo e/ou banda de previses e
identificar ainda o quo preciso esse intervalo pode ser, isto , qual a porcentagem, via
envelopamento, o intervalo conter das sucesses cronolgicas simuladas e/ou reais.
A rea de Finanas, por exemplo, vem, ao longo das ltimas duas dcadas,
modificando-se e se transformando em uma cincia eminentemente quantitativa, em que
so usadas ferramentas como Estatstica, Matemtica e Cincia da Computao para que
o processamento das informaes fornea resultados mais precisos e confiveis,
principalmente ligados aos modelos de previso (ZOU; YANG, 2004).
As condies presentes determinam, em certo grau, o futuro da forma em que pode

haver muitas interaes e complexas relaes entre as variveis envolvidas. Existindo
informao suficiente disponvel sobre o sistema em estudo, ento uma abordagem
matemtica pode ser desejvel, sendo que as equaes construdas modelam os
mecanismos responsveis pela gerao das sries temporais e como o seu
comportamento evolui. No entanto, em muitos problemas reais de interesse, no temos
informaes e/ou condies ideais suficientes para construir equaes que governem o
comportamento das variveis que queremos prever. Na ausncia de informaes
suficientes para gerar as equaes, mais atrativo usar uma abordagem baseada em
modelos (DE VEAUX et al., 1998).
Com o avano da tecnologia e da capacidade de armazenagem e processamento dos

sistemas computacionais, diversos modelos e tcnicas quantitativas de previso tm sido
14
pesquisados, complementando e aprimorando as anlises qualitativas por uma srie de

fatores, incluindo maior preciso (HARDIE; FADER ; WISNIEWSKI, 1998).
Modelos de previso quantitativos utilizam-se basicamente de dados histricos para

detectar padres de comportamento e estim-los no futuro. Esses modelos empregam
um ferramental matemtico e estatstico para representar a realidade para a qual foram
criados. Diversas tcnicas estatsticas tm sido usadas na criao dos modelos, baseadas
em diferentes pressupostos assumidos (WINKLHOFER et al., 1996).
Atualmente, uma nova metodologia para decomposio de sries via ondaletas, visando
anlise de sries temporais, surgiu como uma rea da Matemtica Aplicada em rpido
desenvolvimento e com diversas aplicaes em vrios ramos da cincia e da
Administrao. Ondaletas so funes que consistem em fracionar a srie temporal
original em duas subsries, uma relativa as altas freqncias e a outra s baixas
freqncias (GENAY; SELUK; WHITCHER, 2002).
O uso das ondaletas significativo por melhor detectar o comportamento da srie em

separado (altas e baixas freqncias), visando reduo dos possveis rudos existentes
na srie original.
J crescente o nmero de pesquisas que esto se desenvolvendo com o uso desta nova
metodologia nos indicadores de bolsa de valores, como tratam Tak (1995), Lee (1999) e
Wong et al. (2003). No Brasil, ainda so poucos os trabalhos, como Chiann (1997) e
Homsy, Portugal e Arajo (2000).
Este trabalho visa explorar a melhoria da qualidade das previses com o uso da
decomposio da srie temporal via ondaletas, com o uso dos modelos j tradicionais de
previso, com os modelos j conceituados como a metodologia de Box e Jenkins e redes
neurais, para sucesses cronolgicas lineares e no-lineares simuladas.
15
1.2 PROBLEMA DE INVESTIGAO
Previso, ou em ingls, forecasting, que se refere a ato ou efeito de prever, anteviso,

prescincia...., pode ser definida como uma seqncia de passos que o tomador de
decises realiza, seja implcita ou explicitamente, para antever satisfatoriamente um
valor futuro (LUXHOJ et al., 1996).
Segundo Harrison e Stevens (1976), uma previso adequada deve dar suporte a uma
deciso minimizadora de risco por parte dos agentes tomadores de decises. Para
Shalizi et al. (2002), o futuro sempre desconhecido e, at certo ponto, imprevisvel e
uma previso sempre imperfeita, mas no intil.
Hanke e Reitsch (1995), ao explicarem o porqu de se fazer previso, afirmam que toda
previso uma tentativa de prognosticar o futuro atravs do exame do passado. Consiste
em gerar previses no enviesadas da magnitude de alguma varivel, como um ndice
de Bolsa, com base no conhecimento presente e passado acumulado em bases de dados
e na experincia dos gestores e outros profissionais envolvidos.
Conforme Tsay (2002), as previses variam segundo a sua aplicao em nveis

agregados (como na Economia) ou para um componente especfico (como para uma
campanha individual). Tambm difere quanto ao horizonte de previso curto, mdio
ou longo prazo que so conceitos flexveis, que iro variar conforme a rea de
aplicao.
Inmeros autores j pesquisaram sobre a adoo das previses na rea de Finanas,

utilizando-se de diferentes tcnicas e abordagens. Alguns autores como Keim e
Stambough (1986), Chen (1991), OConnor, Remus e Griggs (1997), Leung, Daouk,
Chen (2000), Bressan e De Lima (2002) pesquisaram a adoo de mtodos de previso
de indicadores financeiros, desde previsibilidade de retornos de preos de aes at
previses de preos aplicados a contratos futuros na BM&F, atravs da modelagem de
sucesses cronolgicas, em que se tm, como varivel de entrada, os valores histricos
da varivel a ser prevista, utilizando abordagens economtricas e redes neurais.
16
Alguns outros autores exploraram mais especificamente a previso de ndices de Bolsa

de Valores. Esses autores, como Kutsurelis (1998), Leung, Daouk e Chen (2000),
utilizaram tcnicas de modelagem de sries temporais, tomando como base os modelos
ARIMA sugeridos por Box e Jenkins (1976), e com uso de redes neurais voltadas para o
ndice S&P 500.
O surgimento da teoria de decomposio via ondaletas, a partir de meados dos anos 80,
que consiste em fracionar a srie temporal original em duas subsries, sendo uma
relativa s altas freqncias e a outra s baixas freqncias, por meio de formas de
ondas especficas, fez com que alguns autores comeassem a incorporar o uso desta
teoria em conjunto com outras tcnicas j convencionais para fins de previso
(GENAY; SELUK; WHITCHER, 2002).
Ario (1995) utilizou as ondaletas para previso de vendas mensais de carros no

mercado espanhol. Tak (1995) fez uso das ondaletas para previso do S&P500, com a
utilizao em conjunto de redes neurais, modelos ARIMA e a metodologia proposta por
Engle (1982), ambas aplicadas as duas subsries derivadas da srie original, sendo que
se fez as devidas previses e aps a reconstruo da srie, novamente com uma
ondaleta chegou-se previso do ndice futuro.
Lee (1999) utilizou ainda a decomposio em diferentes freqncias para estudar a

relao entre as altas freqncias das oscilaes dos retornos dos ndices das bolsas
Dow Jones e KOSPI (Korea Composite Stock Price Index) em que detectou a existncia
de influncias da alta volatilidade do mercado americano, nos preos dos ativos, no
mercado coreano. Wong et al. (2003) tambm realizaram previses com ondaletas em
conjunto com modelos ARIMA, na srie do dlar americano, e identificaram uma
melhora no desempenho das previses quando do uso das ondaletas para fracionar a
srie.
No Brasil, alguns poucos trabalhos, utilizando ondaletas apareceram na literatura como

Chiann (1997), que trabalha com ondaletas na caracterizao estatstica de processos
estacionrios com dados dos componentes espectrais de eletroencefalograma durante o
estado de sono de bebs, cujas mes se abstiveram de bebidas alcolicas durante a
gravidez e bebs cujas mes consumiram (de forma moderada) bebidas alcolicas
17
durante a gravidez aplicada para deteco de alteraes do estado de sono, via

distores nos comportamentos dos escalogramas em escalas altas e baixas.
Em se tratando de aplicaes ao mercado brasileiro, Homsy, Portugal e Arajo (2000)

tambm utilizaram a decomposio das ondaleta para tratar sries temporais de
produo fsica industrial, exportaes brasileiras e volume de pesca na Groelndia.
Utilizou as previses dentro das subsries extradas com modelos ARIMA e chegou
concluso de que a modelagem em separado de subsries de baixas e altas freqncias
contribui positivamente para a qualidade das previses.
No caso especfico de previso no mercado de capitais brasileiro, atravs do ndice da

Bolsa de Valores de So Paulo, o IBOVESPA, alguns autores como Correia (1998),
Morais e Portugal (2000) e Yim (2001) trataram das previses dos retornos do
IBOVESPA, apenas utilizando os modelos tradicionais como ARIMA, os modelos
Estruturais, os modelos ARCH-GARCH propostos por Engle (1982) e de redes neurais,
encontrando melhor desempenho nos modelos ARIMA e de redes neurais.
Muitos algoritmos neurais para processamento temporal tm sido propostos, entre estes
destacam-se o algoritmo de retropropagao atravs do tempo (BPTT, back propagation
through time), aprendizado recorrente em tempo real (RTRL, real-time recurrent
learning ) e os algoritmos de redes recorrentes utilizando o filtro de Kalman.
V-se, ento, uma lacuna na literatura sobre previso existente no mercado brasileiro,
que o estudo conjunto da utilizao dos modelos ARMA-GARCH e de redes neurais,
dentro das subsries decompostas por meio de uma ondaleta especfica e que, aps a
previso feita dentro destas subsries, reconstruda a srie original pela mesma
ondaleta. A exemplo da pesquisa de Tak (1995) e Homsy, Portugal e Arajo (2000), o
presente estudo investiga a decomposio na srie original via uso de formas de
ondaletas especficas e tambm na reconstruo da srie original para obteno da
previso futura.
O diferencial deste trabalho est na realizao das previses dentro das subsries
decompostas por uma ondaleta em at dois nveis, e obtendo-se a previso da srie
original via reconstruo da srie para modelos construdos por processos geradores de
18
dados e tambm, apresentar um organograma lgico para guiar passo a passo, as

previses de sucesses cronolgicas lineares e no-lineares simuladas.
O problema central da investigao deste trabalho pode ser concentrado na seguinte

questo: comparando os mtodos j utilizados de previso de sucesses cronolgicas
com a metodologia das ondaletas, qual se mostra mais preciso na previso por intervalo
de um processo estocstico simulado?
1.3 OBJETIVOS DA PESQUISA
O objetivo geral desta pesquisa o de explorar a possibilidade de usar uma metodologia

capaz de decompor uma srie temporal via ondaletas, conjuntamente com os modelos j
existentes de previso e comparar a qualidade de previses obtidas.
A anlise de ondaletas tem se mostrado, a partir de meados dos anos 80, uma
metodologia de bastante utilidade em vrios campos do conhecimento como Fsica,
Matemtica, e, na presente dcada, em Economia e Administrao, podendo-se
ressaltar, em econometria, sua utilizao como procedimento auxiliar para ajuste e
previso de sries de tempo (GENAY; SELUK; WHITCHER, 2002).
Entre os objetivos especficos, merecem destaque:
i) Propor um mtodo de pr-processamento, identificao,

estimao, diagnstico, validao e previso;
ii) delinear em um fluxograma as etapas de identificao, estimao,
diagnstico, validao e previso de sucesses cronolgicas;
iii) verificar se o pr-processamento de uma sucesso cronolgica
estacionria e ergdica melhora significativamente a previso
esttica realizada por meio de algoritmos de aprendizagem; e
iv) comparar a utilizao das ondaletas, como pr-processamento,
nas previses conjuntamente com os mtodos j presentes na
literatura.
19
v) aplicar o mtodo desenvolvido na tese para a sucesso

cronolgica do IBOVESPA.
1.4 DELINEAMENTO DA TESE
O captulo 1 trata da apresentao do problema de pesquisa, da motivao que levou ao

desenvolvimento do trabalho com seus objetivos gerais e especficos, mostrando o
sentido do uso do pr-processamento em fora conjunta com os modelos tradicionais de
previso de sucesses cronolgicas.
O captulo 2 mostra a fundamentao terica dos modelos de previses. Para tanto, so

discutidos os principais testes de classificao para estabelecer uma ordem no processo
de previso para sucesses cronolgicas lineares e no-lineares simuladas, o que
justifica a necessidade do posicionamento de um fluxograma, em que se mostra o
processo de previso como um todo.
Foram estudados os mais variados modelos de previso, desde os modelos tradicionais

como ARMA at os mais complexos como GARCH e os modelos neurais via
algoritmos de retropropagao e das redes recorrentes, apresentando as simulaes de
processos geradores de dados (DGP).
Diante desses modelos, o captulo desenvolve ainda a anlise de sucesses cronolgicas

via o pr-processamento atravs de ondaletas. De forma original, apresenta a idia
central do trabalho de se fazer as previses dentro das subsries decompostas em alta e
baixa freqncia, buscando uma melhora na qualidade das previses. Tambm, de
forma original, o captulo descreve todo o processo quantitativo de se escrever
corretamente os processos ARIMA-GARCH. Trata ainda, da matemtica das ondaletas
no processo de previso.
O captulo 3 destaca o processo metodolgico empregado na pesquisa, indicando o

fluxograma para os modelos de previso estudados, levando ao processo final de se
verificar, via envelopamento dos dados, a qualidade tanto das previses pontuais como
o estabelecimento de um intervalo de previso para os dados simulados de redes e
20
modelos ARMA-GARCH, ARIMA, bilinear e um movimento browniano e para os

dados do IBOVESPA.
No captulo 4, so apresentados todos os resultados experimentais das simulaes feitas

para alcanar os objetivos da pesquisa.
Finalmente, so traadas as concluses da pesquisa, destacando o comportamento de

cada modelo simulado, analisando e apontando suas principais caractersticas.
21
2 FUNDAMENTAO TERICA
2.1 SUCESSES CRONOLGICAS
Uma srie temporal qualquer conjunto de variveis estocsticas eqiespaadas e
{Xt } = { X 1 , X 2 , , X n } . Em outras palavras, um sinal que

n
ordenadas no tempo
t =1
depende do tempo e medido em pontos particulares no tempo sinnimo de uma srie

temporal (KLEIN, 1997). Conforme Morettin (1987), o que se chama de srie temporal
uma parte de uma trajetria, dentre muitas que poderiam ter sido observadas de um
processo estocstico1.
Segundo Enders (2003), para que uma srie de observaes indexadas

eqiespaadamente no tempo possa ser chamada de sucesso cronolgica precisa ter
pelo menos 50 observaes.
Box, Jenkins e Reinsel (1994) definem srie temporal como um conjunto de

observaes dos resultados de um fenmeno colhido seqencialmente ao longo do
tempo. Observa-se que a definio feita coerente com a de Newbold (1995): uma
srie temporal uma seqncia de valores, ordenados no tempo, de uma varivel de
interesse particular.
Existindo informaes disponveis suficientes sobre o sistema que est em estudo, ento
uma abordagem matemtica pode ser desejvel, sendo que as equaes construdas
modelam os mecanismos responsveis pela gerao das sries temporais e como o seu
comportamento evolui.
Tipicamente, esses processos envolvem a consolidao das experincias histricas em

sistemas matemticos que descrevem o comportamento dos eventos atravs do tempo.
Esta tarefa deve ser realizada da forma mais concisa possvel e pode ser chamada de
construo do modelo. Numa segunda etapa, estes modelos matemticos so utilizados
1
Processos estocsticos so processos cuja evoluo no tempo gerado por leis probabilsticas.
22
para projetar o que provvel que ocorra durante algum curto perodo de tempo. Este
processo chamado de previso, isto , uma extrapolao feita para alm do processo
temporal conhecido. A juno destes dois processos o que se chama de anlise de
sries temporais. A estatstica , ento, utilizada para se estimar os parmetros e testar
estatisticamente estes modelos. Vale ressaltar que, na regresso, so feitas previses
dentro do domnio no qual a sucesso cronolgica foi observada.
Dentre os objetivos das anlises de sucesses cronolgicas, destacam-se: a investigao

do mecanismo gerador da srie; realizao de previses de valores futuros de curtos e
longos prazos; descrio do comportamento da srie, com verificao grfica de
existncias de tendncia, ciclo e variaes sazonais, busca de periodicidade nos dados
(MORETTIN; TOLOI, 2004).
Se os valores futuros de uma srie temporal forem determinados exatamente por alguma
funo matemtica, ento esta srie denominada determinstica. Caso os valores
futuros possam ser descritos apenas em termos de uma distribuio de probabilidade, a
srie temporal chamada de no-determinstica ou estocstico. Um fenmeno
estatstico que envolva leis da probabilidade no tempo chamado de processo
estocstico.
2.1.1 TCNICAS ESTATSTICAS DE PREVISO
Nesta parte do trabalho, feita uma reunio das tcnicas, buscando uma organizao do
que se deseja fazer em relao previso, usando modelos de sucesses cronolgicas
no-lineares simuladas.
Os problemas de previso de sries temporais so, geralmente, abordados sob a

perspectiva dos modelos matemticos gerados. Um modelo uma descrio
probabilstica para uma srie temporal. Os modelos utilizados para descrever sucesses
cronolgicas so processos estocsticos (DINIZ, 1999).
Winklhofer et al. (1996) destacam os fatores que alavancaram os estudos de previses:

23
aumento da complexidade das organizaes e de seu ambiente, destacando o

crescimento do nmero de nichos de mercados e produtos oferecidos;
adoo, pelas organizaes, de procedimentos decisrios mais sistemticos, que
envolvem justificativas explcitas para cada ao tomada. Ter uma idia da
previso de oscilao do risco de um ativo financeiro uma forma de suportar
esses procedimentos; e
desenvolvimento contnuo das tcnicas de previso e suas aplicaes, permitindo
que no s agentes especializados, mas tambm outros tomadores de decises
possam ter acesso s tcnicas mais facilmente.
Observar os dados passados de um fenmeno para tentar antecipar o seu comportamento

futuro constitui a essncia da previso. Existindo um modelo matemtico capaz de
descrever completamente esse fenmeno, diz-se que este fenmeno determinista. Caso
o modelo seja incompleto ou desconhecido, ele no-determinista e as suas variveis
probabilsticas devem ser consideradas na representao, passando a ser chamado de
processo ou modelo estocstico ou aleatrio (DINIZ, 1999).
2.1.2 QUANTO AO HORIZONTE DE TEMPO DAS PREVISES
Em relao ao horizonte de tempo das previses feitas, h pouco consenso entre os

autores, tanto no que se refere ao desempenho das tcnicas quanto s prprias definies
de curto, mdio e longo prazos. Estudos j foram conduzidos para previses com
horizonte de tempo desde um dia (SAKAI et al., 1999) at 25 anos (NAYLOR, 1981).
A previso de uma srie temporal a determinao dos provveis valores que sero
assumidos pela varivel de previso, dentro de um horizonte mximo de tempo. A
previso pode ser classificada como de curto, mdio e longo prazo, dependendo do
valor associado ao horizonte mximo de previso (DINIZ , 1999).
Souza (1989) ressalta que qualquer que seja o horizonte de previso (curto, mdio ou
longo prazo), no existe uma maneira clara de definir o horizonte mximo. Este
24
depender do grau de previsibilidade da srie, que, por sua vez, est associado ao erro
de previso.
Os estudos relacionados ao horizonte de tempo e freqncia das previses confirmam,

no entanto, a proposio de WINKLHOFER et al. (1996), de que as companhias
utilizam o perodo que melhor se adapta aos seus produtos, mercado e mtodo de
operao. No h um perodo ideal para previses.
Em relao s previses feitas para o IBOVESPA, alguns autores como Correia e Perera
(1997) e Morais e Portugal (1999) fizeram previses no curtssimo prazo (um passo
frente).
2.1.3 OS MTODOS DE PREVISO
Segundo Diniz (1999), at o incio da dcada de 70, havia poucas alternativas

metodolgicas para anlise e previses de sries temporais como, por exemplo, os
mtodos de decomposio clssica e os mtodos de caixa-preta (regresso linear
simples e mltipla etc.).
Souza (1989) frisa que foi, a partir dos trabalhos de Box e Jenkins, nos anos 70, que a
rea de previso comeou a despertar grande interesse. Quase que simultaneamente
surge, em 1971, a abordagem bayesiana dos modelos de previso propostos por
Harrison e Stevens (1971). Assim, tanto do lado conhecido, tambm chamado clssico,
como o lado bayesiano, toda a dcada de 70 foi dedicada implementao prtica dos
modelos propostos e as conseqentes melhorias metodolgicas sugeridas pela aplicao
real destes mtodos.
Os mtodos de previso podem ser classificados basicamente em duas grandes famlias,

conforme as tcnicas que utilizam na elaborao da previso: tcnicas qualitativas e
tcnicas quantitativas (ABRAHAM; LETHOLTER, 1983).
25
2.1.3.1 TCNICAS QUALITATIVAS
As tcnicas de previso qualitativas, tambm chamadas de tcnicas subjetivas ou

baseadas em critrios de juzo, so aquelas que utilizam primordialmente a capacidade
humana de estabelecer generalizaes e extrapolaes (WINKLHOFER et al., 1996).
Segundo Pindyck e Rubenfield (1997), essas tcnicas so usadas quando dados
histricos so inexistentes ou escassos, sendo baseadas em opinies de especialistas.
Para os autores, as tcnicas mais difundidas esto associadas pesquisa de mercado, e
incluem a utilizao de grupos focados e tcnicas de consenso.
Em pesquisa feita por Mentzer e Cox (1984) sobre familiaridade com mtodos
qualitativos e quantitativos, 39% dos respondentes usavam tcnicas qualitativas em seus
negcios, contra 61% que afirmavam conhecer pelo menos uma tcnica quantitativa de
previso. Na pesquisa de Sanders e Manrodt (1994), o nmero de pessoas que j
trabalhavam com tcnicas quantitativas subiu para 76%, contra 24% das tcnicas
qualitativas. Em recente pesquisa de Jan (2003), apenas 13,95% dos respondentes
estavam empregando tcnicas qualitativas, 19,69% usavam modelos de causa e efeito
(regresso e modelos economtricos) e 63,08% utilizavam tcnicas quantitativas
(modelos de sries temporais) e 3,28% dos respondentes, utilizavam-se de outros
mtodos.
Jan (2003) comprovou, ainda, que 66,09% dos que usam modelos de sries temporais
so aplicados pelas empresas para previses no mercado financeiro.
Esses nmeros comprovam os estudos de Luxhoj et al. (1996), Zhou (1999),

Subrahmanyan (2000) e Lawrence et al. (2000), sobre a baixa qualidade das previses
feitas por mtodos qualitativos, que acabavam por ocasionar distrbios no planejamento
e nos resultados finais das empresas pesquisadas.
Lawrence et al. (2000) sugerem alguns motivos pelos quais as previses subjetivas,
mesmo sendo realizadas por analistas experientes e com informaes contextuais do
mercado, no possuem bom desempenho:
as informaes contextuais podem no ter valor preditivo;
26
enviesamento e ineficincia na interpretao dos relacionamentos podem

mascarar as informaes contextuais levadas em considerao;
excesso de dados a serem considerados pelos analistas, fazendo com que ignore
ou atribua pesos errados s informaes contextuais recebidas;
perturbaes recentes, na srie temporal, podem ser entendidas pelo analista
como um sinal de tendncia, confundindo a interpretao das informaes
contextuais; e
acurcia no o critrio mais importante nas previses das empresas.
Dada a baixa capacidade preditiva das tcnicas qualitativas, esta pesquisa est focada
em tcnicas quantitativas de previso, e, portanto, apenas apresenta brevemente algumas
das tcnicas qualitativas mais utilizadas, sem detalhar seu funcionamento.
Segundo Armstrong e Brodie (1999), as duas tcnicas qualitativas empregadas mais

utilizadas que so:
mtodo PERT-modificado: que uma tcnica exploratria de dados,
baseada em estimativas otimista, pessimista e realista de acontecimentos
futuros. s estimativas, so associadas probabilidades de acontecimento,
que so posteriormente avaliadas. Fundamenta-se na teoria das decises,
porm simplificado quanto parte estatstica;
tcnica delphi: criada em 1950, na Rand Corporation, uma tcnica de
grupo baseada em questionrios enviados para especialistas que buscam
um consenso de opinies at que se chegue a um resultado final. A
premissa bsica a de que o julgamento coletivo, organizado
adequadamente, superior a opinies individuais.
2.1.3.2 TCNICAS QUANTITATIVAS
As tcnicas de previso quantitativas so aquelas que usam dados histricos para

calcular matematicamente extrapolaes dos dados no futuro (MAKRIDAKIS et al.,
1983). Para os autores, o uso das tcnicas quantitativas podem ser aplicadas quando:
informao sobre o passado esteja disponvel;
27
esta informao possa ser quantificada em termos matemticos; e

seja possvel assumir que alguns aspectos do padro verificado no passado
continuaro no futuro. Esta colocao tambm chamada de pressuposto da
continuidade.
Segundo Winklhofer et al. (1996), existem duas grandes famlias de tcnicas

quantitativas: a anlise de sries temporais e os modelos causais e os modelos
estruturais. Os autores citam, ainda, que os modelos causais assumem um
relacionamento de causa e efeito entre as entradas e as sadas do sistema. O sistema
pode ser visto como a economia nacional, o mercado de uma empresa, e assim por
diante.
Essa definio coerente com a encontrada em Pindyck e Rubinfeld (1998), em que

estes autores frisam que as tcnicas de previso causais buscam descrever
matematicamente as relaes de causa e efeito entre a varivel que est sendo medida e
seus valores constituintes. Como exemplos de modelos causais, os autores citam os
modelos de regresso.
Para Yim (2001), os modelos estruturais propostos por Harvey (1989) so aqueles que
pressupem que uma srie de tempo resulta da combinao dos seguintes componentes:
tendncia, cclica, sazonal e irregular.
A previso com uso de sries temporais trata o sistema como uma caixa preta, sem
tentar descobrir os fatores que causam os comportamentos observados (WINKLHOFER
et al.,1996).
Segundo Makridakis et al. (1983), existem duas razes bsicas para tratar um sistema
como uma caixa preta:
1. o sistema no pode ser compreendido, ou mesmo que possa, difcil
medir o relacionamento entre as variveis que governam seu
comportamento; e
2. a preocupao pode ser simplesmente prever, com algum grau de
preciso, o que vai acontecer ou no.
28
A anlise de sries temporais o processo de avaliar os relacionamentos histricos entre

uma varivel e o tempo. O propsito bsico identificar comportamentos peridicos e
utiliz-los para prever sries futuras (CAMPBELL; LO; MACKINLAY, 1997).
Os resultados de Bidarkota (1998), entretanto, mostram que h uma associao positiva

entre a importncia dos mtodos de previso e a sua acurcia. Isto significa que quanto
maior for a acurcia do modelo, maior a importncia percebida dele.
Aps a gerao de um modelo de previso, deve-se verificar se ele representa, ou no,

corretamente os dados conhecidos atravs de medidas estatsticas convenientes para
estabelecer a eficincia do modelo.
2.1.3.3 ANLISE DA QUALIDADE DA PREVISO PONTUAL REALIZADA

PELO MTODO
Para Makridakis et al. (1983), a acurcia (previso em termos pontuais) vista como o
critrio primordial na anlise para seleo do melhor modelo de previso. A palavra
acurcia refere-se a o quo bem ajustado o modelo, isto , quanto o modelo
capaz de reproduzir os dados j conhecidos.
Dentre as diversas ferramentas possveis para analisar a eficincia de um modelo, citam-

se, a seguir, as principais medidas de desempenho, admitindo o uso de sentenas
matemticas (MAKRIDAKIS et al., 1983).
Adotando a abordagem sugerida por Enders(2003), primeiramente considere um modelo

de previso, a partir de um AR(1), como X t = 0 + 1 X t 1 + t , sendo que t um rudo
branco. Prevendo um passo frente atravs da filtragem I t = { X t , X t 1 ,...} , obtm-se:
Et [ X t +1 ] = 0 + 1 X t (2.1)
29
sendo que Et [ X t +1 ] a esperana condicionada de X t +1 , dada a informao at perodo
t(inclusive), sendo o estimador timo pelo critrio do erro quadrtico mdio

condicionado.
Formalmente, Et X t + j = E X t + j | X t , X t 1 , , sendo I t o conjunto informacional
dado por I t = { X t , X t 1, ...} . Segundo Enders (2003), pode-se definir o erro de previso j
passos frente, a partir de t - et ( j ) como sendo a diferena entre a varivel aleatria
X t + j e o previsor condicionado:
et ( j ) X t + j Et X t + j (2.2)
Assim, o erro da previso um passo frente : et (1) X t +1 Et [ X t +1 ] = t +1 , isto , a
parte no prevista da poro X t +1 , dada a informao contempornea avaliada no
perodo t e o previsor de X t dado o conjunto informacional I t 1 ficando:
t = et 1 (1) = X t Et 1 [ X t ] (2.3)
E ainda, para encontrar o erro de previso para dois passos frente, tem-se:
et (2) X t + 2 Et [ X t + 2 ] (2.4)
sendo que X t + 2 = 0 + 1 X t +1 + t + 2 e
Et [ X t + 2 ] = 0 + 1 Et [ X t +1 ] (2.5)
que representa a natureza do modelo ARMA.
Assim:
et (2) X t + 2 Et [ X t + 2 ] = et (2) = 0 + 1 X t +1 + t + 2 0 1 Et [ X t +1 ]
30
et (2) = 1 ( X t +1 Et [ X t +1 ]) + t + 2
et (2) = 1 t +1 + t + 2 . (2.6)
Generalizando:
et ( j ) = t + j + 1 t + j 1 + 12 t + j 2 + + 1j 1 t +1 (2.7)
Como se tem uma srie temporal com n perodos de tempo, logo ter-se-o n termos de
erro, e ento se pode calcular:
Erro Percentual Absoluto Mdio (Mean Absolute Percentage Error)

(MAPE): um valor absoluto mdio em percentual, para se verificar a
margem de acerto em comparao com o valor previsto. mais
adequado para comparao entre modelos. Quanto menor for o seu valor,
melhor o ajuste do modelo.
h
i (2.8)
Xi =1
MAPEh = i
100 % MAPE 0
h
r : Coeficiente de Correlao linear de Pearson. O coeficiente de

correlao linear r mede o grau de relacionamento linear entre os valores
emparelhados x e y em uma amostra. O coeficiente de correlao linear
chamado, s vezes, coeficiente de correlao momento-produto de
Pearson. Varia entre 1 e 1, sendo estes extremos indicao de
associao linear negativa e positiva perfeita, respectivamente.
h (2.9)
(X i X )( X i X )
rh = i =1
[ 1;1]
S X S X
em que X a esperana condicionada de X t +1 dada a informao at perodo t
(inclusive).
31
Quadro 1 : Valor do coeficientes de correlao e sua interpretao

rh Interpretao
+ 1,00 positiva perfeita
+ 0,70 a 0,99 positiva muito forte
+ 0,50 a 0,69 positiva substancial
+ 0,30 a 0,49 positiva moderada
+ 0,10 a 0,29 positiva baixa
+ 0,01 a 0,09 positiva nfima
0,00 Nenhuma
- 0,01 a 0,09 negativa nfima
- 0,10 a 0,29 negativa baixa
- 0,30 a 0,49 negativa moderada
- 0,50 a 0,69 negativa substancial
- 0,70 a 0,99 negativa muito forte
- 1,00 negativa perfeita
Fonte: Newbold (1995)
TIC Coeficiente de Desigualdade de Theil (Theil Inequality

Coefficient): Este coeficiente sempre estar entre zero e um, sendo que
zero indica um ajuste perfeito.
i
2
TICh = i =1
[ 0,1]
h h
X X
(2.10)
i
2
+ i
2
i =1 i =1
Outras medidas de acurcia das previses pontuais ainda podem ser definidas, apesar de
no serem to comuns na prtica. A escolha do critrio a ser utilizado para medir a
acurcia dos modelos no arbitrria e deve ser feita baseada nas caractersticas do
problema e das medidas citadas (HARDIE; FADER; WISNIEWSKI, 1998).
No caso das sucesses cronolgicas, diversos autores como Toloi (1980), Winklofer,
Witt e Diamatopoulos (1996), Diniz (1999) e Yim (2001), utilizaram o RMSE (raz do
32
erro quadrtico mdio) e o MAPE, indicando preferencialmente este ltimo por ser
computado por medidas absolutas (e no quadradas) e em porcentagem do valor
previsto.
Neste trabalho, usado MAPE e correlao de Pearson, conforme sugere Qi (1999) e

TIC, conforme Tak (1995).
2.2 ANLISE DE SUCESSES CRONOLGICAS
O propsito de descrever um esquema para anlise de sucesses cronolgicas explicar

como uma seqncia de testes estatsticos podem ser aplicados para identificar quais
tipos de modelos de sucesses cronolgicas univariadas podem ser construdos e
aplicados.
O primeiro passo requer testar a estacionariedade do processo. O segundo envolve o

teste para normalidade, para prever o tipo de dependncia do processo estacionrio. No
terceiro passo, deve-se determinar se a mesma srie , de fato, estatisticamente
independente. Se a hiptese nula de independncia rejeitada, isto implica aceitao da
hiptese alternativa da existncia de dependncia linear ou dependncia no-linear. O
teste para estas hipteses ocorre no quarto passo.
Se a srie temporal apresentar dependncia linear, ento se deve especificar os modelos

lineares para ajustes com filtro linear ou ARMA. Alternativamente, caso ocorra
dependncia no-linear, utilizar os modelos especficos para dados no-lineares.
A especificao de modelos no-lineares inicia-se no quinto passo, nos quais modelos

no-lineares aditivos ou multiplicativos devem ser construdos. Por exemplo, no caso da
existncia de no-linearidade na esperana condicionada, podem ser usados os modelos
bilinear, TAR (threshold autoregressive) ou exponenciais. Alternativamente, se a no-
linearidade ocorrer na varincia pode ser usados os modelos da famlia GARCH.
O prximo passo a anlise da qualidade das previses e encerra-se com a validao

dos modelos.
33
2.2.1 FLUXOGRAMA PARA ANLISE DE SUCESSES CRONOLGICAS
A seguir, apresenta-se um fluxograma, seguido para a anlise de sucesses cronolgicas

unidimensionais lineares e no-lineares simuladas. Trata-se de uma metodologia de
anlise e previso a ser adotada para modelos de sucesses cronolgicas.
DGP Simulado ou
sucesso
cronolgica real
Pr-Processamento
Teste Estacionariedade
- Teste de D.Pantulla
Teste Independncia
- Teste de BDS (sobre a srie bruta ou
pr-processada)
Independncia Dependncia
Teste Normalidade Teste de Linearidade

- Teste de JB - Teste de McLeod-Li
- Teste ARCH-LM
Se no Normal Se Normal
Teoria do Passeio Modelo

Caos Aleatrio Modelo No Linear - Teste de Hsieh
Linear Mdia Varincia Total
ARIMA
Bilineares GARCH Redes Neurais
Retroprop.
Recorrentes
Ps-Processamento
Teste Independncia
- Teste de BDS (sobre os resduos)
Teste Normalidade
- Teste de JB
No Normal Normal
Identificar distribuio
Anlise da Qualidade da Previso Pontual Anlise da Qualidade da Previso Esttica

(TIC, MAPE, e r ) por intervalo atravs do envelopamento
Comparao da Acurcia entre os modelos
Figura 1: Fluxograma proposto para anlise de sucesses cronolgicas

34
A integrao entre as ondaletas e a sucesso cronolgica prevista, est no fato de que,

uma vez realizadas as previses nas sub-divises obtidas na etapa de pr-
processamento, a transformada inversa da ondaleta na etapa de ps-processamento, que
ir trazer de volta a sucesso no nvel, isto , a sucesso original, far com que
transforme tambm os valores j previstos, em valores previstos no nvel.
2.2.2 ESTACIONARIEDADE DE SUCESSES CRONOLGICAS
Os mtodos usados em sries temporais baseiam-se fortemente nos conceitos de

estacionariedade, de filtro linear, ergodicidade e independncia. Assim, a maioria dos
modelos considerados so lineares estacionrios fracos, como modelos autoregressivos
(AR), de mdias mveis (MA) e mistos (ARMA). Em Finanas, existem modelos no-
estacionrios e no-lineares. Para se descrever sries no estacionrias com
comportamento no explosivo, usam-se modelos autoregressivos integrados de mdias
mveis - ARIMA (MORETTIN e TOLOI, 2004).
Dizer que uma srie temporal estacionria, dizer que ela se desenvolve no tempo
aleatoriamente ao redor de uma mdia constante (reverso mdia), refletindo
alguma forma de equilbrio dinmico estvel.
[...] um processo estocstico estacionrio se suas mdia e varincia forem

constantes ao longo do tempo e o valor da covarincia entre dois perodos de
tempo depender apenas da distncia ou defasagem entre os dois perodos, e
no do perodo de tempo efetivo em que a covarincia calculada (ENDERS,
2003).
Para Enders (2003), pode-se ter ainda:

estacionariedade estrita: uma srie temporal dita estritamente
estacionria se a distribuio conjunta de qualquer conjunto de n
variveis estocsticas X (t1 ),..., X (tn ) a mesma que a distribuio
conjunta de X (t1 + k ),..., X (tn + k ) para todos n e k.

35
estacionariedade fraca: uma srie temporal chamada fracamente

estacionria se sua esperana constante e sua funo de autocovarincia
depender apenas da defasagem, isto : E [ X (t )] = , V [ X (t ) ] = 2 e
C X (t ), X (t + k ) = ( k ) se t t + k .
2.2.2.1 TESTES DE ESTACIONARIEDADE
Box e Pierce (1970, apud MORETTIN, 2002) sugerem um teste para detectar as
autocorrelaes dos resduos, que, apesar de no detectar quebras especficas no
comportamento de rudo branco, pode indicar se esses valores so muito altos. Um
aperfeioamento deste teste foi feito por Ljung e Box (1978), baseados na funo de
autocorrelao (FAC). A FAC, no lag k, indicada por k , definida como:
n
(X t X )( X t + k X )
(2.11)
k = t =1
n
(X
t =1
t X )2
que nada mais do que a covarincia do ativo na defasagem k, dividido pela varincia
do ativo. Como, tanto a covarincia como a varincia apresentam as mesmas unidades,
k no tem unidade. Oscila entre 1 e 1 e o grfico feito colocando k contra k
chamado de correlograma amostral da FAC. Na prtica, geralmente, somente se trabalha

com uma trajetria da srie temporal (ergodicidade), pode-se calcular apenas a funo
de autocorrelao amostral passando a ser denotado por k .
Para realizao do teste, tem-se a seguinte hiptese nula:

H 0 : todos os k = 0
H1 : pelo menos um dos valores de k 0.
A estatstica teste :
m
k2 (2.12)
LB = n(n + 2) ~ m
k =1 n k
2
36
que segue uma distribuio qui-quadrado com m graus de liberdade ( m2 ), sendo que k
o tamanho da defasagem e m a defasagem mxima considerada.
A deciso do teste baseia-se no valor da estatstica teste, isto , se o valor de LB for

superior ao valor tabelado para dado nvel de significncia, deve-se rejeitar H 0 e
pelo menos alguns dos k devem ser diferentes de zero.
Enders (2003) afirma que a anlise da FAC amostral requer o conhecimento da

distribuio de k , e que para k = 0 para k 0 , a varincia de k
aproximadamente igual a 1 , sendo que n o tamanho da amostra. Para n

n
suficientemente grande, tem-se uma distribuio normal para o estimador k .
Bartlett (1946) obteve o seguinte resultado para a varincia de k quando k = 0 para
k > q:
( )
1 (2.13)
V ( k ) = 1 + 2 12 + + 2 q2
n
para k = q + 1, q + 2, .
De posse da distribuio assinttica de k , pode-se construir um intervalo de confiana
e visualmente observar o grfico da FAC e observar os valores que so significativos

(isto , fora do intervalo de confiana), para um dado nvel de significncia.
Vandaele (1983) sugere uma regra prtica: se para k maior do que cinco, o valor do
coeficiente de autocorrelao ainda for maior que 0,7, em mdulo, a srie deve ser
considerada no-estacionria. Da calcula-se a primeira diferena e aplica-se a regra at
que se obtenha uma srie estacionria.
2.2.2.2 FUNES DE AUTOCORRELAO
Box, Jenkins e Reinsel (1994) propuseram a utilizao de outro instrumento para

facilitar a identificao da estacionariedade de sries temporais que a funo de
37
autocorrelao parcial (FACP), obtida pelas estimaes do valor kk como uma funo
de k
M k* (2.14)
kk =
Mk
sendo que M k a matriz de autocorrelaes para a defasagem k e M k* a matriz M k
com a ltima coluna substituda pelo vetor de autocorrelaes (MORETTIN, 2002).
A funo de autocorrelao parcial (FACP) mede a correlao entre os termos X t e
X t k depois de eliminada a influncia dos elementos intermedirios, ao passo que a
funo de autocorrelao (FAC) calcula a correlao apenas entre X t e X t k .
O quadro2 apresenta, de forma resumida, o comportamento das FAC e FACP e as

caractersticas dos respectivos modelos.
Quadro 2: Descrio do comportamento das funes FAC e FACP.

Processo FAC FACP
AR(p) decai, de acordo com apresenta um corte em p,
exponenciais e/ou senides sendo que o valor kk 0
amortecidas, infinita em para os valores de k p e
extenso
sendo kk = 0 para k > p
MA(q) finita, no sentido de que decai, de acordo com

ela apresenta um exponenciais e/ou senides
truncamento (corte) na amortecidas, infinita em
defasagem q extenso
ARMA(p,q) infinita em extenso, decai, decai, de acordo com
de acordo com exponenciais exponenciais e/ou senides
e/ou senoidais amortecidas amortecidas, infinita em
aps a defasagem q p extenso
Fonte: MORETTIN, 2002
38
A identificao de modelos ARIMA no uma tarefa muito fcil de ser executada,

porque podem ser encontrados diversos modelos candidatos para representar a srie
quando se observa as FAC e FACP. comum aparecer certo grau de incerteza na
observao, de onde a funo realmente truncada (cortada), ou mesmo verificar se h
um decaimento considervel na srie.
Empiricamente, pode-se dizer atravs da anlise do grfico da FAC que a srie temporal
ser no estacionria se o correlograma apresentar uma queda demorada, e ainda,
podendo ser regular e contnua, o que d indcios de no apresentar sazonalidade. Caso
essa queda demorada seja descontnua com picos irregulares por um perodo ou padro
cclico, indicativo de presena de sazonalidade.
Enders (2003) afirma que se pode utilizar os critrios AIC (Akaikes Information
Criteria), proposto por AKAIKE (1973, 1974) e BIC (Bayesian Information Criteria)
proposto por GEWEKE e MEESE (1981), apud Cromwell, Labys e Terraza (1994).
Esses processos so baseados na estimao da varincia do t , no tamanho da amostra h
e nos valores de p e q. Calculam-se, ento, as estatsticas:

2( p + q) (2.15)
AIC = ln 2t +
h
( )
BIC = n ln 2t (n p q ) ln 1

p+q
+
n
2
1 x
(2.16)

+ ( p + q ) ln(n) + ( p + q ) ln ( p + q ) 1
2
t
sendo que 2t = E ( t2 ) e 2t a mxima verossimilhana estimada para os resduos.
Escolhe-se aquela especificao que apresentar o menor valor para AIC ou BIC. Os
autores recomendam ainda que os critrios AIC e BIC sejam considerados apenas como
procedimentos complementares e no alternativos, as FAC e FACP.
2.2.2.3 TESTE DE RAIZ UNITRIA TESTE DE DICKEY-PANTULA
Tambm conhecido como teste de Dickey-Pantula, sendo que no se sabe se a sucesso

cronolgica possui mais de uma raiz unitria, pois o nmero de termos de diferenas
39
defasadas , muitas vezes, determinado empiricamente. Segundo Cromwell, Labys e

Terraza (1994), a idia incluir termos suficientes, de modo que o termo do erro seja
serialmente independente. As hipteses ficam ento, por exemplo, para testar a presena
de trs razes:
Hipteses Testadas
H 0 : 3RU
H1 : 2 RU
H 0 : 2 RU
H1 :1RU
H 0 :1RU
H1 : 0 RU
A estatstica do teste ADF tem a mesma distribuio assinttica que a estatstica de DF,
de modo que podem ser usados os mesmos valores crticos, conforme a Tabela 1 do
Apndice A.
2.2.3 TESTE DE NORMALIDADE TESTE DE JARQUE-BERA (JB)
O conceito de distribuio normal usado, neste trabalho, em combinao com o

conceito de independncia para prover mtodos para especificar os modelos a serem
construdos para as sucesses cronolgicas. Se a srie passar pelo conceito de
estacionariedade e pelo teste de normalidade, ento possvel especificar um modelo
linear que descreva o comportamento da sucesso cronolgica (CROMWELL; LABYS
e TERRAZA, 1994).
O teste mais comum aplicado para verificar a normalidade o teste de Jarque e Bera
(1987), que um teste assinttico, isto , para grandes amostras. A estatstica de clculo
:
A 2 (C 3) 2
JB = n + (2.17)
6 24
40
sendo que n o tamanho da serie, A o coeficiente de assimetria dado por

1 n 1 n
3 (X
A = ( X t X )3 e C representa a curtose dado por C = X )4 .
n t =1 n 4
t
t =1
As hipteses a serem testadas ficam:
H 0 : X t tem anlise de assimetria estatisticamente nula e excesso de curtose zero
H1 : X t no tem anlise de assimetria estatisticamente nula e excesso de curtose
zero
A hiptese nula H 0 : a srie normal, tem distribuio qui-quadrado com dois graus
de liberdade ( 2 (2) ). Para uma distribuio normal, o valor da assimetria zero e a
curtose 3. O valor ( C -3) chamado de excesso de curtose.
Assim, para testar a normalidade de uma sucesso cronolgica, basta estimar os valores
de A e C , calcular a estatstica JB e comparar com o valor tabelado dado um nvel de
significncia previamente adequado. Outra forma analisar o nvel de significncia
adotado do teste, sendo que se o p-valor for suficientemente baixo, rejeita-se
H 0 ,caso contrrio se o p-valor for razoavelmente alto, no se rejeita H 0 , ou seja,
nada se pode concluir acerca da normalidade da srie.
2.2.4 TESTE BDS TESTE DE BROCH-DECHERT-SCHEINKMAN
Segundo Cromwell, Labys e Terraza (1994), a independncia estatstica requer que uma
distribuio de probabilidade de uma sucesso cronolgica, para um conjunto de
variveis aleatrias, possa ser escrita como um produto das distribuies marginais para
cada uma das variveis aleatrias. Por exemplo, f ( x1 , x2 ) = f ( x1 ) f ( x2 ) . Na prtica, o
caso da independncia examinado atravs dos momentos da distribuio, ou seja, se

t = 2, por exemplo, o valor esperado de duas variveis aleatrias o produto dos valores
esperados de cada uma delas, e ento, as duas variveis so parcialmente independentes
e tambm no correlacionadas no caso onde X t tem varincia finita.
41
O teste para independncia pode ser aplicado para testar se a sucesso cronolgica
apresenta independncia estatstica, pois, se for, esto o processo estatisticamente um
rudo branco independente, que ser definido a seguir.
Broch, Dechert e Scheinkman (1987) desenvolveram um mtodo alternativo melhor

adaptado s sucesses cronolgicas econmico-financeiras. Inicialmente organiza-se os
{ X t }t =1 = { X t n+1 , , X t } ,
n
dados em vetores n-dimensionais como sendo que o
parmetro n chamado dimenso de imerso. Por questo de simplificao de notao,

neste estudo, T ser o tamanho total da amostra. A estatstica do teste BDS baseada na
integral de correlao entre dois vetores de sucesses cronolgicas, definidas atravs
das seguintes quantidades:
Cn (k ) lim Cn ,T (k ) (2.18)
T
T T
k st
Cn ,T (k ) s =1 t = s
(2.19)
T (T 1) / 2
1, se max X s i X t 1 < k
k st = (2.20)
0, caso contrrio
sendo que o tamanho da sucesso cronolgica e ento:
Cn (k ) = C1n (k ) (2.21)
Para entender melhor este resultado, a razo:
Cn +1 (k )
= Pr max X s i X t 1 < k max X s i X t 1 < k = Pr X s X t < k max X s i X t 1 < k
Cn ( k ) i = 0,1,, n i =1,, n i =1,, n
pode ser interpretada como uma probabilidade condicionada. Fixando
Cn +1 (k ) / Cn (k ) = C1 (k ) para todo n positivo, obtm-se a equao (2.21).
Os autores propuseram a seguinte estatstica para o teste BDS:

42
Cn ,T (k ) C1,nT (k )
J n ,T (k ) = T (2.22)
n ,T (k )
sendo que:
1
n 1 2
n ,T (k ) = 4 wn + 2 wn j c 2 j + (n 1) 2 c 2 n n 2 wc 2 n 2 em que

j =1
c = C1, n (k )
6 n n n (2.23)
w= hk ( X t , X s , X r )
n(n 1)(n 2) t =1 s =t +1 r = s +1
1
hk (i, j , k ) = ki , j k j , w + ki , w k w, j + k j ,i ki , w (2.24)
3
e ainda Cn ,T (k ) e C1,T (k ) so as integrais de correlao amostral definidas em (2.21) e
n ,T (k ) o estimador do desvio-padro assinttico de Cn ,T (k ) C n (k ) . 1,T
As hipteses do teste BDS so:

H 0 :o processo X t estocasticamente independente
H1 : o processo X t estocasticamente dependente
A estatstica do teste BDS definida em (2.22) assintoticamente uma normal

padro (N(0,1)) usando um teste bicaudal e a hiptese nula a de independncia
identicamente distribuda rejeitada ao nvel de significncia de 5% se
J n ,T (k ) > 1,96 .
Entretanto, nos resultados dos testes subseqentes, que ficar claro que a rejeio da
hiptese de que as variveis aleatrias que compem uma sucesso cronolgica
apresentam distribuio independente e est mais fortemente associada existncia de
dependncia linear ou no-linear nas sucesses cronolgicas simuladas.
43
Vale lembrar que foi atravs das pesquisas em torno da Teoria do Caos determinstica
que se agregaram procedimentos teis para tratamento da no-linearidade,
especialmente no teste BDS para verificao de no-linearidade em sucesses
cronolgicas (CORREA; PEREIRA, 1997).
2.2.5 TESTES DE DEPENDNCIA LINEAR E NO-LINEAR
Na anlise de sucesses cronolgicas, antes mesmo de se comear a procurar

uma especificao geral, para encontrar os devidos modelos que se ajustem ao seu
conjunto particular de dados, importante testar a presena de no-linearidade. Um dos
testes mais conhecidos o de McLeod-Li, o qual visa determinar se existem correlaes
significantes nos resduos quadrados de uma equao linear.
2.2.5.1 TESTE DE MCLEOD-LI
O teste baseado na autocorrelao amostral dos quadrados dos resduos de uma

sucesso cronolgica estacionria gaussiana. Para realizar o teste, deve-se estimar a
srie, estimando o melhor modelo de ajuste linear e chamar os resduos de t .
A hiptese a ser testada :

H 0 : X t2 independente, isto , a sucesso cronolgica linear
H1 : X t2 dependente, isto , a sucesso cronolgica no-linear
Considerando ento ( X 1 , X 2 , , X n ) os resduos ajustados de um modelo ARMA e
denotando X 2 o coeficiente de correlao entre os resduos X t2 e X t2i dado por:

t
nk
(X
j =1
2
j 2 )( X 2j + k 2 )
X (k ) =
2 n
(2.25)
(X
j =1
2
j )
2 2
44
X
j =1
2
j
em que 2 = .
n
A hiptese nula de as primeiras k autocorrelaes do quadrado dos retornos serem

simultaneamente zero, pode ser testada, utilizando a estatstica de Ljung-Box (LB). A
rejeio da hiptese nula indica a existncia de dependncia no-linear, que pode
ocorrer na mdia ou na varincia. A estatstica LB tem um distribuio 2 assinttica
{ }
n
com n graus de liberdade se a seqncia X t2 no correlacionada.
t =1
2.2.5.2 TESTE PARA VERIFICAR A PRESENA DE

HETEROCEDASTICIDADE CONDICIONADA
Para verificar se a sucesso cronolgica apresenta heterocedasticidade condicionada,

pode-se aplicar os seguintes testes:
1) Teste de Box-Ljung (LB) para a srie X t2
2) Teste dos Multiplicadores de Lagrange (LM), onde a hiptese nula H 0 : i = 0
para todo i = 1, , r na regresso X t2 = 0 + 1 X t21 + + r X t2 r para
t = r + 1, , n . A estatstica de teste
S = nR 2 (2.26)
que segue uma distribuio assinttica 2 (r ) com r graus de liberdade em que n o
tamanho da amostra e R 2 o quadrado do coeficiente de correlao mltipla da

regresso acima (MORETTIN, 2002).
O teste verifica a existncia de correlao dos resduos quadrados. As hipteses so:
H 0 : no existe efeitos ARCH no modelo
H1 : existe efeitos ARCH no modelo
A hiptese nula indica a no necessidade de um modelo com no-linearidade na

varincia condicionada para os dados. A estatstica de teste ARCH-LM calculada, a
partir do teste auxiliar de uma regresso como descrito anteriomente que indica a
45
hiptese nula de que existe linearidade na varincia condicionada, isto , a varincia

condicionada poderia ser escrita como combinao linear dos t2 na forma
q

t2 = 0 + t t2 s + t , sendo {t } um processo de rudo branco.
s =1
2.2.5.3 TESTE PARA DETECTAR NO-LINEARIDADE NA ESPERANA OU

NA VARINCIA CONDICIONADA: TESTE DE HSIEH
Uma vez estabelecido que existe algum tipo de no-linearidade em uma sucesso
cronolgica, preciso filtrar o tipo de no-linearidade existente. Hsieh (1989) props
um teste para detectar os dois tipos diferentes de no-linearidade: aditiva (no-
linearidade na mdia) ou multiplicativa (no-linearidade na varincia).
A dependncia multiplicativa implica que a esperana condicionada dos resduos dadas

as defasagens anteriores da varivel X t e X t 1 zero:
E[ X t X t 1 , , X t k ] = 0 .
A dependncia aditiva implica que a mesma esperana condicionada seja diferente de

zero:
E[ X t X t 1 , , X t k ] 0
As hipteses do teste de Hsieh so:
H 0 : X t no-linear na varincia condicionada
H1 : X t no-linear na esperana condicionada
A estatstica do teste de Hsieh para a hiptese nula :

1
X t X t i X t j
(i, j ) = t
n
3
(2.27)
1
n X t
2
2
sendo i, j > 0 representam as defasagens do processo { X t } .

46
O teste segue assintoticamente uma distribuio normal padro N(0,1), sendo que, por
exemplo, o valor (i, j ) < 1,96 com 95% de confiana no se rejeita a hiptese nula de
no-linearidade na varincia condicionada.
2.2.6 MODELOS LINEARES METODOLOGIA DE BOX-JENKINS
A anlise de sucesses cronolgicas, segundo enfoque de Box, Jenkins e Reinsel

(1994), tem por objetivo principal a realizao de previses. Essa metodologia permite
que valores futuros de uma srie possam ser previstos com base apenas em seus valores
presentes e passados. O feitio deste processo se d pela explorao da correlao
temporal que existe, geralmente, entre os valores exibidos pela srie. Por envolverem
apenas uma srie de tempo, so classificados como modelos paramtricos lineares
univariados (MORETTIN, 2002).
Para Enders (2003), a relao temporal desenvolvida por Box-Jenkins representada

formalmente por um conjunto de processos estocsticos genericamente denominados
modelos ARMA.
Muitas das idias hoje conhecidas nos modelos ARIMA foram desenvolvidas, nos anos
70, por George Box e Gwilym Jenkins2 e por estas razes os modelos ARIMA so
chamados de modelagem ou metodologia Box-Jenkins. Vale lembrar que uma srie de
tempo pode conter os trs filtros ou apenas um subconjunto destes, resultando a em
vrias alternativas de construo dos modelos passveis de anlise pela metodologia de
Box e Jenkins (1976).
Os modelos de esperanas condicionadas (Autoregressive Moving Average ARMA3)

fazem parte de uma classe genrica de mtodos capazes de gerar modelos, atravs da
2
Para mais detalhes vide BOX, JENKINS e REINSEL, 1994.
3
H uma certa confuso ocasionada pela nomenclatura dada para ARIMA. Existem duas ambigidades:
1) O termo Integrated, representado pela letra I no nome da tcnica, refere-se ao processo de diferena
fintia, a srie pelo fato dela no ser estacionria, e no pela inteno de integrar a srie; 2) o termo
moving average mdias mveis tem neste mtodo um significado diferente daquele usado nos
47
combinao de trs tcnicas matemtico-estatsticas, tambm chamados filtros4:

modelos autoregressivos, mdias mveis e diferenciao (MAKRIDAKIS et al., 1983).
Para Enders (2003), um modelo ARIMA pode ter qualquer componente, ou ambos os
componentes sazonais e no sazonais. Existem diferentes tipos de modelos ARIMA e a
forma geral para se descrever um modelo de esperana condicionada o SARIMA (p, d,
q):(P, D, Q)S onde, ao primeiro parnteses, cabe a parte no sazonal e o segundo a parte
sazonal do modelo que pode ser aditivo ou multiplicativa. No caso dos modelos com a
parte sazonal, estes costumam ser encontrados na literatura com o nome de SARIMA,
sendo que o S representa periodicidade sazonal. E ainda:
p se refere ordem do processo AR auto-regressivo, no sazonal, incorporado
no modelo ARIMA, e P se refere ordem do processo AR sazonal;
d se refere ordem de integrao ou diferenciao da parte no sazonal e D a
parte sazonal da integrao ou diferenciao;
q se refere ordem do processo de mdias mveis, no sazonal, incorporado no
modelo e Q a ordem da parte sazonal de mdias mveis.
A construo dos modelos estocsticos discretos para sries temporais feita via rudo
branco. A seqncia { t }t =1 dita ser um rudo branco se cada valor da seqncia tiver
n
esperana nula, varincia constante e forem serialmente no correlacionados

(HAMILTON, 1994).
Formalmente, pode-se definir, segundo Hamilton (1994), rudo branco (RB) como uma
srie de erros estocsticos { t }t =1 se:

n
(i) A esperana dos erros nula:
{E [ ] = 0}
n
t t =1
(2.28)
(ii) Os erros entre instantes de tempo distintos so no correlacionados e
todas as suas varincias so iguais (homocedasticidade):
mtodos de suavizao, referindo-se srie dos termos dos erros em diferentes perodos de tempo
considerados: Yt = + b1et 1 + b2 et 2 + + bk et k + et .
4
Entende-se por filtragem ou tratamento, um caminho antes de analisar os dados, visando melhorias na
interpretao e utilizao dos dados alm de resumir os efeitos na autocovarincia (HAMILTON, 1994).
48
C [ t ; s ] = 0, s t
n

V [ t ] = t =1
2
{ t }t =1 ~ RB
n
(2.29)
Pode-se definir ainda rudo branco independente (RBI) como uma srie de erros
estocsticos { t }t =1 se:
n
(i) A esperana dos erros nula:
{E [ ] = 0}
n
t t =1
(2.30)
(ii) os erros so estocasticamente independentes entre instantes de tempo
distintos:
t = et R
f1 ; 2 ;; n e1 ; e2 ; ; en = ft et
n
t =1

{ t }t =1 ~ RBI
n
(2.31)
Define-se rudo branco independente normal (RBIN) como uma srie de erros
estocsticos { t }t =1 se:
n
(i) esperana dos erros nula:
{E [ ] = 0}
n
t t =1
(2.32)
(ii) os erros so estocasticamente independentes e normalmente distribudos
entre instantes de tempo distintos:
{ N ( 0; 2 ) }
n
t
t =1
t = et R
1 e
2
1
ft et = exp t 2
2 2

n
f1 ; 2 ;; n e1 ; e2 ; ; en = ft ( et )
t =1
49
2 0 0
1 0
n = ~ N n ;
0 0
0 0
n 0
2
0 0
= N n 0 ; 2 I n
n1
{ t }t =1 ~ RBIN
n
(2.33)
2.2.6.1 MODELOS AUTO-REGRESSIVOS (AR)
Segundo Box, Jenkins e Reinsel (1994), a parte auto-regressiva dos modelos ARMA
usa variveis independentes para predizer a varivel dependente. O termo auto-
regressivo indica que as sries de valores a serem previstos provem dos valores
passados para predizer o valor futuro quando h autocorrelao entre as observaes.
Quando se cita ordem do modelo, faz-se referncia diferena entre o valor a ser
previsto e o nmero de defasagens usadas como preditores. Se a srie de valores utilizar
2 valores passados para prever o valor atual, tem-se um modelo auto-regressivo de
segunda ordem, indicado por AR(2), isto , o valor X t da srie depender dos valores
X t 1 e X t 2 .
A equao de previso para um modelo AR(2) fica:

Et [ X t ] = 1 X t 1 + 2 X t 2 + t (2.34)
os valores de 1 e 2 so os coeficientes (parmetros) a serem estimados pelo modelo,
bem como a componente do erro t ~ N (0, 2 ) , que indica o erro ou o termo aleatrio
no, correlacionado com mdia aritmtica zero e varincia constante. Respeitadas aqui
as condies de estacionariedade do modelo.
De um modo geral, tem-se para um modelo auto-regressivo de ordem p:

50
X t = 1 X t 1 + 2 X t 2 + + p X t p + t (2.35)
Da mesma forma, poder-se-ia escrever via um operador de atraso L:

LX t = X t 1 (2.36)
(2.37)
L2 X t = LLX t = LX t 1 = X t 2
(2.38)
Ln X t = X t n
sendo que,
X t 1 X t 1 2 X t 2 p X t p = t (2.39)
(2.40)
X t 1 LX t 2 L2 X t p Lp X t = t
embora o operador L no seja um nmero, pode ser tratado algebricamente como se

fosse. Ao colocar X t em evidncia:
X t (1 1 L 2 L2 p Lp ) = t (2.41)
Aparece, ento, um polinmio no operador L, que se pode chamar simplesmente de

p ( L) , e ento o modelo fica resumido a:
p ( L) X t = t (2.42)
2.2.6.2 MODELOS DE MDIAS MVEIS (MA)
De acordo com Box, Jenkins e Reinsel (1994), os termos de mdias mveis dos
modelos ARIMA representam as defasagens dos valores dos erros passado e presente,
muitas vezes, chamado de rudo branco5, usado quando h autocorrelao entre os
resduos. Pode-se interpretar tambm os termos de mdias mveis como eventos
externos ou choques no sistema, isto , uma mudana nos valores no previstos no
ambiente pode influenciar tanto os valores passados como os valores futuros. Assim, o
5
O termo do erro chamado de rudo branco se ele possui mdia zero, varincia constante 2 e no
autocorrelacionado. Ao se estimar um modelo, deseja-se que o erro seja um rudo branco.
51
componente de erro para o perodo de tempo atual se relaciona ao valor da srie no

futuro. A ordem q do termo de mdias mveis se refere ao tamanho da defasagem
entre o erro e a varivel da srie. Dessa forma, se a srie influenciada pelo erro do
modelo defasado de 1 perodo, tem-se um processo MA(1), cuja equao seria:
X t = 1 t 1 + t (2.43)
sendo que 1 parmetro, isto , o coeficiente do primeiro termo do erro de mdia
mvel e o componente do erro t ~ N (0, 2 ) que indica o erro ou termo aleatrio no
correlacionado com mdia aritmtica zero e varincia constante.
De um modo geral, tem-se para um modelo de mdias mveis de ordem q:

X t = 1 t 1 + 2 t 2 + + q t q + t (2.44)
Da mesma forma que no processo auto-regressivo, poder-se-ia escrever via um operador

de atraso L:
X t = 1 L t + 2 L2 t + + q Lq t + t (2.45)
Ao colocar t em evidncia e atribuindo q ( L) a 1 + 1 L + 2 L2 + + p Lp , fica:
X t = t q ( L) (2.46)
Uma caracterstica importante de um modelo MA(q), e conseqentemente do modelo

ARMA(p,q), que as variveis na equao (2.44), ou seja, t 1 at t q , so no
observveis e tm de ser estimadas, usando a amostra de dados disponvel. Para que isso
no cause problemas, usual manter o valor de q o tanto menor quanto possvel. Na
prtica, esse valor de q freqentemente tomado como sendo 0, 1 ou 2. primeira
vista, pode parecer que X t no depende de seu prprio passado quando um modelo
MA(q) descreve esta varivel.

52
2.2.6.3 MODELOS ARIMA
So modelos que so aplicados no caso especfico de sries no estacionrias ou

estacionarizadas e so compostos pelos trs filtros: auto-regressivo, mdia mvel e
diferenciao. Para se montar um modelo ARIMA para uma sucesso cronolgica, h
trs estgios a se considerar: identificao, estimao e verificao (diagnstico)
(MORETTIN, 2002).
Box, Jenkins e Reinsel (1994) frisam que a componente de integrao ou diferenciao

no modelo ARIMA prov um meio de representar a tendncia dentro de um modelo de
sucesso cronolgica. Diferenciar a srie, significa subtrair os valores dos valores
adjacentes para avaliar os componentes restantes do modelo. A diferenciao pode
ocorrer tanto no nvel sazonal quanto no sazonal, podendo ocorrer diferenciaes
sucessivas, embora no seja, muitas vezes, necessrio. A forma de diferenciar a srie em
nvel no sazonal :
Z t = X t X t 1 (2.47)
e, assim, sucessivamente.
A metodologia proposta por Box e Jenkins (1976) define trs passos para a construo
do modelo de previso:
1) identificao: consiste em descobrir qual entre as vrias verses possveis de

um modelo ARIMA descreve o comportamento da srie. O objetivo desta etapa
encontrar os filtros que iro compor o modelo, estabelecendo os valores de p, d e q. A
escolha feita, principalmente, com base o grfico das funes de autocorrelaes
(FAC) e na funo autocorrelaes parciais (FACP) proposta por Box, Jenkins e Reinsel
(1994), as quais se espera que representem adequadamente as respectivas quantidades
tericas, que so desconhecidas no modelo. De maneira geral, a FAC usada para
identificao dos processos autoregressivos (AR) e a FACP, para identificar os
processos de mdias mveis (MA). A parte de integrao depender da estacionariedade
da srie, e caso no seja estacionria, usar-se- o processo de diferenciao para tornar a
srie estacionria.
53
Sries temporais no estacionrias apresentam fortes correlaes seriais, ou seja, os

valores dos coeficientes de autocorrelao declinam lentamente medida que o valor da
defasagem k aumenta. Assim sendo, o grfico de uma FAC com valores muito altos
inicialmente e que declinam lentamente para um valor estatisticamente igual a zero,
medida que o valor da defasagem k aumenta, um indicativo de que a srie no-
estacionria e precisa ser diferenciada (HAMILTON, 1994).
Caso contrrio, a srie ser estacionria, o valor de d ser zero e passa-se para a
identificao dos demais filtros AR e MA. Cabe ressaltar aqui, que nem sempre a
diferenciao suficiente para estacionarizar a srie, sendo que se esta tiver tendncia
determinstica, dever ser removida antes ou se usar outro modelo. Se a no
estacionariedade estiver associada varincia da srie, pode-se optar por usar
transformaes como logaritmo neperiano ou raiz-quadrada (VASCONCELLOS e
ALVES, 2000).
2) estimao:o segundo passo consiste em estimar os parmetros p, d e q do
modelo e a varincia do rudo branco 2 , observando sempre a minimizao dos
critrios AIC e BIC6.
3) verificao: consiste em verificar a eficcia da estimao dos parmetros do
modelo. Caso falhe na eficcia dos parmetros, o processo refeito desde a
identificao para se obter o ajuste timo do modelo.
Genericamente, um modelo ARMA (p,q) seria:

X t = 1 X t 1 + 2 X t 2 + + p X t p + t + 1 t 1 + 2 t 2 + + q t q (2.48)
Ou ainda:
X t 1 X t 1 2 X t 2 p X t p = t + 1 t 1 + 2 t 2 + + q t q (2.49)
X t 1 LX t 2 L2 X t p Lp X t = t + 1 L t + 2 L2 t + + q Lq t (2.50)
Ou, simplesmente:
6
Critrios AIC (Akaikes Information Criteria) proposto por AKAIKE (1973, 1974) e BIC (Bayesian
Information Criteria) proposto por GEWEKE e MEESE(1981), apud Cromwell, Labys e Terraza (1994).
54
p ( L) X t = t q ( L) (2.51)
X
sendo Yt = ln t = ln( X t ) e
X t 1
p ( L)
tARIMA( p ,1,q ) = Yt = p ( L) q1 ( L) ln X t
q ( L) (2.52)
tARIMA( p ,1,q ) ~ RB
Da equao (2.2) com a equao (2.52), tem-se:

ARIMA = et 1 (1) Yt Et 1 [Yt ]
t
(2.53)
Poderia ter-se ainda caso a srie seja no estacionria, definir uma nova varivel Z t
como sendo a primeira diferena de X t , isto :
Z t = X t X t 1 = X t (2.54)
Se X t no estacionria, mas Z t , diz-se que X t integrada de ordem 1, ou I(1). s
vezes, a primeira diferena no suficiente para estacionarizar a srie, e ento temos de

tomar a segunda diferena, isto , a diferena da diferena:
Z t = 2 X t = X t X t 1 (2.55)
Agora, se X t no uma varivel estacionria, mas sua d-sima diferena , um modelo
ARIMA (p,d,q), ficaria:

Zt = d X t (2.56)
Z t = 1 d X t 1 + 2 d X t 2 + + p d X t p + t 1 t 1 2 t 2 q t q (2.57)
Indicando Wt = d X t tem-se:
Z t = 1Wt 1 + 2Wt 2 + + pWt p + t 1 t 1 2 t 2 q t q (2.58)
Alternativamente, utilizando o operador L de defasagem, tem-se:
(1 L + L ) w = (1 L L )
1 p
p
t 1 q
q
t
(2.59)
Wt = (1 L) d X t (2.60)
(1 L) d p ( L) = q ( L) t (2.61)
55
Nesse caso, (1 L) d p ( L) = 0 apresenta d razes sobre o crculo unitrio (d razes
unitrias) e p razes fora do crculo unitrio.
Um caso especial do processo no estacionrio homogneo o ARIMA(0,1,0),

denominado random walk ou passeio aleatrio: X t = X t 1 + t .
A srie X t integrada de ordem 1 e sua primeira diferena ARMA(0,0), ou seja, um
RB.
2.2.7 MODELOS NO-LINEARES
Em muitas situaes, uma sucesso cronolgica pode exibir comportamentos

incompatveis com a formulao de um processo linear. Os comportamentos incluem,
por exemplo, mudanas repentinas, varincia condicionada, evoluindo no tempo e
irreversibilidade no tempo (MORETTIN, 2002).
Para Enders (2003), a teoria econmica sugere que um grande nmero de sucesses
cronolgicas econmico-financeiras fornea evidncias de exibir um comportamento
no-linear, conforme sugerido por Morettin (2002), visto que, as sries financeiras
apresentam instabilidades no tempo e peculiaridades institucionais que fazem com que
os modelos de coeficientes fixos lineares e gaussianos sejam inadequados para
aproximar tais sries. O objetivo passa a ser ento, modelar o que se chama de
volatilidade, que a varincia condicional de uma varivel, comumente um retorno.
Para Campbell, Lo e Mackinlay (1997), a volatilidade no medida diretamente e se

manifesta numa srie temporal financeira da seguinte maneira:
a volatilidade aparece em grupos, de maior ou de menor variabilidade;
a volatilidade evolui continuamente no tempo, podendo ser considerada
estacionria;
reage a valores positivos ou negativos de maneira diferente.
56
Tsay (2002) define um modelo no-linear como sendo aquele em que a condio de
primeira ordem para a estimao dos parmetros por mnimos quadrados gera funes
no-lineares nos parmetros. Dessa forma, a no-linearidade definida em termos das
tcnicas necessrias para estimar os parmetros, e no da forma funcional da regresso.
Para Campbell, Lo e Mackinlay (1997), alguns modelos de sucesses cronolgicas

tpicas relacionam umas sries de tempo observadas a uma sucesso subjacentes de
choques aleatrios t . Na anlise de sucesses cronolgicas lineares, assume-se que
estes choques so no correlacionados, mas no necessariamente assume-se que sejam

independentes e identicamente distribudos.
Segundo Hamilton (1994), pelo teorema da representao de Wold, qualquer srie

temporal pode ser escrita como uma mdia mvel linear, de ordem finita para tais
choques estocsticos e esta representao resume a varincia no condicionada e
autocovarincias da srie.
Na anlise de modelos no-lineares, Campbell, Lo e Mackinlay (1997) afirmam que os

valores de t so, em geral, supostos independentes e identicamente distribudos (I.I.D),
mas buscam uma funo no-linear relacionando srie de X t com os choques
estocsticos, cuja representao geral :
Xt = f ({ } ) = f ( ,

s s =t t t 1 , t 2 , ) (2.62)
sendo que se assume que os choques possuem esperana nula e varincia unitria, t
um choque estocstico contemporneo e { t 1 , t 2 ,} so os choques estocsticos
passados, isto { s }s = t ~ RBI .

Pode-se, ento, aproximar X t por Taylor em torno de t0 = 0 :
(2.63)
X t = f ( t , t 1 , t 2 ,) + ( t t0 ) f ( t , t 1 , t 2 ,) +
t = 0
t t
2
+ ( t t0 ) f ( t , t 1 , t 2 ,)
2
+
t2
t = t0
57
Segundo Campbell, Lo e Mackinlay (1997), considerando at a segunda expanso onde
se tem para p 2 , E ( X t Et 1 [ X t ]) h p ( t 1 , t 2 ,) E tp , chamado momento

p

centrado condicionado de ordem p, e definindo g ( t 1 , t 2 ,) Et 1 [ X t ] , pois
Et 1 [ X t ] o previsor timo de X t pelo critrio do erro quadrtico mdio, fazendo com
que a equao (2.63) fique:
(2.64)
X t f ( 0, t 1 , t 2 ,) + t f ( 0, t 1 , t 2 ,)
t
X t g ( t 1 , t 2 ,) + t h ( t 1 , t 2 ,) = g (.) + t h(.) (2.65)
de modo que a funo g representa a mdia condicional e h 2 a varincia condicionada.

Se a funo g for no-linear, o modelo diz-se no-linear na esperana, enquanto se h for
no-linear, o modelo diz-se no-linear na varincia.
Considerando { t } ~ RBIN , ento E t2 = 1 , de onde se tem:
E ( X t Et 1 [ X t ]) = Vt 1 [ X t ] = h 2 (.) E t2
2
(2.66)

Vt 1 [ X t ] = h 2 (.) 1 (2.67)
h(.) = Vt 1 [ X t ] (2.68)
Dessa forma, juntando-se a equao (2.65) com o resultado de (2.68), tem-se:
X t g (.) + t h(.) = Et 1 [ X t ] + t Vt 1 [ X t ] (2.69)
X t Et 1 [ X t ] t Vt 1 [ X t ] (2.70)
Da equao (2.2), tem-se et 1 (1) X t Et 1 [ X t ] e juntamente com a equao (2.70):
et 1 (1) X t Et 1 [ X t ] = t Vt 1 [ X t ] (2.71)
(2.72)
et 1 (1) t Vt 1 [ et 1 (1) ]
58
sendo que et 1 (1) X t Et 1 [ X t ] representa o erro de previso um passo frente e
lembrando que Vt 1 et 1 (1) = Vt 1 [ X t Et 1[ X t ]] = Vt 1 [ X t ] . (2.73)
Segundo Tsay (2002), se os modelos com no-linearidade na esperana condicionada se

mostrarem adequados para sries financeiras, eles podem ser utilizados em previso
como concorrentes ou complementares a outros mtodos. Nos conglomerados de
valores extremos, um dos fatos estilizados de dados financeiros pode ser explicado por
modelos no-lineares, embora possam ser decorrncia de outliers e/ou mudanas
estruturais.
Para Enders (2003), os modelos ARCH e GARCH so muito aplicados a estes tipos de
dados por captarem os fatos estilizados citados pelos autores acima. Existem ainda
outras classes de modelos no-lineares como o modelo de volatilidade estocstica que
modela a varincia atravs de um processo no observado, tentando captar a notcia que
chega ao mercado, os modelos TAR (Limiar Auto-regressivo) que incluem no-
linearidades na esperana e os bilineares.
2.2.7.1 VARINCIA CONDICIONADA
Segundo Soares e Castelar (2003), dentre as hipteses do modelo clssico de

regresso linear, tem-se a que estabelece que os distrbios estocsticos tm a mesma
varincia em todas as observaes, o que recebe o nome de homocedasticidade. A
violao deste pressuposto recebe o nome de heterocedasticidade.
Muitas sucesses cronolgicas econmico-financeiras apresentam informaes
adicionais discrepantes e outliers, provindos de inovaes que no acontecem com
freqncia. Uma vez que os dados refletem resultados de negcios entre compradores e
vendedores, por exemplo, o mercado de aes, vrias fontes de eventos exgenos
podem ter um impacto sobre o padro dos preos dos ativos. Algumas notcias podem
levar a vrias interpretaes diferentes e tambm que certos eventos econmicos
especficos, tal como uma crise de petrleo, pode durar por algum tempo.
Freqentemente, observa-se que grandes quantidades positivas e negativas de
observaes de sries temporais financeiras podem aparecer em clusters
59
(agrupamentos). O autor frisa, ainda, que uma abordagem para tratar esta situao e
explorar o fato de que os outliers aparecem em clusters e tentar construir um modelo de
srie temporal para estes prprios outliers. Ou seja, devido presena de conjuntos de
valores discrepantes, a varincia das sries temporais financeiras devero variar em
funo do tempo e, conseqentemente, os intervalos de previso tambm devero para
cada nvel. Logo, os modelos no-lineares so aplicados quando as sries so no
serialmente correlacionadas, mas dependentes.
2.2.7.2 MODELOS NO-LINEARES NA MDIA
Para os modelos da equao (2.65) vista anteriormente, pode-se gerar, existe uma
grande variedade de modelos no-lineares disponveis na literatura. Destacam-se, a
seguir, alguns destes modelos. Para mais detalhes, ver Tsay (2002).
2.2.7.2.1 MODELOS POLINOMIAIS
Para este modelo, a funo g (.) fica:

g ( t 1 , t 2 ,...) = i t i + ij t i t j + ... (2.74)
i =1 i =1 j =1
Segundo Morettin e Toloi (2004), esta uma expanso envolvendo termos lineares,
bilineares etc. dos t .
2.2.7.2.2 MODELOS BILINEARES
Para este modelo, tem-se:

g ( t 1 , t 2 ,...) = i t i + i X t i + ij X t i t j + ... (2.75)
i =1 i =1 i =1 j =1
60
2.2.7.2.3 MODELOS LINEARES POR PARTES
Segundo Cromwell, Labys e Terraza (1994), a idia bsica da classe dos modelos
lineares por partes, tambm chamados de modelos TAR (threshold autoregressive)
a linearizao por partes por meio da introduo de limiares.
Um modelo TAR(2,1,1) fica:

X + , se X t 1 < d
X t = 1 t 1 1 (2.76)
2 X t 1 + 2 , se X t 1 > d
Aqui o processo tem dois regimes, dependendo de X t 1 ser maior ou menor do que o
limiar d. Segundo Morettin (2004), os modelos com quebras estruturais podem ser
includos nessa classe de modelos e um dos objetivos estimar os pontos de mudanas
de regimes.
2.2.7.2.4 MODELO AUTOREGRESSIVO EXPONENCIAL
Segundo Cromwell, Labys e Terraza (1994), um modelo autoregressivo exponencial

(EXPAR (p)) tem a forma:
{ ( ( X ) )
} { ( ( X ) )
}X
2 2
X t = 1 + 1e t 1
X t 1 + ... + p + p e t p
t p + t (2.77)
onde t um processo independente e identicamente distribudo com mdia zero e
varincia finita (RBI) e p e p so os parmetros e > 0 .
2.2.7.3 MODELOS NO-LINEARES NA VARINCIA CONDICIONADA

MODELOS GARCH
uma generalizao dos modelos ARCH (Autoregressive Conditional

Heteroskedasticity) isto , de heterocedasticidade autoregressiva condicionada, proposto
inicialmente por Engle (1982), que conhecido por GARCH foi proposto por Bollerslev
(1986), e pode ser usado para descrever a volatilidade com menos parmetros do que
um modelo ARCH. Apresentam as mesmas vantagens e desvantagens dos modelos
ARCH, conforme se observa no quadro a seguir. Altas volatilidades so precedidas de
61
grandes retornos ou volatilidades, onde se observam os grupos de volatilidades

presentes nas sries financeiras, isto , comum o fato de que grandes valores num
determinado instante de tempo sejam seguidos tambm por valores elevados nos
perodos subseqentes, no necessariamente na mesma direo.
Quadro 3: Vantagens e desvantagens dos Modelos ARCH

Vantagens dos modelos ARCH Desvantagens do modelo ARCH
A distribuio das taxas de retorno Tratar os retornos positivos e negativos da
leptocrtica. mesma forma, j que os quadrados dos
retornos entram na forma da volatilidade e
na prtica, sabe-se que a volatilidade reage
de forma diferente a retornos positivos e
negativos. Tambm devido ao fato de
trabalhar com retornos ao quadrado, alguns
retornos grandes e isolados podem levar a
super-previses.
Fonte: Morettin, 2002
O modelo ARMA especifica uma expresso para a esperana condicionada. O modelo

de heterocedasticidade condicionada auto-regressivo generalizado (GARCH) especifica
uma expresso para a varincia condicionada e modela movimentos persistentes na
volatilidade de maneira parcimoniosa. O GARCH significativo para pesquisadores de
Economia Estocstica ou da Incerteza. Modelos tericos, usando varincia como
uma medida de incerteza, como, por exemplo, a anlise de mdia-varincia, podem ser
testados, usando esperana e varincia condicionadas por um conjunto informacional.
Define-se um Conjunto informacional ordem p at o instante t (CI) como: uma srie de

variveis estocsticas p-dimensionais indexadas por instantes de tempo eqiespaados

Ft = i conjunto informacional de ordem p=1 at o instante t inclusive.
p
( p1) i =
E tambm pode-se definir um Conjunto informacional ordem 1 at o instante t (CI):

uma srie de variveis estocsticas unidimensionais indexadas por instantes de tempo
62
eqiespaados Ft = {i }i = conjunto informacional de ordem 1 at o instante t

inclusive.
O Ft pode ser entendido como um conjunto de informaes disponveis e selecionadas
pelo pesquisador at o instante t inclusive. Intuitivamente, espera-se que o conjunto

informacional auxilie na diminuio da incerteza na previso de uma varivel
estocstica por meio do condicionamento. Uma propriedade importante a de filtragem:
Ft 1 Ft , t .
Um modelo GARCH(p,q) para o etARIMA

1
( p ,1, q )
(1) = tARIMA( p ,1,q ) tem-se:
p ( L)
tARIMA( p ,1,q ) = Yt = p ( L) q1 ( L) ln X t da equao (2.56) definido a partir da
q ( L)
equao (2.72):
t t Vt 1 [ t ] (2.78)
sendo que:
{ t }t =1 RBIN ( 0;1) e { t } RB
n
{ t } e { t } independentes
+ j ( t2 j )
GARCH ( r,s )
s r
Vt 1 tARIMA(p,1,q) + i Vt i 1 tARIMA(p,1,q)
i >0
i =1 j =1
Br ( L) Vt 1 [ t ] = As ( L) ( t2 )
GARCH ( r,s )
(2.79)
Br1 ( L) As ( L) ( tARIMA(p,1,q) ) = Et 1 ( tARIMA(p,1,q) )

2 2

>0
i > 0, i = 1, 2, , r (parmetros GARCH) (2.80)
j > 0, j = 1, 2, , s (parmetros ARCH)

V tARIMA(p,1,q) = r s
= 2 > 0 (2.81)
1 i i
i =1 i =1
r s
1 i i > 0 V tARIMA(p,1,q) < (2.82)
i =1 i =1
Dessa forma, tem-se:
X t Et 1 [ X t ] vt Vt 1 tARIMA(p,1,q) (2.83)
ARIMA GARCH
63
Da equao (2.79), tem-se:
p ( L ) q1 ( L ) ln X t (
vt Br1 ( L ) As ( L ) tARIMA(p,1,q) )
2
(
p2 ( L ) q2 ( L )( ln X t ) vt2 Br1 ( L ) As ( L ) tARIMA(p,1,q) )
2 2
(2.84)
( )
GARCH(r,s)
ARIMA(p,1,q) 2 vt2 p2 ( L ) 2q ( L ) Br ( L ) As1 ( L ) ( ln X t )
2
t
E ainda:
Et 1 tARIMA(p,1,q) = E tARIMA(p,1,q) = 0
Vt 1 tARIMA(p,1,q) = Et 1 ( tARIMA(p,1,q) )
2
(2.85)

E Vt 1 tARIMA(p,1,q) = E E t 1 ( tARIMA(p,1,q) ) = 2
2
Os parmetros so estimados, por exemplo, por meio de mtodos de maximizao da

chamada funo de mxima verossimilhana condicionada. A descrio do processo
no ser feita, neste trabalho, por no estar entre os objetivos. Mais detalhes podem ser
vistos em BOLLERSLEV (1986, 1987) e MILLS (1999).
Toloi (1980) comparou as tcnicas Box-Jenkins, alisamento exponencial, mtodo de

filtragem adaptativa, mtodo de regresso para 8 sries temporais distintas para
previso de curto, mdio e longo prazos. A autora identificou, com exceo da previso
a longo prazo, que o mtodo de Box-Jenkins o mais eficiente por apresentar, na
maioria das comparaes, um menor erro quadrtico mdio. O mtodo de Holt-Winters
foi considerado sempre o pior, quando da anlise das sries de manchas solares,
embarque de metal, concentrao de um processo qumico e imigrao. Todavia, o
mtodo de Holt-Winters apresenta um comportamento significativo, para ocupar um
segundo lugar, nas sries de produo de leite e vendas de champanhe, para qualquer
distncia de previso sua origem. E devido sua simplicidade, o mtodo de
Alisamento Exponencial Simples apresentou um bom comportamento, em alguns casos
espordicos, e, na maioria das vezes, quando trabalhamos com sries no sazonais.
Bollerslev, Chou e Kroner (1992) mostraram que, na prtica, tpico encontrar que o
modelo GARCH (1,1) produz uma descrio adequada de muitas sries temporais
financeiras.
64
Expresses explcitas para curtose e as autocorrelaes de t gerada pelas equaes
(2.68) podem ser geradas, mostrando que um modelo GARCH (r,s) pode descrever
sries temporais com seqncias de grandes observaes, tanto positivas quanto
negativas. A FAC de t2 pode ser encontrada, aplicando as mesmas tcnicas dos
modelos ARCH (BOLLERSLEV, 1997).
Diniz (1999) utilizou modelos ARIMA na modelagem da srie dos retornos dirios dos
preos mnimo e mximo da Telebrs, no perodo de 01/08/94 a 13/03/97. Obteve
melhores resultados nas previses um passo-a-frente. Estudou as funes FAC para
identificao dos modelos e chegou em ARIMA (1,1,0) para a srie dos preos mnimo
e ARIMA (2,1,0) para os valores mximo. Mediu a acurcia dos modelos pelo MAPE,
que forneceu 2,29% para os valores mnimos e 1,97% para os valores mximos.
Soncin e Corrente (2003) analisaram a srie de fechamento da Embraer durante 24

meses, num total de 128 dados. Aps ajustes indicados pelas funes de autocorrelao,
grficos dos resduos e verificaes das pressuposies para o ajuste, bem como uma
anlise de diagnstico, o modelo adotado e que melhor explicou os dados foi o modelo
ARIMA (2,1,1). Cabe ressaltar que o objetivo dos autores era apenas a modelagem da
srie.
2.2.8 REDES NEURAIS
Redes neurais artificiais so sistemas de processamento de informaes distribudas,

compostas por muitos elementos computacionais simples que interagem atravs de
conexes com pesos distintos. Inspiradas na arquitetura do crebro humano, elas exibem
caractersticas como a habilidade de aprender padres complexos de informao e
generalizar a informao aprendida (ZHANG; PATUWO; HU, 1998).
Cada elemento computacional no-linear chamado de n, e densamente

interconectado atravs de conexes diretas. Os ns operam em passos discretos, de
forma anloga a uma funo de dois estgios: o primeiro estgio calcula a soma dos
65
sinais de entrada, atribuindo pesos aos sinais; o segundo estgio consiste da aplicao de
uma funo de sada, chamada de funo de ativao (HILL; OCONNOR;
REMUS,1996).
Segundo Haykin (2001), as unidades bsicas da rede so os neurnios artificiais. Os

neurnios se agrupam em camadas. Existem trs categorias de camadas: a camada de
entrada, a intermediria que pode tambm conter mais de uma camada e a camada de
sada. Os neurnios entre as camadas so conectados por sinapses ou pesos, os quais
refletem a relativa importncia de cada entrada com o neurnio. A camada de entrada
responsvel pelas variveis de entrada do modelo; a camada de sada contm um ou
mais ns, representando os resultados finais do processamento e as camadas
intermedirias, ou camadas ocultas, que podem existir uma ou mais que iro tornar o
processamento mais refinado e no-linear.
A Figura, a seguir, apresenta o modelo de um neurnio, que forma a base para o

projeto de redes neurais (artificiais):
wk0 = bk
Entrada ( i )
Fixa x0 = wk0
1
x1 wk1
Potencial
de Funo de
x2 wk Ativao
Sinais de Ativao
v Sada

k
Entrada (.) yk

Juno
aditiva
x wk
Pesos
sinpticos
Figura 2: Modelo de um neurnio artificial
Fonte: HAYKIN, 2001.
No modelo neural da Figura 2, temos:
- Um conjunto de sinapses ou elos de conexo, sendo que cada sinapse

caracterizada por um peso ou fora prpria. Especificamente, um sinal
66
x j , na entrada da sinapse j conectada ao neurnio k, multiplicado pelo
peso sinptico wkj . importante notar como so escritos os ndices do
peso sinptico wkj . O primeiro ndice se refere ao neurnio em questo
e o segundo ao terminal de entrada da sinapse qual o peso se articula.

- Um somador ou integrador para somar os sinais de entrada,
ponderados pelas respectivas sinapses do neurnio; as operaes
descritas, neste caso, constituem um combinador linear.
- Uma funo de ativao para restringir a amplitude da sada de um
neurnio. A funo de ativao tambm referida como funo
restritiva j que restringe (limita) o intervalo permissvel de amplitude
do sinal de sada a um valor finito.
Tipicamente, o intervalo normalizado da amplitude da sada de um neurnio escrito

como intervalo unitrio fechado [0,1] ou alternativamente [-1,1].
O modelo neural da Figura 2 inclui tambm um vis aplicado externamente,

representado por bk . O vis bk tem o efeito de aumentar ou diminuir a entrada lquida
da funo de ativao, dependendo se ele positivo ou negativo, respectivamente.
Em termos matemticos, pode-se descrever um neurnio k, a partir das seguintes

equaes:
m
uk = wkj x j (2.86)
j =1
yk = ( uk + bk ) (2.87)
sendo que x1 , x2 , ..., xm so os sinais de entrada; wk1 , wk 2 , ..., wkm so os pesos
sinpticos do neurnio k; uk a sada do combinador linear devido aos sinais de
entrada; bk o vis; () a funo de ativao e yk o sinal de sada do neurnio. O
uso do vis bk tem o efeito de aplicar um transformao afim sada uk do combinador
linear no modelo da Figura 2, como mostrado por:

vk = uk + bk (2.88)
67
Em particular, dependendo se o vis bk positivo ou negativo, a relao entre o campo
local induzido ou potencial de ativao vk do neurnio k e a sada do combinador linear
uk pode ser alterada.
O modelo linear tem a propriedade til de ter uma soluo de forma fechada para
resolver o problema de uma regresso, ou seja, de minimizar a diferena quadrtica
entre oi e o valor previsto p i . Para a previso de um perodo curto, o modelo linear
um ponto de partida razovel, ou um padro reconhecido, visto que, em muitos

mercados, observam-se apenas pequenas mudanas simtricas na varivel a ser predita,
ao longo de uma tendncia de longo prazo. No entanto, isto pode no ser preciso o
bastante para mercados financeiros volteis em que pode haver um processo no-linear
dos dados. Movimentos lentos no aumento dos preos dos ativos, seguidos por colapsos
repentinos conhecidos como bolhas so comuns de acontecer. Dessa forma, o modelo
linear pode falhar em capturar ou prever pontos de mudana acentuada nos dados. Por
esta razo, que so utilizadas tcnicas no-lineares de previso.
A rede neural uma alternativa aos modelos lineares e a algumas abordagens no-
paramtricas para a aproximao de sistemas no-lineares. A razo para o uso de uma
rede neural simples e direta. O objetivo encontrar uma abordagem ou mtodo o qual
realize bem previses para dados gerados para processos que, freqentemente, so
desconhecidos e altamente no-lineares, com uma quantidade pequena de parmetros e
o qual seja mais fcil de estimar que os modelos no-lineares paramtricos (DE
OLIVEIRA, 2003).
2.2.8.1 ALGORITMO DE RETROPROPAGAO (BACKPROPAGATION)
Suponha que se tenha uma rede com N neurnios na camada de entrada ( n = 1, 2, , N ),

J neurnios na camada intermediria ( j = 1, 2, , J ) e K na camada de sada
( k = 1, 2, , K ). Considerando W 1 jn como sendo o peso entre o j-simo neurnio na
camada intermediria e o n-simo neurnio da camada de entrada, e ainda, W 2kj o peso

68
entre o k-simo neurnio na camada de sada e o j-simo neurnio da camada

intermediria, conforme a figura a seguir:
camada de sada
W 2kj
camada intermediria
W 1 jn
camada de entrada
Figura 3: Rede neural com 3 camadas

Fonte: TAK, 1995.
Usando I para indicar a camada de entrada (input) e O para sada (output), e ainda o
sobrescrito i para camada de entrada, h (hidden) para intermediria e o para camada de
sada, onde se poder indicar I h , denotando a entrada do neurnio da camada
intermediria, O i indicando a sada do neurnio da camada de entrada.
A camada de entrada mostra que estes ns que recebem os valores dos dados de
entrada. As linhas de interconexo indicam que o valor de sada de um neurnio que
passado ao longo desta linha at o prximo neurnio. Quando todos os dados da camada
de entrada tiverem passado atravs da ltima camada, conhecida como camada de sada,
um ciclo ou poca ter sido realizado. Cada linha de interconexo tem um valor,
chamado de peso, os pesos so parmetros que operam sobre os dados associados a cada
linha (ou seja, realizada uma multiplicao do valor do dado pelo peso). Estes pesos
so incrementalmente ajustados durante a fase de treinamento de tal forma a alcanar o
resultado de sada desejado para um determinado dado de entrada. Inicializaes tpicas
para estes pesos encontram-se no intervalo de [-1;1] ou menos.
A segunda camada e todas as camadas subseqentes contm ns de processamento,

conhecidos como neurnios artificiais e so chamadas de intermedirias (ou ocultas). O
processamento realizado em um neurnio artificial pode ser dividido em trs passos:
1- os dados que passam, ao longo das linhas de entrada para os neurnios, so
multiplicados pelos de pesos;
69
2- todos esses dados que foram multiplicados pelos pesos so somados dentro do
neurnio;
3- o valor total dessa soma passado atravs de uma funo de transferncia, cuja sada
representa o valor de sada do neurnio.
A funo de transferncia mais simples a funo linear (adequada para um espao

linearmente separvel), a qual iguala a sada entrada. A utilizao de funes de
transferncia no-lineares (adequadas para um espao no-linearmente separvel) uma
das caractersticas principais da rede neural.
A seguir, so apresentadas todas as etapas do algoritmo de retropropagao (AZOFF,

1994).
1. Definir a funo de pesos da rede, E (w) , conhecida como a energia ou funo de
custo, a qual se deseja minimizar. Considerando a metade da soma quadrtica dos erros
(SSE sum of square errors), tem-se que:
Etotal = E (w) (2.89)
o
1
E ( w) = [T O ]
2
(2.90)
2
E
= (T O ) (2.91)
O
sendo que a soma em (2.89) realizada sobre os padres e os neurnios de sada o, T
o valor alvo e O a sada observada da rede, uma funo dos pesos da rede w. A
expresso (2.89) significa que se deve minimizar o erro de todos os processadores da
camada de sada para todos os padres que so apresentados rede.
2. Calcular a sada do neurnio da camada intermediria O h , multiplicando os pesos

W 1 pelas sadas do neurnio da camada de entrada O i
N
I h = W 1n O i
n =1
3. Esta entrada I h o nvel de ativao do neurnio que determina se o neurnio pode

produzir uma sada. A relao entre o nvel de ativao e a sada pode ser linear ou no-
linear (HAYKIN, 2001).
70
1
Considerando a funo logstica ( x ) = que facilmente derivvel:
1 + e x
d e x
= ( x) = = ( x) (1 ( x) ) (2.92)
dx (1 + e x ) 2
A sada do neurnio da camada intermediria O h :

1
Oh = (I h ) =
1 + e I
h
4. Calculando a sada do neurnio da camada de sada O o , multiplicando os pesos W 2

pela sada do neurnio da camada intermediria O h :
J J
1
I o = W 2 j.O h = W 2 j. h (2.93)
j =1 j =1 1 + e I
e
1
Oo = ( I o ) = (2.94)
1 + e I
o
5. Calculando o erro:
n n
1
E = (T O o ) = E = T o (2.95)
t =1 t =1 1 + e I
As derivadas so importantes porque se conhecerem as derivadas parciais do erro com
respectivos pesos, conhecer-se- o caminho que os pesos deveriam percorrer para
reduzir o erro.
E
W 2 = (2.96)
W 2
E E I o
= o.
W 2 I W 2
e (2.97)
E E O o
= . = (T O o ) ( I o )
I o
O W 2
o
E I o
Usando (2.92): = (T O o
)O o
(1 O o
) = o
, e ainda = Oh (2.98)
I o
W 2
E
E assim: W 2 = = o O h (2.99)
W 2
6. Calculando o erro da camada intermediria:

E
W 1 = (2.100)
W 1
71
E E I h
= h.
W 1 I W 1
e (2.101)
E E O h
= . = O o (1 O o ) oW 2 = h
I h
O W 1
h
I h
e ainda = Oi (2.102)
W 1
E
E assim: W 1 = = hO i (2.103)
W 1
7. Ajustando W 2 , isto , os pesos entre a camada intermediria e a camada de sada:

W 2(t + 1) = W 2(t ) = oO h + (W 2(t ) W 2(t 1)) (2.104)
onde a taxa de aprendizagem e (W 2(t ) W 2(t 1)) o termo de momento onde,
o coeficiente de momento que recebe um valor no intervalo [0,1], usado para das
atualizao dos pesos uma memria de sua ltima atualizao, fornecendo uma
suavizao nas foras que afetam as mudanas nos pesos.
8. Ajustando W 1 :
W 1(t + 1) = W 1(t ) = hO i + (W 1(t ) W 1(t 1)) (2.105)
Se a lista de pocas foi exaurida, deve-se ir at o prximo passo, caso contrrio,

apresentar o prximo conjunto de treinamento camada de entrada e voltar ao passo
inicial.
Tendo completado uma poca, e acumulado os erros de todos os padres de entrada, os

erros obtidos so avaliados e comparados com os nveis de tolerncia.
O que d rede neural seu poder de previso o processamento paralelo.

Adicionalmente ao processamento seqencial dos sistemas lineares tpicos, no qual
apenas entradas observadas so utilizadas para predizer uma sada observada, pela
ponderao dos neurnios de entrada, os neurnios na camada oculta processam as
entradas de forma paralela, de tal forma a melhorar as predies. Esta rede de camada
simples alimentada adiante, ou multiperceptron, com uma camada escondida a rede
neural mais bsica e comumente utilizada em aplicaes econmicas e financeiras. Mais
genericamente, a rede representa o modo como o crebro humano processa os dados
72
sensoriais de entrada, recebidos como neurnios de entrada, e internamente

reconhecidos como um neurnio de sada. Com o desenvolvimento do crebro, mais e
mais neurnios so interconectados e mais sinapses, e os sinais de diferentes neurnios,
trabalham de forma paralela, em mais e mais camadas escondidas, so combinados
pelas sinapses para produzir insights e reaes.
2.2.8.2 REDES NEURAIS RECORRENTES
Redes neurais recorrentes so redes neurais com um ou mais laos de realimentao,

podendo ser local ou global (HAYKIN, 2001).
Talvez, os algoritmos mais amplamente utilizados sejam o algoritmo de aprendizagem
recorrente em tempo real (RTRL real time recurrent learning) e o algoritmo de
retropropagao atravs do tempo (BPTT backpropagation through time) (WILLIAM
e ZIPSER, 1995).
Uma rede neural pode ser classificada, de acordo com a arquitetura da rede. A forma
mais simples de rede a rede alimentada adiante feedforward. Essas redes constituem-
se de mltiplas camadas, onde a entrada de cada camada a sada da camada
predecessora e a interconexo dos neurnios acclica.
As redes recorrentes tendem a ser mais difceis de treinar do que as redes alimentadas
adiante, principalmente em funo dos ciclos. As redes recorrentes mais utilizadas so a
rede de Jordan, a rede de Elman e a rede de Elman estendida, conforme podem ser
vistas nas figuras a seguir (DE OLIVEIRA, 2003).
A diferena entre a rede de Elman e a rede de Jordan que, na rede de Jordan, a

realimentao ocorre apenas dos ns de sada para os ns de entrada, enquanto que na
rede de Elman a realimentao sai dos ns das camadas escondidas. Existe tambm a
rede de Elman estendida, na qual a realimentao sai dos ns da camada escondida e
tambm dos ns (ou neurnios) de sada.
73
y (k )
vis
-1

bias

y ( k 1)
-1 -1
x ( k 1) x ( k p + 1) x (k p)
x (k )
Figura 4: Rede de Jordan

Fonte: DE OLIVEIRA, 2003.
y (k )
vis
-1 -1 -1

vis
-1 -1
x (k p)
x (k ) x ( k 1) x ( k p + 1)
Figura 5: Rede de Elman

Fonte: DE OLIVEIRA, 2003
74
y (k )
vis
-1
-1 -1 -1

vis y ( k 1)
-1
-1
x (k p)
x (k ) x ( k 1) x ( k p + 1)
Figura 6: Rede de Elman estendida

Fonte: DE OLIVEIRA, 2003
A rede de Elman pode ser treinada com qualquer algoritmo de aprendizagem para
MLPs, tal como o retropropagao. De forma semelhante rede de Jordan, a rede de
Elman pertence classe das redes recorrentes simples (SRN simple recurrent
networks). Embora ela contenha conexes de realimentao ela no pode ser vista como
um sistema dinmico nas quais as ativaes so espalhadas indefinidamente. Em vez
disso, as ativaes para cada camada so computadas, apenas uma vez, a cada passo de
tempo (cada apresentao de um vetor de seqncias).
Freeman (1994) as redes de mapeamento, tais como redes com retropropagao, e

memrias associativas, geralmente trabalham com padres estticos ou espaciais. Elman
(1990) discute o uso das redes recorrentes simples, apresentada na Figura 5, para
descobrir fronteiras entre palavras em uma sucesso de fonemas. Haykin (2001)
comparou quatro arquiteturas principais de redes pertencentes classe das redes
recorrentes com realimentao global: as redes auto-regressivas no-lineares com
entradas exgenas (NARX), usando realimentao da camada de sada para a camada de
entrada; as redes recorrentes totalmente conectadas com realimentao da camada
oculta para a camada de entrada; o perceptron de mltiplas camadas recorrentes com
mais de uma camada oculta, usando realimentao da sada de cada camada
75
computacional para a sua prpria entrada e as redes recorrentes de segunda ordem,

usando neurnios de segunda ordem.
Williams e Zipser (1995) afirmam que, em se tratando de previso de sucesses

cronolgicas, as redes recorrentes no sofrem nem de escassez nem de excesso de
ajuste, sendo que as redes recorrentes de tempo real so as mais adequadas para dados
dinmicos, por aprender a dinmica subjacente de um ambiente no-estacionrio,
armazenando o conhecimento obtido da amostra de treinamento em um conjunto de
pesos.
Enquadrando as redes neurais no contexto dos mtodos estatsticos tradicionais, elas

podem ser consideradas como uma tcnica de estimao no paramtrica, no-linear,
multivariada e mltipla, ou seja, uma funo dos dados sem um modelo de descrio
especfico. Ser multivariada indica que a entrada da rede neural contm duas ou mais
variveis distintas, cujas interdependncias e causalidades so exploradas para prever o
comportamento futuro de uma ou mais variveis intertemporais. No paramtrica e sem
modelo especfico uma conseqncia de algumas suposies referentes s relaes
entre as variveis de entrada e as extrapolaes dentro de um horizonte de tempo futuro
(DE OLIVEIRA, 2003).
Nas abordagem de redes neurais, ao invs de explicitamente deduzir equaes que

descrevam o comportamento subjacente do sistema em estudo, um capturador
automtico de um modelo no-linear, usando um algoritmo de aprendizagem neural
construdo para aproximar as equaes ideais. Muitos algoritmos neurais para
processamento temporal tm sido propostos, entre estes se destacam o algoritmo de
retropropagao (BPTT, backpropagation through time), aprendizado recorrente, em
tempo real (RTRL, real-time recurrent learning) e os algoritmos de redes recorrentes,
utilizando o filtro de Kalman. As redes neurais so atrativas para modelar sistemas no-
lineares porque elas so inerentemente no-lineares, devido s funes de ativao no-
lineares, e tambm so bem estabelecidas como funes de aproximao (DE
OLIVEIRA; SIQUEIRA,2003).
Segundo Hill, OConnor e Remus (1996), a modelagem atravs de redes neurais

artificiais uma das tcnicas que defendida como alternativa s j tradicionais
76
tcnicas de previses estatsticas. Os autores frisam, ainda, que um aspecto significativo

das redes neurais a sua capacidade de construir relaes no-lineares entre os dados de
entrada e as sadas desejadas. Os modelos lineares (por exemplo,
yt = 1 yt 1 + 2 yt 2 + sendo que yt uma srie e os i so os parmetros) apenas
descrevem a relao mais simples que pode ocorrer em uma srie temporal.
Kutsurelis (1998) trabalhou com o desenvolvimento de redes neurais para previso no

mercado de capitais e chegou a um nvel de eficincia, em sua rede, de 88,07% na
previso do S&P 500 com redes MLP e concluram que as redes neurais so eficientes
previsores para sries financeiras.
De Oliveira e Siqueira (2003) justificam o uso de redes neurais para previso de sries
financeiras, principalmente por dois motivos: primeiro, a utilizao de camadas
intermedirias de neurnios que capturam todas as relaes indiretas entre variveis
explanatrias e variveis dependentes; segundo, a aplicao de uma funo de ativao
que possibilita a aproximao de qualquer funo no-linear.
Essa afirmao tambm encontrada em Vojinovic, Kecman e Seidel (2001) que frisa,
ainda, que com o uso de redes neurais, um conhecimento, a priori, da relao entre as
variveis no requerido j que elas so auto adaptativas, ou seja, elas so capazes de
gerar modelos no-lineares, sem um conhecimento prvio sobre os relacionamento entre
as variveis de entrada e sada, podendo ser, portanto, mais genricas e flexveis que
metodologias estatsticas tradicionais.
Em particular, as redes neurais artificiais oferecem potencial significativo para a

abordagem do problema de previso de sries financeiras, como sugerem pesquisas em
diferentes reas do mercado financeiro, dentre outras:
Mercado de cmbio: utilizando marco e dlar (KLIMASAUSKAS,

1992); dlar com franco suo (LEQUARR, 1994);
Cotaes de aes: Aes da Apple Computer (DEBOECK, 1992), da
Kyokuyo Company, uma empresa japonesa de porte mdio
77
(HUTCHINSON, 1994); Hochtief, empresa alem (SCHUMANN;

LOHRBACH, 1996), Telebrs (DINIZ et al., 1998);
Indicadores macroeconmicos: ndice de desemprego americano
(DRAISMA, KAASHOEK; DIJK, 1993); (SILVA; FERREIRA;
SFADI, 2000);
ndices de Bolsas de Valores: ATX ndice da Bolsa de Valores da
Austrlia (HAEFKE e HELMENSTEIN, 1996), DAX- ndice da Bolsa
de Valores da Alemanha (SIEGLER; STEURER, 1998), S&P500
(MOODY; SAFFELL, 1998) e KUTSURELIS(1998).
Yang (1999) concorda com a viso anterior, afirmando ter conseguido resultados
promissores na previso de sucesses cronolgicas financeiras, com o uso de redes
neurais probabilsticas, que so conceitualmente construdas com base na classificao
dos mtodos bayesianos.
Testando a eficcia de tcnicas de previso probabilsticas da direo/sinal do retorno de

ndices de bolsa de valores (S&P 500, FTSE 100 e NIKEI 225), Leung, Daouk e Chen
(2000) compararam dois tipos de modelos: de classificao e de modelos de estimao
em nvel. Os modelos de classificao testados foram de anlise discriminante linear,
logit, probit e redes neuraus probabilsticas (PNN) e os modelos de estimao em nvel
foram o de alisamento exponencial, funo de transferncia multivariada, vetor
autoregressivo com filtros de Kalman e redes neurais com alimentao adiante
(feedforward). Os resultados sugeriram uma superioridade na performance das
previses feitas pelos modelos de classificao. De acordo com os autores, os melhores
desempenhos, nos testes de verificao, ocorreram a partir dos modelos de redes neurais
com mdia de 64%.
Diniz (1999) tambm usou as redes neurais, para efeitos de previso um passo frente
das aes dos preos mnimo e mximo. Testou diversas combinaes de atrasos das
camadas intermediria e de sada, e a melhor rede MLP selecionada possua dois
neurnios na camada de entrada e apenas um neurnio, tanto na camada de entrada
quanto na de sada. Os erros medidos pelo MAPE indicaram para os a srie dos valores
mnimos 1,09% e para os valores mximo 1,83%.
78
Yim (2001) encontrou resultados que mostram os modelos ARIMA melhores no curto
prazo (um passo frente) do que os modelos de redes neurais, chegando concluso de
que, embora as redes neurais tenham acompanhado melhor a direo dos valores reais
observados nos retornos do IBOVESPA, para todas as freqncias, a hiptese de que os
modelos de redes neurais superior aos modelos economtricos tradicionais, no pode
ser verificada, pois os resultados das estatsticas de previso medidos pelo MAPE
ficaram muito prximos aos obtidos nos modelos de sries temporais.
Moshiri e Cameron (2000) compararam o uso das redes neurais MLP com algoritmo de
retropropagao, na comparao da previso da inflao canadense com os modelos
ARIMA e estruturais. Os dados utilizados foram mensais de janeiro de 1970 a dezembro
de 1994 e divididos em duas partes: inicialmente de janeiro de 1970 a dezembro de
1990, para estimao e treinamento, e o restante para previso. O perodo de estimao
comeava com baixas taxas de inflao, em torno de 5% e terminava com altas taxas de
inflao. O perodo de previso coincide com perodos de mais baixas taxas de inflao.
De maneira geral, a diferena no trabalho destes autores que utilizaram a estratgia de
previso recursiva, isto , realizaram a previso para um perodo (um ms), re-
estimavam o modelo, e faziam novas previses para mais um perodo frente. O
processo foi repetido para trs perodos (um trimestre) de previso e para doze (um ano)
perodos de previso. O procedimento para medir a acurcia dos modelos foi o MAE e
os modelos gerados no Eviews e Matlab . Os resultados mostraram que as redes
neurais foram superiores aos modelos ARIMA, nos perodos de longo prazo (1 ano). No
caso das previses de um e trs passos frente, os modelos ARIMA levaram uma
pequena vantagem sobre as redes neurais. Os piores resultados foram todos para os
modelos estruturais.
De Oliveira (2003) afirma que um dos algoritmos mais amplamente utilizados o de

aprendizagem recorrente em tempo (real time recurrent learning-RTRL), conforme j
citado anteriormente. Esse algoritmo baseado na computao do gradiente de uma
medida de erro de sada em relao aos pesos da rede, seguindo o trabalho de Williams
e Zipser (1995). Para que os dados fossem inseridos na rede, utilizou o processo de
normalizao proposto por Azoff (1994). As previses de um passo frente da srie do
IBOVESPA obtiveram pela rede com o uso do algoritmo RTRL um resultado
79
satisfatrio, no que concerne aproximao dos valores futuros dada uma seqncia
histrica de dados.
O autor tambm explica que as previses foram realizadas atravs de modelos ARIMA-
GARCH e redes neurais artificiais (RNAs) que utilizam o algoritmo de aprendizagem
recorrente em tempo real (ARTR). As metodologias estudadas foram aplicadas
separadamente para cada srie. Assim se pode avaliar que a seqncia empregada no
modelamento ARIMA-GARCH dispe, por construo, de rigor estatstico, em cada
etapa do processo, para realizar a previso, no caso das redes neurais, do trabalho
principal constitui-se basicamente na implementao de um algoritmo de otimizao.
Uma vez que o algoritmo da rede neural foi transformado em um programa de
computador, os dados de entrada so inseridos e tem-se um valor de resposta, ou seja,
uma sada. Em muitos casos, uma determinada rede neural implementada pode ser
utilizada para a tarefa de previso de sries temporais com comportamentos distintos,
por exemplo, tanto para sries de alta, quanto de baixa freqncia. Ou seja, no existem
critrios bem definidos para escolha do tipo de rede neural que deve ser utilizada para
previso de sries temporais que apresentam comportamentos especficos.
Uma diferena significativa que deve ser destacada entre as RNAs recorrentes e os
modelos ARIMA-GARCH a capacidade das RNA de capturar padres no-lineares
subjacentes ao comportamento da srie, enquanto que isso no acontece na modelagem
ARIMA-GARCH.
No caso da srie de retornos do IBOVESPA, pode-se observar que o modelo da RNA

gerou uma curva de valores de previso que acompanhou, de forma mais prxima, os
valores desejados. As previses obtidas pela RNA, para a srie de retornos do
IBOVESPA, apresentaram estatstica MAPE menor que o modelo ARIMA-GARCH e o
TIC da RNA tambm indica um ajuste mais perfeito que o obtido pelo modelamento
que usou as tcnicas de volatilidade.
Especificamente, em relao aos trabalhos que compararam as previses com modelos

ARIMA e de redes neurais, destaca-se que, mesmo com metodologias diferentes de
previses, as redes neurais se mostraram potencialmente superiores aos modelos
80
ARIMA, por apresentarem maior versatilidade e no requererem especificaes de

modelos formais.
De acordo com Vieria e Thom (2000), a previso de sucesses cronolgicas

econmico-financeiras considerada uma tarefa de grande dificuldade por vrios
motivos: pequena quantidade de observaes da srie; presena de intenso rudo; carter
no estacionrio e da tpica no-linearidade inerente a essas sries.
Um resultado coerente foi encontrado em De Oliveira e Siqueira (2003), ao explicarem

que sries temporais financeiras como preos de aes, crescimento econmico, taxas
de cmbio e curva de Phillips so no-lineares ou caticas.
Para Correia e Pereira (1997), os modelos no-lineares podem explicar melhor as

sries financeiras, especialmente em perodos de turbulncia, e eventualmente,
apresentar previses melhores do que os modelos lineares, que so incapazes de captar
mudanas bruscas e outros efeitos no-lineares.
No mercado brasileiro, o estudo realizado por Throstensen (1976) sobre a eficincia

fraca do mercado de capitais, com dados obtidos do ndice BOVESPA, no perodo de
1971 a 1975, demonstrou os seguintes pontos: nos testes de correlao serial para
diferentes tipos de perodos, os resultados mostraram pouca evidncia de dependncia
para as variaes do ndice; j, nos testes de seqncia efetuados, apesar de, nos anos de
1971 e 1972, terem demonstrado evidncias de padres de dependncia, anos
considerados atpicos, estes no foram suficientes para se obter ganhos significativos.
Nos demais perodos de anlise, o estudo demonstrou ausncia de padres de
dependncia, evidenciando que o ndice BOVESPA se adapta ao modelo de passeio
aleatrio.
Correia e Pereira (1997) realizaram uma discusso sobre a previsibilidade e no-

linearidade do IBOVESPA. No teste de normalidade, os autores encontraram assimetria
negativa e coeficiente de curtose ligeiramente inferior a trs unidades nos retornos
dirios do IBOVESPA, no perodo de 17/04/1991 a 29/11/1993, no rejeitando a
hiptese de distribuio normal. O teste de Mcleod e Li (1983) apresenta indcios de
no-linearidade nos retornos dirios, e o teste de Hisieh (1989) rejeita a hiptese de
81
linearidade na mdia. Adicionalmente, os autores verificam um ganho de previsibilidade

na considerao do efeito do dia da semana, em funo da tendncia dos retornos a
serem ligeiramente menores na segunda feira, tal qual observado nos estudos norte-
americanos. Finalmente, os autores verificaram que modelos no-lineares, como
GARCH (1,1), geraram melhores previses de retornos em relao a modelos lineares.
Outros autores como Kutsurelis (1998), Leung, Daouk e Chen (2000) utilizaram outras
tcnicas de modelagem de sries temporais, tomando como base os modelos ARIMA,
sugeridos por Box e Jenkins (1976) e com uso de redes neurais voltados para o ndice
S&P 500, indicando boa performance para as redes neurais e modelos ARIMA em
detrimento de outras tcnicas tradicionais como alisamento exponencial.
A anlise de sries temporais, para efeitos de previso, o enfoque deste trabalho, por
isso, dada maior nfase a estas tcnicas. Uma viso destes modelos apresentada, a
seguir, com a discusso dos trabalhos encontrados na literatura sobre previso.
2.3 DA ANLISE DE FOURIER ANLISE DE ONDALETAS
2.3.1 ANLISE DE FOURIER
A anlise de sries temporais j tem, sua disposio, um impressionante arsenal de

ferramentas (WINKLHOFER et al., 1996). Talvez a mais conhecida de todas seja a
anlise de Fourier, ou anlise harmnica, a qual quebra a srie em seus componentes
senoidais, cada uma com dada freqncia (combinao linear de harmnicos). Uma
outra maneira de se definir a anlise de Fourier como uma tcnica matemtica para
transformar a srie temporal em uma base de freqncias. Essa tcnica foi criada por
Jean Baptiste Joseph Fourier e publicada, em 1822, num livro intitulado Thorie
Analitique de la Chaleur (OLIVEIRA; FAVERO, 2003).
Chiann (1997) afirma que a anlise de Fourier fundamental em reas onde o interesse
bsico a procura de periodicidades nos dados. Para muitas sries, a anlise de Fourier
extremamente usada porque a freqncia contm grande importncia no estudo e
apropriada para processos estacionrios.
82
Uma importante ferramenta da anlise das sries temporais a decomposio espectral

das sries em sries de Fourier (SILVA; FERREIRA; SFADI, 2000). Para estes
autores, essa anlise, utilizando o termo espectro como uma metfora, como colocar a
srie em um prisma com a finalidade de identificar o tamanho das ondas e a importncia
dos componentes cclicos.
Fourier acreditava ser possvel representar os mais diferentes tipos de funes atravs da
soma das funes seno e cosseno. Dessa forma, pode-se observar que uma funo
genrica f ( x) pode ser representada da seguinte forma:
f ( x) = A + a1 cos(1x) + a2 cos(2 x) + a3 cos(3x) +
(2.106)
+ b1sen(1x) + b2 sen(2 x) + b3 sen(3 x) +
ou ainda, pode-se representar a equao (2.106) por:

f ( x) = A + ak cos(kx)bk sen(kx) (2.107)
k =1
Todavia, surge ento a seguinte questo: dada uma funo f ( x) , definida em um certo
intervalo, quais seriam os valores dos coeficientes A, ak e bk de modo que a equao
(2.107) a represente?
Esses valores foram encontrados por Fourier para uma funo definida no intervalo
[ ; ] .
Tem-se:

f ( x)dx = A + ak cos(kx)bk sen(kx) dx (2.108)

k =1
ou ainda:

f ( x)dx = Adx +

a
k =1
k cos(kx)bk sen(kx)dx (2.109)

f ( x)dx = Adx + ak cos(kx)bk sen(kx)dx (2.110)

k =1
Donde:

1 1
f ( x)dx =A ( x )

+ ak sen(kx) bk cos(kx) (2.111)
k =1
k k
83

1 1 1 1
f ( x)dx = A( ( )) + ak sen(k ) bk cos(k ) ak sen( k ) + bk cos( k )
k =1
k k k k
(2.112)
Como a funo seno uma funo mpar ( sen( x) = sen( x) ) e a funo cosseno par
( cos( x) = cos( x) ), portanto:

1 1 1 1
f ( x)dx = 2 A + ak sen(k ) bk cos(k ) + ak sen(k ) bk cos(k )
k =1
k k k k
(2.113)

f ( x)dx =2 A + 0

(2.114)
e assim:
1
A=
2 f ( x)dx

(2.115)
Os valores de ak e bk ficariam:
1
ak =
f ( x) cos(kx)dx

(2.116)

bk = f ( x) sen(kx)dx (2.117)

Cabe ressaltar ainda que: para funes pares tem-se ak 0 e bk = 0 para funes
mpares ak = 0 e bk 0 .
Para perodos genricos, a funo de Fourier pode se expressa por:

k x k x
f ( x) = A + ak cos bk sen (2.118)
k =1 L L
E para esse perodo genrico, definindo como intervalo [ L; L ] , tem-se:
1 L
2 L L
A= f ( x)dx (2.119)
1 L k x
ak =
L L
f ( x) cos
L
dx (2.120)
1 L k x
bk =
L L
f ( x) sen
L
dx (2.121)
Para medir a freqncia e encontrar as freqncias contidas em um sinal, necessrio

utilizar a Transformada de Fourier (FT). Se a freqncia de um sinal no domnio do
tempo dada, a representao da amplitude do sinal obtida. Ao traar o grfico
84
freqncia amplitude, sendo a freqncia indo de zero a infinito, para toda freqncia
ter-se- uma amplitude. Em outras palavras, a FT d a informao de freqncia do
sinal, a qual significa que se tem o quanto de cada freqncia existe no sinal, mas isso
no nos diz quando no tempo estas componentes freqncias existem, isto , a FT
fornece quais os componentes de freqncia (componentes espectrais) que existem no
sinal.
Segundo Shiavi (1999), na maioria das vezes, uma informao que no pode ser lida no
domnio do tempo pode ser extrada no domnio da freqncia. Um exemplo disso o
eletrocardiograma, onde qualquer alterao na forma de onda conhecida pode indicar a
presena de alguma patologia clnica. Os cardiologistas usam os sinais do
eletrocardiograma no domnio do tempo, os quais so registrados e analisados
posteriormente para possveis constataes de outras patologias.
Todavia, se esta informao necessria, isto , se pretende saber qual o componente

espectral que ocorre em qual tempo (intervalo), ento a transformada de FT no a
transformada correta para ser utilizada. Surge, ento, que a transformada de ondaleta
capaz de fornecer a informao de tempo de freqncia simultaneamente, conduzindo a
representao de freqncia-tempo do sinal.
Todavia, a anlise de Fourier tem uma sria desvantagem, pois quando transforma a
srie para o domnio da freqncia, a informao do tempo perdida. Ao se observar a
transformada de Fourier de uma srie impossvel de se saber quando determinado
evento ocorreu (GENAY; SELUK; WHITCHER, 2002).
Segundo Misiti et al. (1997), Dennis Garbor (1946) adaptou a transformada de Fourier
para analisar apenas uma pequena seo da srie no tempo, que chamou de Short-time
Fourier Transform (STFT), que conseguia mapear a srie com uma funo de duas
dimenses: o tempo e a freqncia. Essa transformada conseguiria captar algumas
informaes, tanto no tempo, como na freqncia, porm com certa limitao, pois a
janela que era criada para se fazer a anlise era de um tamanho fixo, captando, assim,
sempre a mesma freqncia, como se observa na figura a seguir:
85
(a) domnio da freqncia (b) STFT (Garbor)
Figura 7: Anlise de Fourier no domnio do tempo e a STFT proposta por Garbor

Fonte: Misiti et al., 1997.
Dessa forma, o prximo passo ento era obter uma janela de anlise com tamanho
flexvel, e as ondaletas conseguem esse feito, pois, em um mesmo intervalo de tempo,
conseguem detectar informaes de baixa e de alta freqncia, que podem assim ser
mais bem ajustadas em cada trecho da srie. A figura, a seguir, ajuda a ilustrar o papel
da ondaleta:
Figura 8: Anlise por Ondaletas

Fonte: Misiti et al.,1997.
Para Genay, Seluk e Whitcher (2002), apesar da funcionalidade da transformada de

Fourier, especialmente no que diz respeito obteno da anlise espectral de um sinal,
existem muitas falhas nesta tcnica como:
a incapacidade da transformada de Fourier em representar funes que tm
componentes no peridicas, que esto localizadas no tempo e no espao, tais
como pulsos breves;
a incapacidade de fornecer qualquer informao sobre a dependncia temporal
de um sinal, visto que ela faz a mdia sobre todo o tempo de durao do sinal;
as funes seno e cosseno usadas no so locais e, portanto, desempenham uma
tarefa muito pobre de aproximao de sinais muito localizados;
a anlise de Fourier altamente instvel em relao perturbaes na srie; e
86
pequenas mudanas em algumas das observaes podem provocar mudanas em

todas as componentes de uma expanso de Fourier, o que no acontece nas
ondaletas.
Diante desses pressupostos, a contrapartida a ser usada seriam as ondaletas, vistas como
um mecanismo para quebrar a srie em duas partes constituintes, permitindo-nos
analisar os dados em diferentes domnios de freqncia. Dessa forma, apresenta-se, a
seguir, uma discusso sobre a teoria das ondaletas.
2.3.2 ANLISE DE SUCESSES CRONOLGICAS VIA ONDALETAS
Ondeletas, Ondelettes, ndulas, Ondaletas podem ser traduzidas respectivamente nas

lnguas ingls, francs, portugus de Portugal e portugus do Brasil. Morettin (1999)
sugere, ainda, as formas alternativas para o vocbulo que seriam ondcula ou ondinha. A
grosso modo, representa um algoritmo matemtico para se criar funes bases para
representaes de funes em outros modelos (MISITI et al., 1997).
A primeira meno sobre o termo ondaletas foi dada em 1909, por Alfred Haar. O
conceito de ondaletas, na forma atual, foi primeiramente proposto por Jean Morlet e sua
equipe no Marseille Theoretical Physics Center, trabalhando em Alex Grossmann, na
Frana (MISITI et al., 1997).
Por falta de embasamento matemtico, Morlet inicialmente encontrou muitos

opositores. Esses, como lembra Daubechies (1992), teciam crticas do seguinte tipo: se
isso tivesse correto, j estaria nos livros de matemtica. Como no est, provavelmente
intil. Posteriormente, os mtodos de anlise de ondaletas foram desenvolvidos,
principalmente por Yves Meyer, um matemtico que ajudou a enriquecer e amadurecer
a nova teoria e que assegurou a disseminao dos mtodos em diversos campos da
matemtica. Logo em seguida, em 1988, Stphane Mallat, um estudante de
processamento de imagens, desenvolveu um algoritmo para calcular a transformada de
ondaleta, de forma computacionalmente eficiente, abrindo as portas comunidade de
processamento de sinais (GALVO et al., 2001).
87
A anlise de dados, de acordo com escalas variveis, no domnio do tempo e da

freqncia, a idia bsica da utilizao da teoria das ondaletas. As ondaletas so
funes matemticas que ampliam intervalos de dados, separando-os em diferentes
componentes de freqncia, permitindo a anlise de cada componente em sua escala
correspondente. Essa caracterstica distingue mtodos de ondaletas de outros mtodos
em estatstica, baseados em sries ortogonais, tais como as usuais sries de Fourier.
(MISITI et al., 1997).
Para Torrence e Compo (1998), a vantagem das ondaletas sobre os mtodos tradicionais
de Fourier, que a base das funes de Fourier so dependentes da freqncia, mas no
do tempo, ou seja, pequenas alteraes no domnio da freqncia produzem alteraes
em todo o domnio do tempo. Segundo os autores, as ondaletas so dependentes de
ambos os domnios, da freqncia (via dilao) e do tempo (via translao), o que uma
vantagem em diversos casos. Por muitas dcadas, os cientistas procuraram funes mais
apropriadas do que senos e cossenos para anlise de sinais. As bases das funes de
Fourier so imprprias para o tratamento local de dados, pois so sries infinitas e no
se adaptam a anlise de dados descontnuos. As ondaletas no s se prestam a
aproximao de funes finitas, como tambm servem para anlise de dados
descontnuos.
Comparando as ondaletas com as ondas senoidais, essas no tm durao limitada, indo

de menos ao mais infinito. Onde as ondas senoidais so lisas e suaves, as ondaletas
tendem a ser irregulares e assimtricas como se pode observar a seguir: (MISITI et al.,
1997):
onda senoidal ondaleta de Morlet

Figura 9: Formas de ondas: senoidal e de uma ondaleta
88
Para Moura (2002), a anlise de Fourier consiste em quebrar uma srie em suas
componentes de senos e cossenos, em suas vrias freqncias. Similarmente anlise de
ondaleta, considera dilataes (compresses) e translaes de uma onda original,
chamada de ondaleta me.
De uma maneira geral, a filtragem dos dados via ondaletas, em contraste com a
filtragem via transformada de Fourier, no desloca nem deforma pontos notveis
(mximos, mnimos e inflexes) do sinal a ser filtrado, apresentando ainda a vantagem
quando a srie possui baixo fator de preenchimento (filling factor), isto , apresenta
picos alternados com regies de baixa intensidade (GALVO et al., 2001).
A problemtica em questo consiste em obter uma freqncia crtica de maneira que os

componentes da srie original relacionados a freqncias menores ou iguais a uma
freqncia crtica para que formem uma Subsries { A}t2=1 relativa a baixas freqncias,
n
que tambm recebem o nome de srie aproximada (aproximation part) e os demais
{D}t =1 ,
n
componentes formem outra Subsries relativa a altas freqncias, denotada 2
tambm chamada de srie detalhe (detail part) (HOMSY; PORTUGAL; ARAJO,

2000).
Para Misiti et al. (1997), este processo de decomposio que, a partir de uma srie X t ,
passando por um filtro de uma ondaleta, d origem a duas novas sries, uma chamada
aproximao (baixas freqncias) e outra detalhe (altas freqncias).O autor cita ainda
que o processo de decomposio da srie pode ser iterativo, com sucessivas
decomposies, formando uma rvore de decomposio com 2n caminhos diferentes
para a codificao da srie. A rvore de decomposio fica da seguinte forma:
89
baixa freq.
alta freq.
Figura 10: Decomposio via ondaletas
Fonte: MISITI et al., 1997.
O autor cita, ainda, que o processo de decomposio da srie pode ser iterativo, com
sucessivas decomposies, formando uma rvore de decomposio apresentada na
figura a seguir.
Srie
Original
A1 1 Nvel D1
AA1 AD1 2 Nvel DA1 DD1
AAA2 AAD2 ADA2 DAD2 3 Nvel ADA2 ADD2 DDA2 DDD2
Figura 11: rvore de decomposio em 3 nveis de uma srie temporal via

decomposio por ondaleta.
Fonte: MISITI et al., 1997.
Polikar (1994) afirma que, nas ondaletas, as altas freqncias so mais bem resolvidas
no tempo, e baixas freqncias so mais bem resolvidas em freqncia. Isto significa
que um certo componente de alta freqncia pode ser localizado melhor no tempo (com
menor erro relativo) que um componente de baixa freqncia. Do mesmo modo, um
componente de baixa freqncia pode ser localizado melhor em freqncia se
comparado ao componente de alta freqncia.
90
Galvo et al. (2001) frisam que, em cada nvel, cada subconjunto de dados passa por
uma nova diviso, de maneira a gerar novos coeficientes e assim sucessivamente.
Nesses casos, o resultado da transformada de ondaleta um conjunto de coeficientes
indexados por um fator de escala e por um fator de translao.
2.3.3 A MATEMTICA DAS ONDALETAS
Uma base de um espao vetorial V um conjunto de vetores linearmente independentes,

tal que um vetor v V pode ser escrito como uma combinao linear desses vetores
bases. Pode haver mais do que uma base para um espao vetorial. Porm, todos tm o
mesmo nmero de vetores, e este nmero conhecido como dimenso do espao
vetorial.
O conceito de vetores pode ser generalizado para funes, da seguinte forma:

f (t ) = kk (t ) (2.122)
k
No caso das FT, as funes exponenciais complexas senos e cossenos so as devidas

funes base, sendo funes ortogonais, as quais fornecem algumas propriedades
necessrias para reconstruo (POLIKAR, 1994).
Seja f (t ) e g (t ) duas funes em L2 [ a, b ] 7. O produto interno das duas funes :
b
f (t ), g (t ) = f (t ).g * (t )dt (2.123)
a
De acordo com a definio acima, a transformada contnua de ondaleta (CWT) pode ser
interpretada como o produto interno do sinal de teste com as funes base ( , s )(t ) :
CWTx ( , s ) = x ( , s ) = x(t ). *, s (t )dt (2.124)
1 t
onde , s = .
s s
Esta definio de CWT mostra que a anlise de ondaleta uma medida de similaridade
entre as funes base (ondaleta) e o prprio sinal. Aqui similaridade est no sentido de
7
Denota o conjunto de funes quadrticas integrveis no intervalo [a,b].
91
contedo de freqncia similar. Os coeficientes CWT calculados referem o quanto

prximo do sinal est a ondaleta na escala atual. Se o sinal tem maior componente de
freqncia correspondente escala atual, ento a ondaleta (funes base) na escala atual
sero similares ou prximas ao sinal na posio particular, onde esta componente de
freqncia ocorre. Dessa forma, o coeficiente CWT calculado naquele ponto no plano
escala-tempo ser um nmero relativamente grande (POLIKAR, 1994).
Segundo Morettin (1999), toda funo peridica, de perodo 2 , de quadrado

integrvel, ou seja, de L2 (0, 2 ) , gerada por uma superposio de exponenciais
complexas Wn ( x) = einx , n = 0, 1, 2, , obtidas por dilataes da funo Wn ( x) = eix .
O objetivo, segundo o autor, estender essa funo para L2 ( ) , isto , gerar um espao,
a partir de uma funo , que pode ser conseguida por dilataes (parmetro a ) ou
compresses e translaes (parmetro b ) de , dada por:

1
xb (2.125)
a ,b ( x ) = a 2 , a, b IR, a 0
a
Sendo que chamada de ondaleta me e os parmetros a e b tomam os seguintes

valores especiais, a = 2 j e b = k 2 j , que compem a equao:
j (2.126)
(
j ,k ( x) = 2 2 2 j x k , j , k )
obtida pela dilatao binria 2 j e pela translao ditica k 2 j , conforme sugere
Morettin (1999).
Uma maneira de gerar ondaletas pela funo escala, ou chamada de ondaleta pai, ,
que uma soluo da equao
(t ) = 2 l (2t k )
k
k
(2.127)

onde lk = 2 (t ) (2t k )dt

Essa funo gera uma famlia ortonormal de L2 ( ) ,

j (2.128)
(
j ,k ( x) = 2 2 j x k , j , k
2
)
92
Nessas condies, pode ser obtida de por:

(t ) = 2 h (2t k )
k
k
(2.129)
onde
hk = (1) k l1 k (2.130)
que chamada de quadrature mirror filter relation (MORETTIN, 1999).
Segundo Genay, Seluk e Whitcher (2002), uma srie temporal financeira pode ser
decomposta por uma anlise de ondaletas, por uma seqncia de projees de ondaletas
pai e me, a partir das funes e , como seguem as equaes (2.126) e (2.128).
A representao de uma srie temporal X t em L2 ( ) pode ser dada por:
Xt = a k
j ,k j ,k (t ) + d
k
j ,k j ,k (t ) + dk
j 1, k j 1, k (t ) + + d
k
1, k 1,k (t ) (2.131)
Xt = a k
j ,k j ,k (t ) + d
i k
i ,k j i +1,k (t ) (2.132)
onde j o nmero de componentes e k que varia de 1 ao nmero de coeficientes do

componente especfico. Os coeficientes a j ,k , d j ,k , , d1,k so os coeficientes das
transformadas de ondaletas dadas pelas projees

(2.133)
a j ,k = j ,k (t ). X t dt , chamada parte de aproximao
e
(2.134)
d j ,k = j ,k (t ). X t dt , chamada parte de detalhe
E no nvel j tem-se a metade do nmero de coeficientes do nvel j + 1 , donde o nome

piramidal.
Para entender como a funo (2.126) atua, considere, por exemplo, a ondaleta mais
simples, chamada de ondaleta de Haar, cuja equao :
1, se 0 x < 1 2 (2.135)

( x) = -1, se 1 2 x <1
0, caso contrrio

93
Se j = k = 0 , de (2.126) tem-se:
0 (2.136)
( )
0,0 ( x) = 2 2 20 x 0 = ( x)
que a prpria ondaleta primria (2.135).
Se j = 1, k = 0 tem-se:
1 (2.137)
( )
1,0 ( x) = 2 21 x 0 = 2 (2 x)
2
e
1, se 0 2 x < 1 2 1, se 0 x < 1 4 (2.138)

(2x) = -1, se 1 2 2 x <1 = -1, se 1 4 x < 1 2
0, caso contrrio 0, caso contrrio

e assim:
2, se 0 x < 1 4 (2.139)

1,0 ( x) = 2 (2 x) = - 2, se 1 4 x < 1 2
0, caso contrrio

Se j = 2, k = 0 tem-se:
2 (2.140)
( )
2,0 ( x) = 2 22 x 0 = 2 (4 x)
2
e
1, se 0 4 x < 1 2 1, se 0 x < 18 (2.141)

(4 x) = -1, se 1 2 4 x <1 = -1, se 18 x < 1 4

e assim:
2, se 0 x < 18 (2.142)

2,0 ( x) = 2 (2 x) = -2, se 18 x < 1 4
0, caso contrrio

As ondaletas 0,0 ( x), 1,0 ( x) e 2,0 ( x) podem ser vistas na figura seguintes:
94
1,5 2 2,5
2
1,5
1 1,5
1 1
0,5 0,5 0,5
0
0
0 -0,5 0 0,5 1 1,5
0 0,5 1 1,5
0 0,2 0,4 0,6 0,8 1 1,2 -0,5 -1
-0,5 -1 -1,5
-2
-1,5
-1 -2,5
-2
-1,5
0,0 ( x) 1,0 ( x) 2,0 ( x)
Figura 12: ondaletas 0,0 ( x), 1,0 ( x) e 2,0 ( x)
Fazendo agora as translaes com k = 1, 2,3, e considerando j = 0 , tem-se:

Para j = 0, k = 1
0 (2.143)
(
0,1 ( x) = 2 20 x 1 = ( x 1)
2
)
e
1, se 0 x 1< 1 2 1, se 1 x < 3 2 (2.144)

( x 1) = -1, se 1 2 x 1<1 = -1, se 3 2 x <2

e assim:
1, se 1 x < 3 2 (2.145)

0,1 ( x) = ( x 1) = -1, se 3 2 x <2
0, caso contrrio

E ainda, para j = 0, k = 3
0 (2.146)
(
0,3 ( x) = 2 20 x 3 = ( x 3)
2
)
e
1, se 0 x 3< 1 2 1, se 3 x < 7 2 (2.147)

( x 1) = -1, se 1 2 x 3<1 = -1, se 7 2 x <4

e assim:
95
1, se 3 x < 7 2 (2.148)

0,3 ( x) = ( x 3) = -1, se 7 2 x <4
0, caso contrrio

As ondaletas 0,1 e 0,3 ficam:
1,5 1,5
1 1
0,5 0,5
0 0
0 1 2 3 0 2 4 6
-0,5 -0,5
-1 -1
-1,5 -1,5
0,1 ( x) 0,3 ( x)
Figura 13: Formas de Ondaletas 0,1 e 0,3
Como visto anteriormente, a anlise de ondaletas usa as ondaletas como funes bases
para representar uma srie temporal.
Para uma sucesso cronolgica, utilizando-se um modelo ARIMA e as decomposies

via ondaletas para prever a Subsries chamada aproximao e denotada A1n e a
Subsries detalhe, denotada D1n , tem-se:

p q
A1n = Ai A1n 1 + Ai A1, n i (2.149)
i =0 i =0
p q
D1n = Di D1n 1 + Di D1,n i (2.150)
i =0 i =0
Considerando, agora, a ondaleta chapu mexicano e combinando com redes neurais com
algoritmo de retropropagao, por exemplo, tem-se:
x2

2
( x) = (1 x )e 2
,x (2.151)
e substituindo a equao (2.151), no neurnio da camada de entrada no
desenvolvimento de (2.89), tem-se:
96
2
x
3
x2

2 x 2
2

I = W 1 j ,1 (1 x )e
h 2
+ W 1 j ,2 1 e
(2.152)
j
3

E ainda:
1
O hj = x
2 (2.153)

2 3
x 2 2
2 x
W 1 j ,1 (1 x 2 ) e W 1 j ,2 1 e
3
1+ e
E assim, obtm-se a entrada do neurnio da camada de sada:

3
1
I o = W 2 j x
2 (2.154)
j =1
x2 3
2 2
2 2
x

W 1 j ,1 (1 x ) e W 1 j ,2 1 e
3
1+ e
E, conseqentemente, a sada do neurnio da camada de sada:

1
Oo = 3 (2.155)

1
W 2j 2
j =1 x

x2 3
2 2

2 2
x
W 1 j ,1 (1 x ) e W 1 j ,2 1 e
3
1+ e
Assim, fazendo a decomposio como proposta na Figura 11, em 1o nvel, tem-se para
uma sucesso cronolgica X t :
1
Xt = 3 + (2.156)
W 2 j 1+ eW 1 j ,1 S ( t 1)+W 1 j ,2 S ( t2)
1

1+ e j =1
E usando a decomposio de ondaletas, usando duas redes neurais, uma para prever a
srie de aproximao ( A1 ) e outra para a parte detalhe ( D1 ):
1
A1 (t ) = 3 + (2.157)
W 2 j 1+ eW 1 j ,1 A1 ( t 1)+W 1 j ,2 A1 ( t 2 )
1

1+ e j =1
e
1
D1 (t ) = 3 + (2.158)

1
W 2j W 1 j ,1 D1 ( t 1)+W 1 j ,2 D1 ( t 2 )
1+ e
1+ e j =1
97
Torrence e Compo (1998) citam diferentes tipos de ondaletas a ,b ( x) , que podem ser
aplicadas nestas decomposies: Haar, Daubechies (que possui 9 formas distintas),

Biorthogonal (com 14 formas distintas), Coifles (com 5 formas distintas), Symlets (com
7 formas distintas), Morlet, Mexican Hat e Meyer. Ambas as formas de ondaletas
citadas so usadas tanto na decomposio como na reconstruo da srie. Os autores
destacam, ainda, que estudos comparativos mostraram que a mudana na escolha da
funo ondaleta gera apenas pequenos efeitos nos resultados.
2.3.4 APLICAES DE PREVISES BASEADO NA DECOMPOSIO DE

ONDALETAS
Tak (1995) desenvolveu, a partir dos dados mensais do ndice Standard and Poors 500
(S&P 500), de maio de 1980 a dezembro de 1990, baseado na metodologia de
decomposio via ondaletas, em dois subnveis, modelos de previso, dentro destas
sries, via modelos ARIMA e de redes neurais, fazendo posteriormente s previses, a
reconstruo da srie original. Seu objetivo foi de determinar se a decomposio da
srie traria ou no um melhor desempenho para as previses do que se fosse feito
diretamente na srie original.
O autor utilizou testes de Dickey-Fuller para razes unitrias, para testar estatisticamente
a existncia de estacionariedade das sries tanto na srie original como nas
decomposies das subsries. Observou que a decomposio no altera a
estacionariedade da srie, pois o S&P 500 era no estacionria, bem como suas duas
decomposies pelas ondaletas de Morlets e chapu mexicano. Como resultados, o
autor encontrou que as redes neurais com decomposio, via ondaletas, obteve 26,3%
de reduo dos erros medidos pelo MAPE. Para os modelos economtricos com
decomposio via ondaletas, a melhora foi de 17,3%, melhorando a qualidade das
previses.
Ario (1995) analisou a previso de vendas de carro no mercado espanhol, no perodo

de janeiro de 1974 a dezembro de 1994. Utilizando as primeiras 240 observaes e
testando para as ltimas 12, referentes a ano de 1994, ou seja, fez a previso para doze
98
passos frente. Utilizando os modelos ARIMA, na srie original, obteve erros medidos
pelo RMSE de 16,964%. Com a decomposio, via ondaletas pela ondaleta DAUB8
(Ondaleta de Daubechies), o erro caiu para 12,895%, quando fizeram as previses em
ambas as subsries pelos mesmos modelos e reconstruindo pela mesma onda.
Homsy, Portugal e Arajo (2000) comparam, sob forma de estudo de casos, previses
relativas a trs diferentes mtodos de modelagem de sries de tempo, os quais consistem
na aplicao da metodologia ARIMA, tanto da forma usual quanto amparada por dois
procedimentos auxiliares, baseados na anlise de ondaletas para as sries da produo
industrial, exportaes brasileiras, volume de pesca na Groelndia. Utilizou tambm o
procedimento de alisamento exponencial das sries. Com base na medida MAPE de
desempenho econmico, o autor mostrou que o procedimento de decomposio via
ondaletas mostrou-se superior em 3,25% contra 6,88% para a srie da produo
industrial; para a srie das exportaes, indicou 9,9% contra 15,52% e para a srie da
produo de pesca, indicou 17,47% contra 27,35% a favor, em todos os casos, da
decomposio via ondaletas. A forma de ondaleta utilizada foi a ondaleta de Haar. Isto
indica, segundo o autor, ser um indcio de que a modelagem em separado (ondaletas) de
subsries de baixas e altas freqncias contribui positivamente para a qualidade das
previses.
Incorporando dados mais recentes, Wong et al. (2003) trabalharam com a taxa de
cmbio para previses de dez passos frente e na construo dos modelos de tendncia,
utilizando uma amostra de 512 observaes de 1 de agosto de 1989 a 31 de julho de
1991. Utilizou a ondaleta de Daubechies (DAUB7), e comparando com os modelos
ARIMA, o menor erro, 0,95% ficou com a decomposio via ondaletas, contra 2,2%
para os modelos ARIMA, tambm medidos pelo MAPE.
Como visto, recentemente, o desenvolvimento da teoria das ondaletas vem rapidamente

se confirmando nos vrios campos da cincia, devido aplicao de suas ferramentas
matemticas de suporte a anlise de sries temporais. Essa metodologia representa um
vasto campo de pesquisa quantitativa (WONG et al. 2003).
Todavia, desde seu incio, a teoria de ondaletas se mostrou interdisciplinar, o que, em

parte, explica a grande popularidade adquirida nos ltimos anos. Essas concluses
99
fortalecem a carncia latente dos segmentos ligados previso de sries financeiras em

desenvolver melhor esta metodologia das ondaletas, aplicadas ao mercado brasileiro.
Tambm corroboram para a idia de que se pretende diagnosticar a qualidade das
previses, provendo a alta administrao de investimentos com anlises de suporte a
decises acionveis no mercado.
2.4 PROCESSO DE GERAO DE DADOS (DGP DATA GENERATION

PROCESS)
Segundo Doornik e Hendry (2001), somente em alguns casos mais simples, a teoria
economtrica capaz de deduzir as propriedades estatsticas de uma distribuio
amostral. Na maior parte das vezes, a teoria forada a fazer uso da lgebra assinttica,
produzindo resultados que se aplicam apenas s grandes amostras. Mesmo que, em
alguns casos, estes resultados assintticos tenham apresentados boas aproximaes para
as distribuies amostrais associadas a amostras no muito grandes, ainda no se pode
ter certeza dos valores obtidos. Por este motivo, utilizam-se ferramentas computacionais
para encontrar as propriedades estatsticas da distribuio amostral em pequenas
amostras usando o chamado Mtodo de Simulao.
O Mtodo de Simulao usado para simular um processo gerador de dados (DGP)

criando milhares de exemplos tpicos, criando para cada um deles o valor da estatstica
em questo, e em seguida, usando-os na caracterizao da distribuio amostral. Tais
mtodos de simulao consistem geralmente nos seguintes experimentos:
assumir que o verdadeiro DGP conhecido;
especificar o conjunto de variveis explicativas;
criar um conjunto artificial de dados, via seleo aleatria de
observaes, a partir de um DGP e da populao de regressores;
estimar o modelo, a partir do conjunto de dados artificiais gerados,
usando o estimador ou modelo sob investigao; e
gerar um novo conjunto artificial de dados e obter as novas estimativas e
testes estatsticos para os dados.
100
Para os autores, cabe salientar que, para assumir um gerador de dados especfico, a
verdadeira funo populacional nunca conhecida (pois se fosse, no precisaria ser
estimada). Portanto, um DGP nada mais do que um modelo que se espera caracterizar
com certa acurcia algumas caractersticas dos dados. Entretanto, a simulao visa
construir uma situao hipottica com propriedades conhecidas e ento comparar os
resultados com a verdade.
101
3 METODOLOGIA DA PESQUISA
3.1 METODOLOGIA
No referencial terico, foram apresentadas e discutidas as abordagens sobre previso de

sucesses cronolgicas e seus principais resultados, visando refletir sobre o uso desta
nova metodologia, capaz de decompor uma sucesso cronolgica, via ondaletas,
conjuntamente com os modelos j existentes de previso e comparar a qualidade de
previses obtidas para assessorar as decises de investimentos.
Este trabalho est fundamentalmente calcado em uma abordagem quantitativa, a fim de

atender ao objetivo da pesquisa. Os estudos quantitativos so aqueles em que os
pesquisadores estabelecem hipteses e as testam por meio da mensurao de variveis
operacionais definidas, quantificando o resultado com o uso de variados mtodos
quantitativos e estatsticos. um tipo de pesquisa tradicionalmente aceito como tendo
confiabilidade, fidedignidade e validade, desde que realizada seguindo uma
metodologia rigorosa. A validao d-se pelo nvel de significncia adotado nos testes
estatsticos (MARCONI; LAKATOS, 2002).
A metodologia utilizada fundamenta-se na anlise e na construo de modelos

univariados de previso de sucesses cronolgicas lineares e no-lineares, com base em
dados simulados, conjuntamente com a decomposio de ondaletas. H uma grande
variedade de modelos aplicveis a estudos dessa natureza. Para fins desta pesquisa,
optou-se por selecionar os modelos ARIMA-GARCH, ARIMA, bilineares e de Redes
Neurais com o algoritmo de aprendizagem recorrente em tempo real, conforme sugerido
por Williams e Zipser (1995) e De Oliveira (2003).
Utilizou-se dados de sries simuladas para maior controle dos dados, isto , trabalhou-se
com DGP, utilizando ondaletas em at dois nveis para obteno de um intervalo de
previso esttica para os modelos construdos. Para a etapa de construo dos DGPs,
foram construdos programas, que se encontram no Apndice C, no software
Mathematica 5.0, com rotinas auxiliares nas Packages, desenvolvidos pela Wolfram
102
Inc. para o Mathematica 5.0, especificamente para tratamento de sucesses

cronolgicas, redes neurais e ondaletas.
Entendem-se as ondaletas como uma etapa inicial de pr-processamento, para fins de

realizar as previses dentro das subsries de baixa e alta freqncia que a ondaleta as
decompe. Posteriormente, fez-se um fluxograma de anlise de sucesses cronolgicas,
visto como essencial para se fazer previses.
A partir das sucesses cronolgicas simuladas, conduziu-se aos testes para confirmao
dos modelos, passando-se anlise dos dados propriamente dita. Trabalhou-se com
dados de sucesses cronolgicas lineares e no-lineares. razovel que, antes de se
utilizar metodologias para se lidar com sistemas no-lineares, seja comprovada a no-
linearidade subjacente aos dados da sucesso. As no-linearidades tambm podem ter
outras origens que no as no estacionariedades. Os algoritmos de deteco de no-
linearidades so utilizados para quantificar o nvel de interaes no-lineares
encontradas nos dados. Billings e Voon (1986 apud FREITAS, SECURATO e
ANDRADE NETO, 2004) afirmam que a relao:
( )
u ,u 2 ( ) = E ( ut E [ut ]) ut2 E ut2 = 0

(3.1)
vlida se e somente se o sistema original for linear. Assim, pode-se identificar no-
linearidades e, mais ainda, estabelecer os limites de um intervalo de confiana de, por
exemplo, 95% por meio da frmula 1.96n, sendo que n o comprimento do registro de
dados disponveis. A funo de correlao dada pela equao (3.1) pode ser estimada,
utilizando os dados disponveis. Logo, se os valores da funo sair fora dos limites
estabelecidos, o sistema que gerou os dados dever ser representado por um modelo
no-linear.
Freitas, Securato e Andrade Neto (2004) afirmam que um critrio relevante para a
escolha deste tipo de teste sua capacidade de discriminao. A capacidade de
discriminao do teste definida como a probabilidade de se rejeitar a hiptese nula
quando realmente a mesma falsa. Obviamente, tambm depende de como quo
intensamente os dados atuais se desviam da hiptese nula. Um indicador cujo poder de
discriminao particularmente eficiente para este fim o de deteco de no-
linearidades, via assimetrias, sob reverso no tempo, apresentado a seguir:
103
( X n X n )3
rev ( ) = n = +1
3
(3.2)
N
2
2
( X n X n )
n = +1
Segundo os autores, esta estatstica permite detectar possveis assimetrias sob reverso
no tempo. Schreiber e Schmitz (1999), compararam quantitativamente os testes mais
populares de no-linearidades e concluiu que esta mtrica apresenta melhores resultados
empricos.
3.2. PREVISO
Em sucesses cronolgicas simuladas comum encontrar sries com tendncia na

mdia, de modo que em se tomando diferenas finitas obtm-se sries estacionrias.
Todavia, segundo Pankratz e Dudley (1987), se a varincia aumentar com o tempo, s
as diferenas podem no ser suficientes para estacionarizar a srie.
Se, por exemplo, X t uma sucesso cronolgica original e
yt = g ( X t ) (3.3)
uma transformao em X t , que no caso dos retornos a funo logartmica, conforme
Campbell, Lo e Mackinlay (1997).
O problema passa a ser, ento, buscar previses para X t + h , dado que se tem um modelo
de previso para de yt e tambm para as previses de
yt + h = g ( X t + h ) (3.4)
Segundo Pankratz e Dudley (1987), uma maneira ingnua de se proceder para

obteno da previso da srie original considerar a equao (3.4) e substituir as
previses por valores futuros:
(
yt + h = g X t + h ) (3.5)
e posteriormente tentar obter X t + h em funo de y't + h , a partir da equao (3.5). Isso

poderia ser feito se a funo g possuir inversa, e conseqentemente:
X t + h = g 1 ( yt + h ) (3.6)
104
Para Campbell, Lo e Mackinlay (1997), a logaritmizao dos valores observados uma

das transformaes mais usuais para estacionarizar sucesses cronolgicas econmico-
financeiras e permite, quer a linearizao de tendncias exponenciais, quer a
estabilizao de varincias.
No caso das previses com os log-retornos, tem-se:

yt = ln( X t ) (3.7)
e ento
e yt = eln( X t ) = X t (3.8)
e as previses para X t + h ficariam:
X t = e yt +h (3.9)
Com efeito, tem-se:

E [ yt + h | yt , yt 1 ,]
X t + h = E [ X t + h | X t , X t 1 ,] e[
yt +h ]
= e (3.10)
sendo que yt segue a equao (3.5).
Todavia, Granger e Newbold (1976) afirmam que as previses feitas com a equao
(3.7) conduzem a previses viciadas e, como conseqncia, o erro quadrtico mdio da
previso aumentar.
Prankratz e Dudley (1987) frisam que no caso de yt ser gaussiana, a previso tima
dever ser dada por:

1
yt + h + 2 Vary + h
Xt = e
(3.11)
onde Var (h) = Varincia et (h) , sendo que, et (h) yt + h Et [ yt + h ] , conforme define

Enders (2003).
Segundo Morettin (2003), se yt = ln( X t ) seguir, por exemplo, um modelo ARIMA,
sabe-se que a distribuio condicional de yt + h , dado o passado, uma distribuio

105
N ( yt (h), Vy [ h ]) e um intervalo de confiana para yt + h , com nvel de confiana de
[h] .
95% ser yt (h) 1,96 Vy
Uma vez que um ou mais modelos de sries temporais foram selecionados, devemos
gerar previses 1-passo ou h-passos frente de previso para yt (onde yt denota um
varivel diferenciada adequadamente). As previses referem-se s observaes yt + h e
conseqentemente ser denotada por yt + h , com h = 1, 2,3, , m . Em geral, a previso
um passo frente definida por yt +1 , a qual baseada no conjunto de informao yn .
No caso onde t observaes foram registradas para avaliar uma previso um passo
frente, avana-se o conjunto de informao com cada previso. Por exemplo, yt + 2
baseado em yt +1 e yt +3 baseado em yt + 2 . A motivao intuitiva por trs dessa lgica
que no sempre possvel ser capaz de re-estimar os parmetros do modelo de sries

temporais. Neste caso, so mantidos os estimadores para os parmetros fixados para a
amostra t = 1, 2, ..., n, enquanto faz-se previses um passo frente para yt +1 at yt + h . Se
possvel, podemos tambm decidir estimar os parmetros para cada um dos conjuntos
de informao yt + h 1 . Alm disso, podemos ento deletar os primeiros h dados pontuais,
de tal forma que a amostra de estimao tem o mesmo tamanho para as m previses.
Finalmente, uma previso h-passos (ou dinmica) denota uma previso de yt + h (para h
= 1, 2, ...,m), a qual baseada em yt . Obviamente, quando h maior que a memria do
modelo (ou, por exemplo, o comprimento do polinmio AR), a previso yt + h
provavelmente inclui previses para dados pontuais prvios como yt + h 1 e tambm os
erros de previso tendem a ser maiores (ENDERS, 2003).
3.3 DESENVOLVIMENTO DA PESQUISA
Conforme mencionado anteriormente, a linha mestra desta pesquisa estudar e

comparar os mtodos de previso de sucesses cronolgicas com a decomposio via
ondaletas. Para tanto, dividiu-se o trabalho nas seguintes etapas:
106
Num primeiro momento da pesquisa, levantou-se, na literatura, teses e dissertaes, via

UMI - Proquest, artigos em peridicos da rea, em busca de referencial de trabalhos j
divulgados na rea, principalmente em busca de aplicaes das tcnicas economtricas
que sero utilizadas. Posteriormente, estabeleceu-se o organograma da Figura 14, a
seguir, para apresentao passo a passo das etapas de uma anlise de sucesses
cronolgicas, a fim de pr ordem nos procedimentos, conforme apresentados a seguir.
Dentre as etapas descritas no organograma, tem-se o pr-processamento, onde se retm

outliers, faz-se a decomposio por ondaletas, diferenciao, logaritmizao e
normalizao da srie. Parte-se, ento, para testar a estacionariedade do processo. A
seguir, o teste para normalidade para prever o tipo de dependncia do processo
estacionrio. Logo aps, deve-se determinar se a mesma srie , de fato,
estatisticamente independente. Se a hiptese nula de independncia rejeitada, isto
implica a aceitao da hiptese alternativa da existncia de dependncia linear ou
dependncia no-linear.
Caso a sucesso cronolgica apresente dependncia linear, ento se deve especificar os

modelos lineares para ajustes. Alternativamente, caso ocorra dependncia no-linear,
utilizar os modelos especficos para dados no-lineares. A especificao de modelos
no-lineares inicia-se no posteriormente, onde modelos no-lineares aditivos ou
multiplicativos devem ser construdos. Faz-se, ento, o ps-processamento que consiste
na desnormalizao, deslogaritmizao, integrao e reconstruo da sucesso
cronolgica original para obter a sucesso no nvel. O prximo passo a anlise da
qualidade das previses e encerra-se com a validao dos modelos, estimando os testes
de independncia e normalidade dos resduos.
O fluxograma, a seguir, resume e ilustra todo o processo descrito:

107
DGP Simulado ou
sucesso
cronolgica real
Pr-Processamento
Teste Estacionariedade
- Teste de D.Pantulla
Teste Independncia
- Teste de BDS (sobre a srie bruta ou
pr-processada)
Teste Normalidade Teste de Linearidade

- Teste de JB - Teste de McLeod-Li
- Teste ARCH-LM
Se no Normal Se Normal
Teoria do Passeio Modelo

Caos Aleatrio Modelo No Linear - Teste de Hsieh
Linear Mdia Varincia Total
ARIMA
Bilineares GARCH Redes Neurais
Retroprop.
Recorrentes
Ps-Processamento
Teste Independncia
- Teste de BDS (sobre os resduos)
Teste Normalidade
- Teste de JB
No Normal Normal
Identificar distribuio
Anlise da Qualidade da Previso Pontual Anlise da Qualidade da Previso Esttica

(TIC, MAPE, e r ) por intervalo atravs do envelopamento
Comparao da Acurcia entre os modelos

Figura 14: Fluxograma proposto para anlise de sucesses cronolgicas
Seguindo o fluxograma da Figura 14, depois de se estimar um modelo de uma sucesso

cronolgica, passa-se a testar se a especificao estava correta. A pressuposio foi de
108
que os termos de erros aleatrios t , no processo efetivo, tm distribuio normal e so
independentes. Ento, se o modelo foi especificado corretamente, os resduos t
deveriam ser semelhantes a um processo rudo branco. Em particular, tem-se a

expectativa de que os resduos quase no tenham correlao entre si, de modo que a
FAC amostral dos resduos seja prxima de zero para uma defasagem k 1 .
Seguindo os passos descritos, aplica-se novamente os testes de independncia estatstica

(Teste BDS) e teste de Jarque-Bera de normalidade. Caso mantenha dependncia nos
resduos, o modelo deve ser novamente gerado e testado. Se houver independncia,
deve-se estimar a distribuio dos resduos para, posteriormente, estimar-se as bandas
de previso para o envelopamento.
109
4 RESULTADOS EXPERIMENTAIS
Neste captulo analisar-se-o alguns resultados empricos obtidos, a partir da utilizao

de metodologias economtricas tradicionais e de redes neurais com algoritmos de
retropropagao e redes recorrentes para modelagem de sucesses cronolgicas, visando
utilizao do fluxograma proposto.
A pesquisa foi conduzida por meio de simulaes de dados atravs de DGPs gerados
pelo software MATHEMATICA 5.0 atravs de construo de pacotes para gerar os
dados que tambm foram usados para tratamento das decomposies e reconstrues,
via ondaletas e todo o tratamento das previses, dentro das subsries, via combinao
com pacotes especficos do prprio software. Usou-se tambm o EVIEWS 5.0, para
tratamento dos testes e previses. Tais programas se encontram no apndice C. Para as
redes neurais, utilizou-se o MATLAB 6.5, para as redes recorrentes e o software
Statistica da StatSoft 6.1, para as redes com retropropagao.
4.1 SIMULAO DE PROCESSO ARIMA-GARCH
Considerando um DGP para o modelo ARIMA-GARCH da forma ARIMA(2,0,0)-

GARCH(1,1), cujos parmetros so: 1 = 0, 2 e 2 = 0,5 e
0 = 0, 06, 1 = 0, 04, 1 = 0, 7 .
Utilizando-se o programa 1, disponvel no apndice C, foram geradas 1200 observaes

para o modelo que foram divididas em duas partes: a primeira com mil observaes foi
utilizada para gerar o modelo para previso e as 200 restantes, utilizadas para validar o
modelo.
A seguir, tem-se seu grfico com 1000 instantes de tempo:

110
Xt
1.5
0.5
t
200 400 600 800 1000 1200
-0.5
-1
-1.5
Figura 15: DGP para o modelo ARIMA(2,0,0)-GARCH(1,1)
Verificando a sucesso cronolgica como um todo, tem-se:
Teste de raiz unitria
DGP ARIMA(2,0,0)-GARCH(1,1) 1 = 0, 2 e 2 = 0,5 e
0 = 0, 06, 1 = 0, 04, 1 = 0, 7
Hipteses Estatstica de Teste Valores Crticos a 5%
H 0 : 3RU -69,47651 -2,76
H1 : 2 RU
H 0 : 2 RU -22,28469 -3,37
H1 :1RU -38,53137 -3,77
H 0 :1RU -31,02768 -3,42
H1 : 0 RU -14,84719 -3,80
-17,64252 -4,16
Considerando um nvel de confiana de 95%, se rejeita a todas as hipteses nulas, o que

indica que ambas as subsries so estacionrias.
111
Teste de independncia estatstica (BDS) sobre a sucesso cronolgica
Modelo ARIMA-GARCH
Dimenso BDS Erro-padro Estatstica Z p-valor
2 -6,94E-06 1,46E-06 -4,769876 0,0000
3 -9,57E-07 3,60E-08 -26,56382 0,0000
4 -9,41E-09 6,70E-10 -14,04558 0,0000
5 -9,26E-11 1,09E-11 -8,491502 0,0000
6 -9,07E-13 1,65E-13 -5,509733 0,0000
Calculou-se at a sexta dimenso para os dados padronizados e concluiu-se por rejeitar

a hiptese nula ao nvel de significncia de 5%, indicando que os dados da sucesso
cronolgica so dependentes, baseado na anlise do p-valor, pois pelo menos um dos p-
valores teve seu valor menor que 5%.
Teste de Normalidade de Jarque-Bera
A figura, a seguir, ilustra a distribuio da sucesso cronolgica.
90
Series: G
80 Sample 1 1000
70 Observations 1000
60 Mean 0.012916
Median 0.007344
50
Maximum 1.517590
40 Minimum -1.246590
Std. Dev. 0.468553
30 Skewness 0.072681
Kurtosis 2.892439
20
10 Jarque-Bera 1.362480
Probability 0.505989
0
-1.0 -0.5 0.0 0.5 1.0 1.5
Figura 16: Distribuies do modelo ARIMA(2,0,0)-GARCH(1,1) simulado
De acordo com o p-valor, tem-se uma distribuio normal.
Teste de McLeod-Li
O resultado da estatstica de teste calculado no Eviews 5.0 :
Modelo ARIMA-GARCH
Estatstica F 11,97598 p-valor 0,00000
112
Dessa forma, o teste de McLeod-Li, para 5 defasagens, rejeitou a hiptese nula

pelo fato do p-valor ser inferior a 5%. Isto indica que a sucesso cronolgica simulada
possui comportamento no-linear.
Teste de Hsieh
cronolgica, preciso identificar o tipo de no-linearidade existente, se na mdia ou na
varincia condicionadas.
Para a realizao do teste, fez-se o programa 4 (ver apndice C) que ir calcular os

coeficientes (i,j) para cada uma das subsries. Os resultados desta etapa vem a seguir:
Modelo ARIMA-GARCH
Coeficiente Estatstica de Hsieh p-valor
11 -0,0333 0,4867
12 -0,6631 0,2536
13 -2,4526 0,0071*
14 -0,8405 0,2003
15 0,5051 0,6933
22 0,408 0,6584
23 -1,6157 0,0531
24 -0,9803 0,1635
25 -2,2876 0,0111*
33 -0,0189 0,4925
34 2,1549 0,9844
35 1,828 0,9662
44 0,8702 0,8079
45 -1,7137 0,0433*
55 -0,5708 0,2841
Conforme se observa no quadro anterior, para quinze pares (i,j), os valores dos
coeficientes do teste de Hsieh amostrais para as duas subsries e o correspondente p-
valor para um nvel de confiana de 95%, apresenta apenas trs coeficientes
significantes (indicado com *), podendo-se dizer que, de maneira geral, no se rejeita a
hiptese nula dos coeficientes iguais a zero, o que indica uma no-linearidade na
varincia condicionada.
113
Seguindo o fluxograma proposto no trabalho, a primeira etapa corresponde ao pr-

processamento da decomposio via ondaletas. Foi escolhida a ondaleta de Daubesch
nmero 1 (DB1), por ser a mais trabalhada nos artigos da reviso da literatura.
Atravs do programa 2 do apndice C, que foi desenvolvido para estas aplicaes, pode-
se gerar o pr-processamento do DGP gerado acima, em apenas um nvel de sub-
divises.
A figura a seguir ilustra a decomposio (pr-processamento) em primeiro nvel da srie

no nvel original:
CA-1Nvel CD-1 Nvel
2 2
CAt CDt
1,5 1,5
1 1
0,5
0,5
0 t
0 t -0,5 0 200 400 600
-0,5 0 200 400 600 -1
-1 -1,5
-1,5 -2
-2
Figura 17: Pr-processamento em 1 Nvel da srie original do modelo ARIMA(2,0,0)-

GARCH(1,1)
Testes de raiz unitria (RU):
O teste de DFA de razes unitrias foi aplicado no Eviews 5.0. A seguir, so

apresentados os testes para verificar se a srie apresenta uma ou mltiplas razes
unitrias atravs das hipteses:
H 0 : a srie no-estacionria (apresenta raiz unitria)
H1 : a srie estacionria (sem raiz unitria)
Para o teste de razes unitrias, foi utilizado o teste de DF aumentado, conhecido como
teste de Dikey-Pantula, que apresentou os seguintes resultados com 5% de significncia
para as subsries decompostas no pr-processamento:
114
Subsrie: CA Subsrie: CD
Hipteses Estatstica Valores Hipteses Estatstica Valores
de Teste Crticos a 5% de Teste Crticos a
5%
H 0 : 3RU -54,6783 -2,76 H 0 : 3RU -52,1822 -2,76
H1 : 2 RU H1 : 2 RU
H 0 : 2 RU -17,63888 -3,37 H 0 : 2 RU -17,22859 -3,37
H1 :1RU -29,18961 -3,77 H1 :1RU -29,60606 -3,77
H 0 :1RU -25,43932 -3,42 H 0 :1RU -25,43257 -3,42
H1 : 0 RU -9,790482 -3,80 H1 : 0 RU -9,322556 -3,80
-14,86584 -4,16 -15,29174 -4,16

Teste para Independncia Estatstica Teste BDS
Como visto anteriormente, o teste para independncia pode ser aplicado para ver se a
sucesso cronolgica apresenta independncia, pois, se for, esto o processo RBI.
Suas hipteses so:
H 0 :o processo CA estocasticamente independente
H1 : o processo CA estocasticamente dependente
H 0 :o processo CD estocasticamente independente
H1 : o processo CD estocasticamente dependente
Dimenso BDS Erro Estatstica p-valor Dimenso BDS Erro Estatstica p-valor
Padro Z Padro Z
2 -3,00E-06 4,85E-05 -0,061797 0,9507 2 4,77E-05 3,97E-05 1,199797 0,2302
3 2,87E-05 5,75E-06 4,989138 0,0000 3 -1,82E-06 4,68E-06 -0,389464 0,6969
4 1,81E-05 5,12E-07 35,39495 0,0000 4 -6,13E-06 4,14E-07 -14,81243 0,0000
5 7,84E-06 3,99E-08 196,4425 0,0000 5 -3,04E-07 3,20E-08 -9,493997 0,0000
6 -1,52E-08 2,88E-09 -5,280915 0,0000 6 -1,49E-08 2,29E-09 -6,514062 0,0000
O software Eviews 5.0 calcula a estatstica BDS para todas as dimenses de dois at o
valor especificado, variando a dimenso de correlao para maximizar o poder do teste.
Neste caso, calculou-se at a sexta dimenso para os dados padronizados e concluiu-se
por rejeitar a hiptese nula ao nvel de significncia de 5%, indicando que os dados da
115
sucesso cronolgica so dependentes, baseado na anlise do p-valor, pois pelo menos

um dos p-valores deve ser menor que 5%.
Teste de Normalidade
Na figura a seguir, tm-se as estatsticas das duas subsries do pr-processamento, onde

a hiptese nula e alternativa so:
H 0 : a srie segue uma distribuio normal
H1 : a srie no segue uma distribuio normal
60 50
Series: CA Series: CD
Sample 1 500 Sample 1 500
50 40 Observations 500
Observations 500
40 Mean 0.018266 Mean 0.008551

Median 0.008789 30 Median 0.008117
Maximum 1.386964 Maximum 1.187280
30 Minimum -1.387735
Minimum -1.498960
20 Std. Dev. 0.450965
Std. Dev. 0.485880
20 Skewness 0.016863 Skewness -0.120215
Kurtosis 3.051662
Kurtosis 3.196228 10
Jarque-Bera 0.825891
Probability 0.661698 0
0
-1.0 -0.5 0.0 0.5 1.0
-1.5 -1.0 -0.5 0.0 0.5 1.0
Figura 18: Distribuies das subsries em 1 nvel do modelo ARIMA-GARCH
Para as duas subsries, no h evidncias de no rejeio da hiptese nula pelo p-valor

que maior que 5%, nvel de significncia adotado no teste. Portanto, pode-se
considerar que as duas subsries apresentam comportamento normal. O teste de Jarque-
Bera tambm foi realizado no Eviews 5.0.
Teste de McLeod-Li
O teste baseado na autocorrelao amostral dos quadrados dos resduos de uma

sucesso cronolgica estacionria gaussiana.
A hiptese a ser testada :

H 0 : X t2 independente, isto , a sucesso cronolgica linear
H1 : X t2 dependente, isto , a sucesso cronolgica no-linear

116
Estatstica F 20,41297 p-valor 0,0000000 Estatstica F 13,87677 p-valor 0,000000
Dessa forma, o teste de McLedod-Li para 5 defasagens rejeitou a hiptese nula pelo fato
do p-valor ser inferior a 5%. Isto indica que ambas as subsries possuem
comportamento no-linear.
Matematicamente, este resultado pode ser entendido que a srie no pode ser escrita
({t i }t =1 ) = it i

como combinao linear dos termos de erro da forma X t = f ,
i =1
sendo que { t } ~ RB , pelo Teorema de Wold (HAMILTON, 1994).
Freitas, Securato e Andrade Neto (2004) implementaram um algoritmo, com base nos
trabalhos de Billings e Voon (1986) e Scheiber (1998), para estudar o comportamento
de uma sucesso cronolgica ao longo de sua trajetria. Tal implementao ilustrada, a
seguir, indica que quando a sucesso cronolgica se encontra dentro da banda
construda, o seu comportamento tem caractersticas lineares e, fora desta banda,
comportamento no-linear.
A figura, a seguir, mostra o comportamento para as sub-divises do primeiro nvel de

pr-processamento do modelo ARIMA-GARCH, feito com base no programa 7 do
Apndice C.
117
Xt
CA-ARIMA-GARCH
0.3
0.2
0.1
t
-0.1
0 100 200 300 400 500 600
Xt
CD-ARIMA-GARCH
0.3
0.2
0.1
-0.1 t
-0.2
0 100 200 300 400 500 600
Figura 19: Comportamento da srie ao longo do tempo para o modelo ARIMA-

GARCH em 1 nvel de pr-processamento.
Observa-se que a parte relativa s baixas freqncias (CA) manteve o comportamento

no-linear durante toda a trajetria, ao passo que a parte de alta freqncia da
decomposio, oscila no incio e depois apresenta comportamento linear.
Teste de Hsieh
Uma vez estabelecido que existe algum tipo de no-linearidade, em uma sucesso
As hipteses do teste de Hsieh so:
H 0 : CA apresenta no-linearidade na varincia condicionada
H1 : CA apresenta no-linearidade na esperana condicionada

118
H 0 : CD apresenta no-linearidade na varincia condicionada
H1 : CD apresenta no-linearidade na esperana condicionada
Para a realizao do teste, fez-se o programa 4 que ir calcular os coeficientes (i,j) para
cada uma das subsries. Os resultados desta etapa vm a seguir:
Coeficiente Estatstica de Hsieh p-valor Coeficiente Estatstica de Hsieh p-valor
11 -0,662 0,25399 11 0,6549 0,74373
12 -1,37 0,08534 12 -0,474 0,31775
13 -0,6574 0,25546 13 0,2844 0,61195
14 -2,5114 0,00601* 14 1,5583 0,94042
15 0,1633 0,56486 15 -0,0346 0,4862
22 0,6884 0,7544 22 0,1942 0,57699
23 0,3119 0,62244 23 0,5378 0,70464
24 0,0571 0,52277 24 -0,0107 0,49573
25 -0,0592 0,4764 25 -0,2428 0,40408
33 0,6083 0,72851 33 -0,1283 0,44896
34 1,9814 0,97623 34 -0,1268 0,44955
35 -0,7488 0,22699 35 -0,1189 0,45268
44 -0,028 0,48883 44 0,1248 0,54966
45 0,0619 0,52468 45 1,7597 0,96077
55 -0,2244 0,41122 55 0,097 0,53864
Conforme se observa, no quadro anterior, para quinze pares (i,j), os valores dos
valor para um nvel de confiana de 95%, apresenta apenas um coeficiente significante
(indicado com *), podendo-se dizer que, de maneira geral no se rejeita a hiptese nula
dos coeficientes iguais a zero, o que indica uma no-linearidade na varincia. Para a
sucesso de alta freqncia (CD), isto j no ocorre e todos os pares apontam pela
dependncia na varincia condicionada.
De posse das informaes descritas acima, gerou-se um modelo ARIMA-GARCH, para

cada uma das subsries descritas a seguir:
cat = 1cat 1 + 2 cat 2 + t
cdt = 1cdt 1 + 2 cdt 2 + t
ht = 0 + 1 t21 + 1ht 1 t2 I t 1 ~ N (0, ht )

119
Parmetros Subsrie CA Coeficiente Erro Padro Estatstica t Significncia estimada

1 0,009764 0,046617 0,209463 0,8341
2 -0,010070 0,045200 -0,222781 0,8237
0 0,026695 0,062264 0,428739 0,6681
1 0,009319 0,024975 0,373132 0,7091
1 0,878487 0,278042 3,159551 0,0016
Modelo Log de Verossimilhana AIC BIC
AR(2)-GARCH(1,1) -346,9275 1,413363 1,455639
Parmetros Subsrie CD Coeficiente Erro Padro Estatstica t Significncia estimada
1 0,002285 0,044694 0,051127 0,9592
2 -0,079776 0,042094 -1,895189 0,0581
0 0,014863 0,008863 1,677016 0,0935
1 -0,025768 0,014765 -1,745226 0,0809
1 0,954012 0,040681 23,45115 0,0000
AR(2)-GARCH(1,1) -306,4353 1,250744 1,293019
Aps a etapa de identificao e previso dos modelos nas subsries de baixa e alta
freqncia, tem-se, a seguir, as estatsticas de previso esttica feitas pelo para 100
passos frente dentro de cada subsrie. Na etapa do ps-processamento, como para
cada um valor previsto em cada sub-nvel, na juno novamente para obter a srie no
nvel via transformada inversa da ondaleta, resulta em 200 pontos na srie no nvel.
Como os erros ficaram demasiadamente grandes, considerou-se tambm a estatstica de
acurcia pontual para os dez primeiros elementos previstos, para fins de comparao. A
previso foi feita, da forma esttica, atravs do Eviews 5.0.
A reconstruo da srie no nvel na etapa de ps-processamento do fluxograma

proposto, foi feita com o auxlio do programa 3, disponvel no Apndice C.
Aps a etapa de ps-processamento, tomou-se os valores previstos e atravs de uma

planilha do Microsoft Excel, programou-se as equaes (2.8) do MAPE, (2.9) do
coeficiente de correlao e (2.10) do TIC. Os resultados obtidos aparecem a seguir:
120
Identificao com ARIMA-GARCH Modelo ARIMA(2,0,0)-GARCH(1,1)

Estatsticas de Previso Valor Estatsticas de Previso Valor
Pontual para os 200 pontos Pontual para os 10 primeiros
pontos
TIC 0,99 TIC 0,83
MAPE 110,00% MAPE 10,00%
Correlao -0,11 Correlao 0,16
Utilizando Redes Neurais
A seguir, so apresentados os resultados obtidos, utilizando-se redes neurais artificiais

para o tratamento do DGP do modelo ARIMA-GARCH. A rede neural utilizada,
primeiramente, foi com o algoritmo de retropropagao e, posteriormente, com a rede
recorrente proposta por Williams e Zipser (1995). Foi utilizado, nesta etapa, o Matlab
6.5.
Para que os dados sejam inseridos na rede, foi utilizado o processo de normalizao
proposto por Azoff (1994), que considera um vetor de entrada de dimenso n, ou seja,
os elementos no vetor variam de i = 1, , n . Os elementos ti j , para a sinapse i e a
amostra total de tamanho N, do vetor indo de j = 1, , N so normalizados e utilizados

para anlise pela expresso:
Yt min {Yt }t =1
N
Zt = [ 0;1]
max {Yt }t =1 min {Yt }t =1
N N
Dessa forma, os 500 pontos de cada subsrie da etapa de pr-processamento dos dados
do DGP do modelo ARIMA-GARCH so divididos em trs partes, a primeira com 200
valores que so utilizados para treinar os pesos sinpticos da rede, a segunda parte para
realizar a validao com 100 valores e a terceira para previso com 100 valores pelo
algoritmo de retropropagao.
Tem-se, a seguir, as estatsticas de previso esttica feitas pelo para 100 passos frente
em cada subsrie, que resulta em 200 pontos na srie no nvel e para apenas os 10
primeiros, via rede neural, com algoritmo de retropropagao:
121
Redes Neurais: retropropagao Modelo ARIMA(2,0,0)-GARCH(1,1)

pontos
TIC 0,86 TIC 0,75
MAPE 72,76% MAPE 3,39%
Correlao -0,47 Correlao -0,04
Usando redes neurais recorrentes, tem-se:

Redes Neurais: recorrente Modelo ARIMA(2,0,0)-GARCH(1,1)
pontos
TIC 0,77 TIC 0,85
MAPE 26,22% MAPE 1,14%
Correlao -0,18 Correlao 0,01
A figura, a seguir, mostra a banda de previso de 95% de confiana para as redes

recorrentes para a previso pontual com 200 pontos com base na expresso
[ h ] , indicado pelos seus respectivos valores mximos e mnimos nas
Yt (h) 1,96 VY
bandas acima. Posteriormente, fez-se os mesmos para h=10, isto , os 10 primeiros

valores.
Como foram simuladas 100 sucesses cronolgicas de 1200 observaes, foi feito todo
o trabalho descrito anteriormente para a primeira delas, isto , tomou-se a amostra dos
mil primeiros elementos para estimao e testada com as 200 observaes restantes,
construindo um intervalo de previso para as redes e para o modelo economtrico.
Posteriormente, fez-se o mesmo trabalho para as 99 restantes, com os respectivos
intervalos de confiana para os valores mximos e mnimos. Tomou-se, ento, a mdia
[ h ] e a mdia
dos 100 valores mnimos do intervalo de confiana LI = Yt (h) 1,96 VY
[ h ] . Assim, teve-se um intervalo de

dos 100 valores mximos LS = Yt (h) + 1,96 VY
[ h ] . Verificou-se, a partir da,

confiana mdio de toda a simulao Yt (h) 1,96 VY

apenas para a parte prevista que foram os 200 pontos previstos, quantos de cada uma
das 100 sucesses estavam dentro deste envelope criado pelas bandas mdias. Para isso,
122
deu-se o nome de envelopamento, objetivando perceber a mdia de pontos que caiam

dentro deste intervalo como uma medida comparativa de previso do modelo.
Valor Real X Intervalo de Previso por redes recorrentes - 1 Nvel

1,5
1
0,5
0
Xt
-0,5 0 50 100 150 200t

-1
-1,5
-2
Valor real Valor Mnimo Valor Mximo
Figura 20: Intervalo de previso em 1 nvel para redes recorrentes para a amostra de
teste do modelo ARIMA-GARCH
Valor Previsto X Intervalo de Previso por redes

recorrentes - 1 Nivel
1,5
1
0,5
0
t
Xt
-0,5 0 2 4 6 8 10
-1
-1,5
-2
Valor Real Valor Mnimo Valor Mximo
Figura 21: Intervalo de previso em 1 nvel para redes recorrentes para os primeiros
10 elementos do modelo ARIMA-GARCH.
Valor Real X Intervalo de Previso por redes neurais com

retropropagao - 1 Nvel
1,5
1
0,5
Xt
0 t
-0,5 0 50 100 150 200
-1
-1,5
Figura 22: Intervalo de previso em 1 nvel feito por redes neurais com
retropropagao do modelo ARIMA-GARCH
123
Valor Previsto X Intervalo de Previso por redes neurais

com retropropagao - 1 Nvel
1
0,5
t
Xt
0
0 2 4 6 8 10
-0,5
-1
Figura 23: Intervalo de previso em 1 nvel para redes neurais com retropropagao
para os primeiros 10 elementos do modelo ARIMA-GARCH.
Valor Real X Intervalo de Previso por um modelo ARIMA-GARCH- 1

Nvel
1,5
1
0,5
Xt
0 t
-0,5 0 50 100 150 200
-1
-1,5
Figura 24: Intervalo de previso em 1 nvel feito por um modelo ARIMA-GARCH
Valor Previsto X Intervalo de Previso um modelo ARIMA-

GARCHo - 1 Nvel
1,5
1
0,5
t
Xt
0
-0,5 0 2 4 6 8 10
-1
-1,5
Figura 25: Intervalo de previso em 1 nvel por um modelo ARIMA-GARCH para os

primeiros 10 elementos.
124
Nas figuras anteriores, valor real significa o valor simulado pelo DGP, o valor mnimo
o limite inferior da banda de previso e o valor mximo o correspondente limite
superior.
Fazendo o clculo do envelopamento para 200 sries simuladas e verificando quais

esto contidas completamente na banda de confiana de 95%, tem-se:
Porcentagem de Envelopamento
Modelo Percentual
Rede Neural Recorrente 96,45%
Rede Neural Retropropagao 93,74%
ARIMA-GARCH 48,42%
O resultado anterior mostra uma vantagem das redes recorrentes sobre os demais
modelos no critrio do envelopamento da sucesso cronolgica prevista.
Simulao no 2o Nvel do Pr-Processamento
De acordo com a proposta do trabalho, apresenta-se, a seguir, o pr-processamento feito

em dois nveis do DGP para o modelo ARIMA-GARCH com o auxlio do programa 2,
aplicado sobre as duas primeiras decomposies:
CAA CDA
1,5
1,5
1
1
0,5 0,5
0 0
-0,5 -0,5
-1
-1
-1,5
-1,5
125
CAD CDD
2 1,5
1,5
1
1
0,5 0,5
0 0
-0,5 -0,5
-1
-1
-1,5
-2 -1,5
Figura 26: Pr-processamento em 2 nvel do modelo ARIMA-GARCH
Seguindo o mesmo roteiro do modelo anterior, apresentam-se, a seguir, os resultados:
Teste de Razes Unitrias

Subsrie: CAA Subsrie: CAD
5%
H 0 : 3RU -31,95246 -2,76 H 0 : 3RU -37,73648 -2,76
H1 : 2 RU H1 : 2 RU
H 0 : 2 RU -10,32123 -3,37 H 0 : 2 RU -10,56451 -3,37
H1 :1RU -19,99126 -3,77 H1 :1RU -20,71348 -3,77
H 0 :1RU -14,66594 -3,42 H 0 :1RU -15,96954 -3,42
H1 : 0 RU -7,184838 -3,80 H1 : 0 RU -6,150885 -3,80
-8,716525 -4,16 -9,942485 -4,16

Subsrie: CDA Subsrie: CDD
5%
H 0 : 3RU -35,01270 -2,76 H 0 : 3RU -34,24383 -2,76
H1 : 2 RU H1 : 2 RU
H 0 : 2 RU -10,72136 -3,37 H 0 : 2 RU -11,73372 -3,37
H1 :1RU -19,88246 -3,77 H1 :1RU -17,81364 -3,77
H 0 :1RU -15,26169 -3,42 H 0 :1RU -15,87592 -3,42
H1 : 0 RU -7,034603 -3,80 H1 : 0 RU -7,299054 -3,80
-8,978980 -4,16 -8,577802 -4,16
126
Considerando um nvel de confiana de 95%, no se aceita a hiptese nula, o que indica

que ambas as subsries so estacionrias.
Teste para Independncia Estatstica Teste (BDS)

Padro Z Padro Z
2 -0,000216 9,45E-05 -2,286002 0,0223 2 -0,00034 6,10E-05 -5,630532 0,0000
3 -4,09E-05 1,19E-05 -3,432417 0,0006 3 -3,99E-0 7,14E-06 -5,590338 0,0000
4 -7,11E-06 1,13E-06 -6,303094 0,0000 4 -5,08E-0 6,28E-07 -8,085309 0,0000
5 -3,77E-07 9,37E-08 -4,018874 0,0001 5 -2,41E-0 4,83E-08 -4,979506 0,0000
6 -2,04E-08 7,21E-09 -2,837173 0,0046 6 -1,14E-0 3,44E-09 -3,310096 0,0009
Padro Z Padro Z
2 -4,01E-05 8,12E-05 -0,494265 0,6211 2 0,000460 6,98E-05 6,586959 0,0000
3 -6,89E-05 1,02E-05 -6,777076 0,0000 3 7,44E-05 8,55E-06 8,698174 0,0000
4 -6,86E-06 9,55E-07 -7,186312 0,0000 4 -5,99E-06 7,87E-07 -7,611436 0,0000
5 -3,60E-07 7,86E-08 -4,577967 0,0000 5 -2,92E-07 6,34E-08 -4,595844 0,0000
6 -1,83E-08 6,00E-09 -3,059027 0,0022 6 -1,43E-08 4,74E-09 -3,024861 0,0025
O teste de Hsieh rejeita a hiptese de independncia de todas as subsries, pela anlise

do p-valor para os dados padronizados, sendo que, pelo menos um deles, deve ser
menor que 5%.
28 28
Series: CAA Series: CAD
24 Sample 1 250 24 Sample 1 250
Observations 250 Observations 250
20 20
Mean 0.111593 Mean 0.050047
Median 0.129708 16 Median 0.038743
16 Maximum 3.101749
Maximum 3.380836
Minimum -3.299709 Minimum -2.985643
12 12
Std. Dev. 1.271061 Std. Dev. 1.060927
Skewness -0.087580 Skewness 0.075547
8
8 Kurtosis 3.097902
Kurtosis 3.060266
4
0
-3 -2 -1 0 1 2 3
-2.50 -1.25 0.00 1.25 2.50
36 32
Series: CDA Series: CDD
32 Sample 1 250 28 Sample 1 250
28 Observations 250 Observations 250
24
24 Mean -0.025967 Mean 0.064845
Median -0.024640 20
Median 0.017853
20
16
16 Minimum -2.276417 Minimum -2.429397
Std. Dev. 0.775176 12 Std. Dev. 0.929946
12 Skewness 0.065554 Skewness 0.160388
Kurtosis 3.461628 8 Kurtosis 2.868702
8
4 Jarque-Bera 2.398856 4 Jarque-Bera 1.251419
Probability 0.301367 Probability 0.534882
0 0
-2 -1 0 1 2 -2 -1 0 1 2 3
Figura 27: Distribuies das subsries em 2 nvel do modelo ARIMA-GARCH

127
No se rejeita a hiptese de normalidade pelo teste de Jarque-Bera e nota-se um excesso

de curtose, isto , os dados seguem uma distribuio normal e h provvel indicao da
necessidade de um modelo no-linear.
Teste de McLeod-Li

Para 95% de confiana, o teste de McLeod-Li indica a necessidade de um modelo no-

linear para representar os dados.
Com base no algoritmo de Billings e Voon (1986 apud FREITAS, SECURATO e

NETO, 2004), tem-se:
CAA-ARIMA-GARCH CAD-ARIMA-GARCH
0.6 0.4
0.4 0.2
0.2 0
0 -0.2
-0.2 -0.4
0 100 200 300 0 100 200 300
CDA-ARIMA-GARCH CDD-ARIMA-GARCH
0.4 0.6
0.2 0.4
0 0.2
-0.2 0
-0.4 -0.2
0 100 200 300 0 100 200 300
Figura 28: Comportamento da srie, ao longo do tempo, para o modelo ARIMA-

GARCH em 2 nveis de pr-processamento.
128
Observa-se, na figura anterior, que, na segunda decomposio, a parte de baixa

freqncia e a parte de alta freqncia da primeira subdiviso tiveram comportamento
no-linear, ao longo do tempo, enquanto que as demais apresentaram oscilaes, mas
com maior comportamento linear.
Teste de Hsieh

11 0,4698 0,68075 11 -0,4292 0,33389
12 -1,1475 0,12559 12 1,8214 0,96573
13 2,8339 0,9977 13 -2,0257 0,0214*
14 0,1524 0,56056 14 0,1589 0,56313
15 -0,8364 0,20146 15 -0,9621 0,168
22 -0,2085 0,41742 22 0,4216 0,66334
23 0,2751 0,60838 23 1,3729 0,91511
24 0,4183 0,66214 24 -1,4502 0,0735
25 -2,4288 0,00757* 25 0,6314 0,73611
33 -0,6885 0,24557 33 -0,3166 0,37577
34 -0,0774 0,46915 34 -0,6647 0,25312
35 1,8667 0,96903 35 0,2207 0,58734
44 0,3276 0,62839 44 -0,7103 0,23876
45 1,1642 0,87783 45 1,1564 0,87624
55 -0,568 0,28502 55 -0,3742 0,35413

11 0,3661 0,64285 11 0,0159 0,50634
12 0,4026 0,65638 12 -0,3975 0,3455
13 2,02 0,97831 13 -0,3184 0,37509
14 -0,4836 0,31433 14 -0,39 0,34827
15 -0,361 0,35905 15 -1,0603 0,1445
22 0,278 0,60949 22 0,3411 0,63349
23 -0,8093 0,20917 23 1,7178 0,95708
24 0,3801 0,64806 24 -0,549 0,2915
25 2,193 0,98585 25 -1,6716 0,0473*
33 0,2333 0,59224 33 -0,1566 0,43778
34 -1,6869 0,04581* 34 1,1567 0,8763
35 1,2024 0,8854 35 -1,1896 0,1171
44 -0,0308 0,48771 44 -0,479 0,31597
45 0,2495 0,59851 45 1,575 0,94237
55 0,2613 0,60307 55 -0,1297 0,4484
129
Conforme se observa, na tabela anterior, para quinze pares i,j, os valores dos
coeficientes do teste de Hsieh amostrais para as quatro subsries e o correspondente p-
valor para um nvel de confiana de 95%, apresenta apenas um coeficiente significante
(indicado com *) em cada uma delas, podendo-se dizer que, de maneira geral, no se
rejeita a hiptese nula dos coeficientes iguais a zero, o que indica uma no-linearidade
na varincia condicionada.
Estimando a equao para a subsrie CAA, tem-se:
caat = 1caat 1 + 2 caat 2 + t
2 I t 1 ~ N (0, ht )
t
ht = 0 + 1 t21 + 1ht 1
Parmetros Subsrie CAA Coeficiente Erro Padro Estatstica t Significncia

1 -1,319948 0,052072 -25,34834 0,0000
2 -0,866083 0,051420 -16,84337 0,0000
0 0,130362 0,053318 2,445007 0,0145
1 -0,161613 0,040130 -4,027200 0,0001
1 0,626123 0,208442 3,003817 0,0027
AR(2)-GARCH(1,1) -170,6000 1,432258 1,531427
Para a subsrie CAD:

cadt = 1cadt 1 + 2 cadt 2 + t
2 I t 1 ~ N (0, ht )
t
ht = 0 + 1 t21 + 1ht 1
Parmetros Subsrie CAD Coeficiente Erro Padro Estatstica t Significncia

1 1,034446 0,070684 14,63470 0,0000
2 -0,692425 0,051489 -13,44811 0,0000
0 1,109032 0,954899 1,161413 0,0245
1 -0,106960 0,030310 -3,528851 0,0004
1 0,040028 0,904893 0,044235 0,0464
ARMA(2,2)-GARCH(1,1) -166,5539 1,383499 1,454334
Estimando a equao para a subsrie CDA, tem-se:

130
cdat = 1cdat 1 + 2 cdat 2 + t
2 I t 1 ~ N (0, ht )
t
ht = 0 + 1 t21 + 1ht 1
Parmetros Subsrie CDA Coeficiente Erro Padro Estatstica t Significncia

1 0,877888 0,103388 8,491157 0,0000
2 -0,792456 0,060697 -13,05591 0,0000
0 -0,955782 0,078134 -12,23262 0,0000
1 0,224620 0,063608 3,531325 0,0004
1 0,199012 0,098891 2,012431 0,0442
AR(2)-GARCH(1,1) -148,9386 1,257569 1,356739
Estimando a equao para a subsrie CDD, tem-se:
cddt = 1cddt 1 + 2 cddt 2 + t
2 I t 1 ~ N (0, ht )
t
ht = 0 + 1 t21 + 1ht 1
Parmetros Subsrie CDD Coeficiente Erro Padro Estatstica t Significncia

1 0,071763 1,727515 0,041541 0,0000
2 -0,011981 1,988571 -0,006025 0,0000
0 0,071700 0,033239 2,157094 0,0310
1 -0,125130 0,011606 -10,78123 0,0000
1 0,766429 0,160036 4,789103 0,0000
AR(2)-GARCH(1,1) -145,8158 1,232385 1,331555
As redes recorrentes foram geradas com a arquitetura 10-2R-1. Estimando-se os

resultados por redes neurais com retropropagao, tem-se, a seguir, um quadro
resumindo o tipo de rede utilizado e as respectivas performances de seleo, teste e
validao. Por exemplo, o modelo neural para a subsrie CAA apresentou uma rede
MLP (Multilayer Perceptron) - MLP cuja arquitetura, identificao e seleo indicou
como a melhor rede, a MLP 1:5-8-1:1, com um neurnio na camada de entrada, nas
camadas ocultas cinco e oito, e um neurnio na camada de sada:
131
Subs Rede Desempenho Performance Performance Erro Erro Seleo Erro Teste Caractersticas
ries de treinam. Seleo Teste Treinamento
CAA MLP s5 1:5-8-1:1 0,999861 0,996576 0,994204 0,161463 0,175151 0,152884 BP100,CG4b
CAD MLP s5 1:5-8-1:1 0,999861 0,996576 0,994204 0,161463 0,175151 0,152884 BP100,CG4b
CDA MLP s5 1:5-2-1:1 0,972494 0,993032 1,028907 0,201680 0,209264 0,204046 BP100,CG21b
CDD MLP s5 1:5-8-1:1 0,981154 1,002502 0,990287 0,217439 0,242021 0,249169 BP67b
Estimando-se os valores e calculando as estimativas pontuais de erros para a

previso em 2 nveis de pr-processamento, tem-se:
MODELO ARMA-GARCH Modelo ARIMA(2,0,0)-GARCH(1,1)

pontos
TIC 0,99 TIC 0,96
MAPE 99,99% MAPE 11,37%
MODELO RN-BACKPROPAGATION - Modelo ARIMA(2,0,0)-GARCH(1,1)

pontos
TIC 0,99 TIC 0,86
MAPE 98,46% MAPE 13,05%
MODELO RN RECORRENTE - Modelo ARIMA(2,0,0)-GARCH(1,1)

pontos
TIC 0,69 TIC 0,14
MAPE 89,40% MAPE 5,80%
Correlao 0,37 Correlao 0,96
Fazendo o clculo do envelopamento para 200 sries simuladas e verificando quais

esto completamente contidas dentro do intervalo de confiana de 95% para a srie
prevista via procedimento esttico, tem-se:
132
Envelopamento Modelo Percentual

ARIMA-GARCH 48,15%
A seguir, tem-se os resultados das previses feitas e aps a etapa de ps-processamento.
Varlor Real X Intervalo de Previso por redes neurais

recorrentes - 2 Nvel
2
1,5
0,5
0 t
0 20 40 60 80 100 120 140 160 180 200
-0,5
-1
- 1,5
-2
Figura 29: Intervalo de previso em 2 nvel para redes recorrentes para a amostra de
teste do modelo ARIMA-GARCH
Varlor Real X Intervalo de Previso por redes neurais

recorrentes - 2 Nvel
2
1,5
0,5
0 t
0 1 2 3 4 5 6 7 8 9 10
-0,5
-1
- 1,5
-2
Figura 30: Intervalo de previso em 2 nvel para redes recorrentes para os primeiros
10 elementos do modelo ARIMA-GARCH.
133
Varlor Real X Intervalo de Previso por redes neurais com

1,5
0,5
0 t
0 20 40 60 80 100 120 140 160 180 200
-0,5
-1
- 1,5
Figura 31: Intervalo de previso em 2 nvel feito por redes neurais com
retropropagao do modelo ARIMA-GARCH
Varlor Real X Intervalo de Previso por redes neurais com

1,5
0,5
0 t
0 1 2 3 4 5 6 7 8 9 10
-0,5
-1
- 1,5
Figura 32: Intervalo de previso em 2 nvel para redes neurais com retropropagao
para os primeiros 10 elementos do modelo ARIMA-GARCH.
Varlor Real X Intervalo de Previso por um Modelo ARIMA-

GARCh - 2 Nvel
1,5
0,5
0 t
0 20 40 60 80 100 120 140 160 180 200
-0,5
-1
- 1,5
Figura 33: Intervalo de previso em 2 nvel feito por um modelo ARIMA-GARCH

134
Varlor Real X Intervalo de Previso por um Modelo ARIMA-

GARCh - 2 Nvel
1,5
0,5
0 t
0 1 2 3 4 5 6 7 8 9 10
-0,5
-1
- 1,5
Figura 34: Intervalo de previso em 2 nvel por um modelo ARIMA-GARCH para os

Nos grficos anteriores, o valor real corresponde ao valor no nvel do processo

simulado. O valor mnimo o termo inferior da banda de previso mdia do
envelopamento e o valor mximo o termo superior da banda.
Teste para Independncia Estatstica dos Resduos Teste BDS
Como visto anteriormente, o teste para independncia deve ser aplicado para ver se a
sucesso cronolgica apresenta independncia nos resduos. Suas hipteses so:
H 0 :os resduos so estocasticamente independentes
H1 : os resduos so estocasticamente dependentes

Resduos Modelo ARIMA-GARCH Previsto pelo Resduos Modelo ARIMA - GARCH Previsto
GARCH com 1 Nvel de pr-processamento pelo GARCH com 2 Nveis de pr-processamento
Padro Z Padro Z
2 -0,000944 0,004561 -0,206852 0,8361 2 -0,000648 0,004541 -0,142673 0,8865
3 0,003871 0,007238 0,534773 0,5928 3 0,003913 0,007202 0,543379 0,5869
4 0,006691 0,008603 0,777761 0,4367 4 0,006235 0,008557 0,728710 0,4662
5 0,006365 0,008950 0,711227 0,4769 5 0,006221 0,008897 0,699292 0,4844
6 0,006514 0,008613 0,756320 0,4495 6 0,006410 0,008558 0,748946 0,4539
Resduos Modelo ARIMA-GARCH Previsto RN Resduos Modelo ARIMA-GARCH Previsto RN
com retrop. com 1 Nvel de pr-processamento com retrop. com 2 Nveis de pr-processamento
Padro Z Padro Z
2 0,103531 0,003402 30,43279 0,0000 2 -0,000859 0,004344 -0,197658 0,8433
3 0,143677 0,005346 26,87661 0,0000 3 0,002777 0,006920 0,401302 0,6882
4 0,240527 0,006291 38,23391 0,0000 4 0,005129 0,008258 0,621073 0,5346
5 0,306458 0,006478 47,30565 0,0000 5 0,005429 0,008623 0,629619 0,5289
6 0,355816 0,006172 57,65411 0,0000 6 0,006309 0,008331 0,757276 0,4489
135
Resduos Modelo ARIMA-GARCH Previsto RN Resduos Modelo ARIMA-GARCH Previsto RN

recorrentes com 1 Nvel de pr-processamento recorrentes com 2 Nveis de pr-processamento
Padro Z Padro Z
2 1,90E-05 8,50E-06 2,231815 0,0256 2 -0,000614 0,000965 -0,636124 0,5247
3 -7,48E-07 2,79E-07 -2,675869 0,0075 3 0,000890 0,002063 0,431336 0,6662
4 -6,75E-09 6,91E-09 -0,977534 0,3283 4 0,002581 0,003301 0,781933 0,4343
5 -5,91E-11 1,50E-10 -0,394381 0,6933 5 0,002600 0,004621 0,562700 0,5736
6 -5,09E-13 3,01E-12 -0,168993 0,8658 6 0,003773 0,005985 0,630418 0,5284
O software Eviews-5.0 calcula a estatstica BDS para todas as dimenses de dois at o

valor especificado variando a dimenso de correlao para maximizar o poder do teste.
Neste caso, calculou-se at a sexta dimenso e optou-se por no se rejeitar a hiptese
nula ao nvel de significncia de 5%, indicando que os dados dos resduos padronizados
do modelo ARIMA-GARCH so independentes para os modelos gerados baseados na
anlise do p-valor, com exceo do primeiro nvel de pr-processamento na rede neural
com retropropagao.
Na figura, a seguir, tem-se as estatsticas dos resduos do ps-processamento onde a

hiptese nula e alternativa so:
H 0 : os resduos seguem uma distribuio normal
H1 : os resduos no seguem uma distribuio normal
20 20
Series: RESGG1 Series: RESGG
16 Observations 200 16 Observations 200
Mean 0.016808 Mean 0.018021

12 Median -0.024538
12 Median -0.018860
Maximum 1.323752
Maximum 1.328934
Minimum -1.148323
Minimum -1.171343 8
8 Std. Dev. 0.473788
Std. Dev. 0.474645 Skewness 0.219554
Skewness 0.207984 Kurtosis 2.943526
Kurtosis 2.962400 4
4
Jarque-Bera 1.453699 Probability 0.441894
0 -1.0 -0.5 0.0 0.5 1.0
-1.0 -0.5 0.0 0.5 1.0
1 Nvel 2 Nvel
Figura 35: Distribuio dos resduos do modelo ARIMA-GARCH previsto por um
modelo ARIMA-GARCH, em 1 e 2 nveis de pr-processamento.
136
100 24
Series: RESGB1 Series: RESGB
20
Mean 0.313517 16 Mean -0.034671

60 Median 0.324680 Median -0.066092
12
Minimum 0.208627 Minimum -1.149243
40 Std. Dev. 0.032075 Std. Dev. 0.473491
Skewness -0.139154 8 Skewness 0.230222
Kurtosis 1.803131 Kurtosis 2.831074
20
4
Jarque-Bera 12.58293 Jarque-Bera 2.004534
0 0
0.25 0.30 0.35 -1.0 -0.5 0.0 0.5 1.0
1 Nvel 2 Nvel
Figura 36: Distribuio dos resduos do modelo ARIMA-GARCH previsto por redes
neurais com retropropagao, em 1 e 2 nveis de pr-processamento
28
24 Series: RESGR1
Series: RESGR Sample 1 200
24
Sample 1 200
20 Observations 200
Observations 200
20
Mean 0.311580
16 Mean -7.65E-06
16 Median 0.309587
Median -0.030082
Maximum 1.301860
Maximum 1.463796
12 Minimum -0.461242
Minimum -1.225987 12
Std. Dev. 0.444179 Std. Dev. 0.184073
8 Skewness 0.233093 Skewness 1.017067
8
4 4
0 0
-1.0 -0.5 0.0 0.5 1.0 -0.5 0.0 0.5 1.0 1.5
1 Nvel 2 Nvel
Figura 37: Distribuio dos resduos do modelo ARIMA-GARCH previsto por redes
neurais recorrentes, em 1 e 2 nveis de pr-processamento
Observa-se que os dados dos resduos so normais pela estatstica de Jarque-Bera, com
exceo no primeiro nvel de pr-processamento das redes neurais com
retropropagao, e no segundo nvel das redes neurais recorrentes.
137
4.2 SIMULAO DE UM PROCESSO ARIMA
Considere agora um DGP para o modelo ARIMA, da forma ARIMA(1,0,0), com o

seguinte parmetro: 1 = 0,3 .
Utilizando-se o programa 5, disponvel no Apndice C, foram geradas 1200

observaes para o modelo, sendo divididas em duas partes: a primeira com mil
observaes foi utilizada para gerar o modelo para previso e as 200 restantes utilizadas
para validar o modelo e seu grfico com 1000 pontos seria:
3
Xt
2
t
200 400 600 800 1000
-1
-2
-3
Figura 38: DGP para um modelo AR(1)
Modelo AR(1)
H 0 : 3RU -61,28628 -2,76
H1 : 2 RU
H 0 : 2 RU -25,32047 -3,37
H1 :1RU -31,97124 -3,77
H 0 :1RU -32,93413 -3,42
H1 : 0 RU -14,96314 -3,80
-16,43593 -4,16
138

Teste de independncia estatstica BDS
Modelo AR(1)
Dimenso BDS Erro Padro Estatstica Z p-valor
2 -9,45E-06 1,62E-06 -5,826504 0,0000
3 -9,97E-07 4,06E-08 -24,53405 0,0000
4 -1,00E-08 7,65E-10 -13,11928 0,0000
5 -1,00E-10 1,26E-11 -7,930219 0,0000
6 -1,01E-12 1,93E-13 -5,243348 0,0000
Calculou-se at a sexta dimenso e concluiu-se por rejeitar a hiptese nula ao nvel de

significncia de 5%, indicando que os dados da sucesso cronolgica so dependentes,
baseado na anlise do p-valor, sendo que pelo menos um dos p-valores deve ser menor
que 5%.
100
Series: A
Sample 1 1000
Mean 0.055796
60 Median 0.033190
Maximum 2.970780
Minimum -2.907510
40 Std. Dev. 1.024893
Skewness -0.036009
Kurtosis 2.786074
20
0
-3 -2 -1 0 1 2 3
Figura 39: Distribuies do modelo AR(1) simulado
Teste de McLeod-Li
Modelo AR(1)
139
Dessa forma, o teste de McLeod-Li para 5 defasagens no se rejeita a hiptese nula pelo
fato do p-valor ser inferior a 5%. Isto indica que o modelo apresenta um comportamento
linear
E seguindo o organograma, foi escolhida novamente a ondaleta de Daubesch nmero 1

(DB1). A figura, a seguir, ilustra a decomposio (pr-processamento), em primeiro
nvel, da srie no nvel original feita com o auxlio do programa 2 do Apndice C:
CA-1Nvel CD-1Nvel
4 4
2 2
0 0
0 100 200 300 400 500 0 100 200 300 400 500
-2 -2
-4 -4
Figura 40: Pr-processamento em 1 nvel para o DGP do modelo AR(1)
Teste de razes unitria
Hipteses Estatstica Valores Hipteses Estatstica Valores Crticos a
de Teste Crticos a 5% de Teste 5%
H 0 : 3RU -36,79883 -2,76 H 0 : 3RU -50,94641 -2,76
H1 : 2 RU H1 : 2 RU
H 0 : 2 RU -15,34845 -3,37 H 0 : 2 RU -14,25024 -3,37
H1 :1RU -20,82436 -3,77 H1 :1RU -24,79960 -3,77
H 0 :1RU -22,75377 -3,42 H 0 :1RU -20,90149 -3,42
H1 : 0 RU -6,216736 -3,80 H1 : 0 RU -7,698684 -3,80
-13,30905 -4,16 -12,44013 -4,16

140
Teste de independncia estatstica - BDS
Padro Z Padro Z
2 -3,00E-06 4,85E-05 -0,061797 0,9507 2 4,77E-05 3,97E-05 1,199797 0,2302
3 2,87E-05 5,75E-06 4,989138 0,0000 3 -1,82E-06 4,68E-06 -0,389464 0,6969
4 1,81E-05 5,12E-07 35,39495 0,0000 4 -6,13E-06 4,14E-07 -14,81243 0,0000
5 7,84E-06 3,99E-08 196,4425 0,0000 5 -3,04E-07 3,20E-08 -9,493997 0,0000
6 -1,52E-08 2,88E-09 -5,280915 0,0000 6 -1,49E-08 2,29E-09 -6,514062 0,0000
O teste BDS rejeita a hiptese de independncia das subsries; todos com 95% de
confiana, j que pelo menos um dos valores menor que 5%.
Teste de normalidade
Subsries: CA Subsries: CD
50 60
40 Observations 400 50
Observations 400
Mean 0.110225 40 Mean -0.015633
30 Median 0.142537
Median -0.034499
Maximum 2.918894
Minimum -3.439481 30 Maximum 2.410167
20 Std. Dev. 1.131283 Minimum -2.649748
Skewness -0.016080 Std. Dev. 0.863606
Kurtosis 2.805492
10 Kurtosis 3.286729
Jarque-Bera 0.647794 10
Probability 0.723325 Jarque-Bera 3.155536
0 Probability 0.206435
-3 -2 -1 0 1 2 3 0
-2 -1 0 1 2
Figura 41:Distribuio das subsries para o modelo AR(1)
No se rejeita a hiptese de normalidade pelo teste de Jarque-Bera, com 95% de

confiana para as subsries CA e CD.
Teste de McLeod-Li
141
Para 95% de confiana, o teste de McLeod-Li aceita-se a hiptese de linearidade do

modelo simulado, isto , h evidncias de que um modelo linear melhor ajustados s
subsries.
Xt
CA-ARIMA-GARCH
0.3
0.2
0.1
-0.1
0 100 200 300 400 500 600 t
Xt CD-ARIMA-GARCH
0.3
0.2
0.1
-0.1
-0.2 t
0 100 200 300 400 500 600
Figura 42: Comportamento da srie ao longo do tempo para o modelo ARIMA em 1

nvel de pr-processamento.
Observa-se que a subsrie de baixa freqncia apresenta comportamento no-linear,

enquanto que a subsrie de alta freqncia tem comportamento linear ao longo da
trajetria.
Verificando-se o correlograma da srie simulada no pr-processamento, tem-se:

142
CA CD
Modelo ARIMA(1,0,0) Modelo ARIMA(3,0,0)
FAC FAC
e e
FACP FACP
Figura 43: Funes FAC e FACP para o DGP do modelo AR(1)
Parmetros Subsries CA Coeficiente Erro Padro Estatstica t Significncia

1 0,225422 0,048613 4,637076 0,0000

AR(1) -604,7926 3,036554 3,046552
Parmetros Subsries CD Coeficiente Erro Padro Estatstica t Significncia

1 -0,170420 0,049392 -3,450396 0,0006

AR(1) -501,8275 2,520439 2,530436
143
Estimando-se os valores e calculando as estimativas de erros pontuais para a previso

das subsries e fazendo o ps-processamento com o auxlio do programa 3, tem-se:
MODELO ARIMA - Modelo ARIMA(1,0,0)

pontos
TIC 1,00 TIC 0,90
MAPE 100,00% MAPE 10,90%
MODELO ARIMA Rede Neural Recorrente

pontos
TIC 0,99 TIC 0,64
MAPE 100,00% MAPE 8,76%
MODELO ARIMA Rede Neural Retropropagao

pontos
TIC 0,99 TIC 0,86
MAPE 110,11% MAPE 10,24%
Fazendo o clculo do envelopamento para 200 sries simuladas e verificando quais se

enquadram dentro do intervalo de confiana de 95%, para a srie prevista, via
procedimento esttico, tem-se:
Envelopamento modelo Percentual

Modelo ARIMA 92,67%
144
Previso - Modelo ARIMA 1 nvel

Xt
1,5
1
0,5
0 t
-0,5 1 2 3 4 5 6 7 8 9 10
-1
-1,5
real previsto
Figura 44: Previso em 1 nvel para o modelo AR(1) por

para os primeiros 10 elementos.
Apresenta-se, a seguir, o grfico da decomposio em 2 nveis do DGP para o modelo

ARIMA com o auxlio do programa 2, sobre as duas primeiras subsries anteriores:
CAA CDA
4 3
2
2
1
0 0
0 50 100 150 200 250 -1 0 50 100 150 200 250
-2
-2
-4 -3
CAD CDD
4 4
2 2
0 0
0 50 100 150 200 250 0 50 100 150 200 250
-2 -2
-4 -4
Figura 45: Pr-processamento em 2 nvel para o DGP do modelo AR(1)
A partir do mesmo roteiro do modelo anterior, apresenta-se, a seguir, os resultados

obtidos na tabela a seguir:
145

5%
H 0 : 3RU -31,95246 -2,76 H 0 : 3RU -37,73648 -2,76
H1 : 2 RU H1 : 2 RU
H 0 : 2 RU -10,32123 -3,37 H 0 : 2 RU -10,56451 -3,37
H1 :1RU -19,99126 -3,77 H1 :1RU -20,71348 -3,77
H 0 :1RU -14,66594 -3,42 H 0 :1RU -15,96954 -3,42
H1 : 0 RU -7,184838 -3,80 H1 : 0 RU -6,150885 -3,80
-8,716525 -4,16 -9,942485 -4,16

5%
H 0 : 3RU -35,01270 -2,76 H 0 : 3RU -34,24383 -2,76
H1 : 2 RU H1 : 2 RU
H 0 : 2 RU -10,72136 -3,37 H 0 : 2 RU -11,73372 -3,37
H1 :1RU -19,88246 -3,77 H1 :1RU -17,81364 -3,77
H 0 :1RU -15,26169 -3,42 H 0 :1RU -15,87592 -3,42
H1 : 0 RU -7,034603 -3,80 H1 : 0 RU -7,299054 -3,80
-8,978980 -4,16 -8,577802 -4,16
Observa-se que, com 95% de confiana, ambas as quatro subsries definidas no pr-
processamento so estacionrias.

Padro Z Padro Z
2 -0,000216 9,45E-05 -2,286002 0,0223 2 -0,000344 6,10E-05 -5,630532 0,0000
3 -4,09E-05 1,19E-05 -3,432417 0,0006 3 -3,99E-05 7,14E-06 -5,590338 0,0000
4 -7,11E-06 1,13E-06 -6,303094 0,0000 4 -5,08E-06 6,28E-07 -8,085309 0,0000
5 -3,77E-07 9,37E-08 -4,018874 0,0001 5 -2,41E-07 4,83E-08 -4,979506 0,0000
6 -2,04E-08 7,21E-09 -2,837173 0,0046 6 -1,14E-08 3,44E-09 -3,310096 0,0009
146

Padro Z Padro Z
2 -4,01E-05 8,12E-05 -0,494265 0,6211 2 0,000460 6,98E-05 6,586959 0,0000
3 -6,89E-05 1,02E-05 -6,777076 0,0000 3 7,44E-05 8,55E-06 8,698174 0,0000
4 -6,86E-06 9,55E-07 -7,186312 0,0000 4 -5,99E-06 7,87E-07 -7,611436 0,0000
5 -3,60E-07 7,86E-08 -4,577967 0,0000 5 -2,92E-07 6,34E-08 -4,595844 0,0000
6 -1,83E-08 6,00E-09 -3,059027 0,0022 6 -1,43E-08 4,74E-09 -3,024861 0,0025
O teste de independncia no aceita a hiptese nula da independncia das observaes.
28 28
24 Sample 1 250 24 Sample 1 250
20 20
Mean 0.111593 Mean 0.050047
16 Median 0.129708 16 Median 0.038743
12 Minimum -3.299709 Minimum -2.985643
12
Std. Dev. 1.271061 Std. Dev. 1.060927
Skewness -0.087580 Skewness 0.075547
8 8
4 Jarque-Bera 0.357424 4
0 0
-2.50 -1.25 0.00 1.25 2.50 -3 -2 -1 0 1 2 3
36 32
32 Sample 1 250 28 Sample 1 250
24
24 Mean -0.025967 Mean 0.064845
Median -0.024640 20
20 Median 0.017853
16 Minimum -2.276417 16
Minimum -2.429397
Std. Dev. 0.775176
12 12 Std. Dev. 0.929946
Skewness 0.065554
Skewness 0.160388
8 Kurtosis 3.461628
8 Kurtosis 2.868702
-2 -1 0 1 2 0
-2 -1 0 1 2 3
Figura 46: Distribuio em 2 nvel para o pr-processamento do DGP do modelo

AR(1)
O mesmo ocorre com o teste de normalidade dos dados, o que indica que todas as
subsries apresentam comportamento estatisticamente normal.
147
Teste de McLeod-Li

Pelo teste, aceita-se a hiptese nula que indica que o modelo linear.
Xt
CA-ARIMA-GARCH
0.3
0.2
0.1
-0.1 t
0 100 200 300 400 500 600
Xt CD-ARIMA-GARCH
0.3
0.2
0.1
-0.1
-0.2 t
0 100 200 300 400 500 600
Figura 47: Comportamento da srie ao longo do tempo para o modelo ARIMA em 2

nveis de pr-processamento.
A subsrie de baixa freqncia apresenta comportamento no-linear, ao passo que a de

alta freqncia tem comportamento linear ao longo da trajetria.
Estimando-se os parmetros para cada modelo tem-se:

148
Parmetros Subsrie CAA Coeficiente Erro Padro Estatstica t Significncia

1 -0,710816 0,215902 -3,292299 0.0011

AR(1) -410,7312 3,344606 3,401274
Parmetros Subsrie CAD Coeficiente Erro Padro Estatstica t Significncia

1 -0,171287 0,061596 -2,780803 0.0058

AR(1) -360,7360 2,905510 2,919636
Parmetros Subsrie CDA Coeficiente Erro Padro Estatstica t Significncia

1 -0,223134 0,064951 -3,435409 0.0007

AR(1) -253,0027 2,295989 2,341825
Parmetros Subsrie CDD Coeficiente Erro Padro Estatstica t Significncia

1 0,156319 0,067640 2,311057 0.0218

AR(1) -284,0033 2,700965 2,779610

em 2 nveis de pr-processamento e fazendo o ps-processamento, tem-se:
149
MODELO ARIMA
pontos
TIC 0,97 TIC 0,91
MAPE 99,68% MAPE 9,19%
Correlao 0,11 Correlao -0,36
MODELO ARIMA Redes Neurais Recorrentes

pontos
TIC 0,90 TIC 0,53
MAPE 112,19% MAPE 7,88%
MODELO ARIMA Redes Neurais Retropropagao

pontos
TIC 0,90 TIC 0,82
MAPE 108,67% MAPE 28,99%
Nota-se que a previso feita para o curto prazo apresenta menos oscilaes nas
estatsticas pontuais, e que as redes neurais recorrentes tambm apresentam um
signiticativo comportamento, principalmente em relao correlao.

enquadram dentro do intervalo de confiana de 95% para a srie prevista, via

Redes Neurais Recorrente 95,00%
Redes Neurais Retropropagao 95,00%
Modelo ARIMA 90,69%
150
Intervalo de Previso - Modelo ARIMA

4
3
2
1
0
-1
-2
-3
-4
Valor no nvel Mnimo Mximo
Figura 48: Intervalo de previso em 2 nvel para o DGP do modelo AR(1)
Previso - Modelo ARIMA 2 nveis
1,5
1
0,5
0
-0,5 1 2 3 4 5 6 7 8 9 10
-1
-1,5
real previsto
Figura 49: Previso dos primeiros 10 pontos para o 2 nvel para o DGP
do modelo AR(1)
Fazendo a troca da ondaleta de Daubesch nmero um pela ondaleta chapu mexicano,

tm-se os seguintes resultados:
MODELO ARIMA
Estatsticas Valor Valor Estatsticas Valor Valor
de Previso 1 nvel de pr- 2 nveis de de Previso 1 nvel de pr- 2 nveis de
Pontual processamento pr- Pontual processamento pr-
para os 200 processamento para os 10 processamento
pontos primeiros
pontos
TIC 0,99 0,98 TIC 0,40 0,18
Correlao 0,12 0,16 Correlao 0,756602 0,97
MAPE 100,00% 100,82% MAPE 7,59% 5,69%
151

Modelo ARIMA 1 nvel 89,67%
Modelo ARIMA 2 nveis 83.25%
Fazendo a troca da ondaleta de Daubesch, nmero um, pela ondaleta biortogonal 3.1,
tem-se o seguinte resultado:
MODELO ARIMA
Estatsticas Valor Valor Estatsticas Valor Valor
de Previso 1 nvel de pr- 2 nveis de de Previso 1 nvel de pr- 2 nveis de
Pontual processamento pr- Pontual processamento pr-
para os 200 processamento para os 10 processamento
pontos primeiros
pontos
TIC 1 0,99 TIC 0,92 0,62
Correlao -0,04 0,08 Correlao -0,27 0,29
MAPE 100,00% 100,23% MAPE 10,55% 15,01%

Modelo ARIMA 1 nvel 92,70%
Modelo ARIMA 2 nveis 90,03%

152
Resduos Modelo ARIMA Previsto pelo AR(1) Resduos Modelo ARIMA Previsto pelo AR(1)
com 1 Nvel de pr-processamento com 2 Nveis de pr-processamento
Padro Z Padro Z
2 -3,24E-06 1,07E-06 -3,011273 0,2625 2 -2,73E-06 9,36E-07 -2,916037 0,3522
3 -5,65E-09 1,44E-08 -0,393125 0,6942 3 -4,35E-09 1,23E-08 -0,354429 0,7230
4 -9,66E-12 1,45E-10 -0,066870 0,9467 4 -6,77E-12 1,21E-10 -0,055943 0,9554
5 -1,77E-14 1,27E-12 -0,013934 0,9889 5 -1,03E-14 1,04E-12 -0,009815 0,9922
6 -2,96E-17 1,04E-14 -0,002848 0,9977 6 -1,33E-17 8,36E-15 -0,001590 0,9987
Neste caso, calculou-se tambm at a sexta dimenso e concluiu-se por no se rejeitar a

hiptese nula ao nvel de significncia de 5%, indicando que os dados dos resduos do
modelo ARIMA so independentes para os modelos gerados baseados na anlise do p-
valor.
Na figura, a seguir, tm-se as estatsticas dos resduos do ps-processamento, sendo que

a hiptese nula e alternativa so:
20 20
Series: RAR1 Series: RAR2
16 Observations 200 16 Observations 200
Mean 0.096871 Mean 0.096081

12 Median 0.098783 12 Median 0.089083
8 Std. Dev. 1.060025 8 Std. Dev. 1.064680
Skewness 0.166160 Skewness 0.191241
4 4
0 0
-2 -1 0 1 2 -2 -1 0 1 2 3
1 Nvel 2 Nvel
Figura 50: Distribuio dos resduos do modelo AR(1) previsto por um modelo
ARIMA, em 1 e 2 nveis de pr-processamento.
Observa-se que os dados dos resduos so normais pela estatstica de Jarque-Bera.

153
4.3 SIMULAO DE UM MOVIMENTO BROWNIANO GEOMTRICO
Gerando-se um DGP com a seguinte expresso, X t = X t 1 + X t 1 t + tZ t , ( )

{Zt } ~ N (0;1) , para o movimento browniano geomtrico, com parmetros
= 0, 09 e = 0, 40 . Tem-se mil pontos no grfico a seguir:
Simulao - Movimento Browniano
9 Xt
8
7
6
5
4
3
2
1
0 t
111
166
221
276
331
386
441
496
551
606
661
716
771
826
881
936
991
56
1
Figura 51: Simulao de um movimento browniano geomtrico
Movimento Browniano
H 0 : 3RU -56,15525 -2,76
H1 : 2 RU
H 0 : 2 RU -31,81716 -3,37
H1 :1RU -22,45761 -3,77
H 0 :1RU -31,80359 -3,42
H1 : 0 RU -22,43190 -3,80
-0,324796* -4,16
Nota-se a no rejeio da hiptese nula de no estacionariedade para a presena de uma

raiz unitria na sucesso cronolgica do movimento browniano geomtrico.
154
Movimento Browniano Geomtrico

2 -3.56E-08 1.19E-08 -2.978556 0.2901
3 -6.75E-12 3.21E-11 -0.209812 0.8338
4 -1.28E-15 6.49E-14 -0.019788 0.9842
5 -2.46E-19 1.15E-16 -0.002140 0.9983
6 -4.72E-23 1.88E-19 -0.000251 0.9998
O teste de independncia, revela a no-rejeio da hiptese nula pelo p-valor que so

superiores ao nvel de significncia de 5%, concluindo, pela independncia das
observaes, indicando que os dados representam um RBI.
A figura, a seguir, ilustra a distribuio da sucesso cronolgica do movimento
browniano geomtrico.
100
Series: BROW
Sample 1 1000
Mean 0.055796
60 Median 0.033190
Maximum 2.970780
Minimum -2.907510
40 Std. Dev. 1.024893
Skewness -0.036009
Kurtosis 2.786074
20
0
-3 -2 -1 0 1 2 3
Figura 52: Distribuio do movimento browniano geomtrico simulado
E seguindo o fluxograma, foi escolhida novamente a ondaleta de Daubesch

nmero 1 (DB1). A figura, a seguir, ilustra a decomposio (pr-processamento) em
primeiro nvel da srie no nvel original:
155
CA - 1 Nvel - Brow niano CD - 1 Nvel - Brow niano
12 0,3
10 0,2
8 0,1
6
0
4
142
189
236
283
330
377
424
471
48
95
1
-0,1
2
0 -0,2
133
177
221
265
309
353
397
441
485
45
89
1
-0,3
Figura 53: Pr-processamento em 1 nvel do movimento browniano geomtrico
5%
H 0 : 3RU -30,08746 -2,76 H 0 : 3RU -50,20512 -2,76
H1 : 2 RU H1 : 2 RU
H 0 : 2 RU -18,06209 -3,37 H 0 : 2 RU -13,58794 -3,37
H1 :1RU -14,72879 -3,77 H1 :1RU -26,37183 -3,77
H 0 :1RU -17,97134 -3,42 H 0 :1RU -19,45983 -3,42
H1 : 0 RU -14,70409 -3,80 H1 : 0 RU -9,214053 -3,80
0,546188* -4,16 -11,54976 -4,16

indica que ambas as subsries so estacionrias. Nota-se ainda, que a sucesso
cronolgica do movimento browniano na subsrie de baixa freqncia, apresenta
comportamento semelhante sucesso cronolgica inicialmente simulada.
Padro Z Padro Z
2 -3,30E-08 4,93E-08 -0,668203 0,5040 2 -1,77E-08 3,91E-08 -0,452892 0,6506
3 -6,07E-12 2,93E-10 -0,020752 0,9834 3 -2,40E-12 2,28E-10 -0,010519 0,9916
4 -8,58E-16 1,30E-12 -0,000659 0,9995 4 -3,27E-16 9,92E-13 -0,000329 0,9997
5 -1,50E-19 5,06E-15 -2,97E-05 1,0000 5 -2,80E-20 3,78E-15 -7,39E-06 1,0000
6 -2,67E-23 1,82E-17 -1,46E-06 1,0000 6 -3,54E-24 1,33E-17 -2,65E-07 1,0000
156
O teste de independncia revela a no-rejeio da hiptese nula pelo p-valor que so

superiores ao nvel de significncia de 5%, concluindo pela independncia das
observaes, indicando que os dados representam um processo independente.
60 80
Sample 1 500 70 Sample 1 500
50
60
40 Mean 0.010801 Mean -0.067182
Median 0.047498 50
Median -0.036666
30 Maximum 3.624622 Maximum 2.554869
40
Std. Dev. 1.227793 30 Std. Dev. 0.837480
20 Skewness -0.054964 Skewness -0.046020
10
Jarque-Bera 0.273812 10 Jarque-Bera 1.434332
0 0
-3.75 -2.50 -1.25 0.00 1.25 2.50 3.75 -3 -2 -1 0 1 2
Figura 54: Distribuies em 1 nvel do movimento browniano
No se rejeita a hiptese de normalidade pelo teste de Jarque-Bera, para a sucesso

cronolgica de CA e CD, o que confirma ser um movimento browniano geomtrico.
Aps aplicar o pr-processamento novamente para as duas primeiras sub-divises, tem-

se os grficos das subsries decompostas. Utilizou-se a mesma ondaleta.
CAA - Browniano CAD - Browniano
20 0,4
0,3
15 0,2
0,1
10
0
5 -30-0,1 20 70 120 170 220 270
-0,2
0 -0,3
-30 20 70 120 170 220 270 -0,4
157
CDA - Browniano CDD - Browniano
0,3 0,3
0,2 0,2
0,1 0,1
0 0
-30-0,1 20 70 120 170 220 270 -30- 0,1 20 70 120 170 220 270
-0,2 - 0,2
-0,3 - 0,3
Figura 55: Pr-processamento em 2 nvel do movimento browniano geomtrico

5%
H 0 : 3RU -24,87385 -2,76 H 0 : 3RU -32,61729 -2,76
H1 : 2 RU H1 : 2 RU
H 0 : 2 RU -15,34300 -3,37 H 0 : 2 RU -9,160192 -3,37
H1 :1RU -9,025265 -3,77 H1 :1RU -19,56653 -3,77
H 0 :1RU -15,22935 -3,42 H 0 :1RU -15,53842 -3,42
H1 : 0 RU -8,970041 -3,80 H1 : 0 RU -3,709442 -3,80
0,245851* -4,16 -10,59386 -4,16
5%
H 0 : 3RU -29,37741 -2,76 H 0 : 3RU -27,85526 -2,76
H1 : 2 RU H1 : 2 RU
H 0 : 2 RU -9,627443 -3,37 H 0 : 2 RU -9,468162 -3,37
H1 :1RU -17,91034 -3,77 H1 :1RU -18,09463 -3,77
H 0 :1RU -14,61356 -3,42 H 0 :1RU -13,51133 -3,42
H1 : 0 RU -5,231595 -3,80 H1 : 0 RU -6,717338 -3,80
-9,147208 -4,16 -8,064806 -4,16
Observa-se claramente que a subsrie de baixa freqncia do 2 nvel de pr-

processamento se apresenta com a mesma forma do modelo simulado originalmente, ou
seja, a transformada de ondaleta de baixa freqncia no decompe o movimento
browniano geomtrico. Considerando um nvel de confiana de 95%, se rejeita a todas
as hipteses nulas, o que indica que ambas as subsries so estacionrias.
158
Subsries: CAA Subsries: CAD

Padro Z Padro Z
2 2,89E-05 1,06E-06 27,32995 0,4101 2 2,97E-05 7,33E-07 40,45374 0,4214
3 -6,79E-09 1,42E-08 -0,478657 0,6322 3 -4,62E-09 9,42E-09 -0,490176 0,6240
4 -1,33E-11 1,43E-10 -0,092749 0,9261 4 -7,94E-12 9,08E-11 -0,087440 0,9303
5 -2,64E-14 1,27E-12 -0,020840 0,9834 5 -1,39E-14 7,67E-13 -0,018099 0,9856
6 -4,81E-17 1,04E-14 -0,004630 0,9963 6 -2,47E-17 6,00E-15 -0,004114 0,9967
Subsries: CDA Subsries: CDD

Padro Z Padro Z
2 2,69E-05 1,03E-06 26,21474 0,3841 2 -3,17E-06 8,75E-07 -3,627919 0,3996
3 -1,25E-08 1,49E-08 -0,836821 0,4027 3 -5,79E-09 1,16E-08 -0,499994 0,6171
4 -2,98E-11 1,62E-10 -0,184312 0,8538 4 -9,98E-12 1,15E-10 -0,086680 0,9309
5 -7,26E-14 1,54E-12 -0,047096 0,9624 5 -1,85E-14 1,00E-12 -0,018419 0,9853
6 -1,65E-16 1,36E-14 -0,012133 0,9903 6 -3,11E-17 8,09E-15 -0,003841 0,9969
O teste de independncia revela a no-rejeio da hiptese nula pelo p-valor que so

superiores ao nvel de significncia de 5%, concluindo pela independncia das
observaes.
159
4.4 SIMULAO DE UM PROCESSO BILINEAR
Considere agora um DGP para o modelo bilinear da equao (2.76) com a seguinte
equao: X t = 0.3 X t 1 + 0.8 X t 1 t 1 + t . O DGP possui um grande coeficiente associado
ao termo bilinear e apresenta um grande nmero de exploses de grande amplitude.
Foram gerados, pelo programa 6 do Apndice C, 1400 valores para o modelo,

descartados os 200 primeiros para que os valores iniciais atribudos x0 = 0 = 0 no
tenham influncia no comportamento do modelo. Seu grfico com 1000 pontos pode ser
visto a seguir:
40
Xt 30
20
10
t
0
0 200 400 600 800 1000
-10
-20
Figura 56: DGP para um modelo bilinear.
Modelo Bilinear
H 0 : 3RU -55,61291 -2,76
H1 : 2 RU
H 0 : 2 RU -24,91645 -3,37
H1 :1RU -31,05414 -3,77
H 0 :1RU -30,14238 -3,42
H1 : 0 RU -18,63510 -3,80
-13,32537 -4,16

160
Modelo Bilinear
2 0,074498 0,003227 23,08473 0,0000
3 0,119117 0,005131 23,21576 0,0000
4 0,139180 0,006114 22,76362 0,0000
5 0,144287 0,006378 22,62265 0,0000
6 0,138812 0,006156 22,54743 0,0000

baseados na anlise do p-valor, sendo que pelo menos um dos p-valores deve ser menor
que 5%.
120
Series: BILINEAR3
Sample 1 1000
100
Observations 1000
80 Mean 0.030273
Median 0.007079
60 Maxim um 3.276033
Minim um -3.439481
Std. Dev. 1.025965
Kurtosis 3.225912
20
0
-2.50 -1.25 0.00 1.25 2.50
Figura 57: Distribuies do modelo bilinear simulado
Observa-se, pelo p-valor, que a distribuio da sucesso cronolgica bilinear segue uma
distribuio normal pela no rejeio da hiptese nula.
Teste de McLeod-Li
Modelo Bilinear
161
Dessa forma, o teste de McLeod-Li para 5 defasagens rejeitou a hiptese nula pelo fato
do p-valor ser inferior a 5%. Isto indica que a sucesso cronolgica do modelo bilinear
possui estatisticamente comportamento no-linear.
Teste de Hsieh
Para a realizao do teste, fez-se o programa 4 que ir calcular os coeficientes (i,j) para
cada uma das subsries. Os resultados desta etapa vem a seguir:
Modelo Bilinear
11 -1,8707 0,0307
12 -1,406 0,0799*
13 -2,6029 0,0046
14 -1,7474 0,0403
15 -1,9897 0,0233
22 -2,4454 0,0072
23 -1,689 0,0456
24 -1,9339 0,0266
25 -1,688 0,0457
33 -1,6685 0,0476
34 -1,9953 0,0230
35 -2,1541 0,0156
44 -2,2459 0,0124
45 1,0084 0,8434*
55 3,0644 0,9989*
Conforme se observa no quadro anterior, para quinze pares (i,j), os valores dos
coeficientes do teste de Hsieh amostrais para o modelo bilinear e o correspondente p-
valor para um nvel de confiana de 95%, apresenta apenas trs coeficientes
significantes (indicado com *), podendo-se dizer que, de maneira geral, rejeita-se a
hiptese nula dos coeficientes iguais a zero, o que indica uma no-linearidade na
esperana condicionada.
162
E seguindo o fluxograma de anlise e testes, foi escolhido novamente a ondaleta de

Daubesch nmero 1 (DB1). A figura, a seguir, ilustra a decomposio (pr-
processamento) em primeiro nvel da srie no nvel original:
CA - 1 Nvel CD - 1 Nvel
40 25
30 20
20 15
10 10
0 5
-10 0 100 200 300 400 500 0
-20 -5 0 100 200 300 400 500
-30 -10
Figura 58: Pr-processamento em 1 nvel para o DGP do modelo bilinear
Teste de razes unitrias
H 0 : 3RU -40.14459 -2.76 H 0 : 3RU -50.94260 -2.76
H1 : 2 RU H1 : 2 RU
H 0 : 2 RU -15.48948 -3.37 H 0 : 2 RU -14.33825 -3.37
H1 :1RU -25.77090 -3.77 H1 :1RU -30.38486 -3.77
H 0 :1RU -18.97206 -3.42 H 0 :1RU -22.40184 -3.42
H1 : 0 RU -15.03338 -3.80 H1 : 0 RU -8.158893 -3.80
-9.008961 -4.16 -14.47807 -4.16
Considerando um nvel de confiana de 95%, rejeitam-se a todas as hipteses nulas, o

que indica que ambas as subsries so estacionrias.
Teste para Independncia Estatstica BDS
Padro Z Padro Z
2 0,000507 9,04E-05 5,611479 0,0000 2 0,000311 6,40E-05 4,853707 0,0000
3 0,000114 1,16E-05 9,821680 0,0000 3 7,86E-05 7,78E-06 10,10195 0,0000
4 2,43E-05 1,12E-06 21,75208 0,0000 4 1,52E-06 7,10E-07 2,137668 0,0325
5 -4,33E-07 9,46E-08 -4,577848 0,0000 5 -3,32E-07 5,69E-08 -5,833533 0,0000
6 -2,34E-08 7,43E-09 -3,151588 0,0016 6 -1,65E-08 4,22E-09 -3,903729 0,0001
163
O teste de BDS rejeita a hiptese de independncia das subsries todos com 95% de
confiana, o que tambm implica na existncia de no-linearidade.
250 160
120
Mean 1.583806 Mean -0.002040
150 Median 0.812568 Median -0.163276
Maximum 31.06392 80 Maximum 19.01008
100 Std. Dev. 3.484153 Std. Dev. 2.115571
Skewness 2.698546 Skewness 3.799245
50
0 0
-20 -10 0 10 20 30 -5 0 5 10 15 20
Figura 59: Distribuio das subsries para o modelo bilinear
Rejeita-se a hiptese de normalidade pelo teste de Jarque-Bera com 5% de significncia.
Teste de McLeod-Li
Estatstica F 31.90431 p-valor 0.000000 Estatstica F 40.08631 p-valor 0.0000000
Dessa forma, o resultado do teste de McLedod-Li para 5 defasagens rejeitou a hiptese

nula pelo fato do p-valor ser inferior a 5%. Isto indica que ambas as subsries
estatisticamente possuem comportamento no-linear.
164
Xt CA-bilinear
0.4
0.2
-0.2
-0.4 t
0 50 100 150 200 250 300 350 400 450 500
Xt CD-bilinear
0.2
-0.2
-0.4
-0.6 t
0 50 100 150 200 250 300 350 400 450 500
Figura 60: Comportamento da srie ao longo do tempo para o modelo bilinear em 1

Nota-se que, nas duas decomposies, ocorreram a no-linearidade, o que no vinha

acontecendo nos demais processos.
Teste de Hsieh
Uma vez estabelecido que existe algum tipo de no-linearidade, em uma sucesso
cronolgica, preciso filtrar o tipo de no-linearidade existente, se na mdia ou na
varincia.
11 0,069 0,5275 11 -0,7257 0,23401
12 0,0386 0,5154 12 13,2497* 0,00000
13 1,94 0,0674 13 1,6951 0,95497
14 5,474* 0,0000 14 -4,8641* 0,00000
15 -8,125* 0,0000 15 -5,2335* 0,00000
22 0,0044 0,5018 22 0,1219 0,54851
23 -1,997* 0,0000 23 7,4856* 0,00000
24 -2,423* 0,0000 24 2,1278* 0,00000
25 -2,4157* 0,0000 25 -6,646* 0,00000
165
33 -1,748 0,0847 33 1,1512 0,87517
34 1,434 0,4145 34 4,4668* 0,00000
35 7,145* 0,0000 35 4,2653* 0,00000
44 -1,435 0,0756 44 0,6609 0,74566
45 4,095* 0,0000 45 6,3659* 0,00000
55 -4,567* 0,0000 55 1,072 0,85814
Conforme se observa, no quadro anterior, para quinze pares i,j, os valores dos
valor para um nvel de confiana de 95%, apresenta nove coeficientes significantes
(indicados com *) na srie CD e oito na srie CA, podendo-se dizer que, de maneira
geral, rejeita-se a hiptese nula dos coeficientes iguais a zero, o que indica uma no-
linearidade na esperana condicionada.

em 1 nvel de pr-processamento, via redes neurais, com algoritmo de retropropagao,
tem-se:
Previso em 1 nvel de pr-processamento via redes neurais com algoritmo de

retropropagao
MODELO BILINEAR
pontos
TIC 0,63 TIC 0,68
MAPE 342,27% MAPE 81,86%
166
Previso - Modelo Bilinear 1 Nvel
8
6
4
2
0
-2 0 2 4 6 8 10
-4
Previsto Real
Figura 61: Previso em 1 nvel para o modelo bilinear por

redes neurais com retropropagao para os
Estimando-se agora os valores e calculando as estimativas de erros pontuais para a

previso em 1 nvel de pr-processamento, via redes neurais com algoritmo de redes
recorrentes, tem-se:
Previso em 1 nvel via redes neurais com algoritmo de redes recorrentes

MODELO BILINEAR
pontos
TIC 0,52 TIC 0,24
MAPE 91,15% MAPE 128,70%

enquadram dentro do intervalo de confiana de 95%, para a srie prevista via

Modelo Bilinear Rede Neural recorrente 96,38%
Modelo Bilinear Rede Neural com retropropagao 90,35%
167
Previso - Modelo Bilinear 1 Nvel
5
4
3
2
1
0
-1 0 2 4 6 8 10
-2
Previsto Real
Figura 62: Previso em 1 nvel para o modelo bilinear por

redes neurais com redes recorrentes para os
primeiros 10 elementos. As linhas esto muito
lisas...usar linhas retas para ligar os pontos.
Apresenta-se, a seguir, o grfico da decomposio em 2 nveis do DGP para o modelo

bilinear:
CAA - 2 Nvel CAD - 2 Nvel
30 30
20 20
10
10
0
0 -10 0 50 100 150 200 250
0 50 100 150 200 250
-10 -20
CDA - 2 Nvel CDD - 2 Nvel
30 20
15
20
10
10 5
0 0
-5 0 50 100 150 200 250
-10 0 50 100 150 200 250
-10
-20 -15
Figura 63: Pr-processamento em 2 nvel para o DGP do modelo bilinear.

168
Seguindo o mesmo roteiro do modelo anterior, apresentam-se, a seguir, os resultados

obtidos:

5%
H 0 : 3RU -29,80782 -2,76 H 0 : 3RU -44,43612 -2,76
H1 : 2 RU H1 : 2 RU
H 0 : 2 RU -11,48298 -3,37 H 0 : 2 RU -11,08275 -3,37
H1 :1RU -17,39684 -3,77 H1 :1RU -20,16610 -3,77
H 0 :1RU -13,64584 -3,42 H 0 :1RU -17,02308 -3,42
H1 : 0 RU -10,79305 -3,80 H1 : 0 RU -5,154023 -3,80
-5,973635 -4,16 -10,56126 -4,16

5%
H 0 : 3RU -38,62259 -2,76 H 0 : 3RU -33,04524 -2,76
H1 : 2 RU H1 : 2 RU
H 0 : 2 RU -10,56866 -3,37 H 0 : 2 RU -10,02628 -3,37
H1 :1RU -20,65877 -3,77 H1 :1RU -21,07824 -3,77
H 0 :1RU -15,35957 -3,42 H 0 :1RU -14,00581 -3,42
H1 : 0 RU -6,859079 -3,80 H1 : 0 RU -8,350655 -3,80
-9,253903 -4,16 -8,252479 -4,16
Observa-se, que com 95% de confiana, ambas as quatro subsries definidas no pr-
processamento so estatisticamente estacionrias.
169
70 60
60 Sample 1 250 Sample 1 250
50
50
Mean 2.239840 40 Mean 0.282411
40 Median 1.374118 Median -0.009956
30
30
Std. Dev. 3.718403 Std. Dev. 3.228125
Skewness 3.046540 20 Skewness 2.857894
20
10 10
0 0
-5 0 5 10 15 20 25 -10 -5 0 5 10 15 20 25
50 80
60
Mean -0.002885 Mean 0.094880
50
30 Median -0.133439 Median 0.086971
Maximum 14.32439 40 Maximum 13.74855
Minimum -13.03960
Minimum -4.285253
20 30 Std. Dev. 2.299533
Std. Dev. 1.916343
Skewness 0.575560
Skewness 3.154921
20 Kurtosis 15.87190
Kurtosis 22.55069
10
0 -10 -5 0 5 10
0 5 10
Figura 64: Distribuio em 2 nvel para o pr-processamento do DGP do modelo

bilinear
O mesmo ocorre com o teste de normalidade dos dados, o que indica que todas as
subsries apresentam comportamento no normal.
Teste para independncia estatstica BDS

Padro Z Padro Z
2 0,000374 0,000100 3,736277 0,0002 2 -4,10E-05 0,000137 -0,298182 0,7656
3 -5,22E-07 1,27E-05 -0,041172 0,9672 3 0,000149 1,79E-05 8,322030 0,0000
4 -6,67E-06 1,20E-06 -5,537094 0,0000 4 5,80E-05 1,75E-06 33,21924 0,0000
5 -3,30E-07 1,00E-07 -3,283252 0,0010 5 -3,97E-07 1,50E-07 -2,650488 0,0080
6 -1,64E-08 7,76E-09 -2,109405 0,0349 6 -2,04E-08 1,19E-08 -1,712293 0,0868

Padro Z Padro Z
2 1,26E-05 7,43E-05 0,169738 0,8652 2 0,000200 0,000140 1,435249 0,1512
3 -2,60E-05 9,18E-06 -2,830488 0,0046 3 -5,79E-05 1,75E-05 -3,302999 0,0010
4 -6,17E-06 8,51E-07 -7,247715 0,0000 4 -6,10E-06 1,66E-06 -3,682260 0,0002
5 -3,07E-07 6,91E-08 -4,434827 0,0000 5 -2,98E-07 1,38E-07 -2,162280 0,0306
6 -1,50E-08 5,20E-09 -2,891670 0,0038 6 -1,45E-08 1,06E-08 -1,368179 0,1713
170
O teste de independncia no aceita a hiptese nula independncia das observaes.
Teste de McLeod-Li
Subsries: CAA Subsries: CAD

Subsries: CDA Subsries: CDD
Pelo teste, rejeita-se a hiptese nula, o que indica que o modelo

estatisticamente no-linear.
Xt
CA-bilinear
0.4
0.2
-0.2
-0.4 t
0 50 100 150 200 250 300 350 400 450 500
Xt
CD-bilinear
0.2
-0.2
-0.4
-0.6
0 50 100 150 200 250 300 350 400 450 500 t
Figura 65: Comportamento da srie ao longo do tempo para o modelo bilinear em 1

171
As redes recorrentes foram geradas com a arquitetura 10-3R-1. Estimando-se os

resultados por redes neurais com retropropagao, tem-se, a seguir, um quadro
resumindo o tipo de rede utilizado e as respectivas performances de seleo, teste e
validao.
Subs Redes Performance Performance Performance Erro Erro Seleo Erro Teste Caractersticas
CAA MLP s5 1:5-6-2-1:1 0,846273 1,065622 1,209212 0,084252 0,082395 0,093471 BP100,CG21b
CAD MLP s5 1:5-1-1:1 0,960315 0,959103 1,044380 0,095606 0,074169 0,079927 BP100,CG21b
CDA MLP s3 1:3-1-1:1 0,966962 0,992191 0,980613 0,078589 0,105044 0,100650 BP100,CG25b
CDD MLP s5 1:5-1-1:1 0,962363 0,992466 0,971795 0,078215 0,105076 0,099702 BP100,CG39b
As estatsticas de qualidade das previses foram:
MODELO BILINEAR - RN com retropropagao

pontos
TIC 0,62 TIC 0,71
MAPE 346,47% MAPE 86,93%

em 2 nveis de pr-processamento, por meio de redes neurais recorrentes, tem-se:
MODELO BILINEAR - RN recorrente

pontos
TIC 0,85 TIC 0,65
MAPE 199,69% MAPE 118,56%
Correlao 0,16 Correlao -0,41

enquadram dentro do intervalo de confiana de 95%, para a srie prevista via
procedimento esttico do modelo bilinear com 2 nveis de pr-processamento, tem-se:
172

Modelo bilinear - Rede Neural Recorrente 95,29%
Modelo bilinear Rede Neural Retropropagao 91,11%
Intervalo de Confiana - 1 Nvel
25
20
15
10
5
0
-5 0 20 40 60 80 100 120 140 160 180 200
-10
Figura 66: Intervalo de previso em 1 nvel para o DGP do modelo bilinear via
RN com retropropagao.
Intervalo de Confiana - 2 Nvel
10
8
6
4
2
0
-2 0 20 40 60 80 100 120 140 160 180 200
-4
-6
Figura 67: Intervalo de previso em 2 nvel para o DGP do modelo bilinear via
redes neurais com retropropagao.
173
H1 :os resduos so estocasticamente dependentes
Resduos Modelo Bilinear Previsto RN com Resduos Modelo Bilinear Previsto RN com
retrop. com 1 Nvel de pr-processamento retrop. com 2 Nveis de pr-processamento
Padro Z Padro Z
2 0,014389 0,006935 2,074836 0,0880 2 6,61E-05 3,39E-06 19,52304 0,1540
3 0,018640 0,011068 1,684062 0,0922 3 -1,71E-07 7,47E-08 -2,288941 0,2104
4 0,016867 0,013241 1,273817 0,2027 4 -9,13E-10 1,24E-09 -0,736845 0,4612
5 0,018619 0,013868 1,342564 0,1794 5 -5,07E-12 1,80E-11 -0,281401 0,7784
6 0,023703 0,013441 1,763576 0,0778 6 -2,53E-14 2,43E-13 -0,104304 0,9169
Resduos Modelo Bilinear Previsto RN recorrentes Resduos Modelo Bilinear Previsto RN

com 1 Nvel de pr-processamento recorrentes com 2 Nveis de pr-processamento
Padro Z Padro Z
2 -1,86E-05 2,54E-06 -7,308696 0,0877 2 0,004820 0,006237 0,772786 0,4396
3 -7,82E-08 4,83E-08 -1,619223 0,1054 3 0,008734 0,009926 0,879949 0,3789
4 -3,25E-10 6,92E-10 -0,469927 0,6384 4 0,006174 0,011838 0,521503 0,6020
5 -1,44E-12 8,68E-12 -0,165516 0,8685 5 0,007244 0,012360 0,586084 0,5578
6 -6,46E-15 1,01E-13 -0,063943 0,9490 6 0,007796 0,011941 0,652919 0,5138
Calculou-se a estatstica BDS para todas as dimenses de dois at o valor especificado,

variando a dimenso de correlao para maximizar o poder do teste. Neste caso,
calculou-se at a sexta dimenso e concluiu-se por no se rejeitar a hiptese nula ao
nvel de significncia de 5%, indicando que os dados dos resduos do modelo Bilinear
so independentes para os modelos gerados baseados na anlise do p-valor.
Na figura a seguir, tem-se as estatsticas dos resduos do ps-processamento, onde a

hiptese nula e alternativa so:

174
20
60 Series: B2
Series: B1 Sample 1 200
Sample 1 200 16 Observations 200
50
Observations 200
Mean -0.000767
40 Mean -0.023173 12 Median 0.174602
Median -0.373131 Maximum 14.21010
30 Maximum 18.68739 Minimum -14.84325
Minimum -4.660504 8 Std. Dev. 6.911067
Std. Dev. 2.703207 Skewness -0.028217
20 Skewness 3.243801 Kurtosis 1.672477
Kurtosis 19.32679 4
0
-15 -10 -5 0 5 10 15
-5 0 5 10 15
1 Nvel 2 Nvel
Figura 68: Distribuio dos resduos do modelo Bilinear previsto por redes neurais com
retropropagao, em 1 e 2 nveis de pr-processamento.
35 32
Series: R1 Series: R2
30 Sample 1 200 28 Sample 1 200
24
25
Mean 0.090783 Mean 0.603279
20
Median -0.036827 Median 0.547461
20 Maximum 7.185526
Maximum 6.538352 16
15 12 Std. Dev. 1.448040
Std. Dev. 1.376810
Skewness 0.754154
Skewness 0.700653
10 8 Kurtosis 5.196029
Kurtosis 5.347744
5 4 Jarque-Bera 59.14612
0
1 Nvel Probability 0.000000 0 2 Nvel
-4 -2 0 2 4 6
-4 -2 0 2 4 6
Figura 69: Distribuio dos resduos do modelo bilinear previsto redes neurais
recorrentes, em 1 e 2 nveis de pr-processamento.
Observa-se que os dados dos resduos no so normais pela estatstica de Jarque-Bera.

Existe um teste para detectar a bilinearidade nos resduos. Para mais informaes,
consultar Cromwell, Labys e Terraza (1994).
A seguir, tem-se um quadro comparativo da acurcia entre os modelos.
175
Quadro 4: Resumo das estatsticas da qualidade da previso pontual e do envelopamento das sucesses modelo ARIMA-GARCH
PREVISO ESTTICA FEITA COM MODELO ARIMA-GARCH
Sem pr-processamento Com pr-processamento Com pr-processamento
Estatstica de em 1 nvel em 2 nveis
MODELO Anlise Previso de Previso de Previso de Previso de Previso de Previso de
SIMULADO 200 pontos 10 pontos 200 pontos 10 pontos 200 pontos 10 pontos
TIC 1,00 0,96 0,99 0,83 0,99 0,96
MAPE 100% 9,49% 110,00% 10,0,% 99,99% 11,37%
Correlao -0,02 0,18 -0,11 0,16 -0,07 -0,47
Envelopamento 48,06% 48,42% 48,15%
PREVISO ESTTICA FEITA COM REDE NEURAL RETROPROPAGAO
TIC 0,93 0,97 0,86 0,75 0,99 0,86
ARIMA- MAPE 98,12% 9,25% 72,76% 3,39% 98,46% 13,05%
GARCH Correlao 0,01 0,10 -0,47 -0,04 -0,11 -0,28
Envelopamento 49,44% 93,74% 91,59%
PREVISO ESTTICA FEITA COM REDE NEURAL RECORRENTE
TIC 0,60 0,82 0,77 0,85 0,69 0,14
MAPE 98,90% 9,60% 26,22% 1,14% 89,40% 5,80%
Correlao -0,02 0,36 -0,18 0,01 0,37 0,96
Envelopamento 50,87% 96,45% 93,62%
176
Quadro 5: Resumo das estatsticas da qualidade da previso pontual e do envelopamento das sucesses modelo AR(1).
PREVISO ESTTICA FEITA COM MODELO ARIMA
MODELO Sem pr-processamento Com pr-processamento Com pr-processamento
SIMULADO Estatstica de em 1 nvel em 2 nveis
Anlise Previso de Previso de Previso de Previso de Previso de Previso de
200 pontos 10 pontos 200 pontos 10 pontos 200 pontos 10 pontos
TIC 1,00 0,95 1,00 0,90 0,97 0,91
ARIMA MAPE 99,09% 9.54% 100% 10,90% 99,68% 9,19%
Correlao 0,18 0,22 -0,05 -0,34 0,11 -0,36
Envelopamento 45,54% 92,67% 90,96%
Quadro 6: Resumo das estatsticas da qualidade da previso pontual e do envelopamento das sucesses modelo bilinear com rede neural e
retropropagao.
PREVISO ESTTICA FEITA COM MODELO BILINEAR COM REDE NEURAL
MODELO Retropropagao
SIMULADO Sem pr-processamento Com pr-processamento Com pr-processamento
TIC 1,00 0,82 0,63 0,68 0,62 0,71
BILINEAR MAPE 100% 9,60% 342,27% 81,86% 346,47% 86,93%
Correlao 0,03 0,36 -0,03 -0,66 -0,07 -0,50
Envelopamento 40,54% 90,35% 91,11%
177
Quadro 7: Resumo das estatsticas da qualidade da previso pontual e do envelopamento das sucesses modelo bilinear com redes recorrentes.
PREVISO ESTTICA FEITA COM MODELO BILINEAR COM REDE NEURAL
MODELO RECORRENTE
SIMULADO Sem pr-processamento Com pr-processamento Com pr-processamento
TIC 0,49 0,68 0,52 0,24 0,85 0,65
BILINEAR MAPE 146,08% 113,48% 91,15% 128,70% 199,69% 118,56%
Correlao 0,43 0,51 0,32 0,91 0,16 -0,41
Envelopamento 92,47% 96,38% 95,29%
178
4.5 TESTE PARA O IBOVESPA
A srie do IBOVESPA, apresentada na Figura 70, correspondente aos valores nominais de

fechamento do ndice da Bolsa de Valores de So Paulo, no perodo de 03/01/2000 at
29/10/2004, claramente no estacionria. Nota-se a presena de oscilaes em determinados
perodos, como por exemplo, em setembro de 2001 (atentados terroristas aos Estados Unidos)
e outubro de 2002.
Valor Nominal do Ibovespa 3/1/2000 a 29/10/2004
30000
25000
20000
15000
10000
5000
0
28/ 8/ 1999 15/ 3/ 2000 1/ 10/ 2000 19/ 4/ 2001 5/ 11/ 2001 24/ 5/ 2002 10/ 12/ 2002 28/ 6/ 2003 14/ 1/ 2004 1/ 8/ 2004 17/ 2/ 2005
Figura 70: Valores nominais do IBOVESPA dirio em pontos no perodo de 03/01/2000 a

29/10/2004.
Fonte: Economtica.
Aplicando a primeira diferena ao logaritmo da srie, obtemos a srie de retornos do

IBOVESPA para dados dirios que, nesse caso, chamamos de DLIBOVESPA.
O comportamento da srie DLIBOVESPA apresentado na Figura 71. Pode-se identificar,

nesta figura, que flutuaes de mesma magnitude do retorno tendem a se agrupar, ou seja,
grandes variaes tendem a ser seguidas por outras grandes variaes, o mesmo acontecendo
para o caso de pequenas variaes, sendo seguidas por outras variaes.
179
Retorno do Ibovespa - 01/01/2000 a 30/9/2004
0,1
0,08
0,06
0,04
0,02
0 v
-0,02 0 200 400 600 800 1000 1200
-0,04
-0,06
-0,08
-0,1
-0,12
Figura 71: Log-Retornos do IBOVESPA dirio no perodo de 03/01/2000 a 29/10/2004.
Para realizar as anlises de desempenho de previso de cada um dos mtodos estudados, a

srie foi dividida em duas partes: uma para aprendizagem, correspondendo a 1000 valores e
uma parcela para previso no total de 200 valores.
Verificando a sucesso cronolgica do DLIBOVESPA como um todo, tem-se:
Ibovespa
H 0 : 3RU -68,24733 -2,76
H1 : 2 RU
H 0 : 2 RU -22,38750 -3,37
H1 :1RU -38,46974 -3,77
H 0 :1RU -31,44229 -3,42
H1 : 0 RU -14,39437 -3,80
-18,01330 -4,16

180
IBOVESPA
2 0,001521 0,000486 3,132866 0,0017
3 0,005164 0,001038 4,975060 0,0000
4 0,009762 0,001660 5,879685 0,0000
5 0,015237 0,002324 6,557137 0,0000
6 0,020615 0,003008 6,852887 0,0000

baseados na anlise do p-valor, sendo que pelo menos um dos p-valores deve ser menor que
5%.
120
Series: IBOV
Sample 1 1000
100
Observations 1000
80 Mean 0.000346
Median 0.000671
60 Maximum 0.073353
Minimum -0.096342
Std. Dev. 0.019729
40 Skewness -0.201926
Kurtosis 3.867565
20
0
-0.10 -0.05 0.00 0.05
Figura 72: Distribuio do IBOVESPA
Observa-se, pelo p-valor, que a distribuio da sucesso cronolgica IBOVESPA no segue

uma distribuio normal pela rejeio da hiptese nula. Observa-se excesso de curtose e
assimetria negativa.
Teste de McLeod-Li
Modelo IBOVESPA
181
Dessa forma, o teste de McLeod-Li para 5 defasagens rejeitou a hiptese nula pelo fato do p-
valor ser inferior a 5%. Isto indica que a sucesso cronolgica do modelo IBOVESPA possui
estatisticamente comportamento no-linear.
Teste de Hsieh
Uma vez estabelecido que existe algum tipo de no-linearidade em uma sucesso cronolgica,
preciso identificar o tipo de no-linearidade existente, se na mdia ou na varincia
condicionadas.
Para a realizao do teste, fez-se o programa 4 que calcula os coeficientes (i,j) para cada uma
das subsries. Os resultados desta etapa vm a seguir:
IBOVESPA
11 -0,1171 0,4534
12 0,7191 0,7640
13 0,1492 0,5593
14 0,1298 0,5516
15 -0,0195 0,4922
22 0,0744 0,5297
23 -0,5456 0,2927
24 0,3259 0,6277
25 -0,2027 0,4197
33 0,2956 0,6162
34 -0,6942 0,2438
35 -0,9021 0,1835
44 0,4649 0,6790
45 0,1655 0,5657
55 -0,0273 0,4891
Conforme se observa, no quadro anterior, para quinze pares (i,j), os valores dos coeficientes
do teste de Hsieh amostrais para o IBOVESPA e o correspondente p-valor para um nvel de
confiana de 95%, podendo-se dizer que no se rejeita a hiptese nula dos coeficientes iguais
a zero para nenhum valor, o que indica uma no-linearidade na varincia condicionada.
E seguindo o fluxograma de anlise e testes, foi escolhida novamente a ondaleta de Daubesch

nmero 1 (DB1). A figura, a seguir, ilustra a decomposio (pr-processamento) em primeiro
nvel da srie no nvel original:
182
CD - 1 Nivel - Ibovespa
CA - 1 Nivel - Ibovespa
0,1
0,1
0,05
0,05
0
0
0 100 200 300 400 500
0 100 200 300 400 500 -0,05
-0,05
-0,1
-0,1
Figura 73: Pr-processamento em 1 nvel para o IBOVESPA.
Teste de razes unitrias
H 0 : 3RU -50,35651 -2,76 H 0 : 3RU -52,92045 -2,76
H1 : 2 RU H1 : 2 RU
H 0 : 2 RU -16,23697 -3,37 H 0 : 2 RU -16,55276 -3,37
H1 :1RU -26,49827 -3,77 H1 :1RU -27,39209 -3,77
H 0 :1RU -23,13910 -3,42 H 0 :1RU -22,69907 -3,42
H1 : 0 RU -9,200660 -3,80 H1 : 0 RU -10,56710 -3,80
-13,32963 -4,16 -12,47816 -4,16
Considerando um nvel de confiana de 95%, rejeitam-se todas as hipteses nulas, o que

Teste para Independncia Estatstica BDS
Padro Z Padro Z
2 5,32E-05 2,98E-06 17,82401 0,0000 2 5,53E-05 3,26E-06 16,98216 0,0000
3 -9,89E-07 8,18E-08 -12,09364 0,0000 3 -1,08E-06 9,16E-08 -11,82881 0,0000
4 -9,76E-09 1,68E-09 -5,791813 0,0000 4 -1,10E-08 1,93E-09 -5,682562 0,0000
5 -9,85E-11 3,04E-11 -3,240053 0,0012 5 -1,14E-10 3,58E-11 -3,194547 0,0014
6 -9,73E-13 5,09E-13 -1,912310 0,0008 6 -1,18E-12 6,14E-13 -1,923652 0,0044
183
O teste de BDS rejeita a hiptese de independncia das subsries, com 95% de confiana, o
que tambm implica na existncia de no-linearidade.
60 70
50 Observations 500
Observations 500
50
Mean 0.003065
40 Mean 0.000490
40 Median 0.004510
Median 0.001589 Maximum 0.071744
30 Maximum 0.061117 Minimum -0.063928
30
Minimum -0.087604 Std. Dev. 0.019019
Std. Dev. 0.020202 Skewness 0.035139
20 20
Skewness -0.304385 Kurtosis 3.133655
Kurtosis 3.916711
10
10
0
Probability 0.000003 -0.050 -0.025 0.000 0.025 0.050 0.075
0
-0.05 0.00 0.05
Figura 74: Distribuio das subsries para o IBOVESPA.
Rejeita-se a hiptese de normalidade pelo teste de Jarque-Bera com 5% de significncia para

a subsrie de alta freqncia (CD) e no se rejeita para a subsrie de baixa freqncia.
Teste de McLeod-Li
Dessa forma, o resultado do teste de McLedod-Li para 5 defasagens rejeitou a hiptese nula
pelo fato do p-valor ser inferior a 5%. Isto indica que ambas as subsries estatisticamente
possuem comportamento no-linear.
184
CA-ibov
0.4
0.2
-0.2
-0.4
0 50 100 150 200 250 300 350 400 450 500
CD-ibov
0.4
0.3
0.2
0.1
-0.1
0 50 100 150 200 250 300 350 400 450 500
Figura 75: Comportamento da srie ao longo do tempo para o IBOVESPA em 1 nveis de

pr-processamento.
Nota-se que nas duas decomposies, ocorreu a nao-linearidade ao longo do comportamento

das subsries.
Teste de Hsieh
Uma vez estabelecido que existe algum tipo de no-linearidade em uma sucesso cronolgica,
preciso filtrar o tipo de no-linearidade existente, se na mdia ou na varincia.
11 0,0199 0,5079 11 -0,7673 0,2215
12 -0,3985 0,3451 12 12,2915 1,0000
13 -0,5165 0,3028 13 5,8233 1,0000
14 -2,5064 0,00618 14 -1,0921 0,1374
15 1,1543 0,8758 15 -1,3654 0,0861
22 0,6902 0,7550 22 1,3649 0,9139
23 1,9596 0,9750 23 -1,1688 0,1212
24 0,3939 0,6532 24 -3,7453 0,0001*
25 -0,3271 0,3718 25 -1,4606 0,0721
33 -0,2684 0,3942 33 14,5133 1,0000
185
34 0,1726 0,5685 34 3,3806 0,9996
35 0,045 0,5179 35 -2,4782 0,0066*
44 0,4792 0,6841 44 0,7403 0,7704
45 -1,3619 0,0866 45 2,6633 0,9961
55 -0,3465 0,3645 55 0,478 0,6837
Conforme se observa no quadro anterior, para quinze pares i,j, os valores dos coeficientes do
teste de Hsieh amostrais para as duas subsries e o correspondente p-valor para um nvel de
confiana de 95%, aceita-se a hiptese nula dos coeficientes iguais a zero, o que indica uma
no-linearidade na varincia condicionada. A subsrie de alta freqncia tem apenas dois
coeficientes significativos marcados com (*).
Anlise dos parmetros estimados para o modelo AR(||7||)-GARCH(1,1)

CAt = 7 CA7 + t
t2 I t 1 N ( 0; ht )
ht = 0 + 1 t21 + ht 1
Parmetros Coeficiente Erro-padro Estatstica z Significncia

7 0,111503 0,046572 2,394198 0,0167
0 3,14E-05 2,80E-05 1,122401 0,2617
1 0,037427 0,030131 1,242159 0,2142
0,884750 0,096367 9,181047 0,0000
Anlise dos parmetros estimados para o modelo AR(||9||)-GARCH(1,1) da subsrie CD.

CDt = 9CD9 + t
t2 I t 1 N ( 0; ht )
ht = 0 + 1 t21 + ht 1
Parmetros Coeficiente Erro-padro Estatstica z Significncia

9 -0,030409 0,042890 -0,708995 0,4783
0 8,91E-05 5,61E-05 1,589941 0,1118
1 0,105876 0,041375 2,558965 0,0105
0,645691 0,171914 3,755889 0,0002
Estimando-se os valores e calculando as estimativas de erros pontuais para a previso em 1

nvel de pr-processamento, via redes neurais, com algoritmo de retropropagao, tem-se:
186
IBOVESPA MODELO ARIMA-GARCH
pontos
TIC 1,00 TIC 0,93
MAPE 100,00% MAPE 98,82%
Trabalhando com redes neurais com retropropagao e com redes recorrentes, a rede
recorrente foi gerada com 10-2R-1, com funo de ativao do tipo sigmide, taxa de
aprendizagem de 0,005 e nmero de ciclos de treinamento de 20000. Para as redes com
retropropagao, tem-se:
rie de treinam. Seleo Teste Treinamento
CA MLP s5 1:5-1-1:1 1,007509 0,997100 1,003204 0,16006 0,16454 0,14668 BP100,CG21b

CD MLP s5 1:5-1-1-1:1 1,001132 0,987027 1,002208 0,15449 0,13768 0,14730 BP100,CG22b
Efetuando o ps-processamento e calculando-se as estatsticas pontuais, tem-se:
IBOVESPA REDES NEURAIS com retropropagao

pontos
TIC 0,85 TIC 0,87
MAPE 131,89% MAPE 91,60%
IBOVESPA REDES NEURAIS recorrentes

pontos
TIC 0,99 TIC 0,99
MAPE 207,48% MAPE 99,76%
Fazendo o clculo do envelopamento para a prpria srie do IBOVESPA e verificando quais

se enquadram dentro do intervalo de confiana de 95%, para a srie prevista, via
187

IBOVESPA por Redes recorrentes 66%
IBOVESPA por Redes com retropropagao 28%
IBOVESPA por ARIMA-GARCH 5%
Apresenta-se, a seguir, o grfico da decomposio em 2 nveis do DGP para o IBOVESPA:
CAA - 2 Nvel - IBOVESPA CAD - 2 Nvel - IBOVESPA
0,1 0,06
0,04
0,05 0,02
0
0
-0,02 0 50 100 150 200 250
0 50 100 150 200 250
-0,05 -0,04
-0,06
-0,1 -0,08
CDA - 2 Nvel - IBOVESPA

CDD - 2 Nvel - IBOVESPA
0,08
0,06 0,1
0,04
0,05
0,02
0
0
-0,02 0 50 100 150 200 250
0 50 100 150 200 250
-0,04
-0,05
-0,06
-0,08
-0,1
Figura 76: Pr-processamento em 2 nvel para o IBOVESPA.
Seguindo o mesmo roteiro do modelo anterior, apresentam-se, a seguir, os resultados obtidos

na tabela a seguir:
188
5%
H 0 : 3RU -31,40144 -2,76 H 0 : 3RU -35,64922 -2,76
H1 : 2 RU H1 : 2 RU
H 0 : 2 RU -9,646718 -3,37 H 0 : 2 RU -11,21028 -3,37
H1 :1RU -21,86531 -3,77 H1 :1RU -19,33772 -3,77
H 0 :1RU -13,54963 -3,42 H 0 :1RU -15,79216 -3,42
H1 : 0 RU -8,558362 -3,80 H1 : 0 RU -6,904285 -3,80
-8,118091 -4,16 -9,062377 -4,16

5%
H 0 : 3RU -32,99632 -2,76 H 0 : 3RU -35,93773 -2,76
H1 : 2 RU H1 : 2 RU
H 0 : 2 RU -10,73305 -3,37 H 0 : 2 RU -12,35845 -3,37
H1 :1RU -20,15705 -3,77 H1 :1RU -17,62230 -3,77
H 0 :1RU -14,87379 -3,42 H 0 :1RU -16,68212 -3,42
H1 : 0 RU -7,917262 -3,80 H1 : 0 RU -7,021329 -3,80
-8,511772 -4,16 -8,819183 -4,16
Observa-se que, com 95% de confiana, ambas as quatro subsries definidas no pr-
processamento so estatisticamente estacionrias.
189
32 32
Series: CAD Series: CAA
28 Sample 1 250 28 Sample 1 250
24 24
Mean 0.000485 Mean 0.000693
20 20
Median 0.002111 Median 0.001929
16 Maximum 0.051960 16 Maximum 0.054344
12 Std. Dev. 0.020336 12 Std. Dev. 0.020102
Skewness -0.345198 Skewness -0.284393
8 Kurtosis 3.250787 8 Kurtosis 3.772535
4 Jarque-Bera 5.620212 4 Jarque-Bera 9.586752

0 0
-0.050 -0.025 0.000 0.025 0.050 -0.075 -0.050 -0.025 0.000 0.025 0.050
30 40
Sam ple 1 250 Sample 1 250
25
30
20 Mean 0.004334 Mean 0.002435
Median 0.005801 Median 0.002330
15 Maximum 0.062015 20 Maximum 0.088893
Std. Dev. 0.018623 Std. Dev. 0.019289
10 Skewness -0.085610 Skewness 0.420982
5
0 0
-0.050 -0.025 0.000 0.025 0.050 -0.050 -0.025 0.000 0.025 0.050 0.075
Figura 77: Distribuio em 2 nvel para o pr-processamento do IBOVESPA.
O mesmo ocorre com o teste de normalidade dos dados, o que indica que as subsries de alta
freqncia da primeira decomposio e a baixa freqncia tambm da primeira decomposio
apresentam comportamento normal, as demais apresentam comportamento no normal.
Teste para independncia estatstica BDS

Padro Z Padro Z
2 0.000687 0.000250 2.742139 0.0061 2 -0.000627 0.000241 -2.598822 0.0094
3 0.000328 6.06E-05 5.422063 0.0000 3 -0.000139 5.62E-05 -2.467741 0.0136
4 0.000155 1.10E-05 14.06307 0.0000 4 -6.06E-05 9.81E-06 -6.182160 0.0000
5 -1.11E-05 1.75E-06 -6.368636 0.0000 5 -9.01E-06 1.50E-06 -5.999156 0.0000
6 -1.13E-06 2.57E-07 -4.386083 0.0000 6 -8.67E-07 2.13E-07 -4.079398 0.0000

Padro Z Padro Z
2 0.000618 6.51E-05 9.492246 0.0000 2 0.000167 9.55E-05 1.753199 0.0196
3 7.34E-05 7.95E-06 9.231371 0.0000 3 -3.49E-05 1.20E-05 -2.920055 0.0035
4 -6.05E-06 7.29E-07 -8.302491 0.0000 4 -6.65E-06 1.13E-06 -5.900760 0.0000
5 -2.96E-07 5.86E-08 -5.046648 0.0000 5 -3.42E-07 9.31E-08 -3.670094 0.0002
6 -1.43E-08 4.35E-09 -3.290212 0.0010 6 -1.77E-08 7.13E-09 -2.484924 0.0130
O teste de independncia rejeita a hiptese nula de independncia das observaes.

190
Teste de McLeod-Li

Pelo teste, rejeita-se a hiptese nula, o que indica que o modelo estatisticamente no-
linear.
CAA-ibov CAD-ibov
0.6 0.6
0.4 0.4
0.2 0.2
0 0
-0.2 -0.2
0 100 200 300 0 100 200 300
CDA-ibov CDD-ibov
0.4 0.3
0.2
0.2
0.1
0
0
-0.2
-0.1
-0.4 -0.2
0 100 200 300 0 100 200 300
Figura 78: Comportamento da srie, ao longo do tempo, para o IBOVESPA em 2 nveis de

pr-processamento.
Observa-se que somente a subsrie de alta freqncia da decomposio da prpria subsrie de

alta freqncia do 1 nvel apresenta comportamento linear, depois de um certo perodo. As
demais apresentam claramente comportamento no-linear.
191
nveis de pr-processamento, por meio de redes neurais com retropropagao, tem-se que as
redes recorrentes foram geradas com a arquitetura 10-2R-1. Estimando-se os resultados por
redes neurais com retropropagao, tem-se, a seguir, um quadro resumindo o tipo de rede
utilizado e as respectivas performances de seleo, teste e validao.
CAA MLP s5 1:5-1-1:1 0,997355 0,998706 0,998381 0,15345 0,15632 0,14804 BP100,CG21b
CAD MLP s5 1:5-8-1:1 1,005360 1,029760 1,013637 0,19837 0,18489 0,19656 BP8b
CDA MLP s5 1:5-1-1:1 0,992644 1,001492 1,007899 0,16622 0,18870 0,19275 BP100,CG21b
CDD MLP s5 1:5-1-2-1:1 0,983534 0,972308 1,035553 0,14664 0,11320 0,14462 BP100,CG23b
As estatsticas de qualidade das previses foram:

MODELO IBOVESPA - RN com retropropagao
pontos
TIC 0,73 TIC 0,78
MAPE 175,35% MAPE 102,03%

nveis de pr-processamento por meio de redes neurais recorrentes, tem-se:
MODELO IBOVESPA - RN recorrente
pontos
TIC 0,99 TIC 0,98
MAPE 102,52% MAPE 208,34%
Fazendo o clculo do envelopamento para o IBOVESPA, com 2 nveis de pr-processamento

atravs das frmulas:
DLIBOVESPAt min ( DLIBOVESPAt )
NDLIBOVESPAt =
max ( DLIBOVESPAt ) min ( DLIBOVESPAt )
DLIBOVESPAt = NDLIBOVESPAt max ( DLIBOVESPAt ) min ( DLIBOVESPAt ) + min ( DLIBOVESPAt )

192
ln ( IBOVESPAt ) ln ( IBOVESPAt 1 ) = NDLIBOVESPAt max ( DLIBOVESPAt ) min ( DLIBOVESPAt ) +
+ min ( DLIBOVESPAt )
ln ( IBOVESPAt ) = NDLIBOVESPAt max ( DLIBOVESPAt ) min ( DLIBOVESPAt ) +

+ min ( DLIBOVESPAt ) + ln ( IBOVESPAt 1 )
NDLIBOVESPAt max ( DLIBOVESPAt ) min ( DLIBOVESPAt ) + min ( DLIBOVESPAt ) + ln ( IBOVESPAt 1 )

IBOVESPAt = e

IBOVESPA - Rede Neural Recorrente 83%
IBOVESPA Rede Neural Retropropagao 34%
IBOVESPA ARIMA-GARCH 7%
Embora o envelopamento tenha dado 83%, isso no significa que a previso seja adequada,
conforme as estatsticas de acurcia pontuais.
Como visto anteriormente, o teste para independncia deve ser aplicado para ver se a sucesso
cronolgica apresenta independncia nos resduos. Suas hipteses so:
Resduos IBOVESPA Previsto RN com retrop. Resduos IBOVESPA Previsto RN com retrop.
Padro Z Padro Z
2 0.014896 0.005151 2.891971 0.0888 2 0.01667 4.80E-05 34.72782 0.0950
3 0.018453 0.008213 2.246835 0.0747 3 0.03333 0.000107 31.09772 0.0814
4 0.020576 0.009810 2.097390 0.0560 4 0.05000 0.000179 27.90881 0.0762
5 0.019249 0.010256 1.876818 0.0605 5 0.06667 0.000262 25.44965 0.0774
6 0.017827 0.009920 1.796982 0.0723 6 0.08333 0.000354 23.52168 0.0969
193
Resduos IBOVESPA Previsto RN recorrentes Resduos IBOVESPA Previsto RN recorrentes
Padro Z Padro Z
2 0.002820 0.004442 0.634819 0.5255 2 -5.05E-07 5.33E-07 -0.947302 0.3435
3 0.010294 0.007040 1.462196 0.1437 3 -3.70E-10 6.89E-09 -0.053687 0.9572
4 0.014577 0.008359 1.743854 0.0812 4 -2.77E-13 6.68E-11 -0.004142 0.9967
5 0.014577 0.008687 1.678068 0.0933 5 -2.11E-16 5.66E-13 -0.000373 0.9997
6 0.013164 0.008352 1.576136 0.1150 6 -1.64E-19 4.45E-15 -3.70E-05 1.0000
Resduos IBOVESPA Previsto ARIMA-GARCH Resduos IBOVESPA Previsto ARIMA-GARCH

Padro Z Padro Z
2 -1.74E-06 9.65E-07 -1.803930 0.0712 2 -2.32E-06 8.86E-07 -2.616872 0.0891
3 -2.37E-09 1.39E-08 -0.170852 0.8643 3 -3.64E-09 1.31E-08 -0.277813 0.7812
4 -3.29E-12 1.49E-10 -0.022009 0.9824 4 -5.83E-12 1.45E-10 -0.040131 0.9680
5 -4.66E-15 1.41E-12 -0.003304 0.9974 5 -9.53E-15 1.41E-12 -0.006757 0.9946
6 -6.75E-18 1.23E-14 -0.000547 0.9996 6 -1.59E-17 1.27E-14 -0.001255 0.9990
Calculou-se a estatstica BDS para todas as dimenses de dois at o valor especificado,

variando a dimenso de correlao para maximizar o poder do teste. Neste caso, calculou-se
at a sexta dimenso e concluiu-se por no se rejeitar a hiptese nula ao nvel de significncia
de 5%, indicando que os dados dos resduos do IBOVESPA so independentes para os
modelos gerados baseados na anlise do p-valor. Pode-se concluir que os trs modelos so
plausveis estatisticamente.
Na figura a seguir, tem-se as estatsticas dos resduos do ps-processamento onde as hipteses

nulas e alternativas so:

194
30 32
Series: RESB2 Series: RESID
25
24
20 Mean -0.000561 Mean 0.000773
20
Median -0.000220 Median 0.002091
15 Maximum 0.045545 16 Maximum 0.054344
Std. Dev. 0.018781 12 Std. Dev. 0.020109
10 Skewness -0.261151 Skewness -0.292850
5
Jarque-Bera 2.606158 4 Jarque-Bera 9.961610
0 0
-0.06 -0.04 -0.02 0.00 0.02 0.04 -0.075 -0.050 -0.025 0.000 0.025 0.050
1 Nvel 2 Nvel
Figura 79: Distribuio dos resduos do IBOVESPA previsto por redes neurais com
retropropagao, em 1 e 2 nveis de pr-processamento.
70 1400
Series: RESREC Series: RESREC2
60 Sample 1 200 1200 Sample 2 1200
50 1000
Mean -0.493070 Mean -5.79E-07
40 Median -0.015530
800 Median 0.000000
Maximum 0.045238
Maximum 0.000000
30 Minimum -1.459460
600 Minimum -0.000670
Std. Dev. 0.668478
Skewness -0.636407 Std. Dev. 1.94E-05
20 Skewness -34.51811
Kurtosis 1.422930 400
Kurtosis 1193.930
10
Jarque-Bera 34.22669 200
Probability 0.000000 Jarque-Bera 71094677
-1.50 -1.25 -1.00 -0.75 -0.50 -0.25 0.00 0
-0.00050 -0.00025 -1.7E-19
1 Nvel 2 Nvel
Figura 80: Distribuio dos resduos do modelo IBOVESPA previsto por redes neurais
recorrentes, em 1 e 2 nveis de pr-processamento.
Observa-se que os dados dos resduos no so normais pela estatstica de Jarque-Bera.

195
CONCLUSO
Nesta pesquisa, o objetivo principal foi o de explorar a possibilidade de usar uma metodologia
capaz de decompor uma sucesso cronolgica via ondaletas, conjuntamente com os modelos
economtricos e de redes neurais j existentes de previso e comparar a qualidade de
previses obtidas para sucesses cronolgicas lineares e no-lineares simuladas. Teve tambm
a proposta de traar um fluxograma para tratamento das previses e para propor um rigor
quantitativo mais adequado.
O diferencial deste trabalho est na realizao das previses dentro das subsries decompostas
por uma ondaleta em at dois nveis, obtendo-se a previso da srie original, via reconstruo
da srie para modelos construdos, por processos geradores de dados de sucesses
cronolgicas lineares e no-lineares.
Foram simuladas sucesses cronolgicas de um processo ARIMA-GARCH, um ARIMA, um

bilinear e um movimento browniano geomtrico. O trabalho principal constituiu-se na
elaborao da fase de pr-processamento e das previses estticas, em separado para cada
uma das subsries encontradas, sendo feitas para 10 e 200 observaes futuras. Alm das
previses pontuais, foi verificado tambm o envelopamento dos dados, que consiste em
comparar o modelo de previso atravs de uma banda de confiana, para os valores previstos
em 200 sucesses cronolgicas simuladas. Considerou-se que um envelopamento
significativo foi superior a 66%, descartando os demais.
No caso da simulao feita para um modelo ARIMA(1,0,0)-GARCH(1,1), pode-se observar

que o pr-processamento pela ondaleta foi melhor para apenas uma etapa de separao de
altas e baixas freqncias, tanto pela correlao quanto pelos critrios do TIC, sendo este
reduzido, e pelo MAPE menor para as previses de curto prazo.
Para os modelos de previso com redes neurais, ressalta-se uma diferena entre as redes
neurais recorrentes e as redes com algoritmo de retropropagao: a capacidade de previso
das redes recorrentes para dados no-lineares com 2 nveis de pr-processamento e para
previses de curto prazo. Todavia, para o critrio do envelopamento, o modelo ARIMA-
GARCH apresentou melhores resultados para o pr-processamento com 1 nvel e por rede
196
recorrente. Todos os dados tambm foram comparados com as previses feitas sem pr-
processamento, as quais se mostraram imprprias com MAPE, perto de 100% para previses
de longo prazo.
Na modelagem feita para a sucesso cronolgica AR(1), o melhor modelo ajustado, segundo o
TIC, foi com pr-processamento em uma etapa; mas as previses so melhores com duas
etapas. O envelopamento, para este processo, foi melhor com duas etapas de decomposio.
Tambm se verificaram, neste trabalho, as alteraes que a mudana da escolha de uma

ondaleta por outra poderia impactar nos resultados das previses futuras. Constatou-se que a
troca da forma de onda, no pr-processamento que se parea mais visualmente com a forma
dos dados da srie, aumenta as medidas de acurcia, deixando evidncias de que pode haver
melhoras nos resultados.
Para a simulao do movimento browniano, salienta-se que, na subsrie de baixa freqncia,

o pr-processamento em um e dois nveis, reproduz a srie original no nvel, o que acaba por
provocar a no separao das altas e baixas freqncias, induzindo a sucesso cronolgica ao
critrio de independncia nas observaes.
Com os dados do modelo bilinear, as redes recorrentes se mostraram mais adequadas tanto
para as previses de curto prazo, quanto para o envelopamento, muito embora, neste ltimo
caso, a diferena ficou pouco significativa na capacidade de envelopar.
Da anlise dos resduos resultantes dos modelos simulados, observou-se que, para os modelos
ARIMA-GARCH e AR(1), seus valores foram normais e independentes. J, nos dados do
modelo bilinear, detectou-se apenas a independncia dos resduos e a no normalidade dos
mesmos.
Testando os algoritmos para a srie do IBOVESPA, tambm com 1200 observaes, os

resultados das previses no foram satisfatrios, apresentaram altos ndices de erros nas
estatsticas pontuais e o envelopamento pouco significativo, se comparado com os obtidos, via
simulao. Um fato verificado est na correlao dos dados, em que houve aumento no que
diz respeito s previses dos log-retornos da sucesso, no se podendo dizer, ainda, se o pr-
197
processamento favorece de forma significativa a previso, mas sim ajuda a diminuir o erro no
curto prazo.
Destacou-se tambm o aumento da correlao com o pr-processamento e o envelopamento

ficou mais significativo em apenas um nvel. As previses estticas so melhores e tambm
apresentam reduo do erro por intervalo em um nvel de pr-processamento.
Outrossim, da anlise deste trabalho, emerge a necessidade do fluxograma implementado para

as previses e o papel das previses, em separado por ondaletas, como redutores dos erros nos
processos estocsticos e da implementao das bandas de previses, para redes recorrentes
para sucesses cronolgicas lineares e no-lineares. A capacidade das redes neurais de
lidarem com sucesses no-lineares uma vantagem, pois as previses feitas com pr-
processamento convalidam uma indicao dessa caracterstica.
198
REFERNCIAS
AKAIKE, H. A new look at the statistical model identification. IEEE Transactions on

Automatic Control. AC 19., 1974. p. 716-723.
__________. Maximum likelihood identification of Gaussian autoregressive moving average

models. Biometrika. v. 60, p. 255-265,1973.
ALBUQUERQUE, J. R. Previsibilidade de retorno de aes no mercado brasileiro.

Instituto de Cincias Sociais, 2003. 57 f. Dissertao (Mestrado em Economia) Instituto de
Cincias Sociais. Braslia: Universidade de Braslia, 2003.
AMARAL, L. A. N. et al. Scale-independent measures and pathologic cardiac dynamics.

Physical Review Letters, New York: v. 81, n. 11, p. 2388-2392, S&Pt 1998.
ARMSTRONG, J. S., COLLOPY, F. Error measures for generalizing about forecasting

methods: empirical copmparisons. International Journal of Forecasting. n. 08, 1992. p. 69-
80.
ARIO, M. A. Time series forecasts via ondaletas: an application to car sales in the spanish
market. Discussion Paper 95-30, ISDS, Duke University.
ARMOSTRONG, J. S., BRODIE, R. J. Quantitative methods in marketing. 2. ed. London:

International Thompson Business Press, 1999.
AZOFF, E. M. Neural network time series forecasting of financial markets. John Wiley &
Sons. 1994.
BARTLETT, M. S. On the theoretical specification and sampling properties of autocorrelated

time series. Journal of the Royal Statistical Society. B2, 1946, p. 27-41.
BIDARKOTA, P. V. The comparative forecast performance of univariate and multivariate

models: an application to real interest rate forecasting. International Journal of Forecasting.
n. 14. p. 457- 468,1998.
BILLINGS, S. A.; VOON, W. S. F. Correlation based model validity tests for nonlinear
models. International Journal of Control. v. 44, n. 1, p. 235-244, 1986.
BLACKMAN, R. B.; TUKEY, J. W. The measurement of power spectrum from the point
of view of communications engineering, New York: Dover, 1959.
BOLLERSLEV, T. A conditional heteroscedasticity time series model for speculative process

and rates of return. Review of Economics and Statistics, v. 69, p. 542-547, 1987.
BOLLERSLEV, T. Generalized autoregressive conditional heteroscedasticity. Journal of

Econometrics. v. 31, p. 307-327, 1986.
BOLLERSLEV, T; CHOU, R.; KRONER, K. ARCH modeling in finance: a review of the

theory and empirical evidence. Journal of Econometrics. v. 52, p. 5-59, 1992.
199
BOVESPA. Mercado de capitais. 1999. Disponvel em: <http://www.bovespa.com.br>.
Acesso em 22 mar. de 2003.
_________. ndice Bovespa, definio e metodologia. 2002. Disponvel em:

<http://www.bovespa.com.br> . Acesso em 22 mar. de 2003.
BOX, G. E. P; PIERCE, D. A. Distribution of autocorrelations in autoregressive moving

average models. Journal of the American Statistical Association, v. 65,1970. p. 1509-1526,
1970.
BOX, G. E. P., JENKINS, G. M., REINSEL, G. C. Time series analysis: forecasting and
control. 3. ed. New York : Prentice Hall, 1994.
BOX, G. E. P., JENKINS, G. M. Time series analysis: forecasting e control. 3. ed. New
York: Prentice Hall, 1994.
BRITO, N. O.; DE MANAZES, J. C. F. A eficincia informacional fraca do mercado vista

na Bolsa de Valores do Rio de Janeiro no perodo 1973-1980. Relatrio de Pesquisa 22.
(Setembro), COPPEAD, UFRJ, 1981.
BRUNI, A. L., FAM, R. Eficincia, previsibilidade dos preos, anomalias em mercados de

capitais: teoria e evidncias. Caderno de Pesquisas em Administrao, So Paulo, v. 1, n. 7,
p. 71-85, 1998.
CAMARGOS, M. A. de., BARBOSA, F. V. Teoria e evidncia da eficincia informacional

do mercado de capitais brasileiro. Caderno de Pesquisas em Administrao. So Paulo, v.
10, n. 1, p. 41-55, 2003.
CAMPBELL, J.Y.; LO, A.W.; MACKINLAY, A. C. The econometrics of financial

markets. New Jersey: Princeton University Press, 1997.
CAO, L.; SOOFI, A. S. Non-linear deterministic forecasting of daily dollar exchange rates.
International Journal of Forecasting. Milwaukee, n. 15, p. 421430, 1999.
CERETTA, P. S. Investigando a presena de Caos no Ibovespa. Revista Eletrnica de

Administrao, 29. v. 8, n. 5. Disponvel em <http://read.adm.ufrgs.br>. Acesso em 19: mar.
2003.
CERETTA, P. S., COSTA JNIOR, N. C. A. Quantas aes tornam um portflio

diversificado no mercado de capitais brasileiro. In: Mercado de capitais. So Paulo: Atlas,
2000. cap. 1. p. 19-33.
CHANG, C. Anlise de ondaletas em sries temporais. So Paulo: IME, 1997. 117 f. Tese
(Doutorado em Matemtica Aplicada) Instituto de Matemtica e Estatstica, Universidade
de So Paulo, 1997.
CHOW, G. C. Tests of equality between sets of coefficients in two linear regression.

Econometrica. v. 28., n. 3, p. 591-605, 1960.
CHUI, C. K. Ondaletas: a tutorial in theory and aplicattions. Boston: Academic Press, 1992.
200
CORREA, M. M. R. da L; PEREIRA, P. L. V. Modelos no-lineares em finanas:

previsibilidade em mercados financeiros e aplicaes a gesto de risco. 1997. Disponvel em:
<http://www.ibmec.br/pvalls> Acesso em: 10 dez. 2002.
COWLES, A. Can stock market forecasters forecast? Econometrica I. 1993. p. 309-324.
COSTA, P. H. S.; BAIDYA, T. K. N. Propriedades estatsticas das sries de retornos das

principais aes brasileiras. Pesquisa Operacional, v. 21. n. 1. p. 38-78, 2001.
CROMWELL, J. B.; LABYS, W. C; TERRAZA, M. Univariate tests for time series

models. Sage University Paper series on Quantitative Aplications in the Social Scienses. n. 7-
99. Thousand Oaks, CA: Sage.
DAMODARAN, A., BERNSTEIN, P. L. Administrao de investimentos. Porto Alegre:

Bookman, 2000.
DAUBECHIES, I. Ten lectures on ondaletas, Society for Industrial ans Applied

Mathematics. Philadelphia: Pennsylvania, 1992.
DE OLIVEIRA, M. A. Previso de sucesses cronolgicas econmico-financerias por

meio de redes neurais artificiais recorrentes de tempo real e de processos ARMA-
GARCH: um estudo comparativo quanto eficincia de previso. Faculdade de
Economia, Administrao e Contabilidade. So Paulo, 2003. 171 f. Dissertao (Mestrado
em Administrao). Faculdade de Economia, Administrao e Contabilidade: Universidade
de So Paulo, 2003.
DEBOECK, G. J. Pre-processing and evaluation of neural nets for trading stocks. Advanced
Technology for Developers, USA, v. 1, p. 1-13, aug. 1992.
DE GRAUWE, P.; DEWACHTER, H.; EMBRECHTS, M. Exchange rate theory. Oxford:

Blackwell Publishers, 1993.
DE VEAUX, R.; SCHWEINSBERG, J.; SCHUMI, J.; UNGAR, L. H. Prediction intervals for
neural networks via nonlinear regression. Technometrics. v. 40, n. 4. p. 273-282, nov, 1998.
DINIZ, H. A.; L. CARVALHO, A.; ANDRADE, M. Previso de sries temporais utilizando

redes neurais artificiais e modelos de Box e Jenkins. Proceedings of the V Brazilian
Symposium on Neural Networks, Belo Horizonte: p. 173-178, dez. 1998.
ECHEVERRY, G. E. S. Mtodos de comparao de sries temporais. So Paulo: IME,

1999. 131 f. Dissertao (Mestrado em Estatstica) Instituto de Matemtica e Estatstica,
Universidade de So Paulo, 1999.
ELMAN, J. L. Finding structure in time. Cognitive Science. v. 14. p. 179-211, 1990.
ENDERS, W. Applied econometric time series 2. ed. John Wiley & Sons, 2003.
ENGLE, R. Autoregressive conditional heteroscedasticity with estimates of the variances of

U.K. inflation. Econometrica, v. 50. p. 987-1008, 1982.
201
FAMA, E. Efficient capital markets: a review of theory and empirical work. The Journal of
Finance. 25(1). p. 383-470, 1970.
________. Efficient capital markets II. The Journal of Finance. 46(5). p. 1575-1617, 1991.
FAMA, E.; FRENCH, K. Permanent and temporary components of stock prices. Journal of
Political Economy. v. 26, p. 246-273, 1988.
FRANCIS, J. C. Investments: analysis and management. 5. ed. New York: MacGraw-Hill,

1991.
FREEMAN, J. A. Simulating neural networks with mathematica. New York: Addison-

Wesley Publishing Company, 1994.
FREITAS, A. A. C.; SECURATO, J. R.; NETO, M. A. Non-linear autoregressive (NPAR)

neural network (NN) methodology to predict brazilian exchange rates. IV Encontro
Brasileiro de Finanas., Rio de Janeiro. Anais do IV Congresso da SBFin, Rio de Janeiro,
2004.
GENAY, R.; SELUK, F.; WHITCHER, B. An introduction to ondaletas and other

filtering methods in finance and economics. New York: Academic Press, 2002.
GONALVES, A. Tcnicas de previso em finanas: uma aplicao na administrao de

carteiras de ativos. III SEMEAD, So Paulo, 2000. Anais do III SEMEAD, So Paulo,
2000.
GRANGER, C. W. J.; MORGENSTERN, O. The predictability of stock market prices.

Lexington: Heath-Lexington. 1970.
GROFF, G. K. Empirical comparison of models for short range forecasting. Management

Science. 20: p. 22-31, 1973.
GUJARATI, D. N. Econometria bsica. 3. ed. So Paulo: Makron Books, 2000.
HAEFKE, C.; HELMENSTEIN, C. Predicting stock market averages to enhance profitable

trading strategies. Society of Computational Economics. Second International Conference
on Computing in Economics and Finance. Geneva, Switzerland, 26-28, jun. 1996.
HAMILTON, J. D. Time series analysis. Princeton: Princeton University Press, 1994.
HANNAN, E. J. The estimation of the order of an ARMA process. The Annals of Statistics.
v. 8, p. 1071-1081. 1980.
HARDIE, B. G. S.; FADER, P. S.; WISNIEWSKI, M. An empirical comparison of new

product trial forecasting methods. International Journal of Forecasting. n. 17, p. 209-229,
1998.
HARRISON, P. J.; STEVENS, C. F. Bayesian Forecasting. Journal of the Royal Statistical

Society: series B, v. 38, n. 3, p.81-135, 1976.
202
HARVEY, A. C. Forecasting, structural time series models and the Kalman filter.
Cambridge: Cambridge Academic Press:1989.
HAYKIN, S. Redes neurais: princpios e prtica. 2. ed. Porto Alegre: Bookman, 2001.
HILL, T.; OCONNOR, M.; REMUS, W. Neural network models for time series forecasts.
Management Science. v. 42, n. 7, p. 1082 1092, jul. 1996.
HISIEH, D. Testing for nonlinear dependence in daily foreign exchange rates. Journal of
Business, 62, n. 3, p. 339-368, 1989.
HUTCHINSON, J. M. A radial basis function approach to financial time series analysis.

1994. 159 f. PhD Thesis (Massachusetts Institute of Technology, Department of Eletrical
Engineering and Computer Science), Febr. 1994.
HOMSY, G. V.; PORTUGAL, M. S.; ARAJO, J. P., Ondaletas e previses de sries de

tempo: uma anlise emprica. XXII Encontro Brasileiro de Econometria. Campinas, 2000.
JAN, C. L. Benchmarking forecasting models. The Journal of Business Forecasting, 2003.

p. 16-18.
JARQUE, C. M., e BERA, A. K. A test for normality of observations and regression

residuals. International Statistical Review. v. 55, p. 163-172, 1987.
JARRETT, J. Business forecasting methods. 2. ed. The Alden Press, 1991.
KEIM, D.; STAMBAUGH, R. Predicting returns in stock and bond markets. Journal of
Financial Economics. v. 17, 1986, p. 357-390.
KLEIN, J. L. Statistical visions in time: a history of time series analysis, 1662-1938. New
York: Cambridge University Press, 1997.
KLIMASAUSKAS, C. C. Accuracy and profit in trading systems. Advanced Technology for

Developers. p 10-14. 1992.
KUTSURELIS, J. E. Forecasting financial markets using neural network: an analysis of

methods and accuracy. 1998. 123 f. (Tese em Administrao). Naval Postgraduate School,
Monterey, California. 1998.
LEQUARR , J.Y. Foreign currrency dealing: a brief introduction. In WEINGEND, A. S.;

GERSHENFELD, N. A. Eds. Time series prediction: forecasting the future and
understanding the past. Addison-Wesley, 1994.
LJUNG, G. M., BOX, G. P. E. On a measure of lack of fit in time series models.

Biometrika. v. 66, p. 66-72, 1978.
LUDLOW, J.; ENDERS, W. Estimating non-linear ARMA models using Fourier coefficients.
International Journal of Forecasting. 16, 2000, p. 333 347.
203
McALEER, M., OXLEY, L. The econometrics of financial time series. Journal of Economic
Surveys. v. 16. n. 3, 2002. p. 237-249.
MCLEOD, A. J. e W. K. Li, Diagnostic checking ARMA times series models using squared
residuals correlations. Journal of Time Series Analysis, n. 4, 1983, p. 269-73.
MAKRIDAKIS, S.; WHEELWRIGHT, S. C.; McGEE, V. E. Forecasting: methods and

aplications. 2 .ed. John Wiley e Sons, 1983.
MARCONI, M. de A., LAKATOS, E. M. Tcnicas de pesquisa. 5. ed. So Paulo: Atlas,

2002.
MEYER, Y. Ondaletas and operators. Traduo de D.H. Salinger. Cambridge: Cambridge

University Press, 1993.
MISITI, M. et al. Ondaleta toolbox: for use with Matlab. The Math Works, Inc. 1997.
Disponvel em: <http://www.mathworks.com> . Acesso em: 14 ago. 2003.
MILLS, T. C. The econometric modeling of financial time series. New York: Cambridge
Universisty Press, 1996.
MOODY, J. e SAFFELL, M. Reinforcement learning for trading system and portfolios. In:
AGRAWAL, R.; PIATETSKY-SHAPIRO, G. Ed. KDD98 - Proceedings of The Fourth
International Conference on Knowledge Discovery and Data Mining. AAAI Press,
California, 1998, p. 279-283.
MORAIS, I. A. C., PORTUGAL, M. S. Modelagem e previso de volatilidade determinista e

estocstica para a srie do IBOVESPA. 1999. Disponvel em: <http://www.ufrgs.br/ppge>.
Acesso em: 20 jul. 2003.
MORETTIN, P. A. Sries temporais em finanas. So Paulo, 2002. 156 p. (Texto para um

Curso na Universidade Catlica de Lima, Peru).
______________ .Ondas e ondaletas. So Paulo: Edusp, 1999.
MORETTIN, P. A.; TOLOI, C. M. de C. Anlise de sries temporais. So Paulo: Edgard

Blcher, 2004.
MOSHIRI, S., CAMERON, N. Neural network versus econometric models in forecasting

inflation. Journal of Forecasting, v. 19, 2000. p. 201-217.
MOURA, C. A. de. Introduo s ondeletas. 2002. Disponvel em:

<http://www.uerj.br/ime/cademoura> . Acesso em 10 de jan. 2003.
NEFTCI, S. N. Nave trading rules in financial markets e Wiener-Kolmogorov prediction

theory: a study of technical analysis. Journal of Business. v. 64, n. 4, 1991.
OLIVEIRA, M. A.; FAVERO, L. P. L. Uma breve descrio de algumas tcnicas para anlise
de sries temporais: sries de Fourier, ondaletas, ARIMA, modelos estruturais para sries de
tempo e redes neurais. Anais do VI SEMEAD, So Paulo, 2003.
204
OSBORNE, M.F.M. Brownian motion in the stock market. Operations Research VII. 1959
PANKRATZ, A.; DUDLEY, U. Forecasts of power-transformed series. Journal of

Forecasting. 6, 1987. p. 239-248.
PASSARI, A. F. L. Explorao de dados atomatizados para previso de vendas no varejo

utilizando redes neurais. Faculdade de Economia, Administrao e Contabilidade. So
Paulo, 2003. 143 f. Dissertao (Mestrado em Administrao). Faculdade de Economia,
Administrao e Contabilidade: Universidade de So Paulo, 2003.
PINDYCK, R. S.; RUBINFELD, D. L. Econometric models and economic forecasts. 4. ed.

New York:McGraw-Hill International, 1997.
POLIKAR, R. The wavelet tutorial. 1994. Disponvel em:

<http://www.site.uottawa.ca/~qingchen/wavelet.htm> . Acesso em 10 de jan. 2002.
PRIESTLEY, M.B. Spectral analysis and time series. London: Unknown, 1983.
QI, Min. Nonlinear predictability of stock returns using financial and economic variables.
Journal of Business & Economic Statistics. v. 64, n. 4, 1999, p. 419-429.
SAKAI, H.; NAKAJIMA, H.; YASUDA, M.; HIGASHIHARA, M.; OOSUMI, M.

Development of a fuzzy sales forecasting system for vending machines. Computer and
Industrial Engineering. Elsevier Science. n. 36, p. 427-449. 1999.
SCHAWZ, G. Estimating the dimension of a model. The Annals of Statistics. v. 6,1978. p.

461-464.
SCHREIBER, T.; SCHMITZ, A. Interdisciplinary application of nonlinear time series

methods. Physical Review. E 55, 5443, D-42097 Wuppertal, German, 1999.
SCHUMANN, M.; LOHRBACH, T. Comparing artificial neural networks with statistical

methods within the field of stock market prediction. 0-7803-2566-4/96. IEEE. 1996.
SHALIZI, C. R.; SHALIZI, K. L; CRUTCHFIELD, J. P. An algorithm for pattern

discovery in time series. Santa Fe Institute. Working Paper Nov. 2002.
SHIAVI, R. Introduction to applied statistical signal analysis. 2.ed. San Diego: Academic
Press, 1999.
SIEGLER, W.; STEURER, E. Forecasting of the german stock index DAX with neural
networks: using daily data for experiments with input variable reduction and a modified Error
Function. p 265-273. In: EBECKEN, N. F. F. Editor. Proceedings of the international
conference on data mining, Rio de Janeiro, S&P. 1998. p. 265-273
SIQUEIRA, J. O. Introduo gesto de risco. FACEF Pesquisa, Franca, v. 6. n. 3, p. 19

25, 2003.
205
SONCIN, C. A., CORRENTE, J. E. Uso de modelos de sries temporais para anlise de dados
de preos de aes. 48 Reunio da RBRAS e 10 SEAGRO. Universidade Federal de
Lavras. Lavras, 2003.
SOUZA, R. C. Modelos estruturais para previso de sries temporais: abordagem clssica

e bayesiana. Rio de Janeiro: IMPA, 1989.
STRUZIK, Zbigniew R. Ondaleta methods in financial time series processing. Physica A.

Amsterdam, 296: 307 319, 2001.
SWANSON, N., WHITE, H., A model selection approach to real-time macroeconomic

forecasting under linear models and artificial neural networks. The Review of Economics
and Statistics. 1997.
TAK, B. A new method for forecasting stock prices using artificial neural network and
ondaleta theory. 1995. 107 f. Tese (Doutorado em Economia). Universidade de Pensilvnia,
Estados Unidos, 1995.
TOLOI, C. M. de C. Comparao de mtodos de previso de sries temporais. So Paulo:

IME, 1980. 230 f. Dissertao (Mestrado em Matemtica). Instituto de Matemtica e
Estatstica, Universidade de So Paulo, 1980.
TORRENCE, C., COMPO, G. A. A pratical guide to ondaletas analysis. Bulletin of the

American Meteorology Society, v. 79, n.1, 1998. p. 61-78.
TORRES, R., BONOMO, M. e FERNANDES, C. A aleatoriedade do passeio na Bovespa:

testando a eficincia do mercado acionrio brasileiro. In XXIII ENCONTRO
BRASILEIRO DE ECONOMETRIA, Salvador. Disponvel em:<http://www.sbe.org.br>.
Acesso em: 20 dez. 2003.
TSAY, R. S. Analysis of financial time series. Wiley series in probability and statistics.
2002.
THROSTENSEN,V. H. A teoria de eficincia no mercado de capitais: uma reviso da

literatura e dos trabalhos empricos: o modelo de random walk aplicado ao ndice de aes
da Bovespa. 1976, 121 f. Dissertao (Mestrado em Administrao). Escola de Administrao
de Empresas de So Paulo da Fundao Getlio Vargas, So Paulo. 1976.
VANDAELE, W. Applied time series and Box-Jenkins models. New York: Academic
Press, 1983.
VASCONCELLOS, M. A. S., ALVES, D. Manual de econometria. So Paulo: Atlas, 2000.
WINKLHOFER H.; WITT, S. F.; DIAMATOPOULOS, A. Forecasting practice: a review of

the empirical literature and an agenda for the future research. International Journal of
Forecasting, Elsevier Science B, v. 1 , n.12, p. 193-221,1996.
WILLIAMS, R. J.; ZIPSER, D. A learning algorithm for continually running fully recurrent
neural networks. Neural Computation. v. 1, p. 270-280. 1989.
206
_________________________. Gradient-based learning algorithm for recurrent networks and
their computational complexity, 1995.
WONG, H., IP. W., XIE, Z., LUI, X.. Modelling and forecasting by ondaletas, and the
application to exchange rates. Journal of Applied Statistics, v. 30, n. 5, 2003. p. 537-553.
YANG, Z. Probabilistic neural network in banckruptcy prediction. Journal of Business

Research, 44, 1999. p. 67-74.
YIM, J. Previso de sries de tempo: modelos ARIMA, estruturais e redes neurais artificiais.
So Paulo: IME, 2001. 87 f. Dissertao (Mestrado em Matemtica Aplicada) Instituto de
Matemtica e Estatstica, Universidade de So Paulo, 2001.
ZHANG, G.; PATUWO, B. E.; HU, M. Y. Forecasting with artificial neural networks: the
state of the art. International Journal of Forecasting, Kent(Ohio) 14, p. 3562, 1998.
ZIEGELMANN, F. A., PERERA, P. L. V. Modelos de volatilidade estocstica com

deformao temporal: um estudo emprico para o ndice BOVESPA. Poltica e Planejamento
Econmico. v. 27, n. 2, p. 353376, 1997.
ZOU, W. Integration of different forecasting models. The Journal of Business Forecasting.

p. 26-32,1999.
ZOU, H., YANG, Y. Combining time series models for forecasting. International Journal of
Forecasting. n. 20, p. 69-84.2004.
207
APNDICE A
Tabela 1: Valores crticos para a estatstica do teste de ADF
Tamanho Nvel de significncia

0.01 0.025 0.05 0.10 0.90 0.95 0.975 0.99
Sem intercepto e sem constante
25 -2.66 -2.26 -1.95 -1.60 0.92 1.33 1.70 2.16
50 -2.62 -2.25 -1.95 -1.61 0.91 1.31 1.66 2.08
100 -2.60 -2.24 -1.95 -1.61 0.90 1.29 1.64 2.03
250 -2.58 -2.23 -1.95 -1.62 0.89 1.29 1.63 2.01
300 -2.58 -2.23 -1.95 -1.62 0.89 1.28 1.62 2.00
-2.58 -2.23 -1.95 -1.62 0.89 1.28 1.62 2.00
Com intercepto e sem constante
25 -3.75 -3.33 -3.00 -2.62 -0.37 0.00 0.34 0.72
50 -3.58 -3.22 -2.93 -2.60 -0.40 -0.03 0.29 0.66
100 -3.54 -3.17 -2.89 -2.58 -0.42 -0.05 0.26 0.63
250 -3.46 -3.14 -2.88 -2.57 -0.42 -0.06 0.24 0.62
300 -3.44 -3.13 -2.87 -2.57 -0.43 -0.07 0.24 0.61
-3.43 -3.12 -2.86 -2.57 -0.44 -0.07 0.23 0.60
Com intercepto e com constante
25 -4.38 -3.95 -3.60 -3.24 -1.14 -0.80 -0.50 -0.15
50 -4.15 -3.80 -3.50 -3.18 -1.19 -0.87 -0.58 -0.24
100 -4.04 -3.73 -3.45 -3.15 -1.22 -0.90 -0.62 -0.28
250 -3.99 -3.69 -3.43 -3.13 -1.23 -0.92 -0.64 -0.31
300 -3.98 -3.68 -3.42 -3.13 -1.24 -0.93 -0.65 -0.32
-3.96 -3.66 -3.41 -3.12 -1.25 -0.94 -0.66 -0.33
Fonte: CROMWELL, LABYS, TERRAZA (1994).
208
APNDICE B
TIPOS DE WAVELETS (Misiti et al., 1997)
Haar 1, se 0 x 1
haar
1.4
2 1.2

( x) = 1, se 1 x < 1 1
2
0.8
0, caso contrrio 0.6
0.4
0.2
0
0 50 100 150 200 250 300
Daubechies
db2 db3 db4
2 2 2
1 1 1
0 0 0
-1 -1 -1
0 500 1000 0 1000 2000 0 1000 2000
2 2 2
db5 db6 db7
1 1 1
0 0 0
-1 -1 -1
0 2000 4000 0 2000 4000 0 2000 4000
2 1 1
db8 db9 db10
1 0.5 0.5
0 0 0
-1 -0.5 -0.5
0 2000 4000 0 5000 0 5000
209
Biorthogonal
bior1.3 bior1.5
2 2
0 0
-2 -2
0 500 1000 1500 0 500 1000 1500 2000 2500
bior2.2 bior2.4
10 2
0 0
-10 -2
0 500 1000 1500 0 500 1000 1500 2000 2500
bior2.6 bior2.8
2 2
0 0
-2 -2
0 1000 2000 3000 4000 0 1000 2000 3000 4000 5000
bior3.1 bior3.3
200 5
0 0
-200 -5
0 200 400 600 800 0 500 1000 1500 2000
bior3.5 bior3.7
2 2
0 0
-2 -2
0 1000 2000 3000 0 1000 2000 3000 4000
bior3.9
2 bior4.4
2
0
0
-2
0 1000 2000 3000 4000 5000 -2
0 500 1000 1500 2000 2500
bior5.5 bior6.8
1 2
0 0
-1 -2
0 1000 2000 3000 0 1000 2000 3000 4000 5000
Coiflets
210
coif1
2
-2
0 200 400 600 800 1000 1200 1400
2
coif2
0
-2
0 500 1000 1500 2000 2500 3000
2
coif3
0
-2
0 500 1000 1500 2000 2500 3000 3500 4000 4500
coif4
2
-2
0 1000 2000 3000 4000 5000 6000
coif5
2
-2
0 1000 2000 3000 4000 5000 6000 7000 8000
Symlets
211
sym2
2
-1
0 100 200 300 400 500 600 700 800
sym3
2
-1
0 200 400 600 800 1000 1200 1400
sym4
2
-1
0 200 400 600 800 1000 1200 1400 1600 1800
sym5
2
-1
0 500 1000 1500 2000 2500
sym6
2
-1
0 500 1000 1500 2000 2500 3000
sym7
2
-1
0 500 1000 1500 2000 2500 3000 3500
sym8
2
-1
0 500 1000 1500 2000 2500 3000 3500 4000
212
Morlet x

( x) = Ce 2 .cos(5 x)
sendo que C uma
constante.
Mexican Hat 2 14 x
( )

( x) = 1 x2 e 2
3
Meyer
213
APNDICE C
PROGRAMAS USADOS AO LONGO DO TRABALHO
PROGRAMA 1 Seqncia de comandos para se simular o modelo ARIMA-GARCH no

Mathematica 5.0.
Autor: Fabiano Guasti Lima

Needs["TimeSeries`TimeSeries`"]
SeedRandom[4584715];
Dados=Table[x[i]=Table[TimeSeries[GARCHModel[{0.06,0.04},{0.7}],1200]],{i,1
,200}];TimeSeries[ARModel[{0.2,-0.5}],z,{0,0}]
(* Gera 200 observaes com 1200 pontos *)
ListPlot[x[1],PlotJoined->True]
(* Faz o grfico da primeira sucesso cronolgica simulada *)
writeMatrixSpreadSheet[filename_String, data_List] :=
Block[{file = OpenWrite[filename]},
Scan[(WriteString[file,First[#]];
Scan[WriteString[file,"\t",#]&,Rest[#]];
WriteString[file,"\n"]&,data];
Close[file]]
(* Rotina para escrever os dados no formato de planilha *)
writeMatrixSpreadSheet["serieteste.txt",Transpose[dados]]
(* Salva as observaes numa matrix de 200 colunas com 1200 linhas

*)
214
PROGRAMA 2 Pacote (Ondaleta) com os comandos para se decompor uma sucesso
cronolgica em um nvel de pr-processamento via Mathematica 5.0.
Deve-se carregar o pacote intitulado Ondaleta no Front End do Mathematica 5.0, que deve
estar salvo em um dos arquivos dos pacotes disponveis no caso, no de estatstica com o
comando:
<< Statistics/Ondaleta.m
(* Ttulo: Ondaleta 1 nvel*)

(* Autor: Fabiano Guasti Lima *)
(* Mathematica version: 5.0 *)
BeginPackage["Ondaleta`"]
Ondaleta::usage =
"Ondaleta faz o pr-processamento de uma sucesso cronolgica
decompondo a srie em duas subsries, uma de baixa (ca) e outra
de alta (cd) frequencia."
ca::usage =
"ca faz o pr-processamento da parte de baixa frequencia da
decomposio em 1 nvel."
cd::usage =
"cd faz o pr-processamento da parte de alta frequencia da
decomposio em 1 nvel."
Needs["Wavelets`Wavelets`"];
Ondaleta[arquivo_]:=ListPlot[arquivo, PlotJoined -> True, AxesLabel
-> {"t", "X(t)"}];
(* Plota apenas o grfico do arquivo da sucesso cronolgica*)
ca[arquivo_]:=ListPlot[Flatten[Take[WaveletTransform[arquivo,
DaubechiesFilter[1], 1], 1]],
PlotJoined -> True]
(* Faz o pr-processamento da parte de baixa frequencia da
decomposio em 1 nvel*)
cd[arquivo_]:=ListPlot[Drop[Flatten[WaveletTransform[arquivo,Daubech
iesFilter[1], 1]],
Length[Flatten[WaveletTransform[arquivo, DaubechiesFilter[1],
1]]]/2], PlotJoined -> True]
(* Faz o pr-processamento da parte de alta frequencia da
decomposio em 1 nvel*)
EndPackage[ ]
Obs: O Pacote possui um help prprio. Caso o usurio queira saber o que , por exemplo ca,
basta digitar na linha de comando:
?ca << Shift Enter>>
215
PROGRAMA 3 Pacote (Ondaletapos) com os comandos para se reconstruir uma sucesso

cronolgica em um nvel de pr-processamento via Mathematica 5.0.
Deve-se carregar o pacote intitulado Ondaletapos no Front End do Mathematica 5.0, que
deve estar salvo em um dos arquivos dos pacotes disponveis no caso, no de estatstica
com o comando:
<< Statistics/Ondaletapos.m
(* Ttulo: Ondaletapos 1 nvel*)

(* Autor: Fabiano Guasti Lima *)
(* Mathematica version: 5.0 *)
BeginPackage["Ondaletapos`"]
Ondaletapos::usage =
"Ondaletapos faz o ps-processamento de uma sucesso cronolgica em
primeiro nvel dadas as duas subsries, uma de baixa (ca) e outra
de alta (cd) frequencia."
Needs["Wavelets`Wavelets`"];
(* Fazer a leitura primeiro das duas subsries j previstas *)

(* ca = ReadList["c:\ca.txt", Real];*)
(*cd = ReadList["c:\cd.txt", Real];*)
Ondaletapos[arquivo1_,arquivo2_]:=InverseWaveletTransform[{arquivo1,
arquivo2}, DaubechiesFilter[1]]
(* Faz a reconstruo pela transformada de ondaleta inversa *)

EndPackage[ ]
216
PROGRAMA 4 Hsieh Segue o programa com os comandos para calcular a estatstica de

teste para o teste de Hsieh escrito no Matlab 6.5.
(Neste exemplo, calcula-se o valor dos coeficientes (i,j) para a

Subsries ca.
load ca.txt
valor=ca;
soma=0;soma2=0;
n=length(valor);
%clculo da mdia dos dados
for i=1:n
soma=soma+valor(i);
end;
media=soma/n;
%clculo do desvio padro

for i=1:n
soma2=soma2+(valor(i)-media)*(valor(i)-media);
end;
dp=sqrt(soma2/(n-1));
%clculo do vetor normalizado

for i=1:n
nvalor(i)=(valor(i)-media)/dp;
end;
%clculo do vetor normalizado ao quadrado

for i=1:n
nvalor2(i)=(nvalor(i))*(nvalor(i));
end;
%clculo da varincia do vetor normalizado ao quadrado

soma3=0;soma4=0;
for i=1:n
soma3=soma3+nvalor2(i);
end;
media1=soma3/n;
for i=1:n
soma4=soma4+(nvalor2(i)-media1)*(nvalor2(i)-media1);
end;
var=soma4/(n-1);
q=input('quantos coeficientes quer calcular = ');
aux=0;
for i=1:q
soma5=0;soma6=0;
for j=i:q
for t=(i+j-aux):n
soma5=soma5+(nvalor(t))*(nvalor(t-i))*(nvalor(t-j));
soma6=soma6+(nvalor2(t))*(nvalor2(t-i))*(nvalor2(t-j));
x=(((1/(n))*soma5)/((1/(n))*soma3)^(3/2));
217
y=(((1/(n))*soma6)/((1/(n))*soma3)^(3));
end;
soma5=0;
soma6=0;
hsieh=sqrt(n)*x/y
%if((hsieh<=1.96) & (hsieh>=-1.96))
%disp ('Aceito Ho - nao linearidade na variancia')
%else
%disp ('Reiejto Ho - nao linearidade na media')
%end;
end;
aux=aux+1;
end;
clear
218
PROGRAMA 5 Seqncia de comandos para se simular o modelo ARIMA(1,0,0) no

Mathematica 5.0.

dados =Table[x[i]=TimeSeries[ARModel[{0.3},1],1200],{i,1,200}];
(* Gera 200 observaes com 1200 pontos *)
ListPlot[x[1],PlotJoined->True]
(* Faz o grfico da primeira sucesso cronolgica simulada *)
Close[file]]

*)
219
PROGRAMA 6 Seqncia de comandos para se simular o modelo Bilinear no

Mathematica 5.0.
O modelo gerado foi: X t = 0.3 X t 1 + 0.8 X t 1 t 1 + t

Table[erro[i] = Random[Real, {0, 1}], {i, 1, 1400}];

(* Gera os nmeros aleatrios*)
erro[0] = 0;
x[0] = 0;
(* inicializao das variveis*)
serie = Table[x[j] = (0.3)*x[j - 1] +
(0.8)*(x[j - 1])*(erro[j - 1]) + erro[j] , {j, 1, 1400}];
seriefinal = Drop[serie, 200];
(* Descarta-se os 200 prieiros valores do incio da srie

para que os valores inciais atribudos no tenham
influncia na srie*)
Close[file]]

*)
220
PROGRAMA 7 Teste de No-linearidade por intervalo. FREITAS, SECURATO,
ANDRADE NETO (2004).
Segue o programa com os comandos para calcular o teste escrito no Matlab 6.5 para uma
sub-diviso.
u=ca/max(ca);
t=length(u);
for dtau=1:t-1
soma1=0;soma2=0;
for dtau1=1:dtau
soma1=soma1+(u(t)-u(t-dtau1))^3;soma2=soma2+((u(t)-u(t-
dtau1))^2)*(3/2);
end
ft(dtau)= soma1/soma2;
lim_max(dtau) = (1.96/sqrt(t));lim_min(dtau) = -(1.96/sqrt(t));
end
t1=[1:t-1];
subplot(2,1,1)
plot(t1,ft,t1,lim_max,'-',t1,lim_min,'-')
title('CA-ARIMA-GARCH')
clear
u=cd/max(cd);
t=length(u);
for dtau=1:t-1
soma1=0;soma2=0;
for dtau1=1:dtau
soma1=soma1+(u(t)-u(t-dtau1))^3;soma2=soma2+((u(t)-u(t-
dtau1))^2)*(3/2);
end
ft(dtau)= soma1/soma2;
lim_max(dtau) = (1.96/sqrt(t));lim_min(dtau) = -(1.96/sqrt(t));
end
t1=[1:t-1];
subplot(2,1,2)
plot(t1,ft,t1,lim_max,'-',t1,lim_min,'-')
title('CD-ARIMA-GARCH')
221
PROGRAMA 8 Programa para rodar a rede recorrente. De Oliveira (2003).
% APRENDIZAGEM RECORRENTE EM TEMPO REAL (ARTR)
%
% ALGORITMO - ARTR
load c:\bilinear\Inputs.txt
load c:\bilinear\DesiredOutputs.txt
H = 4;InitialState = [0.0 zeros(1,H)];
sigmoid_type = 0;
alpha = 1.0;
learning_rate = 0.005;
epochs = 20000;epsilon = 0.001;Inputs = Inputs(801:1000);
DesiredOutputs = DesiredOutputs(801:1000);
[WeightMatrix] =
artr_treino(Inputs,DesiredOutputs,H,InitialState,sigmoid_type,alpha,
learning_rate,epochs,epsilon);
[Outputs] =
artr_perf(Inputs,InitialState,H,WeightMatrix,sigmoid_type,alpha);
[samples columns] = size(Inputs);
t = (1:samples)';
figure
hold on
plot(t,DesiredOutputs,'b-.');
plot(t,Outputs,'r');
legend('Valor Desejado','Valor Previsto',0)
xlabel('Janela de Previsao')
ylabel('Serie d(t) versus Serie y(t)')
figure
hold on
plot(t, DesiredOutputs - Outputs)
legend('Erro de previsao',0)
ylabel('Erro de previsao, e(t)')
figure
hold on
plot(t, Outputs)
legend('Valores Previstos',0)
ylabel('Valores Previstos, e(t)')
wk1write('c:\bilinear\bilinearrec',Outputs);
figure
hold on
histfit(DesiredOutputs - Outputs)
e = DesiredOutputs - Outputs
perf_mae = mae(e)
% perf2_mse = mse(e)
rmse = sqrt(mse(e))
eq = (DesiredOutputs - Outputs)*(DesiredOutputs - Outputs)'
dq = (DesiredOutputs)*(DesiredOutputs)'
oq = (Outputs)*(Outputs)'
deq = diag(eq)
ddq = diag(dq)
doq = diag(oq)
theil =
(sqrt(sum(diag(eq))/10))/((sqrt(sum(diag(oq))/10))+(sqrt(sum(diag(dq
))/10)))

Tese Fabiano

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Tese Fabiano

Enviado por

Direitos autorais:

Formatos disponíveis

13

A rea de anlise e previso de sucesses cronolgicas (sries temporais ou crnicas),

Dadas as observaes passadas do comportamento de alguns sistemas, pressupondo

As condies presentes determinam, em certo grau, o futuro da forma em que pode

Com o avano da tecnologia e da capacidade de armazenagem e processamento dos

pesquisados, complementando e aprimorando as anlises qualitativas por uma srie de

Modelos de previso quantitativos utilizam-se basicamente de dados histricos para

O uso das ondaletas significativo por melhor detectar o comportamento da srie em

1.2 PROBLEMA DE INVESTIGAO

Previso, ou em ingls, forecasting, que se refere a ato ou efeito de prever, anteviso,

Conforme Tsay (2002), as previses variam segundo a sua aplicao em nveis

Inmeros autores j pesquisaram sobre a adoo das previses na rea de Finanas,

Alguns outros autores exploraram mais especificamente a previso de ndices de Bolsa

Ario (1995) utilizou as ondaletas para previso de vendas mensais de carros no

Lee (1999) utilizou ainda a decomposio em diferentes freqncias para estudar a

No Brasil, alguns poucos trabalhos, utilizando ondaletas apareceram na literatura como

durante a gravidez aplicada para deteco de alteraes do estado de sono, via

Em se tratando de aplicaes ao mercado brasileiro, Homsy, Portugal e Arajo (2000)

No caso especfico de previso no mercado de capitais brasileiro, atravs do ndice da

dados e tambm, apresentar um organograma lgico para guiar passo a passo, as

O problema central da investigao deste trabalho pode ser concentrado na seguinte

1.3 OBJETIVOS DA PESQUISA

O objetivo geral desta pesquisa o de explorar a possibilidade de usar uma metodologia

Entre os objetivos especficos, merecem destaque:

i) Propor um mtodo de pr-processamento, identificao,

v) aplicar o mtodo desenvolvido na tese para a sucesso

1.4 DELINEAMENTO DA TESE

O captulo 1 trata da apresentao do problema de pesquisa, da motivao que levou ao

O captulo 2 mostra a fundamentao terica dos modelos de previses. Para tanto, so

Foram estudados os mais variados modelos de previso, desde os modelos tradicionais

Diante desses modelos, o captulo desenvolve ainda a anlise de sucesses cronolgicas

O captulo 3 destaca o processo metodolgico empregado na pesquisa, indicando o

modelos ARMA-GARCH, ARIMA, bilinear e um movimento browniano e para os

No captulo 4, so apresentados todos os resultados experimentais das simulaes feitas

Finalmente, so traadas as concluses da pesquisa, destacando o comportamento de

2.1 SUCESSES CRONOLGICAS

Uma srie temporal qualquer conjunto de variveis estocsticas eqiespaadas e

{Xt } = { X 1 , X 2 , , X n } . Em outras palavras, um sinal que

depende do tempo e medido em pontos particulares no tempo sinnimo de uma srie

Segundo Enders (2003), para que uma srie de observaes indexadas

Box, Jenkins e Reinsel (1994) definem srie temporal como um conjunto de

Tipicamente, esses processos envolvem a consolidao das experincias histricas em

Dentre os objetivos das anlises de sucesses cronolgicas, destacam-se: a investigao

2.1.1 TCNICAS ESTATSTICAS DE PREVISO

Os problemas de previso de sries temporais so, geralmente, abordados sob a

Winklhofer et al. (1996) destacam os fatores que alavancaram os estudos de previses:

aumento da complexidade das organizaes e de seu ambiente, destacando o

Observar os dados passados de um fenmeno para tentar antecipar o seu comportamento

2.1.2 QUANTO AO HORIZONTE DE TEMPO DAS PREVISES

Em relao ao horizonte de tempo das previses feitas, h pouco consenso entre os

Os estudos relacionados ao horizonte de tempo e freqncia das previses confirmam,

2.1.3 OS MTODOS DE PREVISO

Segundo Diniz (1999), at o incio da dcada de 70, havia poucas alternativas

Os mtodos de previso podem ser classificados basicamente em duas grandes famlias,

2.1.3.1 TCNICAS QUALITATIVAS

As tcnicas de previso qualitativas, tambm chamadas de tcnicas subjetivas ou

Esses nmeros comprovam os estudos de Luxhoj et al. (1996), Zhou (1999),

enviesamento e ineficincia na interpretao dos relacionamentos podem

Segundo Armstrong e Brodie (1999), as duas tcnicas qualitativas empregadas mais

2.1.3.2 TCNICAS QUANTITATIVAS

As tcnicas de previso quantitativas so aquelas que usam dados histricos para

esta informao possa ser quantificada em termos matemticos; e

Segundo Winklhofer et al. (1996), existem duas grandes famlias de tcnicas

Essa definio coerente com a encontrada em Pindyck e Rubinfeld (1998), em que