Escolar Documentos
Profissional Documentos
Cultura Documentos
So Carlos
2008
Dedicatria
Primeiramente gostaria de agradecer a Prof. Dr. Maria Stela Veludo de Paiva, que me
recebeu muito bem na USP, sempre dedicando muito carinho para com os seus alunos. Gostaria
de agradecer tambm por depositar em mim a conana de uma mudana de tema de pesquisa,
sempre incentivando e apoiando com brilhantismo e motivao os trabalhos dos seus alunos.
Ao meus pais, Sr. Divino Benedito Soares e Sra. Maristela Correia da Silva Soares e minha
irm Gisele da Silva Soares, guerreiros e batalhadores. Cada esforo, cada boa nota, sempre
tiveram por objetivo oferecer um futuro melhor a estes heris.
A minha noiva Telma Woerle de Lima, amiga e companheira de todas as horas, sempre me
apoiando nos momentos mais difceis, inclusive nanceiros. Momentos dos quais jamais esquecerei
e espero torn-los imortais em breve.
Aos Professores Dr. Alexandre Cludio Botazzo Delbem e Dr. Fernando Marques Federson
do Instituto de Cincias Exatas e Computao da USP pelo incentivo e exemplo de amizade e
solidariedade que a mim apresentaram. Os dias em So Carlos teriam sido mais tortuosos se no
fossem os deliciosos churrascos na casa do Professor Dr. Alexandre.
Ao Professor Dr. Ivan Nunes da Silva pela excelncia de qualidade nos cursos ministrados na
ps-graduao, que em muito contriburam para o desenvolvimento desta pesquisa.
Ao amigo e colega de curso Gustavo Teodoro Laureano, que desde a graduao um grande
amigo e companheiro cientco de grande valia.
A Acta Brasil Informtica que na pessoa do Sr. Danilo Alves Martins de Faria me concedeu
um emprego no perodo em que estive sem bolsa de estudos.
CAPES pela concesso da bolsa de mestrado e pelo apoio nanceiro parcial no perodo de
realizao desta pesquisa.
Eu guardei muitas coisas em minhas mos, e perdi todas; mas todas que coloquei nas mos de
Deus, essas eu ainda possuo.
Martin Luther King, Jr.
Resumo
Soares, A.S. Predio de Sries Temporais Econmicas por Meio de Redes Neurais Artici-
ais e Transformada Wavelet: Combinando Modelo Tcnico e Fundamentalista. Dissertao de
Mestrado - Escola de Engenharia de So Carlos, Universidade de So Paulo, So Carlos, 2007.
Palavras chave: Sries Temporais Econmicas, Transformada Wavelet, Redes Neurais Artici-
ais, Algoritmo de Projees Sucessivas, Anlise Tcnica e Fundamentalista.
RESUMO
Abstract
Soares, A.S. A Technique of Economic Time Series Prediction by Articial Neural Network and
Wavelet Transform: Joining Technical and Fundamental Model. 2007. Thesis (Masters Thesis)
- So Carlos Engineer School, University of So Paulo, So Carlos, 2007.
This work presents a method for predicting nonlinear economic time series. The method is
based on fundamental and technical analysis of script quotation, a multiscale wavelet ltering,
pattern selection and articial neural networks. In the technical model is used the wavelet trans-
form in order to lter the economic time series from random or not economic behaviors. After the
data ltering, the successive projections algorithm was used for the training pattern selection to
the articial neural network. In the fundamentalist model is used nancial and macroeconomics
variables that is correlated with the time serie in order to improve the network forecasting. For
the evaluation of the proposed method are used temporal series data related to scrips prices quota-
tion of So Paulo stock market. It presents a comparison of the results between technical model,
mathematical model and proposed method. The mathematical model (ARIMA) presented better
results in series with few variance, however have low performance when compared with the techni-
cal model and with the proposed method. The prediction error evaluation shows that the proposed
method has better results than the other methods.
Keywords: Time Series Forecasting, Technical Analysis, Fundamental Analysis, Articial Neu-
ral Network, Wavelet Transform.
ABSTRACT
Lista de Figuras
6.2 Resultado da seleo de padres (Crculos vermelhos) por meio do algoritmo APS
nas sries da Coteminas e Ita. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
6.2 Resultados RMSEP com tcnicas clssicas e a tcnica proposta. 1 Mtodo A: Mod-
elo ARIMA, 2 Metodo B: Modelo tcnico, 3 Metodo C: Modelo tcnico combinado
com o modelo fundamentalista. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Lista de Tabelas Lista de Tabelas
Lista de Abreviaturas e Siglas
Lista de Smbolos
a: Rudo banco, um tipo de rudo produzido pela combinao simultnea de todas as freqncias.
b: fator de deslocamento de uma funo wavelet.
: Parmetro de inclinao das funes sigmide e hiperblica.
c: Fator de dilatao de uma funo wavelet.
: Taxa de aprendizado da rede neural.
E : Medida do erro total da rede.
g(.): Funo de ativao de um neurnio articial.
k : Intervalo de tempo entre duas observaes.
: Nmero de variveis da matriz de treinamento X .
p: Horizonte de predio da rede.
: Correlao de Spearman.
: Autocorrelao entre duas observaes x(t) e x(t + k).
: Operador polinmio autoregressivo.
: Operador do polinmio de mdias mveis.
rmsep : Mdia dos erros obtidos com um conjunto de testes.
rmsep : Desvio padro dos erros obtidos com um conjunto de testes.
T : Nmero de execues de treinamento e predio de um conjunto de testes.
x: Denota uma srie temporal discreta.
x: Denota uma srie temporal contnua.
x: Valor predito pela rede neural articial.
X : Srie temporal discreta representada no domnio da freqncia.
X : Denota uma srie temporal contnua representada no domnio da freqncia.
$: Funo de janelamento responsvel pela delimitao do trecho da srie.
xviii
Sumrio
Resumo vii
Abstract ix
Lista de Figuras xi
1 Introduo 1
1.1 Introduo ao Mercado de Aes . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Estrutura do Texto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3 Transformada Wavelet 13
3.1 Consideraes Iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.2 Perspectiva Histrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.3 Transformada de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.4 Transformada Wavelet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.4.1 Bases Wavelets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.4.2 Anlise Multiresoluo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.5 Consideraes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
xx
5 Metodologia 33
5.1 Consideraes Iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
5.2 Viso Geral da Tcnica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
5.3 Modelo Tcnico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
5.3.1 Algoritmo de Projees Sucessivas . . . . . . . . . . . . . . . . . . . . . . 35
5.4 Modelo Fundamentalista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.5 Predio: Combinando Modelo Tcnico e Fundamentalista . . . . . . . . . . . . . 40
5.5.1 Medidas de Avaliao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
5.6 Software de Desenvolvimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.7 Consideraes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
6 Resultados 43
6.1 Consideraes Iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
6.2 Suavizao da Componente Aleatria das Sries . . . . . . . . . . . . . . . . . . . 43
6.3 Seleo de Padres Utilizando o APS . . . . . . . . . . . . . . . . . . . . . . . . . 45
6.4 Combinando Modelo Tcnico e Fundamentalista . . . . . . . . . . . . . . . . . . 46
6.5 Consideraes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
7 Concluses 51
7.1 Contribuies do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
7.2 Publicaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
7.3 Limitaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
7.4 Trabalho Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
Referncias Bibliogrcas 55
A.0.1 Cabealho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
A.0.2 Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
C Software de Predio 69
xxii
1
Captulo 1
Introduo
Este trabalho apresenta uma tcnica de predio de sries temporais econmicas que faz uso
de procedimentos economtricos, conhecidos como modelo fundamentalista, e de sries tempo-
rais, conhecidas como modelo tcnico. O economtrico baseia-se em dados econmicos para a
construo do modelo, incluindo no modelo de predio variveis econmicas correlacionadas
com a srie estudada. O procedimento de sries temporais faz uso da transformada wavelet
para o ajuste da srie temporal e de RNAs para predio de valores futuros. Com a atenuao
de movimentos no econmicos por meio da transformada wavelet, possvel estudar os efeitos
economtricos baseando-se em dados econmicos para construir o modelo, empregando-se uma
rede neural articial como estimador de valores futuros.
As sries classicadas como determinsticas, possuem seu comportamento descrito por equaes
matemticas conhecidas, sendo que a predio consiste na mera aplicao das equaes que des-
crevem a srie. Entretanto, a maioria dos problemas que envolvem sries temporais possui com-
portamento estocstico, e o modelo matemtico que descreve o comportamento da srie no existe
ou no conhecido. Como alternativa ao uso de modelos matemticos, tcnicas baseadas em re-
conhecimento de padres como regresso e Redes Neurais Articiais (RNAs) podem ser utilizadas
no problema de predio de valores futuros de sries temporais de comportamento estocstico.
Tais tcnicas fazem uso da identicao de padres histricos recorrentes, isto , a identicao
de padres de oscilao na srie temporal que aconteceram em instantes de tempo passados
2
contnua aos interessados, os dados referentes aos preos de negociao dessas aes.
O modelo tcnico baseia-se em dados histricos das aes da empresa no mercado, propondo
modelos de predio a partir de padres identicados na representao grca das variaes
que os preos demonstraram em um determinado perodo de tempo (Murphy, 1991; Tavares e
Fonseca, 1987).
Dow Jones pode ser considerado o primeiro estudioso das sries temporais econmicas de
preos de aes. No incio do sculo vinte, Dow props um modelo com o objetivo de descrever
o comportamento de qualquer srie atravs de trs tipos de tendncias (Brown et al., 1998):
tendncias de longo, mdio e curto prazo. Segundo relata Brown et al. (1998), logo em seguida
a proposta de Dow, Persons props um outro modelo baseado em quatro tipos de variaes
que descrevesse o comportamento de sries temporais econmicas. Os quatro tipos de variaes
propostos foram:
2. Movimentos cclicos: variaes que correspondem aos chamados ciclos econmicos, ou seja,
oscilaes peridicas com desvios em torno da tendncia.
As quatro variaes mencionadas seriam capazes de explicar qualquer srie temporal econmica
e, a partir destas consideraes de Persons, esta composio da srie temporal econmica tornou-
se clssica, sendo considerada um marco no processo de estudos das sries. Alguns trabalhos
recentes apresentam modelos matemticos e estatsticos de ajustamento das variaes sazonais
a m de explicar a srie somente a partir de parmetros econmicos (Al-Deehani, 2006; Al-Saad,
2005). Em pases desenvolvidos, a suavizao de movimentos sazonais e irregulares em sries
temporais econmicas j considerado uma prtica ocial. Entretanto, segundo Hotta (1988), a
utilizao deste tipo de tcnica em pases em desenvolvimento como o Brasil, deve ser feita com
maior cuidado, em razo de estarem submetidos freqentemente a fortes mudanas estruturais
e econmicas, gerando grandes variaes no comportamento das sries. As tcnicas de suaviza-
o tradicionais fazem uso de ferramentas como mdia mvel, alisamento exponencial e modelos
ARIMA (Autoregressive Integrated Moving Average ), sendo que o modelo ARIMA ser descrito
no Captulo 2. Essas tcnicas de ajustamento so importantes para que seja possvel a utilizao
de um estimador eciente da srie temporal, uma vez que a suavizao funciona como um ltro
da srie.
Captulo 2
Este Captulo apresenta os principais trabalhos sobre predio de sries temporais. Tcnicas
clssicas como ARIMA e redes neurais articiais so descritas, em um contexto de evoluo
histrica do tratamento do problema de predio de sries temporais.
O modelo de Box & Jenkins assume que qualquer srie temporal um processo estocstico
estacionrio 1 gerado pela passagem sucessiva de um processo rudo branco at 2 por modelos de
1
Uma srie temporal dita estacionria quando no existe tendncia de crescimento ou decrescimento dos
dados, ou seja, os dados oscilam sobre uma mdia constante com varincia constante.
2
Um processo estocstico chamado de rudo branco quando o valor tomado no tempo t, independe do valor
tomado no tempo t k, no apresentando qualquer dependncia temporal.
6
O artigo de Harvey e Todd (1983) foi um dos principais artigos da dcada de oitenta voltado
especicamente para o problema de predio de sries temporais econmicas. Entretanto, seu
trabalho era limitado na generalizao do modelo ARIMA proposto por Box-Jenkins para o
problema de predio de sries temporais econmicas (Granger e Morris, 1976). No artigo,
Harvey e Todd (1983) demonstraram que ao separar as quatro componentes de sries temporais
econmicas propostas por Down Jones, o modelo ARIMA poderia ser aplicado ao problema de
predio das componentes de tendncia e sazonalidade da srie. Para separar as componentes,
utilizaram o ltro de Kalman para suavizar o comportamento aleatrio, onde a componente de
tendncia e sazonalidade eram de interesse. Os resultados mostraram que a predio ocorria com
certo sucesso para a componente de sazonalidade, mas no apresentava resultados satisfatrios
para a componente de tendncia.
A primeira aplicao que utilizou RNA como estimador, ao invs de modelo matemtico como
o ARIMA, foi a de White (1988). Apesar da ausncia de comparao com os modelos clssicos
como o ARIMA, o artigo foi importante na discusso de tcnicas inteligentes na deteco dos
padres presentes nas sries temporais econmicas. Como dados de testes foi utilizado somente
a srie econmica dos preos de cotaes da empresa IBM, e o algoritmo OLS (Ordinary Least
Squares ) para treinamento da RNA. O autor conclui que a aplicao de tcnicas inteligentes
como as RNAs ainda careciam principalmente de algoritmos de treinamentos ecientes para o
aprendizado de regularidades no lineares presentes nas sries temporais econmicas.
Outro importante trabalho foi o de Connor et al. (1994), que props uma tcnica mais
sosticada para o problema de predio de sries temporais. A proposta consistiu na ltragem
do comportamento aleatrio por meio da identicao e ltragem de outiliers 3 , e da estimao
da srie a partir dos dados ltrados por meio de uma RNA MLP recorrente. A principal car-
acterstica da RNA proposta por Connor, possuir laos de realimentao dos erros produzidos
pela sada da rede conforme ilustra a Figura 2.1.
A Figura 2.1 mostra uma RNA recorrente para aproximao de um modelo ARMA no linear
3
Uma observao classicada como outilier quando no segue o mesmo padro de dependncia espacial como
a maioria das observaes do conjunto de dados.
8
conhecido como NARMA (Non-linear Autoregressive Moving Average ), que faz uso do modelo
auto-regressivo (AR) de ordem p e do modelo mdia-mvel de ordem q , onde a sada x dada
pela equao 2.3.
m
X Xp q
X
x(t) = Wi g wij x(tj) + wij (x(tj) x(tj) + i ) (2.3)
i=1 j=1 j=1
Saad et al. (1998) apresentou um estudo comparativo de trs tipos de arquiteturas de RNAs
para o problema de predio de sries temporais econmicas. Foram estudadas as arquiteturas
com atraso de tempo (TDNN - Time Delay Neural Network ), recorrente, e probabilstica. As
RNAs foram testadas na predio de tendncias de curto prazo da bolsa de valores de Nova York,
onde os resultados demonstraram que as trs arquiteturas estudas tm uma capacidade preditiva
semelhante, com vantagem para a arquitetura TDNN, por sua facilidade de implementao com-
putacional. Entretanto, o trabalho de Koskela et al. (1996) apresenta o estudo comparativo entre
RNAs do tipo MLP (Multi Layer Perceptron ), FIR (Finite impulse response ) e rede de Elman,
mostrando que utilizando o algoritmo Backpropagation para as trs arquiteturas de redes, a rede
de Elman apresentou uma memria de longo prazo melhor, e conseqentemente uma predio
melhor no problema de sries temporais.
Os trabalhos de Dhatt et al. (1999a), Gurgul et al. (2003), Grppo (2004) e Cajueiro e
Tabak (2005), apesar de no tratarem especicamente de predio, trouxeram um novo foco na
abordagem do problema de predio de sries temporais do tipo econmica. Dhatt estudou a
relao entre as variveis fundamentalistas e o comportamento de preos das aes a partir da
10
bolsa de valores da Korea. Dhatt agrupou um grupo de aes de um mesmo setor de mercado
e props a teoria de que todas as aes do grupo setorial eram inuenciadas pelas variveis
econmicas daquele setor. Para isso, provou de forma experimental, por meio de um modelo de
regresso linear mltipla, que as variveis econmicas especcas do setor econmico que as aes
estavam inseridas, inuenciavam no comportamento dos seus preos.
Em mbito nacional, dois trabalhos recentes, com dados do Brasil, mostram tambm a
tendncia da nova abordagem. Cajueiro e Tabak (2005) zeram o estudo das possveis fontes
do comportamento de longo alcance no mercado nanceiro brasileiro. Utilizando o expoente de
Hurst e o coeciente de Spearman, o autor arma que encontrou a evidncia de que variveis
especcas da empresa emissora dos ttulos de aes na bolsa podem explicar, pelo menos par-
cialmente, comportamento de longo prazo, representando um importante avano nos problemas
relacionados a sries temporais econmicas. Entretanto, na concluso, faz a advertncia que os
preos no esto dirigidos unicamente por variveis fundamentalistas, mas tambm por outras
caractersticas do mercado, como o comportamento especulativo (no contexto deste trabalho,
o comportamento especulativo refere-se a anlise tcnica) e as chamadas bolhas especulativas
tm papis signicativos na determinao dos preos, principalmente em mercados emergentes
como o Brasil.
real de curto prazo (SELIC). Por sua vez, a cotao do petrleo no mercado internacional no
explica signicativamente o comportamento das sries. O autor tambm concluiu que o prprio
ndice Bovespa tambm tem um grande poder explicativo sobre as sries temporais econmicas
que compe o ndice.
E nalmente, Lam (2004) foi a primeira a propor uma RNA que integrasse os modelos tcnicos
e fundamentalistas. Fazendo uso de vinte e sete variveis fundamentalistas, Lam demonstrou que
uma RNA do tipo MLP com algoritmo de treinamento backpropagation capaz de integrar os
dois modelos. Foram utilizados dados de empresas com aes cotadas na bolsa de valores de
Nova York, no perodo de 1985 a 1995. Para a integrao dos modelos, foi utilizado a tcnica
estatstica de planejamento de experimentos, detalhada em Mead (1990). Com os resultados,
a autora concluiu que a habilidade de predio da rede melhorada para a maioria das sries
estudas.
Este Captulo apresentou a reviso bibliogrca das principais tcnicas encontradas na liter-
atura. Foi descrita uma evoluo histrica dos mtodos de tratamento do problema de predio
de sries temporais em geral, at os trabalhos mais recentes. Estes artigos recentes evidenciam
a importncia de utilizar as abordagens fundamentalista e tcnica em conjunto no problema de
predio de sries temporais econmicas. Contudo, a combinao desses modelos ainda tmida
quando tratada no escopo de tcnicas de inteligncia articial como as RNAs.
12
13
Captulo 3
Transformada Wavelet
Neste Captulo feita uma introduo a transformada wavelet e seu funcionamento como
ltro no problema de predio de sries temporais.
A transformada wavelets, ou anlise wavelet, mostra muitas origens diferentes, como ilustra
Meyer (1993a). Entretanto, sua idealizao foi concebida no trabalho de Haar, que no apndice
de sua tese de doutorado, demonstrou que um sinal qualquer poderia ser diferenciado e inte-
grado de modo a conservar sua energia inicial. Por volta de 1930, vrios grupos trabalhando
independentemente publicaram trabalhos desenvolvidos com a teoria wavelet proposta por Haar.
possvel citar, por exemplo, o trabalho de Paul Levy descrito em Meyer (1993b), que investigou
o movimento Browniano usando a base de wavelets de Haar, mostrando que as funes da base
de Haar eram melhores do que as da base de Fourier para estudar os detalhes do movimento
Browniano.
Contudo, somente em meados da dcada de oitenta que seu uso foi amplamente aceito e ado-
tado pela comunidade cientca. Parte dessa aceitao deve-se ao ganho de poder computacional
dos computadores e aos trabalhos de Daubechies (1990), Mallat (1989b) e Morlet et al. (1989).
e ltragem de sinais. Paralelamente aos trabalhos voltadas para aplicaes especcas, diversas
contribuies de novos algoritmos e estratgias de implementaes computacionais propuseram
verses para a transformada rpida discreta (utilizando-se bancos de ltros) e algoritmos melho-
rados para resolver efeitos de bordas e particionamento do espectro do sinal, de forma a aumen-
tar a resoluo nas faixas de freqncias mais altas, utilizando-se tcnicas como os "pacotes de
wavelets "(wavelet-packets ), e multiwavelets.
O incio dos estudos de sinais no domnio da freqncia atribuda a Joseph Fourier, que
em 1807 iniciou o estudo das teorias de anlise de freqncia a partir das sries de Fourier, onde
qualquer sinal poderia ser representado pela soma innita de senos e co-senos. Explorando as
sries de Fourier, os matemticos foram gradualmente se direcionando a noo prvia de anlise
de freqncia e escala conduzindo a famosa transformada de Fourier para anlise de sinais no
domnio da freqncia.
Z +
X(f ) = x(t)ej2f t dt, (3.1)
onde j = 1 e f a freqncia do sinal no domnio do tempo. A transformada inversa de
Fourier que recupera a funo original x a partir de X denida como:
15
Z
x(t) = X(f )ej2f t df, (3.2)
+
N 1
1 X jn2f
X(f ) = x(t)e N (3.3)
N
n=0
A transformada discreta de Fourier inversa (Inverse Discrete Fourier Transform, IDFT) re-
cupera o sinal do domnio da freqncia para o domnio do tempo. A IDFT denida como:
N
X 1
jn2f
x(t) = X(f )e N . (3.4)
n=0
N
X 1
F (p, f ) = xt $(tp) eif t (3.5)
t=0
A transformada wavelet utiliza janelas com comprimentos variveis que se ajustam melhor s
caractersticas do sinal em contraste com a STFT. A grande vantagem da transformada wavelet
a possibilidade da anlise tempo-freqncia que permite a localizao de altas freqncias
em intervalos de tempo especcos, tpico de sries temporais econmicas, tornando possvel a
suavizao do comportamento aleatrio da srie em trechos especcos. A transformada wavelet
para a anlise e ltragem de sries temporais tem sido proposta em diversos trabalhos nos
ltimos anos (Renaud et al., 2005; Fryzlewicz, 2003) em substituio s tcnicas clssicas como
a transformada de Fourier.
X X
X
f (t) = dk k (t) + cjk kj (t) (3.6)
k= j=0 k=
onde a funo
j
j,k (t) = 2 2 (2j t k) (3.8)
1 tb
c,b (t) = ( ) (3.9)
c c
1 tb
c,b (t) = ( ) (3.10)
c c
Para c > 1 tm-se o efeito de dilatao da funo wavelet e para c < 1 tm-se o efeito de
contrao da funo wavelet sendo possvel analisar os aspectos globais e locais das sries.
medida que b varia, a funo f analisada localmente em torno de b.
Z
(t)dt = 0 (3.11)
Z
|(t)|2 |dt = 1 (3.12)
A equao 3.11 expressa que para uma funo ser wavelet, sua integral deve ser zero. Isso
garante que a funo wavelet tenha uma forma do tipo onda, e a equao 3.12 dene que a funo
deve ter energia unitria, garantindo que a funo tenha decaimento rpido para a localizao
temporal (Hernandez e Weiss, 1996; Mallat, 1999).
A wavelet de Haar foi a primeira funo conhecida com comportamento wavelet e tambm a
mais simples em termos matemticos. A wavelet de Haar dada pela equao 3.13.
1, t 1
2
(t) = 1, 1
t<1 (3.13)
2
0, t>1
A base de Haar tem o inconveniente de ser formada por funes descontnuas, expressas na
equao 3.13, entretanto sua facilidade de compreenso e implementao motivam o uso da base
de Haar como wavelet me.
A partir da base de Haar outras bases foram desenvolvidas na forma de famlia de funes
similares, como por exemplo a famlia de bases de Daubechies (Daubechies, 1990), Meyer (Meyer,
18
1993a) e Coiet (Huang e Hsieh, 2002). A Figura 3.1 ilustra a representao dessas bases.
1 0.5
0 0
1 0.5
2 1
0 0.5 1 1.5 0 5 10 15 20
1
2
0
0
1
2 2
0 2 4 6 0 1 2 3
Uma questo que sempre surge na aplicao da anlise wavelet a escolha da base wavelet
mais adequada para analisar um certo tipo de sinal. Ainda no existe uma receita para esse
procedimento, apenas recomendaes teis, como por exemplo, a forma da base wavelet escolhida
deve reetir as caractersticas do sinal. A escolha da base wavelet um fator importante, mas a
escolha de uma base adequada ainda tema de pesquisa em aberto. Outra alternativa denir
experimentalmente a base wavelet a ser utilizada no problema em estudo.
H(t) 2
H(t) 2
L(t) 2 H(t) 2
L(t) 2
L(t) 2
A decomposio wavelet tem como caracterstica ltrar e decimar o sinal. Na Figura 3.2
o operador de decimao diminui a taxa de amostragem do sinal, ou seja, elimina pontos
intercalados. Decimar um sinal pelo fator 2 signica que o sinal ser sub-amostrado por um
fator de 2, obtendo-se metade do sinal original pela reduo da taxa de amostragem. A Figura
3.3 apresenta um exemplo da aplicao da decomposio wavelet ilustrada na Figura 3.2.
Na Figura 3.3(a) mostrada um srie temporal obtida das cotaes de preo das aes do
grupo Po de Acar no perodo de Janeiro a Novembro de 2005. A srie foi submetida
decomposio wavelet utilizando-se a base de Daubechies (db 11), obtendo-se a aproximao a1
e seus detalhes d1 para um primeiro nvel de resoluo, aproximao a2 e detalhes d2 para o
segundo nvel de resoluo, sendo possvel analisar a srie em dois nveis de decomposio.
Para muitos sinais, inclusive as sries temporais econmicas, as componentes de baixa fre-
qncia so aquelas que contm maior informao. J nas componentes de alta freqncia, so
encontrados detalhes que contem a maior parte do comportamento aleatrio da srie, possibili-
tando o emprego de um limiar de corte na componente de detalhes.
20
80
70
60
x
50
40
0 50 100 150 200 250
t
120 2
1
100
a1
d1
0
80
1
60 2
0 50 100 150 0 50 100 150
t t
160 4
140 2
a2
d2
120 0
100 2
80 4
0 20 40 60 80 0 20 40 60 80
t t
A equao 3.14 apresenta o limiar universal proposto por Donoho e Downie (Donoho, 1995;
Downie e Silverman, 1998), para o corte dos coecientes de detalhe para cada nvel de resoluo
na transformada wavelet.
p
2log(n) (3.14)
A equao 3.14 aplicada como limiar de corte nos coecientes de detalhes para cada nvel
de resoluo na transformada wavelet. Utilizando a transformada wavelet na srie temporal
possvel realar ou suavizar determinadas caractersticas em trechos localizados, o que no era
possvel utilizando tcnicas como transformada de Fourier ou mdias mveis.
21
Captulo 4
Neste Captulo so apresentados alguns conceitos fundamentais sobre as redes neurais ar-
ticiais, princpio de funcionamento e a motivao no uso das RNAs no problema de previso
de sries temporais econmicas. Apresenta-se algumas das principais arquiteturas de RNAs uti-
lizadas no problema de predio de sries temporais, concluindo-se com uma comparao sobre
arquiteturas multi-camada recorrente e multi-camada no recorrente.
g(.) a funo de ativao da sada do combinador linear que processa o conjunto de entradas
recebidas e as transforma em estado de ativao. A Figura 4.2 apresenta as principais funes
g(.) de ativao usadas em RNAs, destacando-se como as mais usadas a funo sigmide, tambm
conhecida como logstica, e a hiperblica.
3 2
1.5
2
1
0.5
g(u)
0 0
0.5
1
2
1.5
3 2
4 3 2 1 1 2 3 4 6 4 2 0 2 4 6
u
u
1 1
0.9 0.8
0.8 0.6
0.7 0.4
0.6 0.2
g(u)
g(u)
0.5 0
0.4 0.2
0.3 0.4
0.2 0.6
0.1 0.8
0 1
6 4 2 0 2 4 6 6 4 2 0 2 4 6
u u
A funo logstica utilizada quando deseja-se que os valores de sada do neurnio estejam
no intervalo [0, 1], e a funo hiperblica quando se deseja que os valores de sada do neurnio
estejam no intervalo [1, 1]. A funo sigmide descrita na Equao 4.1.
1
g(u) = (4.1)
1 + eu
1 eu
g(u) = (4.2)
1 + eu
Nas equaes 4.1 e 4.2 dene a inclinao da sigmide e da hiperblica. A funo rampa
denida por:
a, se u > a
g(u) = u, se aua (4.3)
a, se u < a
onde a denota o valor de ativao mnimo e mximo da funo. A funo degrau denida como
1, se u 0
g(u) = (4.4)
0, se u < 0
O parmetro das funes sigmide e hiperblica pode ser ajustado de modo a denir a
inclinao da funo, como ilustrado na Figura 4.3.
0.9 beta = 2
beta = 10
0.8 beta = 0.1
0.7
0.6
g(u)
0.5
0.4
0.3
0.2
0.1
0
0 5 10 15 20 25 30 35 40
u
Inicialmente as arquiteturas podem ser classicadas em duas classes, camada nica e multi-
camadas (Dayho, 1990). Nas redes com arquitetura de camada nica, tem-se a entrada de dados
e uma nica camada de neurnios em paralelo que a prpria camada de sada. Um problema
relacionado a esse tipo de rede a sua limitao em representar funes linearmente separveis,
restrio solucionada com a utilizao de redes com mais de uma camada, redes conhecidas
como multi-camadas. As arquiteturas de redes neurais tambm podem ser classicadas como
recorrentes e no recorrentes (Russell e Norvig, 1995). Esses dois tipos de arquiteturas sero
apresentados nas sees 4.3.1 e 4.4 respectivamente.
A camada de sada contm os neurnios que fornecem a sada da rede. As camadas que no
possuem ligaes diretas com a entrada, nem com a sada so denominadas de camadas ocultas.
No caso de redes no-recorrentes como na Figura 4.4, no existem conexes ligando um neurnio
de uma camada a outro de uma camada anterior, nem a um neurnio da mesma camada, as
conexes so feitas somente para neurnios da camada seguinte.
27
Redes neurais recorrentes so redes que contm realimentao das sadas para as entradas,
sendo suas sadas determinadas pelas entradas atuais e pelas sadas anteriores (Kolen, 1994).
As redes recorrentes, quando organizadas em camadas, possuem interligaes entre neurnios da
mesma camada e entre camadas no consecutivas, gerando interconexes bem mais complexas
que as redes neurais no recorrentes (Jain, 2001).
assumidos por x no tempo, congurando-se como uma RNA de maior potencial de modelagem de
dados temporais (Zhang e Morris, 1995; Williams e Zipser, 1989). Segundo O. Nerrand (1993),
como estruturas de processamento de sinais, redes neurais recorrentes se assemelham a ltros
no-lineares com resposta ao impulso innita. O treinamento da rede TDNN pode ser feito
utilizando-se o algoritmo backpropagation.
Elman (1990) props uma uma RNA recorrente, adicionando uma camada escondida, de-
nominada camada de contexto. A camada de contexto responsvel por guardar a informao
temporal relativa as entradas anteriores da rede. O peso w entre a camada escondida e a camada
de contexto xado em 1, possibilitando a utilizao do algoritmo backpropagation. A estrutura
da rede de Elman mostrada na Figura 4.5.
Essa rede diferencia-se das demais solues temporais por conseguir com que dados de todas
as amostras anteriores ao instante de tempo t inuenciem no instante presente. Isso possvel
devido realimentao feita na camada escondida, que faz com que todas as amostras anteriores
inuenciem na sada. Porm, quanto mais recente a amostra maior a inuncia no resultado.
Kremer (1995) demonstrou que apesar da simplicidade estrutural da rede de Elman, ela
sucientemente capaz de modelar informaes temporais utilizando o modelo de neurnio de
29
O treinamento de uma RNA consiste no ajuste dos pesos sinpticos wj e dos limiares . O
objetivo no treinamento fazer com que a rede seja capaz de generalizar um problema, ou seja,
no necessrio que a rede conhea todas as possibilidades de entrada para obter a sada, de
forma que a aplicao de um conjunto de entradas desconhecidas ao treinamento produza um
conjunto de sadas desejadas (Leonard e Kramer, 1990).
p
1 XX
E= (xi xi )2 (4.5)
2 n
i=1
E
wij = (4.6)
wij
Calculando-se a derivada para todas as camadas da rede, obtm-se as seguintes frmulas para
a atualizao dos pesos wij , para cada padro de entrada individualmente.
Wij = xj (4.7)
onde
N2 !
X
= gj0 k wkj (4.8)
k=1
Para uma apresentao mais detalhada de como o algoritmo backpropagation funciona recomenda-
se a leitura do artigo original de Rumelhart (Rumelhart e McClelland, 1986).
baseada em informaes de gradiente locais. Para isso, introduzido, para cada peso, o seu
valor individual de atualizao Dji , que determina apenas o tamanho da alterao no respectivo
peso. Esse valor individual de atualizao Dji evolui durante o processo de aprendizado, baseado
apenas no sinal local da funo de erro E , baseado nas seguintes regras de aprendizado:
+ ji (n), se E E
+ 1) > 0
wji n ji (n
ji (n + 1) = ji (n), se E E
wji n ji (n + 1) < 0 (4.9)
ji (n), caso contrrio
A regra de aprendizado da equao 4.9 faz com que a mudana no sinal das derivadas parciais
correspondentes ao peso wij indica que a ltima mudana foi grande o suciente pulou sobre um
mnimo local da funo E , implicando em uma diminuio do valor de ji proporcional ao fator
. Se a derivada parcial no trocou de sinal, o algoritmo est movendo permanentemente em
uma nica direo , o que implica num aumento sensvel de ji proporcional ao fator + , para
que a convergncia no sentido de regies de menor erro seja acelerada. Uma vez que os valores
individuais de atualizao ji para cada peso sinptico foram determinados, a atualizao dos
pesos segue a equao 4.10.
ji (n + 1), se + 1) > 0
E
wji (n
wji (n + 1) = E
+ji (n + 1), se wji (n + 1) < 0 (4.10)
0, caso contrrio
importante citar que o ajuste da taxa de aprendizado e dos pesos sinpticos dependem
dos termos do gradiente e no da sua magnitude como no Backpropagation. Com a utilizao
do RPROP, o tamanho da atualizao dos pesos depende apenas da seqncia de troca de sinais
das derivadas parciais.
32
Captulo 5
Metodologia
Predio
Seleo de Padres
Seleo de variveis
Base de dados
Base de dados da Fundao Getlio Vargas
BOVESPA
No modelo tcnico, os dados sobre as sries temporais econmicas utilizadas foram extradas
diretamente do website da BOVESPA1 (Bolsa de Valores de So Paulo), principal bolsa de valores
do Brasil.
Seleo de Padres
Pr-processamento Modelo
tcnico
Srie temporal
econmica
Base de dados
BOVESPA
Conforme o diagrama da Figura 5.2, a primeira etapa consiste da obteno das sries tem-
porais econmicas a partir da base de dados da BOVESPA. No primeiro bloco, as sries foram
extradas isoladamente para cada companhia analisada, de modo que o modelo de srie tempo-
ral fosse univariado, ou seja, as sries foram analisadas de forma independente uma das outras.
Dentre as diversas informaes disponibilizadas, no segundo bloco do diagrama so extradas
as informaes da srie referente a cotao de preo da abertura, preo mximo, preo mnimo,
preo mdio, preo de fechamento e volume negociado amostrado de forma diria, conforme
sugerido nos trabalhos de Yao et al. (1999), Jang (1991) e Lam (2004). Essas variveis sero
1
http://www.bovespa.com.br
35
referenciadas como variveis do modelo tcnico (VMT) e a predio refere-se ao preo mdio dos
dias futuros.
O quarto bloco ilustra o emprego de seleo de padres de treinamento, que visa melhorar
o processo de aprendizagem do mtodo de predio e por conseguinte sua preciso em exemplos
de teste (Raymer et al., 2000; Niska et al., 2006).
Para este trabalho foi escolhido o algoritmo de projees sucessivas para a seleo dos padres
de treinamento da srie temporal econmica, uma vez que este algoritmo mostrou-se promissor
quando comparado aos outros mtodos citados em problemas de regresso e classicao (Arajo
et al., 2001; Pontes et al., 2005).
O algoritmo de projees sucessivas (APS) foi proposto inicialmente por Galvo et al. (1999)
e Arajo et al. (2001), como uma tcnica de seleo de variveis para minimizar problemas
de colinearidade em problemas de calibrao multivariada. Mais recentemente, no trabalho
de Pontes et al. (2005), o APS foi empregado tambm como uma nova estratgia de seleo
de variveis que so minimamente redundantes, mas representativas do conjunto de dados em
36
Seja S o conjunto de variveis disponveis e que ainda no foram selecionadas, tal que,
S = { tal que 0 J 1} e j
/ {i, . . . , x(n 1)} (5.1)
Seja xi a i-sima e xj a j -sima coluna de X , tal que X possua J vetores coluna disponveis,
a projeo de xj na direo de xi dada por:
Projxi ,xj = xj Projxi ,xj = xj (xj xTi )xi (xi xTi )1 j S (5.3)
Na gura 5.3, considerada uma matriz X com 3 amostras e 5 variveis, que no contexto
deste trabalho so os padres de treinamento. Deseja-se selecionar 3 variveis, de forma que
cada linha de X seja representada por um vetor em um espao de 3 dimenses. Tomando-se
x3 como varivel de partida, faz-se v1 = x3 . Como possvel observar na gura 5.3, x1 tem a
maior projeo no subespao ortogonal a v1 . Portanto, faz-se v2 = x1 . Para selecionar a terceira
varivel, repetem-se as projees, agora sobre o subespao ortogonal a v2 . Como resultado, o
vetor x5 escolhido, fazendo-se v3 = x5 . Selecionados x1 , x3 e x5 a escolha encerrada. Vale
ressaltar que segundo Galvo et al. (1999), no seria possvel escolher uma quarta varivel por
esse mtodo, pois todos as variveis resultantes de uma nova projeo teriam norma zero. Assim,
o algoritmo s permite selecionar 1 variveis, sendo que o nmero de amostras dos padres
37
de treinamento.
No problema de seleo de padres para sries temporais econmicas, foi feita uma alterao
no algoritmo de modo que a varivel inicial seja aquela que contm o instante de tempo ime-
diatamente anterior ao instante de tempo que se deseja prever, gerando-se apenas uma cadeia
de variveis selecionadas. A quantidade de padres selecionados pelo algoritmo, foi denida
experimentalmente em 30, 50, 80 e 119.
Seleo de variveis
Modelo
fundamentalista
Variveis macro- Variveis
econmicas financeiras
P
6 ni=0 d2i
|r| = 1 (5.4)
n(n2 1)
2
http://fgvdados.fgv.br
39
O ndice BOVESPA indica o desempenho das principais aes negociadas na BOVESPA. O Risco pas um
mtodo mundialmente reconhecido que classica o risco de calote da dvida pblica de um pas e conseqntemente
o risco de se investir no pas.
di = (Posto de x1i dentre os valores de x1) (Posto de x2i dentre os valores de x2) (5.5)
Aps a converso e ltragem das variveis VMT e da seleo das variveis VMF para cada
srie estudada, a rede neural de Elman foi elaborada de modo a prever p valores futuros. Utilizou-
se os dados de modelo tcnico e fundamentalista do perodo de janeiro de 1999 a agosto de 2006,
para treinamento da rede neural de Elman descrita na seo 4.4, sendo que os dados do modelo
tcnico de agosto a novembro de 2006 foram utilizados para validar a predio. Vale salientar
que, quanto mais dados so utilizados para treinamento, mais difcil torna-se o mapeamento dos
dados pela RNA. Entretanto, a incluso de poucos dados, referentes a perodos de tempo curtos,
podem no ser sucientes para que a RNA aprenda o comportamento da srie.
A dimenso dos dados de entrada varivel para cada srie a ser analisada. So utilizados
cento e vinte atrasos de tempo, denidos experimentalmente, adicionados s m variveis funda-
mentalistas selecionadas pelo teste SRCC. Os neurnios da camada oculta utilizam a funo de
ativao sigmide e os neurnios da camada de sada a funo de ativao rampa. A camada de
sada utilizada como um combinador linear dos neurnios da camada escondida, sendo que uma
funo de ativao do tipo linear, como o caso da funo rampa, suciente para realizar tal
tarefa, minimizando o custo computacional em relao ao uso de uma funo no linear. Para o
treinamento, foi utilizado o algoritmo Resilient Propagation que demonstrou realizar um treina-
mento mais rpido e menos suceptvel a mnimos locais em relao aos principais algoritmos de
treinamento disponveis no toolbox do matlab, como os algoritmos Backpropagation, gradiente
conjugado, Levenberg-Marquardt, Quasi-Newton, mtodo da secante dentre outros.
Para validar a predio, foi utilizado a raiz quadrada da mdia do erro de predio quadrtico
(Root-Mean-Square Error of Prediction, RMSEP ) expressa na Equao 5.6.
41
v
u N
u1 X
RM SEP = t (x(t) x(t))2 (5.6)
N
t=1
onde x(t) o valor real da srie no tempo t, x(t) o valor predito no tempo t e N o nmero
de observaes no conjunto de validao.
PT
i=0 RM SEPi
rmsep = (5.7)
T
s
PT
i=0 (RM SEPi rmsep )2
rmsep = (5.8)
T
O parmetro rmsep calcula a mdia dos erros obtidos com T treinamentos e predies de
uma mesma srie temporal, enquanto que o parmetro rmsep calcula o desvio padro das T
medidas de erro RM SEP .
A leitura dos dados da BOVESPA foi realizada por meio de um algoritmo desenvolvido na
linguagem JAVA, na verso 5.0, com o objetivo de ler o arquivo binrio e convert-lo em um
formato de fcil leitura no software MATLAB.
Este Captulo apresentou a tcnica proposta para o problema de predio de sries temporais
econmicas. A tcnica composta por dois mdulos principais, sendo um baseado no modelo
tcnico e outro no fundamentalista. A combinao desses dois modelos pode apresentar melhores
resultados em relao as tcnicas que fazem uso de apenas um dos modelos. Apresentou-se as
42
medidas de avaliao de erro de predio por meio das equaes 5.6, 5.7 e 5.8.
43
Captulo 6
Resultados
Conforme descrito no Captulo 3, aplica-se a transformada wavelet, sendo que para cada canal
h aplica-se o limiar universal (Equao 3.14) em cada nvel de decomposio. Experimentalmente
deniu-se que trs nveis de decomposio so sucientes para suavizar a componente aleatria.
Para a maioria das sries estudadas, a ltragem utilizando nveis maiores que trs, distorce parte
do comportamento da srie. A Figura 6.1 ilustra dois exemplos de suavizao.
Na Figura 6.1 so apresentados trechos das sries histricas de cotaes de preo mdio no
perodo de agosto a dezembro de 2005. Note que houve uma suavizao das altas freqncias
das sries, sendo que o efeito da suavizao lembra um alisamento polinomial. Entretanto, em
sries onde os picos so altos e estreitos, como a srie da Figura 6.1(c), a transformada wavelet
tambm consegue suavizar a srie.
44
1
Srie original
0.95 Srie filtrada pela transformada wavelet
0.9
0.85
0.8
0.75
0.7
0.65
0.6
0.55
0 50 100 150 200 250
Evoluo diria
1
Srie original
Srie filtrada pela transformada wavelet
0.95
0.9
0.85
0.8
0.75
0.7
0 20 40 60 80 100 120 140 160
Evoluo diria
1
Srie original
Srie filtrada pela transformada wavelet
0.9
0.8
Cotao normalizada
0.7
0.6
0.5
0.4
possvel observar na Figura 6.1(c) que picos em intervalos de tempo curtos com baixas
freqncias no so cortados na ltragem, fato que no possvel utilizando transformada de
Fourier ou outra tcnica de alisamento. Os trechos especcos contendo alta freqncia so
suavizados, como por exemplo no intervalo de tempo de 0 a 100 da Figura 6.1(c), preservando
picos com baixa freqncia, como por exemplo no intervalo de tempo de 130 a 170 da Figura
6.1(c). Isto possvel devido capacidade de resoluo tempo-freqncia da transformada wavelet
descrita no Captulo 3.
Como relatado na seo 5.3.1, o APS foi adaptado para o problema de predio de srie
temporais econmicas para selecionar os padres de treinamento mais representativo do compor-
tamento da srie estudada. Dois resultados da seleo de padres de treinamento por meio do
algoritmo APS em duas sries temporais econmicas diferentes so indicados na Figura 6.2.
4 4
x 10 x 10
3.5 3.5
Srie original
Srie original
Padres de treinamento
Padres de treinamento
3 3
2.5 2.5
Cotao
Cotao
2 2
1.5 1.5
1 1
0 500 1000 1500 0 200 400 600 800 1000 1200 1400
Evoluo diria Evoluo diria
(a) Srie original e padres selecionados para a (b) Srie original e padres selecionados para o
Coteminas. Ita.
Figura 6.2: Resultado da seleo de padres (Crculos vermelhos) por meio do algoritmo APS
nas sries da Coteminas e Ita.
No caso da srie da Coteminas, o algoritmo selecionou a maioria dos padres prximos aos
instantes de tempo t = 500 e t = 800. A matriz de padres continha inicialmente 1357 padres,
sendo que o melhor conjunto selecionado pelo APS em termos de RMSEP contm 50 padres,
proporcionando uma reduo da matriz de treinamento em torno de 96%. J para a srie do
Ita, o algoritmo APS selecionou padres bem prximos aos instantes de tempo a serem preditos.
A matriz de padres continha inicialmente 1422 padres de treinamento, sendo reduzido para 30
46
Com a srie suavizada aplica-se o teste SRCC da seo 5.4, para adio de variveis fun-
damentalistas. O resultado do teste SRCC com arredondamento para duas casas decimais de
preciso, e o resumo das variveis escolhidas para cada srie analisada mostrado na Tabela 6.1.
onde C1 : Grupo Po de Acar, C2 : Grupo ITAUSA, C3 : Embraer, C4 : Compania Vale do rio doce, C5 :
Petrobrs, C6 : AMBEV, C7 : Natura, C8 : VIVO, C9 : TELESP, C10 : GOL, C11 : TAM, C12 : CPFL Energia, C13 :
Aracruz, C14 : Sadia e C15 : Coteminas.
Os resultados da Tabela 6.1 mostram que para cada srie econmica diferentes variveis
podem estar correlacionadas com o comportamento da srie. Para a srie do Po de Acar as
variveis v2 , v4 , v7 , v10 e v11 podem estar correlacionadas com o comportamento da srie e as
variveis v1 , v3 , v5 , v6 , v8 e v9 no apresentam contribuio signicativa para o comportamento
da srie do grupo Po de Acar. Entretanto para a srie da Petrobrs as variveis v1 , v4 , v6 ,
v10 e v11 podem estar correlacionadas com o comportamento da srie e v2 , v3 , v5 , v6 e v8 no.
Portanto, para cada srie econmica, diferentes variveis podem contribuir para a compreenso
do comportamento e consequentemente para sua estimao. Para cada srie temporal econmica
as variveis fundamentalistas escolhidas so adicionadas na entrada da rede neural para estimar
o comportamento futuro.
Entretanto para algumas sries analisadas o teste estatstico no foi capaz de identicar
qualquer relao para a maioria das variveis analisadas. Para a companhia GOL (C10 ), por
47
Tabela 6.2: Resultados RMSEP com tcnicas clssicas e a tcnica proposta. 1 Mtodo A: Modelo
ARIMA, 2 Metodo B: Modelo tcnico, 3 Metodo C: Modelo tcnico combinado com o modelo
fundamentalista.
Mtodo A1 Mtodo B2 Mtodo C3
RMSEP RMSEP RMSEP
(10[) (10[) (10[) (10[)
C1 5, 2 101 4, 1 102 1, 0 102 1, 8 102 (50) 2, 3 103 (50)
C2 8, 6 102 4, 1 102 1, 0 102 1, 8 102 (30) 2, 3 103 (30)
C3 9, 1 101 5, 1 101 3, 7 103 2, 9 101 (80) 2, 2 103 (80)
C4 1, 1 101 7, 9 102 3, 0 103 5, 6 102 (80) 1, 6 103 (80)
C5 9, 8 101 6, 9 101 2, 1 103 4, 0 101 (119) 9, 4 104 (119)
C6 1, 4 101 7, 8 101 4, 4 103 3, 3 101 (80) 2, 1 103 (80)
C7 3, 2 101 2, 6 101 5, 7 103 1, 9 102 (50) 4, 1 103 (50)
C8 8, 2 102 7, 3 102 2, 5 103 6, 8 102 (80) 1, 0 103 (119)
C9 7, 9 102 5, 3 102 6, 1 103 2, 2 102 (119) 5, 2 103 (119)
C10 3, 3 101 1, 2 101 9, 9 103 9, 7 102 (80) 8, 8 103 (80)
C11 9, 6 102 4, 2 102 3, 8 103 3, 5 102 (50) 3, 0 103 (50)
C12 5, 7 102 3, 8 102 9, 3 13 1, 9 102 (119) 4, 9 13 (119)
C13 2, 0 101 3, 4 10 2
4, 2 103 2, 4 102 (80) 5, 3 103 (80)
C14 6, 5 102 2, 9 10 2
4, 3 103 1, 8 102 (119) 2, 7 103 (119)
C15 2, 5 101 3, 7 10 2
7, 4 103 1, 7 102 (50) 2, 5 103 (50)
Os resultados apresentados na Tabela 6.2 mostram que a predio com o modelo ARIMA tem
pouca habilidade de predio (Mtodo A), devido s limitaes da suposio de lineariedades
discutidas no Captulo 2. Os resultados obtidos com RNA (Mtodo B) so melhores, mas ainda
inferiores aos obtidos com o mtodo proposto (Mtodo C). Alguns resultados da predio do
modelo ARIMA e do mtodo proposto so apresentados nas Figura 6.3.
48
0.9 0.9
0.8 0.8
0.7 0.7
Cotao normalizada
Cotao normalizada
0.6 0.6
0.5 0.5
0.4 0.4
0.3 0.3
0.2 0.2
Srie original Srie real
0.1 0.1
Srie predita Srie predita
0 0
0 5 10 15 20 25 30 35 40 0 5 10 15 20 25 30 35 40
Evoluo diria Evoluo diria
(a) Predio da srie econmica do Grupo (b) Predio da srie econmica do Grupo
Po de Acar utilizando o modelo ITAUSA utilizando o modelo ARIMA.
ARIMA.
0.67 1
Srie Predita Srie Predita
0.66 Srie Original 0.98 Srie Original
0.65 0.96
Cotao normalizada
0.64
Cotao normalizada
0.94
0.63
0.92
0.62
0.9
0.61
0.88
0.6
0.59 0.86
0.58 0.84
0.82
0 5 10 15 20 25 30 35 40 0 5 10 15 20 25 30 35 40
Evoluo diria Evoluo diria
(c) Predio da srie econmica da Aracruz uti- (d) Predio da srie econmica do ITAUSA uti-
lizando o mtodo proposto. lizando o mtodo proposto.
0.78 0.92
Srie Predita Srie Predita
Srie Original Srie Original
0.76
0.9
0.74
Cotao normalizada
Cotao normalizada
0.88
0.72
0.86
0.7
0.84
0.68
0.82
0.66
0.64 0.8
0 5 10 15 20 25 30 35 40 0 5 10 15 20 25 30 35 40
Evoluo diria Evoluo diria
(e) Predio da srie econmica do Grupo Po (f) Predio da srie econmica da Cemig uti-
de Acar utilizando o mtodo proposto. lizando o mtodo proposto.
Figura 6.3: Predio de sries econmicas com o mtodo ARIMA e o mtodo proposto.
49
Finalmente, quando os trs mtodos so comparados, possvel notar que a adio de var-
iveis fundamentalistas e seleo de padres por meio do APS oferece em mdia uma melhora
de 76% em relao ao mtodo ARIMA e 47% em relao ao mtodo clssico baseado no modelo
tcnico e RNA. Alm disso, o uso do APS melhorou substancialmente o tempo de treinamento e
predio da RNA, em razo da reduo do nmero de padres de treinamento. A tcnica proposta
apresenta resultados pobres nas sries onde poucas variveis fundamentalista so adicionadas ao
modelo de dados utilizado na predio, oferecendo resultados similares ou inferiores ao mtodo B,
e pouco superiores ao mtodo A. O que leva a inferir que, de fato, as chamadas informaes fun-
damentalistas, so relevantes no estudo do problema de predio de sries temporais econmicas
de cotaes de aes de empresas estudadas neste trabalho.
Apesar de ser um modelo bastante utilizado por prossionais da rea de economia, o modelo
fundamentalista recebeu uma recente ateno da comunidade cientca da rea de predio de
sries. Entretanto, esta nova tendncia ainda no havia sido discutida e implementada nas
tcnicas de inteligncia articial como as redes neurais articiais.
Neste Captulo foram apresentados os resultados obtidos com a tcnica proposta. Os resul-
tados foram comparados com os procedimentos de predio clssicos encontrados na literatura.
Demonstrou-se experimentalmente que a tcnica proposta possui uma capacidade de predio
melhor que as tcnicas tradicionais baseadas nos modelos tcnico e ARIMA.
50
51
Captulo 7
Concluses
Neste trabalho foi apresentado um mtodo de predio no linear de sries temporais econmi-
cas. O mtodo baseia-se no uso de ltro wavelet multiescala, modelos tcnicos e fundamentalista
de anlise de sries temporais econmicas e redes neurais articiais. As sries obtidas aps a
decomposio contm informaes sobre a tendncia da srie com o comportamento aleatrio
suavizado. Os resultados apresentados mostram que a transformada wavelet um ferramenta
eciente na suavizao da componente aleatria de sries temporais econmicas. O uso do algo-
ritmo de projees sucessivas na seleo de padres de treinamento, foi importante para reduzir
o tempo de treinamento da RNA, uma vez que o conjunto de padres foi reduzido de forma
considervel. Utilizando a RNA de Elman foi possvel fazer predies de cotaes futuras com a
adio de variveis fundamentalistas que inuenciam no comportamento da srie. A combinao
dos modelos tcnico e fundamentalista, caracterizado pela adio das variveis fundamentalistas
na srie histrica de preos apresentou um melhor resultado quando comparado com mtodos
tradicionais que so baseados somente no modelo tcnico.
Na anlise dos resultados obtidos foi possvel identicar algumas contribuies do trabalho
para a soluo do problema de predio de sries temporais econmicas. Os resultados apre-
sentados na tabela 6.2, indicam que no correto tratar uma srie econmica como uma srie
temporal pura, ou seja, fazer predies baseando-se somente em seu comportamento histrico. A
predies futuras sem variveis econmicas podem ser feitas, mas quais so as condies econmi-
cas pr-determinadas para estimar o comportamento futuro? Este trabalho demonstra que por
52
melhor que seja o mtodo de predio, extremamente relevante analisar os aspectos econmi-
cos relacionados ao problema. Essa abordagem foi inicialmente proposta no recente trabalho de
Lam (2004). Entretanto, este trabalho apresentou resultados similares aos do trabalho de Lam
(2004) em termos de erro de predio, porm com menos variveis fundamentalistas adicionadas
s sries, proporcionando um modelo mais robusto do que o proposto por Lam (Lam, 2004). Adi-
cionalmente, foi possvel constatatar que mtodos de seleo de variveis, podem ser aplicados ao
problema de seleo de padres de treinamento. O uso do APS para tal nalidade contituiu-se
em uma novidade na gama de aplicaes de tal mtodo.
7.2 Publicaes
A partir do estudo desenvolvido nesta dissertao de mestrado, foram elaborados dois artigos
cientcos, um j publicado na Lecture Notes in Computer Science (SOARES, A. S., PAIVA,
M. S. V, COELHO, C. J. Technical and Fundamental Analysis for the Forecast of Financial
Scrip Quotation: An Approach Employing Articial Neural Networks and Wavelet Transform.
SPRINGER - LECTURE NOTES IN COMPUTER SCIENCE, v.4493, p.1024 - 1032, 2007.) e
outro que na data da defesa desta dissertao encontrava-se em fase nal de reviso e submisso
com o ttulo provisrio Features Selection Based on Sucessive Algorithm Projections for Articial
Neural Networks in Financial Time Series Forecasting.
7.3 Limitaes
Apesar do uso do teste estatstico SCRC para a seleo das variveis fundamentalistas, o
limiar de deciso estabelecido constitui um ponto crtico. No foi estabelecido um teste de
53
O uso comercial do mtodo de predio deve levar em considerao critrios como desconto
de risco, taxa de mobilidade de capital para se comprar ou vender uma ao e clculo de incerteza
sobre a predio realizada.
A partir do desenvolvimento e apresentao dos resultados deste trabalho, foi possvel obser-
var algumas sugestes de trabalhos futuros:
Aprimorar o critrio de seleo de variveis, como por exemplo o uso de um teste estatstico
de hiptese nula de que a varivel ou no co-relacionada com a srie.
Referncias Bibliogrcas
Al-Saad, K. (2005). Seasonality in stock returns: evidence from an emerging market. Applied
Financial Economics 15 (1), 6371.
Attia, J. O. (1999). Fourier Analysis: Electronics and Circuit Analysis using MATLAB. Boca
Raton: CRC Press LLC.
Box, G. e G. Jenkins (1976). Time series analysis, forecasting and control. Rev. Ed. San
Francisco: Holden Day .
Box, G., G. M. Jenkins, e G. Reinsel (1976). Time Series Analysis: Forecasting and Control (2
ed.). Prentice Hall.
Bracewell, R. N. (1988). Fast Fourier Transform and Its Applications (1 ed.). Prentice Hall.
Brown, S. J., W. N. Goetzmann, e A. Kumar (1998). The dow theory: William peter hamilton's
track record reconsidered. The Journal of Finance 53 (4), 13111333.
56
Cerqueti, R. e G. Rotundo (2003). Microeconomic modeling of nancial time series with long
term memory. Proceedings of IEEE International Conference on Computational Intelligence
for Financial Engineering , 191198.
Claerbout, J. F. (1999). Fourier Transforms and Waves: in four lectures. Stanford University.
Connor, J. T., R. D. Martin, e L. E. Atlas (1994). Recurrent neural networks and robust time
series prediction. IEEE Transactions on Neural Networks 5 (2), 240.
Dhatt, M. S., Y. H. Kim, e S. Mukherji (1999a). Relations between stock returns and fundamental
variables: evidence from a segmented market. Asia-Pacic Financial Markets 6, 221233.
Dhatt, M. S., Y. H. Kim, e S. Mukherji (1999b). Relations between stock returns and fundamental
variables: Evidence from a segmented market. Asia-Pacic Financial Markets 6, 221233.
Downie, T. e B. Silverman (1998). The discret multiple wavelet transform and thresholding
methods. IEEE Transactions on Information Theory 46 (9), 25582561.
Fryzlewicz, P. Z. (2003). Wavelet Techniques for Time Series and Poisson Data. Tese de
doutorado, University of Bristol.
Gencay, R., B. Whitcher, R. Gengay, e F. Selguk (2001). An Introduction to Wavelets and Other
Filtering Methods in Finance and Economics. Academic Press.
Gurgul, H., R. Mestel, e C. Chleicher (2003). Stock market reactions to dividend announce-
ments: empirical evidence from the austrian stock market. Financial markets and portfolio
management 17 (3), 332350.
Hamilton, J. D. (1954). Time Series Analysis. New Jersey - USA: Princeton University Press.
Harrison, P. e C. Stevens (1976). Bayesian forecasting. Journal of The Royal Statistical Soci-
ety 38 (3), 205267. Series B.
Harvey, A. C. e P. Todd (1983). Forecasting economic time series with structural and box-jenkins
models: A case study. Journal of Business and Economic Statistics 1 (4), 299.
Hotta, L. K. (1988). Seasonal adjustment of brazilian time series. Journal of Econometrics 8 (1),
8395.
Huang, S.-J. e C.-T. Hsieh (2002). Coiet wavelet transform applied to inspect power
systemdisturbance-generated signals. IEEE Transactions on Aerospace and Electronic Sys-
tems 38 (1), 204210.
58
Jaeger, R. M. (1990). Statistics: A Spectator Sport (Secord Edition ed.). London - U.K: Sage
Publications Inc.
Jain, L. (2001). Recurrent Neural Netoworks: Design and Applications. Departments of Physics
and Computer Science and Information Systems American University Washington, D.C.: CRC
Press.
Jang, G. S. (1991). An intelligent stock portfolio management system based on short-term trend
prediction using dual-module neural networks. International Conference on Articial Neural
Networks 1, 447452.
Kedem, B. e K. Fokianos (2002). Regression Models for Time Series Analysis. University of
Maryland and Cyprus: John Wiley Sons.
Kolen, J. (1994). Exploring the Computational Capabilities of Recurrent Neural Networks. Ph.d.
thesis, The Ohio State University, USA.
Koskela, T., M. Lehtokangas, J. Saarinen, e K. Kaski (1996). Time series prediction with multi-
layer perceptron.
Kremer, S. (1995). On the computational power of elman-style recurrent networks. IEEE Trans.
on Neural Networks 6 (4), 10001004.
Lam, M. (2004). Neural network techniques for nancial performance prediction: integrating
fundamental and technical analysis. Decision Support Systems 37 (4), 567581.
Mallat, S. (1989a). A theory for multiresolution signal decomposition: The wavelet representa-
tion. IEEE Transaction on Pattern Analysis and Machine Intelligence 11 (7), 674693.
Mallat, S. G. (1989b). A theory for multiresolution signal decomposition : The wavelet repre-
sentation. IEEE Transactions on Pattern Analysis and Machine Intelligence 11 (7), 647693.
Matsuba, I. (1991). Neural sequential associator and its application to stock price prediction.
IECON 91 2, 14761479.
McCabe, B. P. M. e A. R. Tremayne (1995). Testing a time series for dirence stationarity. The
Annals of Statistics 23 (3), 10151028.
Mead, R. (1990). The Design of experiments: statistical principles for practical applications.
Cambridge University Press.
Mertins, A. (1996). Signal Analysis: Wavelets, Filter Banks, Time-Frequency Transforms and
Applications. University of Wollongong - Australia: John Wiley Sons.
Meyer, Y. (1993a). Wavelets: Algorithms and Applications. Society for Industrial and Applied
Mathematic.
Meyer, Y. (1993b). Wavelets: Algorithms and Applications. Society for Industrial and Applied
Mathematics. Philadelphia.
Murphy, J. J. (1991). Intermarket Technical Analysis (Wiley Finance Editions ed.). New York:
John Wiley Sons.
Nagano, M. S., E. M. Merlo, e M. C. da Silva (2003). The fundamental variables and yours
impacts in scrips return tax in brazil. FAE 6 (2), 1328.
Niska, H., M. Heikkinen, e M. Kolehmainen (2006). Genetic algorithms and sensitivity analysis
applied to select inputs of a multi-layer perceptron for the prediction of air pollutant time-
series. Lecture Notes in Computer Science 4224, 224231.
60
Pereira, B. B. (1945). Anlise Espectral de Sries Temporais - Uma introduo para Engenharia,
Economia e Estatstica (1 ed.). Rio de Janeiro - Brasil: Arte Final Leasing Editorial LTDA.
Phillips, P. C. (1992). Bayes models and forecasts of australian macroeconomic time series.
Cowles Foundation Discussion Papers 1024, Cowles Foundation, Yale University. available at
http://ideas.repec.org/p/cwl/cwldpp/1024.html.
Pole, A. (1994). Applied Bayesian Forecasting and Time Series Analysis (1 ed.). Crc Press.
Pole, A., M. West, e J. Harrison (1996). Applied bayesian forecasting and time series analysis.
The Statistician 45 (1), 136137.
Qi, M. (1999). Nonlinear predictability of stock returns using nancial and economic variables.
Journal of Business and Economic Statistics 17 (4), 419429.
Racine, J. (2001). On the nonlinear predictability of stock returns using nancial and economic
variables. Journal of Business and Economic Statistics, 19 (3), 380382.
Renaud, O., J. Starck, e F. Murtagh (2005). Wavelet-based combined signal ltering and pre-
diction. IEEE Transaction on Systems, Man and Cybernetics 35 (6), 12411251.
Riedmiller, M. e H. Braun (1993). A direct adaptive method for faster backpropagation learning:
therprop algorithm. IEEE International Conference on Neural Networks 1, 586591.
Saad, E. W., D. V. Prokhorov, e D. Wunsch (1998). Comparative study of stock trend predicion
using time delay, recurrent and probabilistic neural networks. IEEE Transactions on Neural
Networks 9 (6), 14561470.
Soltani, S. (2002). On the use of the wavelet decomposition for time series prediction. Neuro-
computing 48, 267277.
Spall, J. (1988). Bayesian Analysis of Time Series and Dynamic Models (1 ed.). Marcel Dekker.
Temizel, T. T. e K. Ahmad (2005). Are arima neural network hybirds better than single models?
Proceedings of International Joint Conference on Neural Networks 5, 31923197.
Walczak, S., I. Yegorova, e B. H. Andrews (2003). The eect of training set distributions for
supervised learning articial neural networks on classication accuracy. Information manage-
ment: support systems and multimedia technology , 93108.
Wang, J.-H. e J.-Y. Leu (1996). Stock market trend prediction using arima-based neural networks.
IEEE International conference on Neural Networks 4, 21602165.
White, H. (1988). Economic prediction using neural networks: the case of ibm dailystock returns.
IEEE Internacional conference on Neural Networks 2, 451458.
Williams, R. J. e D. Zipser (1989). A learning algorithm for continually running fully recurrent
neural networks. Neural Computation 1, 270280.
Yao, J., C. L. Tan, e H.-L. Poh (1999). Neural networks for technical analysis: A study on klci.
International Journal of Theoretical and Applied Finance 2 (2), 221241.
Zhang, J. e A. J. Morris (1995). Dynamic process modeling using locally recurrent neural net-
works. Proceedings of the American Control Conference 4, 27672771.
63
Apndice A
Cada arquivo disponibilizado pela BOVESPA contm informaes como nome e cdigo da
empresa, cdigo da ao, cdigo ISIN, tipo de mercado (a vista, termo, opes), especicao
(ON/PN), preos (anterior, abertura, mnimo, mdio, mximo, fechamento), quantidade de neg-
cios e volume negociado com o papel, dentre outros dados disponveis.
A.0.1 Cabealho
A.0.2 Dados
Apndice B
Valor de mercado: o ltimo preo pago por cada ao da empresa vezes o nmero total
de ttulos disponveis.
Lucro lquido: o total de vendas brutas da empresa subtrado pelo custo das mercadorias
vendidas, das despesas variveis e das despesas xas.
Taxa de juro bsica: a taxa xada pelo banco central, que serve de referncia para o
clculo do custo do dinheiro para emprstimos bancrios.
n
X
Ibovespa = P (i)Q(i) (B.1)
i=1
Risco pas: O Risco pas um mtodo mundialmente reconhecido que classica o risco
em se investir em um determinado pas. O risco determinado levando-se em considerao
diversos indicadores econmicos, nanceiros e polticos do pas como por exemplo dcit scal,
crescimento da economia, solidez das instituies, etc. O risco-pas funciona como termmetro
que mede a desconana dos investidores quanto ao cumprimento ou no do reembolso prometido
pelo devedor (no caso o pas) na data de vencimento dos ttulos por ele emitidos. Em outras
palavras, o investidor est interessado em quanto deveria ser recompensado por aplicar em papis
que embutem certa possibilidade de calote. Considerando-se o risco dos Estados Unidos como
zero, a taxa paga pelo governo desse pas ser a base comparativa de clculo utilizada pelo
investidor. Vrias instituies fazem o clculo do risco pas como por exemplo, Standard and
Poors, Moody's, JP Morgan, dentre outros.
69
Apndice C
Software de Predio
O menu de seleo da srie econmica, permite ao usurio selecionar qual srie ser utilizada
70
no software. O menu de mtodo, permite ao usurio selecionar qual tipo de mtodo ser em-
pregado na predio, sendo que o resultado ser plotado em um grco de resultado esperado
versus resultado do mtodo.