Você está na página 1de 92

Anderson da Silva Soares

PREDIO DE SRIES TEMPORAIS ECONMICAS


POR MEIO DE REDES NEURAIS ARTIFICIAIS E
TRANSFORMADA WAVELET: COMBINANDO
MODELO TCNICO E FUNDAMENTALISTA

Dissertao apresentada Escola de Engenharia de So Carlos


da Universidade de So Paulo, como parte dos requisitos para
obteno do ttulo de Mestre em Engenharia Eltrica

rea de Concentrao: Processamento de Sinais e Instru-


mentao
Orientadora: Profa. Dra. Maria Stela Veludo de Paiva

So Carlos
2008
Dedicatria

Para Divino, Maristela, Gisele e Telma.


Agradecimentos

Primeiramente gostaria de agradecer a Prof. Dr. Maria Stela Veludo de Paiva, que me
recebeu muito bem na USP, sempre dedicando muito carinho para com os seus alunos. Gostaria
de agradecer tambm por depositar em mim a conana de uma mudana de tema de pesquisa,
sempre incentivando e apoiando com brilhantismo e motivao os trabalhos dos seus alunos.

Gostaria de expressar tambm minha profunda gratido e reconhecimento a Universidade


Catlica de Gois, que na pessoa do Professor Dr. Clarimar Jos Coelho investiram tempo
e recursos em minha formao atravs da iniciao cientca. Ainda guardo comigo toda a
motivao, apoio e amizade construdas ao longo dos dois anos e meio de convivncia com o
Professor Dr. Clarimar, espero um dia poder recompens-lo por todo o seu esforo e pacincia.

Ao meus pais, Sr. Divino Benedito Soares e Sra. Maristela Correia da Silva Soares e minha
irm Gisele da Silva Soares, guerreiros e batalhadores. Cada esforo, cada boa nota, sempre
tiveram por objetivo oferecer um futuro melhor a estes heris.

A minha noiva Telma Woerle de Lima, amiga e companheira de todas as horas, sempre me
apoiando nos momentos mais difceis, inclusive nanceiros. Momentos dos quais jamais esquecerei
e espero torn-los imortais em breve.

Aos Professores Dr. Alexandre Cludio Botazzo Delbem e Dr. Fernando Marques Federson
do Instituto de Cincias Exatas e Computao da USP pelo incentivo e exemplo de amizade e
solidariedade que a mim apresentaram. Os dias em So Carlos teriam sido mais tortuosos se no
fossem os deliciosos churrascos na casa do Professor Dr. Alexandre.

Ao Professor Dr. Ivan Nunes da Silva pela excelncia de qualidade nos cursos ministrados na
ps-graduao, que em muito contriburam para o desenvolvimento desta pesquisa.

Ao amigo e colega de curso Gustavo Teodoro Laureano, que desde a graduao um grande
amigo e companheiro cientco de grande valia.

A Acta Brasil Informtica que na pessoa do Sr. Danilo Alves Martins de Faria me concedeu
um emprego no perodo em que estive sem bolsa de estudos.

CAPES pela concesso da bolsa de mestrado e pelo apoio nanceiro parcial no perodo de
realizao desta pesquisa.

A DEUS, pela vida.


Epgrafe

Eu guardei muitas coisas em minhas mos, e perdi todas; mas todas que coloquei nas mos de
Deus, essas eu ainda possuo.
 Martin Luther King, Jr.
Resumo

Soares, A.S. Predio de Sries Temporais Econmicas por Meio de Redes Neurais Artici-
ais e Transformada Wavelet: Combinando Modelo Tcnico e Fundamentalista. Dissertao de
Mestrado - Escola de Engenharia de So Carlos, Universidade de So Paulo, So Carlos, 2007.

Este trabalho apresenta um mtodo de predio no linear de sries temporais econmicas. O


mtodo baseia-se na anlise tcnica e fundamentalista de cotao de aes, ltragem wavelet, se-
leo de padres e redes neurais articiais. No modelo tcnico emprega-se a transformada wavelet
para ltrar a srie temporal econmica de comportamentos aleatrios ou no econmicos. Aps
a ltragem dos dados o algoritmo de projees sucessivas utilizado para a seleo de padres
de treinamento para a rede neural articial, com o objetivo de selecionar os padres de compor-
tamento mais importantes na srie. No modelo fundamentalista utiliza-se variveis econmicas
que podem estar correlacionadas com a srie, com o objetivo de aprimorar a predio da srie na
rede neural articial. Para avaliao do mtodo so utilizados dados de sries temporais econmi-
cas referentes cotao de preos de aes negociadas na bolsa de valores de So Paulo, onde
os resultados da predio do comportamento futuro so comparados com modelos matemticos
clssicos e com o modelo convencional, que se baseia somente na anlise tcnica. Apresenta-se
uma comparao dos resultados entre modelos tcnicos, modelos matemticos e o mtodo pro-
posto. O modelo matemtico utilizado (ARIMA) apresentou seu melhor desempenho em sries
com pouca varincia, porm com desempenho inferior quando comparado com o modelo tcnico
e com o mtodo proposto. A avaliao do erro de predio em termos de RMSEP evidenciou
que o mtodo proposto apresenta os melhores resultados em relao aos demais mtodos.

Palavras chave: Sries Temporais Econmicas, Transformada Wavelet, Redes Neurais Artici-
ais, Algoritmo de Projees Sucessivas, Anlise Tcnica e Fundamentalista.
RESUMO
Abstract

Soares, A.S. A Technique of Economic Time Series Prediction by Articial Neural Network and
Wavelet Transform: Joining Technical and Fundamental Model. 2007. Thesis (Masters Thesis)
- So Carlos Engineer School, University of So Paulo, So Carlos, 2007.

This work presents a method for predicting nonlinear economic time series. The method is
based on fundamental and technical analysis of script quotation, a multiscale wavelet ltering,
pattern selection and articial neural networks. In the technical model is used the wavelet trans-
form in order to lter the economic time series from random or not economic behaviors. After the
data ltering, the successive projections algorithm was used for the training pattern selection to
the articial neural network. In the fundamentalist model is used nancial and macroeconomics
variables that is correlated with the time serie in order to improve the network forecasting. For
the evaluation of the proposed method are used temporal series data related to scrips prices quota-
tion of So Paulo stock market. It presents a comparison of the results between technical model,
mathematical model and proposed method. The mathematical model (ARIMA) presented better
results in series with few variance, however have low performance when compared with the techni-
cal model and with the proposed method. The prediction error evaluation shows that the proposed
method has better results than the other methods.

Keywords: Time Series Forecasting, Technical Analysis, Fundamental Analysis, Articial Neu-
ral Network, Wavelet Transform.
ABSTRACT
Lista de Figuras

2.1 Rede neural recorrente NARMA. . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

3.1 Exemplo de funes base wavelet. . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

3.2 Transformada wavelet na forma de banco de ltros. . . . . . . . . . . . . . . . . . 19

3.3 Decomposio wavelet de uma srie temporal econmica. . . . . . . . . . . . . . . 20

4.1 Representao de um neurnio articial. . . . . . . . . . . . . . . . . . . . . . . . 24

4.2 Principais funes de ativao utilizadas em neurnios articiais. . . . . . . . . . 24

4.3 Funo sigmide com diferentes valores de (beta). . . . . . . . . . . . . . . . . 25

4.4 Rede neural articial multi-camada no recorrente. . . . . . . . . . . . . . . . . . 27

4.5 Rede Neural Articial de Elman. . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

5.1 Viso geral da tcnica proposta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

5.2 Diagrama esquemtico do modelo tcnico. . . . . . . . . . . . . . . . . . . . . . . 34

5.3 Exemplo de seleo de variveis utilizando o APS. . . . . . . . . . . . . . . . . . 37

5.4 Diagrama esquemtico do modelo fundamentalista. . . . . . . . . . . . . . . . . . 38

6.1 Filtragem das sries utilizando transformada wavelet. . . . . . . . . . . . . . . . . 44

6.2 Resultado da seleo de padres (Crculos vermelhos) por meio do algoritmo APS
nas sries da Coteminas e Ita. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

6.3 Predio de sries econmicas com o mtodo ARIMA e o mtodo proposto. . . . 48

C.1 Software de predio desenvolvido no MatLab. . . . . . . . . . . . . . . . . . . . 69


Lista de Figuras Lista de Figuras

C.2 Exemplo de Resultado Obtido no Software de predio. . . . . . . . . . . . . . . 70


Lista de Tabelas

5.1 Variveis fundamentalistas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

6.1 Resultado do coeciente de Spearman para as variveis fundamentalistas. . . . . 46

6.2 Resultados RMSEP com tcnicas clssicas e a tcnica proposta. 1 Mtodo A: Mod-
elo ARIMA, 2 Metodo B: Modelo tcnico, 3 Metodo C: Modelo tcnico combinado
com o modelo fundamentalista. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
Lista de Tabelas Lista de Tabelas
Lista de Abreviaturas e Siglas

ARMA - AutoRegressive Moving Average


ARIMA - Autoregressive Integrated Moving Average
BOVESPA - BOlsa de ValorES de So PAulo
DFT - Discrete Fourier Transform
IDFT - Inverse Discrete Fourier Transform
FGV - Fundao Getlio Vargas
FIR - Finite Impulse Response
MLP - Multi Layer Perceptron
NARMA - Non-linear Auto Regressive Mean Average
PME - Percentile Mean Error
RPQME - Root of Percentile Quadratic Mean Error
RNA - Redes Neurais Articiais
SRCC - Spearman Rank Correlation Coecient
STFT - Short Time Fourier Transform
OLS - Ordinary Least Squares
TDNN - Time Delay Neural Network
VMF - Variveis do Modelo Fundamentalista
VMT - Variveis do Modelo Tcnico
RPROP - Resilient Propagation
LISTA DE ABREVIATURAS E SIGLAS
xvii

Lista de Smbolos

Escalares so representados em itlico; vetores e seqncias em minsculo, matrizes em


negrito.

a: Rudo banco, um tipo de rudo produzido pela combinao simultnea de todas as freqncias.
b: fator de deslocamento de uma funo wavelet.
: Parmetro de inclinao das funes sigmide e hiperblica.
c: Fator de dilatao de uma funo wavelet.
: Taxa de aprendizado da rede neural.
E : Medida do erro total da rede.
g(.): Funo de ativao de um neurnio articial.
k : Intervalo de tempo entre duas observaes.
: Nmero de variveis da matriz de treinamento X .
p: Horizonte de predio da rede.
: Correlao de Spearman.
: Autocorrelao entre duas observaes x(t) e x(t + k).
: Operador polinmio autoregressivo.
: Operador do polinmio de mdias mveis.
rmsep : Mdia dos erros obtidos com um conjunto de testes.
rmsep : Desvio padro dos erros obtidos com um conjunto de testes.
T : Nmero de execues de treinamento e predio de um conjunto de testes.
x: Denota uma srie temporal discreta.
x: Denota uma srie temporal contnua.
x: Valor predito pela rede neural articial.
X : Srie temporal discreta representada no domnio da freqncia.
X : Denota uma srie temporal contnua representada no domnio da freqncia.
$: Funo de janelamento responsvel pela delimitao do trecho da srie.
xviii

R: Denota o espao dos nmeros reais.


I: Denota o espao dos nmeros imaginrios.
H : Filtro passa alta.
L: Filtro passa baixa.
t: Unidade de tempo discreto.
: Mdia aritmtica simples.
2 : Varincia da srie temporal.
: Operador de decimao.
: Limiar de ativao de um neurnio articial.
u: Sada do combinador linear de um neurnio articial.
y : Sada do neurnio articial.
w: Peso sinptico de um neurnio articial.
: Funo escala.
: Funo wavelet-me.
xix

Sumrio

Resumo vii

Abstract ix

Lista de Figuras xi

Lista de Tabelas xiii

Lista de Abreviaturas e Siglas xv

Lista de Smbolos xvii

1 Introduo 1
1.1 Introduo ao Mercado de Aes . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Estrutura do Texto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2 Predio de Sries Temporais - Estado da Arte 5


2.1 Consideraes Iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Modelos Clssicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.3 Tcnicas de Predio Baseadas em Redes Neurais Articiais . . . . . . . . . . . . 7
2.4 Novas Tendncias no Problema de Predio . . . . . . . . . . . . . . . . . . . . . 9
2.5 Consideraes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

3 Transformada Wavelet 13
3.1 Consideraes Iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.2 Perspectiva Histrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
3.3 Transformada de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.4 Transformada Wavelet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.4.1 Bases Wavelets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.4.2 Anlise Multiresoluo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.5 Consideraes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
xx

4 Redes Neurais Articiais na Previso de Sries Temporais Econmicas 23


4.1 Consideraes Iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.2 Fundamentos de Redes Neurais Articiais . . . . . . . . . . . . . . . . . . . . . . 23
4.3 Arquiteturas de Redes Neurais Articiais . . . . . . . . . . . . . . . . . . . . . . . 26
4.3.1 Redes Neurais Articiais No Recorrentes . . . . . . . . . . . . . . . . . . 26
4.4 Redes Neurais Articiais Recorrentes para Sistemas Variantes no Tempo . . . . . 27
4.4.1 Rede Neural Articial de Elman . . . . . . . . . . . . . . . . . . . . . . . 28
4.5 Algoritmos de Treinamento de Redes Neurais Articiais . . . . . . . . . . . . . . 29
4.5.1 Algoritmo Resilient Propagation (RPROP) . . . . . . . . . . . . . . . . . 30
4.6 Consideraes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

5 Metodologia 33
5.1 Consideraes Iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
5.2 Viso Geral da Tcnica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
5.3 Modelo Tcnico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
5.3.1 Algoritmo de Projees Sucessivas . . . . . . . . . . . . . . . . . . . . . . 35
5.4 Modelo Fundamentalista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.5 Predio: Combinando Modelo Tcnico e Fundamentalista . . . . . . . . . . . . . 40
5.5.1 Medidas de Avaliao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
5.6 Software de Desenvolvimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.7 Consideraes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

6 Resultados 43
6.1 Consideraes Iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
6.2 Suavizao da Componente Aleatria das Sries . . . . . . . . . . . . . . . . . . . 43
6.3 Seleo de Padres Utilizando o APS . . . . . . . . . . . . . . . . . . . . . . . . . 45
6.4 Combinando Modelo Tcnico e Fundamentalista . . . . . . . . . . . . . . . . . . 46
6.5 Consideraes Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

7 Concluses 51
7.1 Contribuies do Trabalho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
7.2 Publicaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
7.3 Limitaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
7.4 Trabalho Futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

Referncias Bibliogrcas 55

A Layout do arquivo de Dados da BOVESPA 63


xxi

A.0.1 Cabealho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
A.0.2 Dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

B Descrio das variveis fundamentalista utilizadas 67

C Software de Predio 69
xxii
1

Captulo 1

Introduo

Este trabalho apresenta uma tcnica de predio de sries temporais econmicas que faz uso
de procedimentos economtricos, conhecidos como modelo fundamentalista, e de sries tempo-
rais, conhecidas como modelo tcnico. O economtrico baseia-se em dados econmicos para a
construo do modelo, incluindo no modelo de predio variveis econmicas correlacionadas
com a srie estudada. O procedimento de sries temporais faz uso da transformada wavelet
para o ajuste da srie temporal e de RNAs para predio de valores futuros. Com a atenuao
de movimentos no econmicos por meio da transformada wavelet, possvel estudar os efeitos
economtricos baseando-se em dados econmicos para construir o modelo, empregando-se uma
rede neural articial como estimador de valores futuros.

As sries temporais so formadas por conjuntos de observaes seqenciais ordenadas em


relao ao tempo, sendo possvel classic-las quanto ao seu processo gerador dos dados, como
estocsticas ou determinsticas (Hamilton, 1954; McCabe e Tremayne, 1995; Pereira, 1945).

As sries classicadas como determinsticas, possuem seu comportamento descrito por equaes
matemticas conhecidas, sendo que a predio consiste na mera aplicao das equaes que des-
crevem a srie. Entretanto, a maioria dos problemas que envolvem sries temporais possui com-
portamento estocstico, e o modelo matemtico que descreve o comportamento da srie no existe
ou no conhecido. Como alternativa ao uso de modelos matemticos, tcnicas baseadas em re-
conhecimento de padres como regresso e Redes Neurais Articiais (RNAs) podem ser utilizadas
no problema de predio de valores futuros de sries temporais de comportamento estocstico.
Tais tcnicas fazem uso da identicao de padres histricos recorrentes, isto , a identicao
de padres de oscilao na srie temporal que aconteceram em instantes de tempo passados
2

(t 1, t 2, . . . , t n) para ento prever os valores nos instantes futuros (t + 1, t + 2, . . . , t + p)


(Koskela et al., 1996; Kedem e Fokianos, 2002).

O incio dos estudos no problema de predio de sries temporais estocsticas atribudo


a Weigend et al. (1990), que em 1926 props um modelo de predio que consistia de uma
operao puramente linear onde a soma ponderada das observaes prvias da srie era utilizada
para determinar valores futuros. A limitao de linearidade do modelo apresentado por Weigend
foi superada pela de Harrison e Stevens (1976) que se baseia em um modelo probabilstico
bayesiano (Spall, 1988; Pole et al., 1996). Entretanto, somente na metade da dcada de 80 que
os modelos probabilsticos como o de Harrison e Stevens foram amplamente difundidos devido
popularizao dos computadores e consequentemente dos pacotes de softwares estatsticos
utilizados neste tipo de modelo (Phillips, 1992; Pole, 1994).

Ainda na dcada de oitenta, foram iniciados estudos de tcnicas de inteligncia articial,


como as Redes Neurais Articiais (RNAs) na predio de sries temporais. A habilidade das
RNAs em extrair relaes no lineares a partir de dados de entrada ruidosos, no lineares e no
estacionrios, tem produzido resultados melhores que os obtidos por procedimentos matemticos
e estatsticos (Kolen, 1994; O. Nerrand, 1993). Entretanto os avanos mais recentes no problema
de predio de sries temporais econmicas fazem uso de conceitos no-relacionados a RNAs
ou a modelos matemticos e estatsticos. A partir dos estudos como o de Qi (1999), Racine
(2001), Grppo (2004) e Nagano et al. (2003) foi possvel compreender que fatores econmicos
so extremamente relevantes na compreenso e predio do comportamento de uma srie tem-
poral econmica, sendo que os padres podem ser melhor compreendidos fazendo uso de dados
econmicos.

1.1 Introduo ao Mercado de Aes

As sries temporais econmicas so um caso particular de sries temporais, distinguindo-se


por conceitos econmicos relacionados ao comportamento da srie e pela origem dos dados, que
so publicados de forma ocial em perodos de tempo constantes (dia, ms, trimestre, etc.).
Como exemplo possvel citar as sries econmicas de cotao de preos de aes, que so
disponibilizadas de forma diria. As chamadas aes, que geram esses dados, representam a
menor parcela do capital de uma empresa, podendo ser negociadas em mercados organizados
como as Bolsas de Valores (Zancop, 2000). As Bolsas de Valores ento disponibiliza de forma
3

contnua aos interessados, os dados referentes aos preos de negociao dessas aes.

Existem no mercado de capitais dois modelos de avaliao que procuram compreender e


propor estratgias para a compra e venda de aes de uma determinada empresa: O modelo
fundamentalista e o modelo tcnico (Lameira, 2003).

O modelo fundamentalista analisa os aspectos econmicos e contbeis da empresa, bem como


as variveis macroeconmicas que tem inuncia direta ou indireta no valor da empresa. Como
ilustrao possvel citar a inuncia da cotao do dlar e do preo do barril de petrleo
internacional no preo das aes de empresas petrolferas e distribuidoras de combustvel em geral,
ou ainda, a inuncia da taxa de juros no valor das aes de bancos e instituies nanceiras.

O modelo tcnico baseia-se em dados histricos das aes da empresa no mercado, propondo
modelos de predio a partir de padres identicados na representao grca das variaes
que os preos demonstraram em um determinado perodo de tempo (Murphy, 1991; Tavares e
Fonseca, 1987).

Os dois modelos de avaliao procuram, em essncia, projetar o comportamento futuro dos


preos das aes no mercado nanceiro, sendo perfeitamente possvel ainda a combinao das
duas tcnicas. Segundo S (1997), os dois modelos mencionados so complementares e a combi-
nao deles poder precisar de maneira mais adequada o comportamento dos preos.

Dow Jones pode ser considerado o primeiro estudioso das sries temporais econmicas de
preos de aes. No incio do sculo vinte, Dow props um modelo com o objetivo de descrever
o comportamento de qualquer srie atravs de trs tipos de tendncias (Brown et al., 1998):
tendncias de longo, mdio e curto prazo. Segundo relata Brown et al. (1998), logo em seguida
a proposta de Dow, Persons props um outro modelo baseado em quatro tipos de variaes
que descrevesse o comportamento de sries temporais econmicas. Os quatro tipos de variaes
propostos foram:

1. Tendncia: variaes caracterizadas por um movimento regular e contnuo de longo perodo


de tempo, obedecendo uma direo geral.

2. Movimentos cclicos: variaes que correspondem aos chamados ciclos econmicos, ou seja,
oscilaes peridicas com desvios em torno da tendncia.

3. Variaes sazonais: as variaes sazonais correspondem s oscilaes de subida e de queda


que ocorrem sempre em um mesmo perodo de tempo.
4

4. Variaes Irregulares, residuais ou aleatrias: movimentos sistemticos causados por fen-


menos no econmicos de natureza aleatria, como por exemplo, catstrofes e boatos.

As quatro variaes mencionadas seriam capazes de explicar qualquer srie temporal econmica
e, a partir destas consideraes de Persons, esta composio da srie temporal econmica tornou-
se clssica, sendo considerada um marco no processo de estudos das sries. Alguns trabalhos
recentes apresentam modelos matemticos e estatsticos de ajustamento das variaes sazonais
a m de explicar a srie somente a partir de parmetros econmicos (Al-Deehani, 2006; Al-Saad,
2005). Em pases desenvolvidos, a suavizao de movimentos sazonais e irregulares em sries
temporais econmicas j considerado uma prtica ocial. Entretanto, segundo Hotta (1988), a
utilizao deste tipo de tcnica em pases em desenvolvimento como o Brasil, deve ser feita com
maior cuidado, em razo de estarem submetidos freqentemente a fortes mudanas estruturais
e econmicas, gerando grandes variaes no comportamento das sries. As tcnicas de suaviza-
o tradicionais fazem uso de ferramentas como mdia mvel, alisamento exponencial e modelos
ARIMA (Autoregressive Integrated Moving Average ), sendo que o modelo ARIMA ser descrito
no Captulo 2. Essas tcnicas de ajustamento so importantes para que seja possvel a utilizao
de um estimador eciente da srie temporal, uma vez que a suavizao funciona como um ltro
da srie.

1.2 Estrutura do Texto

No Captulo 2 apresenta-se uma reviso bibliogrca dos principais trabalhos de predio de


sries temporais encontrados na literatura. No Captulo 3 feita uma reviso sobre a transfor-
mada wavelet e seu funcionamento como ltro em srie temporais. No Captulo 4 apresentada
uma reviso sobre redes neurais articiais e sua aplicao para tratar sistemas variantes no tempo
como as sries temporais. No Captulo 5 descrito o mtodo proposto. No Captulo 6 so apre-
sentados os resultados obtidos e nalmente no Captulo 7, Ao trmino do Captulo, so tecidas
consideraes sobre as contribuies, limitaes e continuidades do trabalho para o problema
apresentado.
5

Captulo 2

Predio de Sries Temporais - Estado


da Arte

2.1 Consideraes Iniciais

Este Captulo apresenta os principais trabalhos sobre predio de sries temporais. Tcnicas
clssicas como ARIMA e redes neurais articiais so descritas, em um contexto de evoluo
histrica do tratamento do problema de predio de sries temporais.

2.2 Modelos Clssicos

Em 1970, os professores George E. P. Box e Gwilym M. Jenkins publicaram o livro, Time


Series Analysis: forecasting and control (Box et al., 1976). O modelo de Box & Jenkins, tambm
conhecido como auto-regressivo integrado de mdia mvel - ARIMA (AutoRegressive Integrated
Moving Average ), foi elaborado a partir da coletnea de diversos trabalhos publicados na poca,
trazendo como mrito, a unicao das principais tcnicas estatsticas, em uma nica metodologia
para construir modelos de predio de sries temporais.

O modelo de Box & Jenkins assume que qualquer srie temporal um processo estocstico
estacionrio 1 gerado pela passagem sucessiva de um processo rudo branco at 2 por modelos de

1
Uma srie temporal dita estacionria quando no existe tendncia de crescimento ou decrescimento dos
dados, ou seja, os dados oscilam sobre uma mdia constante com varincia constante.
2
Um processo estocstico chamado de rudo branco quando o valor tomado no tempo t, independe do valor
tomado no tempo t k, no apresentando qualquer dependncia temporal.
6

mdias mveis (equao 2.1) e auto-regressivos (equao 2.2).

xt = + a(t) (1) a(t1) (2) a(t2) . . . (q) a(tq) (2.1)

xt = 1 x(t1) + 2 x(t2) + . . . + p x(tp) + at (2.2)

onde so os parmetros da estrutura auto-regressiva de ordem p, so os parmetros da es-


trutura mdias mveis de ordem q , a mdia da srie e at representa o rudo branco com
mdia zero e varincia 2 . De acordo com Box e Jenkins (1976), qualquer processo estocstico
pode ser representado por um modelo auto-regressivo e/ou mdias mveis. No caso de pro-
cessos estocsticos no estacionrios, aplica-se o operador de diferenciao para tornar a srie
estacionria.

O artigo de Harvey e Todd (1983) foi um dos principais artigos da dcada de oitenta voltado
especicamente para o problema de predio de sries temporais econmicas. Entretanto, seu
trabalho era limitado na generalizao do modelo ARIMA proposto por Box-Jenkins para o
problema de predio de sries temporais econmicas (Granger e Morris, 1976). No artigo,
Harvey e Todd (1983) demonstraram que ao separar as quatro componentes de sries temporais
econmicas propostas por Down Jones, o modelo ARIMA poderia ser aplicado ao problema de
predio das componentes de tendncia e sazonalidade da srie. Para separar as componentes,
utilizaram o ltro de Kalman para suavizar o comportamento aleatrio, onde a componente de
tendncia e sazonalidade eram de interesse. Os resultados mostraram que a predio ocorria com
certo sucesso para a componente de sazonalidade, mas no apresentava resultados satisfatrios
para a componente de tendncia.

Entretanto, os trabalhos de McCabe e Tremayne (1995) e Leybourne et al. (1996) questionam


a utilizao do ltro de diferenciao no modelo ARIMA para sries no estacionrias. Utilizando
sries temporais econmicas e testes estatsticos de hiptese, os resultados dos dois trabalhos
mostraram que para vrias sries temporais do tipo estocsticas, a srie gerada aps a aplicao de
diferenciao, pode no ser da mesma fonte, ou seja, gera-se uma srie estatisticamente diferente
da srie original e conseqentemente seu modelo de predio pode ser rejeitado.
7

2.3 Tcnicas de Predio Baseadas em Redes Neurais Articiais

A primeira aplicao que utilizou RNA como estimador, ao invs de modelo matemtico como
o ARIMA, foi a de White (1988). Apesar da ausncia de comparao com os modelos clssicos
como o ARIMA, o artigo foi importante na discusso de tcnicas inteligentes na deteco dos
padres presentes nas sries temporais econmicas. Como dados de testes foi utilizado somente
a srie econmica dos preos de cotaes da empresa IBM, e o algoritmo OLS (Ordinary Least
Squares ) para treinamento da RNA. O autor conclui que a aplicao de tcnicas inteligentes
como as RNAs ainda careciam principalmente de algoritmos de treinamentos ecientes para o
aprendizado de regularidades no lineares presentes nas sries temporais econmicas.

No ano de 1991 a comunidade cientca conheceu dois trabalhos notoriamente reconhecidos


at os dias atuais, como marcantes no problema de predio de sries temporais econmicas. A
importncia desses resultados deve-se consistncia dos resultados obtidos pelos trabalhos de
Jang (1991) e Matsuba (1991). A aplicao de Jang (1991) conseguiu prever com erros pequenos
algumas sries econmicas utilizando duas RNAs do tipo MLP (Multi Layer Perceptron ) com
algoritmo de treinamento backpropagation. Uma rede foi treinada para prever a tendncia de
preos a longo prazo e a segunda rede foi treinada para aprender a tendncia a curto prazo.
Os dados usados foram valores de pico, valores de baixa, fechamento e o volume negociado
para cada dia. Os autores concluram que a rede neural implementada apresentou uma resposta
mais satisfatria do que tcnicas estatsticas baseadas em regresso. J o trabalho de Matsuba
empregou uma rede neural do tipo feedforward com os n ltimos valores de ndice como entrada
na rede, e os p preos futuros como sada da rede, empregando tambm duas redes neurais, uma
aprender as caractersticas globais e outra para aprender as caractersticas locais ou pequenas
utuaes para realizar a predio de sries temporais.

Outro importante trabalho foi o de Connor et al. (1994), que props uma tcnica mais
sosticada para o problema de predio de sries temporais. A proposta consistiu na ltragem
do comportamento aleatrio por meio da identicao e ltragem de outiliers 3 , e da estimao
da srie a partir dos dados ltrados por meio de uma RNA MLP recorrente. A principal car-
acterstica da RNA proposta por Connor, possuir laos de realimentao dos erros produzidos
pela sada da rede conforme ilustra a Figura 2.1.

A Figura 2.1 mostra uma RNA recorrente para aproximao de um modelo ARMA no linear

3
Uma observao classicada como outilier quando no segue o mesmo padro de dependncia espacial como
a maioria das observaes do conjunto de dados.
8

Figura 2.1: Rede neural recorrente NARMA.

conhecido como NARMA (Non-linear Autoregressive Moving Average ), que faz uso do modelo
auto-regressivo (AR) de ordem p e do modelo mdia-mvel de ordem q , onde a sada x dada
pela equao 2.3.


m
X Xp q
X
x(t) = Wi g wij x(tj) + wij (x(tj) x(tj) + i ) (2.3)

i=1 j=1 j=1

onde o limiar de ativao do i-simo neurnio, g a funo de ativao, x a entrada e x a


sada da rede, Wi so os pesos entre os neurnios da camada intermediria (ou escondida) e de
sada, wij so os pesos entre as entradas externas e a camada escondida, wij so os pesos entre
a primeira camada de neurnios com entradas de retro-alimentao (recorrentes) e a camada
de neurnios escondidos, i o bias que modica as sadas dos neurnios. Foi utilizada a srie
temporal de demanda de consumo de energia eltrica, onde o problema consistia na predio do
consumo no tempo futuro. Os autores concluiram que a proposta apresenta melhores resultados
do que as redes convencionais na presena de outiliers.

A proposta de Connor foi a primeira de inmeros trabalhos que propuseram a combinao


de RNAs com modelos clssicos. Outros trabalhos similares foram as propostas de Wang e Leu
(1996), Diniz et al. (1999) e Temizel e Ahmad (2005). Os trs artigos propuseram um sistema
preditivo que faz uso de RNAs e do modelo ARIMA. O algoritmo consistiu no uso do modelo
ARIMA na etapa de pr-processamento da srie, onde aplicou-se o modelo ARIMA por meio
9

de operaes de diferenciao e posteriormente a predio da srie. O trabalho de Wang e Leu


(1996) foi aplicado na bolsa de valores de Taiwan enquanto que o de Diniz na bolsa de valores
de So Paulo - Brasil. Os resultados dos dois trabalhos mostraram que a RNA melhorou sua
capacidade preditiva das sries aps a combinao com o modelo ARIMA, pois, a diferenciao
da srie elimina alguns tipos de comportamentos no estacionrios.

Apesar do relativo sucesso da utilizao de tcnicas matemticas e estatsticas na fase de


pr-processamento, nos trabalhos de Aussem e Murtagh (1997) e Malliavin e Mancino (2002),
a utilizao de tcnicas estatsticas, combinadas ou no com RNAs, comeou a ser confrontada
com tcnicas como transformadas de Fourier e wavelets, baseadas no domnio da freqncia. A
comparao dos mtodos mostrou que as tcnicas no domnio da freqncia tiveram resultados
superiores quando comparadas com as tcnicas estatsticas, haja vista que no domnio transfor-
mada possvel evidenciar caractersticas e comportamentos no notados no domnio original
dos dados. Desde ento, a maioria dos trabalhos nos ltimos dez anos vem propondo a utilizao
de mtodos no domnio da freqncia.

Saad et al. (1998) apresentou um estudo comparativo de trs tipos de arquiteturas de RNAs
para o problema de predio de sries temporais econmicas. Foram estudadas as arquiteturas
com atraso de tempo (TDNN - Time Delay Neural Network ), recorrente, e probabilstica. As
RNAs foram testadas na predio de tendncias de curto prazo da bolsa de valores de Nova York,
onde os resultados demonstraram que as trs arquiteturas estudas tm uma capacidade preditiva
semelhante, com vantagem para a arquitetura TDNN, por sua facilidade de implementao com-
putacional. Entretanto, o trabalho de Koskela et al. (1996) apresenta o estudo comparativo entre
RNAs do tipo MLP (Multi Layer Perceptron ), FIR (Finite impulse response ) e rede de Elman,
mostrando que utilizando o algoritmo Backpropagation para as trs arquiteturas de redes, a rede
de Elman apresentou uma memria de longo prazo melhor, e conseqentemente uma predio
melhor no problema de sries temporais.

2.4 Novas Tendncias no Problema de Predio

Os trabalhos de Dhatt et al. (1999a), Gurgul et al. (2003), Grppo (2004) e Cajueiro e
Tabak (2005), apesar de no tratarem especicamente de predio, trouxeram um novo foco na
abordagem do problema de predio de sries temporais do tipo econmica. Dhatt estudou a
relao entre as variveis fundamentalistas e o comportamento de preos das aes a partir da
10

bolsa de valores da Korea. Dhatt agrupou um grupo de aes de um mesmo setor de mercado
e props a teoria de que todas as aes do grupo setorial eram inuenciadas pelas variveis
econmicas daquele setor. Para isso, provou de forma experimental, por meio de um modelo de
regresso linear mltipla, que as variveis econmicas especcas do setor econmico que as aes
estavam inseridas, inuenciavam no comportamento dos seus preos.

Gurgul tambm estudou os efeitos de variveis fundamentalistas no comportamento da srie


temporal de preos de aes. Entretanto, o estudo foi limitado varivel de taxa de lucro da
empresa, empregando um modelo univariado, ao contrrio de Dhatt. Utilizando o teste estatstico
de tstudent, vericava-se se a taxa de lucro da empresa inuenciava no comportamento da srie
econmica. A concluso dos autores sugere que os preos geralmente absorvem a divulgao da
taxa de lucro da empresa de forma rpida, e dentro do mesmo dia a notcia inuencia fortemente
a formao da srie, e perpetua por vrios dias ou at meses.

Em mbito nacional, dois trabalhos recentes, com dados do Brasil, mostram tambm a
tendncia da nova abordagem. Cajueiro e Tabak (2005) zeram o estudo das possveis fontes
do comportamento de longo alcance no mercado nanceiro brasileiro. Utilizando o expoente de
Hurst e o coeciente de Spearman, o autor arma que encontrou a evidncia de que variveis
especcas da empresa emissora dos ttulos de aes na bolsa podem explicar, pelo menos par-
cialmente, comportamento de longo prazo, representando um importante avano nos problemas
relacionados a sries temporais econmicas. Entretanto, na concluso, faz a advertncia que os
preos no esto dirigidos unicamente por variveis fundamentalistas, mas tambm por outras
caractersticas do mercado, como o comportamento especulativo (no contexto deste trabalho,
o comportamento especulativo refere-se a anlise tcnica) e as chamadas bolhas especulativas
tm papis signicativos na determinao dos preos, principalmente em mercados emergentes
como o Brasil.

Grppo (2004) estudou a relao entre um conjunto de variveis macroeconmicas e o mercado


acionrio brasileiro, utilizando um enfoque multivariado com o mtodo de auto regresso vetorial
com correo de erro. O autor buscou analisar o efeito das variveis macroeconmicas sobre o
ndice da Bolsa de Valores de So Paulo, e conseqentemente de suas sries econmicas. O perodo
analisado compreendeu os meses de janeiro de 1995 a dezembro de 2003. O autor concluiu que
existem relaes signicativas entre as variveis econmicas, taxa de cmbio e a taxa de juros de
curto prazo, com o comportamento das sries que compe o ndice Bovespa. Os resultados obtidos
deixam claro, segundo o autor, a elevada sensibilidade das sries econmicas frente taxa de juros
11

real de curto prazo (SELIC). Por sua vez, a cotao do petrleo no mercado internacional no
explica signicativamente o comportamento das sries. O autor tambm concluiu que o prprio
ndice Bovespa tambm tem um grande poder explicativo sobre as sries temporais econmicas
que compe o ndice.

E nalmente, Lam (2004) foi a primeira a propor uma RNA que integrasse os modelos tcnicos
e fundamentalistas. Fazendo uso de vinte e sete variveis fundamentalistas, Lam demonstrou que
uma RNA do tipo MLP com algoritmo de treinamento backpropagation capaz de integrar os
dois modelos. Foram utilizados dados de empresas com aes cotadas na bolsa de valores de
Nova York, no perodo de 1985 a 1995. Para a integrao dos modelos, foi utilizado a tcnica
estatstica de planejamento de experimentos, detalhada em Mead (1990). Com os resultados,
a autora concluiu que a habilidade de predio da rede melhorada para a maioria das sries
estudas.

2.5 Consideraes Finais

Este Captulo apresentou a reviso bibliogrca das principais tcnicas encontradas na liter-
atura. Foi descrita uma evoluo histrica dos mtodos de tratamento do problema de predio
de sries temporais em geral, at os trabalhos mais recentes. Estes artigos recentes evidenciam
a importncia de utilizar as abordagens fundamentalista e tcnica em conjunto no problema de
predio de sries temporais econmicas. Contudo, a combinao desses modelos ainda tmida
quando tratada no escopo de tcnicas de inteligncia articial como as RNAs.
12
13

Captulo 3

Transformada Wavelet

3.1 Consideraes Iniciais

Neste Captulo feita uma introduo a transformada wavelet e seu funcionamento como
ltro no problema de predio de sries temporais.

3.2 Perspectiva Histrica

A transformada wavelets, ou anlise wavelet, mostra muitas origens diferentes, como ilustra
Meyer (1993a). Entretanto, sua idealizao foi concebida no trabalho de Haar, que no apndice
de sua tese de doutorado, demonstrou que um sinal qualquer poderia ser diferenciado e inte-
grado de modo a conservar sua energia inicial. Por volta de 1930, vrios grupos trabalhando
independentemente publicaram trabalhos desenvolvidos com a teoria wavelet proposta por Haar.
possvel citar, por exemplo, o trabalho de Paul Levy descrito em Meyer (1993b), que investigou
o movimento Browniano usando a base de wavelets de Haar, mostrando que as funes da base
de Haar eram melhores do que as da base de Fourier para estudar os detalhes do movimento
Browniano.

Contudo, somente em meados da dcada de oitenta que seu uso foi amplamente aceito e ado-
tado pela comunidade cientca. Parte dessa aceitao deve-se ao ganho de poder computacional
dos computadores e aos trabalhos de Daubechies (1990), Mallat (1989b) e Morlet et al. (1989).

A partir da dcada de noventa possvel observar uma tendncia da comunidade cientca


em explorar o potencial das wavelets em aplicaes de codicao, representao, compresso
14

e ltragem de sinais. Paralelamente aos trabalhos voltadas para aplicaes especcas, diversas
contribuies de novos algoritmos e estratgias de implementaes computacionais propuseram
verses para a transformada rpida discreta (utilizando-se bancos de ltros) e algoritmos melho-
rados para resolver efeitos de bordas e particionamento do espectro do sinal, de forma a aumen-
tar a resoluo nas faixas de freqncias mais altas, utilizando-se tcnicas como os "pacotes de
wavelets "(wavelet-packets ), e multiwavelets.

O incio dos estudos de sinais no domnio da freqncia atribuda a Joseph Fourier, que
em 1807 iniciou o estudo das teorias de anlise de freqncia a partir das sries de Fourier, onde
qualquer sinal poderia ser representado pela soma innita de senos e co-senos. Explorando as
sries de Fourier, os matemticos foram gradualmente se direcionando a noo prvia de anlise
de freqncia e escala conduzindo a famosa transformada de Fourier para anlise de sinais no
domnio da freqncia.

3.3 Transformada de Fourier

A transformada de Fourier tradicionalmente utilizada para se fazer a transformao tempo-


freqncia (Gencay et al., 2001; Soltani, 2002). A transformao dos dados para o domnio da
freqncia mostrar a mesma informao em outro domnio, tornando algumas caractersticas
mais evidentes no domnio transformado, como por exemplo a componente aleatria da srie
temporal (Ingle e Proakis, 2000).

Dado um conjunto de pontos x no domnio do tempo, a transformada de Fourier consiste


em determinar o conjunto de pontos X correspondentes no domnio da freqncia. Isso permite
identicar os aspectos mais freqentes e comuns do sinal. Permite ainda, ltrar, eliminar ou
ampliar com maior facilidade uma faixa especca de freqncia (Attia, 1999; Bracewell, 1988;
Claerbout, 1999; Clarke, 2000).

A transformada de Fourier calculada pela Equao (3.1).

Z +
X(f ) = x(t)ej2f t dt, (3.1)


onde j = 1 e f a freqncia do sinal no domnio do tempo. A transformada inversa de
Fourier que recupera a funo original x a partir de X denida como:
15

Z
x(t) = X(f )ej2f t df, (3.2)
+

A partir do conjunto de pontos nitos obtidos no processo de discretizao possvel aplicar


a frmula de aproximao dos coecientes da transformada de Fourier conhecida como transfor-
mada discreta de Fourier (Discrete Fourier Transform, DFT) (Elliott e Rao, 1982).

A DFT de N pontos denida como:

N 1
1 X jn2f
X(f ) = x(t)e N (3.3)
N
n=0

A transformada discreta de Fourier inversa (Inverse Discrete Fourier Transform, IDFT) re-
cupera o sinal do domnio da freqncia para o domnio do tempo. A IDFT denida como:

N
X 1
jn2f
x(t) = X(f )e N . (3.4)
n=0

A diviso da srie temporal em segmentos de modo a permitir localizao temporal de fre-


qncia uma forma de melhorar o desempenho da transformada de Fourier. A localizao
temporal de freqncias obtida atravs do janelamento da srie x em instantes de tempo t dis-
tintos. A transformada de Fourier aplicada a segmentos denidos por uma janela denida como
$. O procedimento conhecido como transformada de Fourier janelada (Short Time Fourier
Transform, STFT) (Kaiser, 1994). A STFT denida por:

N
X 1
F (p, f ) = xt $(tp) eif t (3.5)
t=0

onde $ a funo de janelamento responsvel pela delimitao do trecho considerado do sinal.


A posio da janela dentro do sinal dada por p.

A diculdade para denio do comprimento da janela e o fato da janela permanecer constante


ao longo do sinal constituem a principal desvantagem para o emprego da STFT, desvantagens
que sugerem o emprego da transformada wavelet.
16

3.4 Transformada Wavelet

A transformada wavelet utiliza janelas com comprimentos variveis que se ajustam melhor s
caractersticas do sinal em contraste com a STFT. A grande vantagem da transformada wavelet
a possibilidade da anlise tempo-freqncia que permite a localizao de altas freqncias
em intervalos de tempo especcos, tpico de sries temporais econmicas, tornando possvel a
suavizao do comportamento aleatrio da srie em trechos especcos. A transformada wavelet
para a anlise e ltragem de sries temporais tem sido proposta em diversos trabalhos nos
ltimos anos (Renaud et al., 2005; Fryzlewicz, 2003) em substituio s tcnicas clssicas como
a transformada de Fourier.

Em sua verso discreta a transformada wavelet dada por:


X X
X
f (t) = dk k (t) + cjk kj (t) (3.6)
k= j=0 k=

onde a funo

kj (t) = (2j t k) (3.7)

chamada de wavelet me e a funo

j
j,k (t) = 2 2 (2j t k) (3.8)

chamada de wavelet pai ou funo escala e os coecientes j e k so os coecientes de transfor-


mao wavelet.

A transformada wavelet especica a localizao (via translao) e freqncia (via dilatao


ou compresso) utilizando a wavelet pai e me respectivamente.

1 tb
c,b (t) = ( ) (3.9)
c c

1 tb
c,b (t) = ( ) (3.10)
c c

Onde os parmetros c e b variam continuamente no espao em R, de modo a obter a wavelet


17

dilatada ou comprimida pelo fator c e deslocada pelo fator b. Atravs de compresses/dilataes


e deslocamentos das funes wavelets possvel aproximar qualquer sinal nos planos R e I.

Para c > 1 tm-se o efeito de dilatao da funo wavelet e para c < 1 tm-se o efeito de
contrao da funo wavelet sendo possvel analisar os aspectos globais e locais das sries.
medida que b varia, a funo f analisada localmente em torno de b.

3.4.1 Bases Wavelets

Enquanto a transformada de Fourier utiliza funes trigonomtricas seno e cosseno, a trans-


formada wavelet pode utilizar qualquer funo matemtica que satisfaa os critrios de admissi-
bilidade expressos nas equaes 3.11 e 3.12.

Z
(t)dt = 0 (3.11)

Z
|(t)|2 |dt = 1 (3.12)

A equao 3.11 expressa que para uma funo ser wavelet, sua integral deve ser zero. Isso
garante que a funo wavelet tenha uma forma do tipo onda, e a equao 3.12 dene que a funo
deve ter energia unitria, garantindo que a funo tenha decaimento rpido para a localizao
temporal (Hernandez e Weiss, 1996; Mallat, 1999).

A wavelet de Haar foi a primeira funo conhecida com comportamento wavelet e tambm a
mais simples em termos matemticos. A wavelet de Haar dada pela equao 3.13.



1, t 1

2
(t) = 1, 1
t<1 (3.13)

2

0, t>1

A base de Haar tem o inconveniente de ser formada por funes descontnuas, expressas na
equao 3.13, entretanto sua facilidade de compreenso e implementao motivam o uso da base
de Haar como wavelet me.

A partir da base de Haar outras bases foram desenvolvidas na forma de famlia de funes
similares, como por exemplo a famlia de bases de Daubechies (Daubechies, 1990), Meyer (Meyer,
18

1993a) e Coiet (Huang e Hsieh, 2002). A Figura 3.1 ilustra a representao dessas bases.

Base de Haar Base de Daubechies (db 11)


2 1

1 0.5

0 0

1 0.5

2 1
0 0.5 1 1.5 0 5 10 15 20

Base de Coiflet (coif 1) Base de Meyer


4 2

1
2
0
0
1

2 2
0 2 4 6 0 1 2 3

Figura 3.1: Exemplo de funes base wavelet.

Uma questo que sempre surge na aplicao da anlise wavelet a escolha da base wavelet
mais adequada para analisar um certo tipo de sinal. Ainda no existe uma receita para esse
procedimento, apenas recomendaes teis, como por exemplo, a forma da base wavelet escolhida
deve reetir as caractersticas do sinal. A escolha da base wavelet um fator importante, mas a
escolha de uma base adequada ainda tema de pesquisa em aberto. Outra alternativa denir
experimentalmente a base wavelet a ser utilizada no problema em estudo.

3.4.2 Anlise Multiresoluo

A representao de um sinal em diferentes nveis de detalhamento conhecida por multires-


oluo. Os nveis de detalhamento so obtidos empregando-se a transformada wavelet atravs
de ltros, tcnica desenvolvida por Mallat (Mallat, 1989a). A aproximao de uma funo x no
domnio t efetuada obtendo sua aproximao grosseira mais os detalhes em diferentes nveis,
ou seja, com aproximaes e nveis de detalhes aplicados de forma recursiva, permitindo analisar
sinais em mltiplas bandas de freqncias (Mertins, 1996).
19

H(t) 2

H(t) 2

L(t) 2 H(t) 2

L(t) 2

L(t) 2

Figura 3.2: Transformada wavelet na forma de banco de ltros.

A transformada wavelet em forma de banco de ltros ilustrada na Figura 3.2, utiliza um


ltro passa-baixa L e outro passa-alta H , onde o ltro passa-alta produz os coecientes de
detalhes da decomposio wavelet o ltro passa-baixa produz os coecientes de aproximao da
decomposio wavelet. A transformada funciona como um ltro de banda passante para cada
nvel de decomposio (Mertins, 1996). O sinal decomposto simultaneamente utilizando os
ltros H e L, repetidindo-se a decomposio no canal L de modo a incrementar a resoluo
tempo-freqncia at um nvel n.

A decomposio wavelet tem como caracterstica ltrar e decimar o sinal. Na Figura 3.2
o operador de decimao diminui a taxa de amostragem do sinal, ou seja, elimina pontos
intercalados. Decimar um sinal pelo fator 2 signica que o sinal ser sub-amostrado por um
fator de 2, obtendo-se metade do sinal original pela reduo da taxa de amostragem. A Figura
3.3 apresenta um exemplo da aplicao da decomposio wavelet ilustrada na Figura 3.2.

Na Figura 3.3(a) mostrada um srie temporal obtida das cotaes de preo das aes do
grupo Po de Acar no perodo de Janeiro a Novembro de 2005. A srie foi submetida
decomposio wavelet utilizando-se a base de Daubechies (db 11), obtendo-se a aproximao a1
e seus detalhes d1 para um primeiro nvel de resoluo, aproximao a2 e detalhes d2 para o
segundo nvel de resoluo, sendo possvel analisar a srie em dois nveis de decomposio.

Para muitos sinais, inclusive as sries temporais econmicas, as componentes de baixa fre-
qncia so aquelas que contm maior informao. J nas componentes de alta freqncia, so
encontrados detalhes que contem a maior parte do comportamento aleatrio da srie, possibili-
tando o emprego de um limiar de corte na componente de detalhes.
20

80

70

60
x

50

40
0 50 100 150 200 250
t
120 2

1
100
a1

d1
0
80
1

60 2
0 50 100 150 0 50 100 150
t t
160 4

140 2
a2

d2

120 0

100 2

80 4
0 20 40 60 80 0 20 40 60 80
t t

Figura 3.3: Decomposio wavelet de uma srie temporal econmica.

A equao 3.14 apresenta o limiar universal proposto por Donoho e Downie (Donoho, 1995;
Downie e Silverman, 1998), para o corte dos coecientes de detalhe para cada nvel de resoluo
na transformada wavelet.

p
2log(n) (3.14)

sendo o desvio padro e n o comprimento dos dados.

A equao 3.14 aplicada como limiar de corte nos coecientes de detalhes para cada nvel
de resoluo na transformada wavelet. Utilizando a transformada wavelet na srie temporal
possvel realar ou suavizar determinadas caractersticas em trechos localizados, o que no era
possvel utilizando tcnicas como transformada de Fourier ou mdias mveis.
21

3.5 Consideraes Finais

Neste Captulo foram apresentadas as principais tcnicas de processamento de sries tempo-


rais no domnio da freqncia. Como mencionado na seo 3.4, a transformada wavelet para a
anlise e ltragem de sries temporais tem sido proposta nos ltimos anos em substituio s
tcnicas clssicas como a transformada de Fourier, cujas limitaes foram apresentadas na seo
3.3.
22
23

Captulo 4

Redes Neurais Articiais na Previso


de Sries Temporais Econmicas

4.1 Consideraes Iniciais

Neste Captulo so apresentados alguns conceitos fundamentais sobre as redes neurais ar-
ticiais, princpio de funcionamento e a motivao no uso das RNAs no problema de previso
de sries temporais econmicas. Apresenta-se algumas das principais arquiteturas de RNAs uti-
lizadas no problema de predio de sries temporais, concluindo-se com uma comparao sobre
arquiteturas multi-camada recorrente e multi-camada no recorrente.

4.2 Fundamentos de Redes Neurais Articiais

RNAs so modelos computacionais no lineares, que de forma similar ao crebro humano, so


organizadas atravs de elementos bsicos de processamento denominados neurnios articiais, que
se interligam formando redes capazes de processar, armazenar e transmitir informaes vindas
de um meio exterior (Haykin, 2001). O modelo geral de um tpico neurnio articial conhecido
como neurnio de Mcculloch-Pitts (Haykin, 2001) ilustrado na Figura 4.1, onde o neurnio
articial, de forma similar a um neurnio biolgico, recebe informaes de outros neurnios ou
de um meio exterior e as processa de modo a oferecer uma resposta em sua sada.
24

Figura 4.1: Representao de um neurnio articial.

Na Figura 4.1, x1 , x2 , . . . , xn so os sinais discretos da entrada, w1 , w2 , . . . , wn so os pesos


sinpticos do neurnio, que so utilizados para armazenar o conhecimento adquirido na etapa
de aprendizagem a ser descrita na seo 4.5, o limiar de ativao do neurnio que dene se
P
a sada ser disparada, u a sada do combinador linear de modo que u = N i=1 wi xi ,

g(.) a funo de ativao da sada do combinador linear que processa o conjunto de entradas
recebidas e as transforma em estado de ativao. A Figura 4.2 apresenta as principais funes
g(.) de ativao usadas em RNAs, destacando-se como as mais usadas a funo sigmide, tambm
conhecida como logstica, e a hiperblica.

3 2

1.5
2

1
0.5
g(u)

0 0

0.5
1

2
1.5

3 2
4 3 2 1 1 2 3 4 6 4 2 0 2 4 6
u
u

(a) Funo rampa. (b) Funo degrau bipolar.

1 1

0.9 0.8

0.8 0.6

0.7 0.4

0.6 0.2
g(u)

g(u)

0.5 0

0.4 0.2

0.3 0.4

0.2 0.6

0.1 0.8

0 1
6 4 2 0 2 4 6 6 4 2 0 2 4 6
u u

(c) Funo sigmide ou logstica. (d) Funo hiperblica.

Figura 4.2: Principais funes de ativao utilizadas em neurnios articiais.


25

A funo logstica utilizada quando deseja-se que os valores de sada do neurnio estejam
no intervalo [0, 1], e a funo hiperblica quando se deseja que os valores de sada do neurnio
estejam no intervalo [1, 1]. A funo sigmide descrita na Equao 4.1.

1
g(u) = (4.1)
1 + eu

A funo hiperblica denida por:

1 eu
g(u) = (4.2)
1 + eu

Nas equaes 4.1 e 4.2 dene a inclinao da sigmide e da hiperblica. A funo rampa
denida por:



a, se u > a




g(u) = u, se aua (4.3)






a, se u < a

onde a denota o valor de ativao mnimo e mximo da funo. A funo degrau denida como


1, se u 0
g(u) = (4.4)
0, se u < 0

O parmetro das funes sigmide e hiperblica pode ser ajustado de modo a denir a
inclinao da funo, como ilustrado na Figura 4.3.

0.9 beta = 2
beta = 10
0.8 beta = 0.1

0.7

0.6
g(u)

0.5

0.4

0.3

0.2

0.1

0
0 5 10 15 20 25 30 35 40
u

Figura 4.3: Funo sigmide com diferentes valores de (beta).


26

Para um de valor grande, a funo tende a aproximar o comportamento da funo degrau,


e com um pequeno a funo tende a aproximar o comportamento da funo rampa, ou seja, a
partir da funo sigmide ou hiperblica possvel aproximar outras funes de ativao.

4.3 Arquiteturas de Redes Neurais Articiais

A forma como os neurnios so agrupados conhecida como arquitetura de rede neural.


Os neurnios articiais podem ser organizados e conectados de vrias formas, resultando em
diferentes arquiteturas neurais, com caractersticas e aplicaes bastante distintas (Grossberg,
1988).

Inicialmente as arquiteturas podem ser classicadas em duas classes, camada nica e multi-
camadas (Dayho, 1990). Nas redes com arquitetura de camada nica, tem-se a entrada de dados
e uma nica camada de neurnios em paralelo que a prpria camada de sada. Um problema
relacionado a esse tipo de rede a sua limitao em representar funes linearmente separveis,
restrio solucionada com a utilizao de redes com mais de uma camada, redes conhecidas
como multi-camadas. As arquiteturas de redes neurais tambm podem ser classicadas como
recorrentes e no recorrentes (Russell e Norvig, 1995). Esses dois tipos de arquiteturas sero
apresentados nas sees 4.3.1 e 4.4 respectivamente.

4.3.1 Redes Neurais Articiais No Recorrentes

Redes no recorrentes, tambm conhecidas como redes multi-camada, so redes que no


possuem realimentao de suas sadas para suas entradas (O. Nerrand, 1993). A estrutura das
redes neurais no recorrentes pode ser formada por uma camada nica ou por mltiplas camadas
tambm conhecidas como redes multi-camadas. As RNAs mlti-camadas no recorrentes contm
um conjunto de entradas, uma ou mais camadas escondidas e uma camada de sada conforme
ilustra a Figura 4.4.

A camada de sada contm os neurnios que fornecem a sada da rede. As camadas que no
possuem ligaes diretas com a entrada, nem com a sada so denominadas de camadas ocultas.
No caso de redes no-recorrentes como na Figura 4.4, no existem conexes ligando um neurnio
de uma camada a outro de uma camada anterior, nem a um neurnio da mesma camada, as
conexes so feitas somente para neurnios da camada seguinte.
27

Figura 4.4: Rede neural articial multi-camada no recorrente.

4.4 Redes Neurais Articiais Recorrentes para Sistemas Vari-


antes no Tempo

Redes neurais no-recorrentes no so capazes de reutilizar as informaes prvias, pro-


duzindo apenas mapeamentos estticos, onde a sada uma resposta imediata ao estmulo da
entrada. Esta a razo pela qual este tipo de rede neural encontra diculdade em representar
sistemas variantes no tempo, j que o vetor de sada da rede neural depende apenas do vetor
de entrada denido no mesmo instante t (Kolen, 1994). Quando deseja-se que todas as infor-
maes prvias inuenciem no instante de tempo atual t, recomendvel o uso de RNAs do tipo
recorrente.

Redes neurais recorrentes so redes que contm realimentao das sadas para as entradas,
sendo suas sadas determinadas pelas entradas atuais e pelas sadas anteriores (Kolen, 1994).
As redes recorrentes, quando organizadas em camadas, possuem interligaes entre neurnios da
mesma camada e entre camadas no consecutivas, gerando interconexes bem mais complexas
que as redes neurais no recorrentes (Jain, 2001).

A arquitetura mais simples de rede recorrente a TDNN (Time-Delay Neural Network ). A


TDNN uma rede perceptron multicamadas (MLP), cujas sadas so re-aplicadas ao longo do
tempo, ou seja, a estimao de x(t + 1) e x(t) por exemplo, realizada baseando-se nos valores
assumidos por x nos intantes de tempo passados (t 1), (t 2), ..., (t n). A realimentao
dos instantes de tempo (t 1),(t 2), ..., (t n) da camada de sada para a camada de entrada,
permite a criao de representaes internas com maior capacidade de memria (Kolen, 1994). A
recorrncia utilizando valores em instantes de tempo passados, armazena indiretamente os valores
28

assumidos por x no tempo, congurando-se como uma RNA de maior potencial de modelagem de
dados temporais (Zhang e Morris, 1995; Williams e Zipser, 1989). Segundo O. Nerrand (1993),
como estruturas de processamento de sinais, redes neurais recorrentes se assemelham a ltros
no-lineares com resposta ao impulso innita. O treinamento da rede TDNN pode ser feito
utilizando-se o algoritmo backpropagation.

4.4.1 Rede Neural Articial de Elman

Elman (1990) props uma uma RNA recorrente, adicionando uma camada escondida, de-
nominada camada de contexto. A camada de contexto responsvel por guardar a informao
temporal relativa as entradas anteriores da rede. O peso w entre a camada escondida e a camada
de contexto xado em 1, possibilitando a utilizao do algoritmo backpropagation. A estrutura
da rede de Elman mostrada na Figura 4.5.

Figura 4.5: Rede Neural Articial de Elman.

Essa rede diferencia-se das demais solues temporais por conseguir com que dados de todas
as amostras anteriores ao instante de tempo t inuenciem no instante presente. Isso possvel
devido realimentao feita na camada escondida, que faz com que todas as amostras anteriores
inuenciem na sada. Porm, quanto mais recente a amostra maior a inuncia no resultado.

Kremer (1995) demonstrou que apesar da simplicidade estrutural da rede de Elman, ela
sucientemente capaz de modelar informaes temporais utilizando o modelo de neurnio de
29

Mcculloch-Pitts e o algoritmo de treinamento backpropagation.

4.5 Algoritmos de Treinamento de Redes Neurais Articiais

O treinamento de uma RNA consiste no ajuste dos pesos sinpticos wj e dos limiares . O
objetivo no treinamento fazer com que a rede seja capaz de generalizar um problema, ou seja,
no necessrio que a rede conhea todas as possibilidades de entrada para obter a sada, de
forma que a aplicao de um conjunto de entradas desconhecidas ao treinamento produza um
conjunto de sadas desejadas (Leonard e Kramer, 1990).

Os algoritmos de treinamento de RNAs podem ser classicados em supervisionados ou no


supervisionados (Walczak et al., 2003). No treinamento supervisionado a rede recebe os vetores
de entrada assim como os resultados desejados na sada da rede. A tarefa do treinamento da
rede ajustar os pesos entre os neurnios de forma que a sada seja a desejada, ou seja, a rede
treinada para fornecer a sada desejada a um estmulo de entrada especco. No treinamento de
redes multi-camadas semelhantes a Figura 4.4 o algoritmo backpropagation tambm conhecido
como retropropagao o mais citado e utilizado na literatura de RNAs.

De maneira geral, o algoritmo backpropagation consiste em dois passos. No primeiro passo, o


passo da propagao, a entrada fornecida aos neurnios da camada de entrada da RNA, e seu
sinal se propaga no sentido das conexes (para a frente) em cada uma das camadas da rede at
a produo de uma sada na ltima cadada. No passo de propagao, no ocorrem alteraes
nos pesos sinpticos da rede. O objetivo apenas calcular a diferena entre a resposta desejada
e a sada produzida conforme a equao 4.5.

p
1 XX
E= (xi xi )2 (4.5)
2 n
i=1

onde E a funo da medida do erro total da rede, n o nmero de padres apresentados


rede, p o nmero de neurnios de sada, xi a i-sima sada desejada e xi a i-sima sada
gerada pela rede.

No segundo passo, o de retropropagao, ocorre o ajuste dos pesos sinpticos da RNA de


modo a minimizar a funo E . O ajuste dos pesos deve ser feito proporcionalmente ao negativo
do gradiente do erro em relao aos pesos da rede conforme a equao 4.6.
30


E
wij = (4.6)
wij

Onde os ndices i e j referem-se ao neurnio i da camada posterior e ao neurnio j da camada


anterior e a taxa de aprendizado que determina a velocidade do passo em direo ao mnimo
da funo de erro E . Vale ressaltar que um muito grande poder levar o treinamento a oscilar
em torno do mnimo de E sem conseguir atingi-lo, entretanto um muito pequeno poder deixar
a convergncia do treinamento muito lenta. Uma alternativa o uso da taxa de aprendizado
adaptativa com um grande no incio do treinamento que reduzido a medida que o erro tambm
diminui.

Calculando-se a derivada para todas as camadas da rede, obtm-se as seguintes frmulas para
a atualizao dos pesos wij , para cada padro de entrada individualmente.

Wij = xj (4.7)

onde

N2 !
X
= gj0 k wkj (4.8)
k=1

e gj0 a derivada da funo de ativao do neurnio j .

Para uma apresentao mais detalhada de como o algoritmo backpropagation funciona recomenda-
se a leitura do artigo original de Rumelhart (Rumelhart e McClelland, 1986).

Apesar de ser o mais utilizado, o algoritmo backpropagation apresenta algumas caractersticas


indesejveis como por exemplo a baixa velocidade de convergncia quando prximo de um mnimo
da funo de erro E , devido ao fato da atualizao dos pesos ser proporcional ao valor do
gradiente de erro e problema com mnimos locais, pois o algoritmo geralmente no consegue
atingir o mnimo global de E quando atinge um mnimo local.

4.5.1 Algoritmo Resilient Propagation (RPROP)

O algoritmo de treinamento Resilient Propagation (RPROP) foi proposto por Riedmiller e


Braun (1993) como uma alternativa mais eciente que o backpropagation para o treinamento
de RNAs do tipo MLP. No algoritmo de treinamento RPROP a alterao dos pesos sinpticos
31

baseada em informaes de gradiente locais. Para isso, introduzido, para cada peso, o seu
valor individual de atualizao Dji , que determina apenas o tamanho da alterao no respectivo
peso. Esse valor individual de atualizao Dji evolui durante o processo de aprendizado, baseado
apenas no sinal local da funo de erro E , baseado nas seguintes regras de aprendizado:



+ ji (n), se E E
+ 1) > 0


wji n ji (n

ji (n + 1) = ji (n), se E E
wji n ji (n + 1) < 0 (4.9)






ji (n), caso contrrio

onde 0 < < 1 < +

Uma melhoria sobre a tcnica de aprendizagem por retropropagao de erro a do algoritmo


de propagao resiliente (Anastasiadis et al., 2004; Riedmiller e Braun, 1993).

A regra de aprendizado da equao 4.9 faz com que a mudana no sinal das derivadas parciais
correspondentes ao peso wij indica que a ltima mudana foi grande o suciente pulou sobre um
mnimo local da funo E , implicando em uma diminuio do valor de ji proporcional ao fator
. Se a derivada parcial no trocou de sinal, o algoritmo est movendo permanentemente em
uma nica direo , o que implica num aumento sensvel de ji proporcional ao fator + , para
que a convergncia no sentido de regies de menor erro seja acelerada. Uma vez que os valores
individuais de atualizao ji para cada peso sinptico foram determinados, a atualizao dos
pesos segue a equao 4.10.



ji (n + 1), se + 1) > 0
E


wji (n

wji (n + 1) = E
+ji (n + 1), se wji (n + 1) < 0 (4.10)






0, caso contrrio

importante citar que o ajuste da taxa de aprendizado e dos pesos sinpticos dependem
dos termos do gradiente e no da sua magnitude como no Backpropagation. Com a utilizao
do RPROP, o tamanho da atualizao dos pesos depende apenas da seqncia de troca de sinais
das derivadas parciais.
32

4.6 Consideraes Finais

Neste Captulo foram apresentadas diferentes arquiteturas de RNAs. As RNAs constituem-se


em uma alternativa bastante interessante em relao aos tradicionais modelos matemticos de
predio como o ARIMA. Contudo, as RNAs de maior interesse para esse trabalho so as que
consideram o histrico de dados, em particular, destaca-se a RNA de Elman, que capaz de
armazenar indiretamente todo o histrico de dados apresentado a rede.
33

Captulo 5

Metodologia

5.1 Consideraes Iniciais

Neste Captulo apresentada a metodologia proposta na predio das sries temporais


econmicas e as medidas de avaliao dos resultados da predio.

5.2 Viso Geral da Tcnica

Como j mencionado no Captulo 1, o objetivo deste trabalho realizar a predio de sries


temporais econmicas. A Figura 5.1 apresenta o resumo da tcnica proposta.

Predio

Seleo de Padres

Seleo de variveis

Modelo Pr-processamento Modelo


fundamentalista tcnico
Variveis macro- Variveis
econmicas financeiras
Srie temporal
econmica

Base de dados
Base de dados da Fundao Getlio Vargas
BOVESPA

Figura 5.1: Viso geral da tcnica proposta.


34

A predio determinada a partir de dois mdulos principais: um baseado no modelo tcnico,


que utiliza o histrico das sries temporais econmicas e outro baseado no modelo fundamentalista
fazendo uso de variveis econmicas que tem impacto direto ou indiretos na srie. Os dois modelos
sero apresentados de forma mais detalhada nas sees 5.3 e 5.4.

5.3 Modelo Tcnico

No modelo tcnico, os dados sobre as sries temporais econmicas utilizadas foram extradas
diretamente do website da BOVESPA1 (Bolsa de Valores de So Paulo), principal bolsa de valores
do Brasil.

Seleo de Padres

Pr-processamento Modelo
tcnico

Srie temporal
econmica

Base de dados
BOVESPA

Figura 5.2: Diagrama esquemtico do modelo tcnico.

Conforme o diagrama da Figura 5.2, a primeira etapa consiste da obteno das sries tem-
porais econmicas a partir da base de dados da BOVESPA. No primeiro bloco, as sries foram
extradas isoladamente para cada companhia analisada, de modo que o modelo de srie tempo-
ral fosse univariado, ou seja, as sries foram analisadas de forma independente uma das outras.
Dentre as diversas informaes disponibilizadas, no segundo bloco do diagrama so extradas
as informaes da srie referente a cotao de preo da abertura, preo mximo, preo mnimo,
preo mdio, preo de fechamento e volume negociado amostrado de forma diria, conforme
sugerido nos trabalhos de Yao et al. (1999), Jang (1991) e Lam (2004). Essas variveis sero

1
http://www.bovespa.com.br
35

referenciadas como variveis do modelo tcnico (VMT) e a predio refere-se ao preo mdio dos
dias futuros.

Utilizando o toolbox de transformada wavelet do software Matlab, os dados das variveis


VMT so ltrados em uma fase chamada de pr-processamento, conforme ilustrado no terceiro
bloco do diagrama do modelo tcnico (Diagrama da Figura 5.2). Esta etapa objetiva suavizar a
componente aleatria da srie, ou seja, suavizar o efeito das altas freqncias presentes nos dados
das sries temporais utilizadas. Segundo a teoria de Down, em sries temporais econmicas, as
altas freqncias so de difcil compreenso e modelagem, pois esto relacionadas a especulaes
e boatos, e seus movimentos no possuem nenhuma lgica econmica ou temporal.

O quarto bloco ilustra o emprego de seleo de padres de treinamento, que visa melhorar
o processo de aprendizagem do mtodo de predio e por conseguinte sua preciso em exemplos
de teste (Raymer et al., 2000; Niska et al., 2006).

No contexto de seleo de padres de treinamento, possvel denir dois tipos de aborda-


gens: mtodos que fazem uso de transformaes lineares das caractersticas a serem selecionadas
e mtodos que utilizam o espao de caractersticas originais. Em ambos os casos, para cada
conjunto original de padres de entrada objetiva-se obter um conjunto de padres de dimenso
menor. Como exemplo de mtodos que fazem uso de transformaes lineares possvel citar a
funo discriminante de Fisher e a anlise de componente principais. Algoritmos genticos e al-
goritmo de projees sucessivas so exemplos de mtodos que utilizam o espao de caractersticas
originais.

Para este trabalho foi escolhido o algoritmo de projees sucessivas para a seleo dos padres
de treinamento da srie temporal econmica, uma vez que este algoritmo mostrou-se promissor
quando comparado aos outros mtodos citados em problemas de regresso e classicao (Arajo
et al., 2001; Pontes et al., 2005).

5.3.1 Algoritmo de Projees Sucessivas

O algoritmo de projees sucessivas (APS) foi proposto inicialmente por Galvo et al. (1999)
e Arajo et al. (2001), como uma tcnica de seleo de variveis para minimizar problemas
de colinearidade em problemas de calibrao multivariada. Mais recentemente, no trabalho
de Pontes et al. (2005), o APS foi empregado tambm como uma nova estratgia de seleo
de variveis que so minimamente redundantes, mas representativas do conjunto de dados em
36

problemas de classicao. O uso do APS em problemas de regresso no linear como a predio


de srie temporais econmicas, constitui-se em uma novidade nas aplicaes do APS.

O algoritmo segue um procedimento recursivo em que, partindo de uma varivel inicial da


matriz de padres de treinamento X , selecionada uma nova varivel de maior projeo a cada
iterao.

Seja S o conjunto de variveis disponveis e que ainda no foram selecionadas, tal que,

S = { tal que 0 J 1} e j
/ {i, . . . , x(n 1)} (5.1)

onde J o nmero total de variveis disponveis de X e o nmero de variveis que se deseja


selecionar.

Seja xi a i-sima e xj a j -sima coluna de X , tal que X possua J vetores coluna disponveis,
a projeo de xj na direo de xi dada por:

Projxi ,xj = (xi xTj )xj (xj xTj )1 j S (5.2)

e a projeo de xj no subespao ortogonal de xi dada por

Projxi ,xj = xj Projxi ,xj = xj (xj xTi )xi (xi xTi )1 j S (5.3)

Um exemplo ilustrativo da seleo de variveis baseada nas projees sucessivas, extrado de


Arajo et al. (2001) e Galvo et al. (1999), est representado na gura 5.3.

Na gura 5.3, considerada uma matriz X com 3 amostras e 5 variveis, que no contexto
deste trabalho so os padres de treinamento. Deseja-se selecionar 3 variveis, de forma que
cada linha de X seja representada por um vetor em um espao de 3 dimenses. Tomando-se
x3 como varivel de partida, faz-se v1 = x3 . Como possvel observar na gura 5.3, x1 tem a
maior projeo no subespao ortogonal a v1 . Portanto, faz-se v2 = x1 . Para selecionar a terceira
varivel, repetem-se as projees, agora sobre o subespao ortogonal a v2 . Como resultado, o
vetor x5 escolhido, fazendo-se v3 = x5 . Selecionados x1 , x3 e x5 a escolha encerrada. Vale
ressaltar que segundo Galvo et al. (1999), no seria possvel escolher uma quarta varivel por
esse mtodo, pois todos as variveis resultantes de uma nova projeo teriam norma zero. Assim,
o algoritmo s permite selecionar 1 variveis, sendo que o nmero de amostras dos padres
37

Figura 5.3: Exemplo de seleo de variveis utilizando o APS.

de treinamento.

importante destacar que segundo o algoritmo original do APS, tendo-se J variveis de


partida iniciais possveis para X , seriam gerados J subconjuntos de padres, onde para cada
varivel de partida diferente estaria associado um subconjunto de padres distinto.

No problema de seleo de padres para sries temporais econmicas, foi feita uma alterao
no algoritmo de modo que a varivel inicial seja aquela que contm o instante de tempo ime-
diatamente anterior ao instante de tempo que se deseja prever, gerando-se apenas uma cadeia
de variveis selecionadas. A quantidade de padres selecionados pelo algoritmo, foi denida
experimentalmente em 30, 50, 80 e 119.

5.4 Modelo Fundamentalista

A Figura 5.2 apresenta as etapas do modelo fundamentalista, extradas da Figura principal


5.1.

O modelo fundamentalista tem por objetivo explicar o comportamento de sries econmicas


por meio de outros dados nanceiros co-relacionados com as sries em estudo.

Nesta dissertao o modelo fundamentalista foi utilizado a partir da hiptese de que os


indicadores econmicos possam contribuir na predio das sries, partindo do pressuposto de
que as sries em estudo so inuenciadas por esses indicadores. As variveis foram divididas
em variveis nanceiras e variveis macro-econmicas conforme sugere (Lam, 2004), de forma a
38

Seleo de variveis

Modelo
fundamentalista
Variveis macro- Variveis
econmicas financeiras

Base de dados da Fundao Getlio Vargas

Figura 5.4: Diagrama esquemtico do modelo fundamentalista.

manter o conceito relacionado a cada varivel. As informaes sobre variveis fundamentalistas


foram extradas a partir do website da fundao Getlio Vargas2 e no possuem carter ocial.

As denominadas variveis macro-econmicas so variveis que esto relacionadas ao desem-


penho geral da economia de mercado nacional ou internacional em que a companhia referente
ao est inserida. J as variveis nanceiras so variveis informativas quanto ao desem-
penho econmico individual da companhia referente a ao, como por exemplo, lucro lquido e
dvida ativa (Lameira, 2003; S, 1997). O anexo B apresenta uma descrio mais detalha sobre
as variveis fundamentalistas utilizadas. Essas variveis sero referenciadas como variveis do
modelo fundamentalista (VMF) e as denies das variveis utilizadas esto descritas na tabela
5.1. Foram selecionadas cinco variveis nanceiras e seis variveis macro-econmicas baseando-se
nos estudos econmicos de Dhatt (Dhatt et al., 1999b), Nagano (Nagano et al., 2003), Cerqueti
(Cerqueti e Rotundo, 2003) e Grppo (Grppo, 2004).

A etapa de seleo de variveis ilustrada na Figura 5.4, consiste no uso do coeciente de


correlao de Spearman (SRCC - Spearman Rank Correlation Coecient ) para selecionar as
variveis fundamentalistas que podem estar estatisticamente correlacionadas com a srie a ser
predita. O coeciente de Spearman dado pela equao 5.4.

P
6 ni=0 d2i
|r| = 1 (5.4)
n(n2 1)

2
http://fgvdados.fgv.br
39

Tabela 5.1: Variveis fundamentalistas.


Variveis nanceiras
Varivel Descrio
v1 Total de bens/Endividamento
v2 Valor de mercado/Total de faturamento
v3 valor do mercado (Somatrio do valor das aes emitidas)
v4 Lucro lquido
v5 Mobilidade de capital
Variveis Macro-econmicas
v6 Taxa de juros bsica
v7 ndice de preo ao consumidor
v8 Cotao do dlar
v9 Cotao do preo de petrleo internacional
v10 ndice BOVESPA
v11 Classicao do risco pas

O ndice BOVESPA indica o desempenho das principais aes negociadas na BOVESPA. O Risco pas um
mtodo mundialmente reconhecido que classica o risco de calote da dvida pblica de um pas e conseqntemente
o risco de se investir no pas.

onde n o nmero de pares entre as variveis x1 e x2 a serem analisadas e di expresso na


equao 5.5.

di = (Posto de x1i dentre os valores de x1) (Posto de x2i dentre os valores de x2) (5.5)

O coeciente de Pearson um teste estatstico freqentemente utilizado para encontrar a


correlao linear entre variveis. Entretanto, segundo Jaeger (1990), o teste de correlao de
Spearman alm de no requerer a suposio de linearidade, como no coeciente de Pearson,
apresenta duas caractersticas importantes em comparao ao coeciente de Pearson. A primeira
caracterstica a possibilidade de se fazer correlaes de dados de fontes distintas e grandezas
diferentes. A correlao de Spearman considera tendncias e no valores como a correlao
de Pearson, ou seja, Spearman equivale a um teste qualitativo de correlao e Pearson a um
teste quantitativo (Jaeger, 1990; Osborn, 2006). A segunda caracterstica importante que o
coeciente de Spearman no requer nenhuma suposio sobre a distribuio de freqncias das
variveis, ao contrrio do coeciente de Pearson que requer que as variveis analisadas estejam
normalmente distribudas.
40

5.5 Predio: Combinando Modelo Tcnico e Fundamentalista

Aps a converso e ltragem das variveis VMT e da seleo das variveis VMF para cada
srie estudada, a rede neural de Elman foi elaborada de modo a prever p valores futuros. Utilizou-
se os dados de modelo tcnico e fundamentalista do perodo de janeiro de 1999 a agosto de 2006,
para treinamento da rede neural de Elman descrita na seo 4.4, sendo que os dados do modelo
tcnico de agosto a novembro de 2006 foram utilizados para validar a predio. Vale salientar
que, quanto mais dados so utilizados para treinamento, mais difcil torna-se o mapeamento dos
dados pela RNA. Entretanto, a incluso de poucos dados, referentes a perodos de tempo curtos,
podem no ser sucientes para que a RNA aprenda o comportamento da srie.

A seleo de padres de treinamento, objetiva no limitar a incluso de perodos longos de


tempo, possibilitando o uso de grandes volumes de dados, uma vez que o algoritmo de seleo
de padres ir selecionar os padres mais informativos sobre o comportamento da srie. Com
efeito, possvel incluir dados antigos da srie no conjunto de padres de treinamento sem a
preocupao de que a RNA no consiga mapear todo o domnio de dados da srie temporal
econmica. O perodo escolhido (1999 a 2006) deve-se somente a limitao de desempenho
computacional do hardware utilizado durante este trabalho.

A dimenso dos dados de entrada varivel para cada srie a ser analisada. So utilizados
cento e vinte atrasos de tempo, denidos experimentalmente, adicionados s m variveis funda-
mentalistas selecionadas pelo teste SRCC. Os neurnios da camada oculta utilizam a funo de
ativao sigmide e os neurnios da camada de sada a funo de ativao rampa. A camada de
sada utilizada como um combinador linear dos neurnios da camada escondida, sendo que uma
funo de ativao do tipo linear, como o caso da funo rampa, suciente para realizar tal
tarefa, minimizando o custo computacional em relao ao uso de uma funo no linear. Para o
treinamento, foi utilizado o algoritmo Resilient Propagation que demonstrou realizar um treina-
mento mais rpido e menos suceptvel a mnimos locais em relao aos principais algoritmos de
treinamento disponveis no toolbox do matlab, como os algoritmos Backpropagation, gradiente
conjugado, Levenberg-Marquardt, Quasi-Newton, mtodo da secante dentre outros.

5.5.1 Medidas de Avaliao

Para validar a predio, foi utilizado a raiz quadrada da mdia do erro de predio quadrtico
(Root-Mean-Square Error of Prediction, RMSEP ) expressa na Equao 5.6.
41

v
u N
u1 X
RM SEP = t (x(t) x(t))2 (5.6)
N
t=1

onde x(t) o valor real da srie no tempo t, x(t) o valor predito no tempo t e N o nmero
de observaes no conjunto de validao.

Para cada srie analisada, so executadas T treinamentos e predies onde so calculadas


medidas estatsticas conforme as Equaes 5.7 e 5.8.

PT
i=0 RM SEPi
rmsep = (5.7)
T

s
PT
i=0 (RM SEPi rmsep )2
rmsep = (5.8)
T

O parmetro rmsep calcula a mdia dos erros obtidos com T treinamentos e predies de
uma mesma srie temporal, enquanto que o parmetro rmsep calcula o desvio padro das T
medidas de erro RM SEP .

5.6 Software de Desenvolvimento

Para a implementao da tcnica, foi utilizado o software MATLAB (Matrix Laboratory )


na verso 7.0, com os toolbox de redes neurais articiais e transformada wavelet. O anexo C
apresenta o software desenvolvido.

A leitura dos dados da BOVESPA foi realizada por meio de um algoritmo desenvolvido na
linguagem JAVA, na verso 5.0, com o objetivo de ler o arquivo binrio e convert-lo em um
formato de fcil leitura no software MATLAB.

5.7 Consideraes Finais

Este Captulo apresentou a tcnica proposta para o problema de predio de sries temporais
econmicas. A tcnica composta por dois mdulos principais, sendo um baseado no modelo
tcnico e outro no fundamentalista. A combinao desses dois modelos pode apresentar melhores
resultados em relao as tcnicas que fazem uso de apenas um dos modelos. Apresentou-se as
42

medidas de avaliao de erro de predio por meio das equaes 5.6, 5.7 e 5.8.
43

Captulo 6

Resultados

6.1 Consideraes Iniciais

Neste Captulo so apresentados e discutidos os resultados obtidos com o mtodo proposto


para a predio de sries temporais econmicas. Deste modo, objetiva-se efetuar uma anlise da
ltragem de comportamentos aleatrios presentes na srie, da seleo de padres por meio do
algoritmo APS e avaliar a importncia de variveis fundamentalista na entrada da rede neural
articial. Os resultados so comparados com as tcnicas clssicas apresentadas no Captulo 2 e
com modelos de predio baseados em anlise tcnica.

6.2 Suavizao da Componente Aleatria das Sries

Conforme descrito no Captulo 3, aplica-se a transformada wavelet, sendo que para cada canal
h aplica-se o limiar universal (Equao 3.14) em cada nvel de decomposio. Experimentalmente
deniu-se que trs nveis de decomposio so sucientes para suavizar a componente aleatria.
Para a maioria das sries estudadas, a ltragem utilizando nveis maiores que trs, distorce parte
do comportamento da srie. A Figura 6.1 ilustra dois exemplos de suavizao.

Na Figura 6.1 so apresentados trechos das sries histricas de cotaes de preo mdio no
perodo de agosto a dezembro de 2005. Note que houve uma suavizao das altas freqncias
das sries, sendo que o efeito da suavizao lembra um alisamento polinomial. Entretanto, em
sries onde os picos so altos e estreitos, como a srie da Figura 6.1(c), a transformada wavelet
tambm consegue suavizar a srie.
44

1
Srie original
0.95 Srie filtrada pela transformada wavelet

0.9

0.85

0.8

0.75

0.7

0.65

0.6

0.55
0 50 100 150 200 250
Evoluo diria

(a) Filtragem da srie econmica das aes do Grupo Po de acar.

1
Srie original
Srie filtrada pela transformada wavelet

0.95

0.9

0.85

0.8

0.75

0.7
0 20 40 60 80 100 120 140 160
Evoluo diria

(b) Filtragem da srie econmica das aes do grupo ITAUSA.

1
Srie original
Srie filtrada pela transformada wavelet
0.9

0.8
Cotao normalizada

0.7

0.6

0.5

0.4

0 50 100 150 200 250 300 350


Evoluo diria

(c) Filtragem da srie econmica das aes da Embraer.

Figura 6.1: Filtragem das sries utilizando transformada wavelet.


45

possvel observar na Figura 6.1(c) que picos em intervalos de tempo curtos com baixas
freqncias no so cortados na ltragem, fato que no possvel utilizando transformada de
Fourier ou outra tcnica de alisamento. Os trechos especcos contendo alta freqncia so
suavizados, como por exemplo no intervalo de tempo de 0 a 100 da Figura 6.1(c), preservando
picos com baixa freqncia, como por exemplo no intervalo de tempo de 130 a 170 da Figura
6.1(c). Isto possvel devido capacidade de resoluo tempo-freqncia da transformada wavelet
descrita no Captulo 3.

6.3 Seleo de Padres Utilizando o APS

Como relatado na seo 5.3.1, o APS foi adaptado para o problema de predio de srie
temporais econmicas para selecionar os padres de treinamento mais representativo do compor-
tamento da srie estudada. Dois resultados da seleo de padres de treinamento por meio do
algoritmo APS em duas sries temporais econmicas diferentes so indicados na Figura 6.2.

4 4
x 10 x 10
3.5 3.5
Srie original
Srie original
Padres de treinamento
Padres de treinamento
3 3

2.5 2.5
Cotao

Cotao

2 2

1.5 1.5

1 1
0 500 1000 1500 0 200 400 600 800 1000 1200 1400
Evoluo diria Evoluo diria

(a) Srie original e padres selecionados para a (b) Srie original e padres selecionados para o
Coteminas. Ita.

Figura 6.2: Resultado da seleo de padres (Crculos vermelhos) por meio do algoritmo APS
nas sries da Coteminas e Ita.

No caso da srie da Coteminas, o algoritmo selecionou a maioria dos padres prximos aos
instantes de tempo t = 500 e t = 800. A matriz de padres continha inicialmente 1357 padres,
sendo que o melhor conjunto selecionado pelo APS em termos de RMSEP contm 50 padres,
proporcionando uma reduo da matriz de treinamento em torno de 96%. J para a srie do
Ita, o algoritmo APS selecionou padres bem prximos aos instantes de tempo a serem preditos.
A matriz de padres continha inicialmente 1422 padres de treinamento, sendo reduzido para 30
46

com o APS, ou seja, em termos percentuais 97% menor.

6.4 Combinando Modelo Tcnico e Fundamentalista

Com a srie suavizada aplica-se o teste SRCC da seo 5.4, para adio de variveis fun-
damentalistas. O resultado do teste SRCC com arredondamento para duas casas decimais de
preciso, e o resumo das variveis escolhidas para cada srie analisada mostrado na Tabela 6.1.

Tabela 6.1: Resultado do coeciente de Spearman para as variveis fundamentalistas.


v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11 Variveis selecionadas
C1 0,19 0,23 0,05 0,20 0,01 0,08 0,12 0,03 0,01 0,13 0,27 v1 , v2 , v4 , v7 , v10 e v11
C2 0,10 0,04 0,08 0,22 0,05 0,13 0,08 0,07 0,01 0,11 0,23 v1 , v4 , v6 , v10 e v11
C3 0,12 0,22 0,05 0,21 0,03 0,01 0,01 0,04 0,01 0,10 0,20 v1 , v2 , v4 , v10 e v11
C4 0,11 0,12 0,01 0,21 0,04 0,01 0,01 0,11 0,02 0,12 0,27 v1 , v2 , v4 , v8 , v10 e v11
C5 0,11 0,01 0,01 0,18 0,00 0,10 0,07 0,09 0,19 0,21 0,19 v1 , v4 , v9 , v10 e v11
C6 0,12 0,14 0,02 0,23 0,03 0,06 0,10 0,03 0,01 0,15 0,23 v1 , v2 , v4 , v4 , v10 e v11
C7 0,00 0,02 0,08 0,2 0,01 0,06 0,10 0,00 0,00 0,1 0,09 v1 , v2 e v11
C8 0,00 0,02 0,08 0,2 0,01 0,06 0,10 0,00 0,00 0,1 0,09 v1 , v2
C9 0,00 0,02 0,08 0,2 0,01 0,06 0,10 0,00 0,00 0,1 0,09 v4 , v6 ,v7 e v11
C10 0,00 0,00 0,00 0,0 0,01 0,00 0,00 0,00 0,00 0,1 0,00 nenhuma
C11 0,00 0,00 0,07 0,04 0,01 0,02 0,00 0,01 0,00 0,23 0,02 v10
C12 0,00 0,02 0,08 0,20 0,01 0,06 0,10 0,00 0,00 0,21 0,09 v4 e v10
C13 0,01 0,03 0,16 0,18 0,08 0,06 0,00 0,01 0,00 0,21 0,09 v10
C14 0,21 0,00 0,06 0,20 0,01 0,00 0,21 0,12 0,17 0,03 0,15 v1 , v7 e v11
C15 0,02 0,07 0,00 0,21 0,11 0,01 0,22 0,01 0,01 0,02 0,08 v4 e v7

onde C1 : Grupo Po de Acar, C2 : Grupo ITAUSA, C3 : Embraer, C4 : Compania Vale do rio doce, C5 :
Petrobrs, C6 : AMBEV, C7 : Natura, C8 : VIVO, C9 : TELESP, C10 : GOL, C11 : TAM, C12 : CPFL Energia, C13 :
Aracruz, C14 : Sadia e C15 : Coteminas.

Os resultados da Tabela 6.1 mostram que para cada srie econmica diferentes variveis
podem estar correlacionadas com o comportamento da srie. Para a srie do Po de Acar as
variveis v2 , v4 , v7 , v10 e v11 podem estar correlacionadas com o comportamento da srie e as
variveis v1 , v3 , v5 , v6 , v8 e v9 no apresentam contribuio signicativa para o comportamento
da srie do grupo Po de Acar. Entretanto para a srie da Petrobrs as variveis v1 , v4 , v6 ,
v10 e v11 podem estar correlacionadas com o comportamento da srie e v2 , v3 , v5 , v6 e v8 no.
Portanto, para cada srie econmica, diferentes variveis podem contribuir para a compreenso
do comportamento e consequentemente para sua estimao. Para cada srie temporal econmica
as variveis fundamentalistas escolhidas so adicionadas na entrada da rede neural para estimar
o comportamento futuro.

Entretanto para algumas sries analisadas o teste estatstico no foi capaz de identicar
qualquer relao para a maioria das variveis analisadas. Para a companhia GOL (C10 ), por
47

exemplo, nenhuma varivel fundamentalista adicionada ao conjunto de variveis VMT, no


contribuindo em nada com a modelagem dos dados. possvel que o intervalo de dados utilizados,
no seja o mais adequado, ou que para algumas sries, a mudana de indicadores econmicos
ocorre com um delay de tempo desconhecido, e no de forma imediata como alguns pesquisadores
sugerem. Outra possibilidade a de que as variveis fundamentalistas exeram inuncia em
determinados trechos da srie temporal econmica, sugerindo que o teste deva ser aplicado em
janelas de tempo t, ao invs da aplicao do teste de correlao sobre toda a srie.

As variveis fundamentalistas selecionadas compem o mtodo proposto no trabalho, que


ainda faz uso da transformada wavelet e do algoritmo APS, e seus resultados so comparados na
Tabela 6.2 com tcnicas clssicas como os modelos ARIMA e tcnico.

Tabela 6.2: Resultados RMSEP com tcnicas clssicas e a tcnica proposta. 1 Mtodo A: Modelo
ARIMA, 2 Metodo B: Modelo tcnico, 3 Metodo C: Modelo tcnico combinado com o modelo
fundamentalista.
Mtodo A1 Mtodo B2 Mtodo C3
RMSEP RMSEP RMSEP
(10[) (10[) (10[) (10[)
C1 5, 2 101 4, 1 102 1, 0 102 1, 8 102 (50) 2, 3 103 (50)
C2 8, 6 102 4, 1 102 1, 0 102 1, 8 102 (30) 2, 3 103 (30)
C3 9, 1 101 5, 1 101 3, 7 103 2, 9 101 (80) 2, 2 103 (80)
C4 1, 1 101 7, 9 102 3, 0 103 5, 6 102 (80) 1, 6 103 (80)
C5 9, 8 101 6, 9 101 2, 1 103 4, 0 101 (119) 9, 4 104 (119)
C6 1, 4 101 7, 8 101 4, 4 103 3, 3 101 (80) 2, 1 103 (80)
C7 3, 2 101 2, 6 101 5, 7 103 1, 9 102 (50) 4, 1 103 (50)
C8 8, 2 102 7, 3 102 2, 5 103 6, 8 102 (80) 1, 0 103 (119)
C9 7, 9 102 5, 3 102 6, 1 103 2, 2 102 (119) 5, 2 103 (119)
C10 3, 3 101 1, 2 101 9, 9 103 9, 7 102 (80) 8, 8 103 (80)
C11 9, 6 102 4, 2 102 3, 8 103 3, 5 102 (50) 3, 0 103 (50)
C12 5, 7 102 3, 8 102 9, 3 13 1, 9 102 (119) 4, 9 13 (119)
C13 2, 0 101 3, 4 10 2
4, 2 103 2, 4 102 (80) 5, 3 103 (80)
C14 6, 5 102 2, 9 10 2
4, 3 103 1, 8 102 (119) 2, 7 103 (119)
C15 2, 5 101 3, 7 10 2
7, 4 103 1, 7 102 (50) 2, 5 103 (50)

: Quantidade de padres selecionados pelo APS.


[: Quantidade de execues utilizadas para o clculo dos parmetros e .

Os resultados apresentados na Tabela 6.2 mostram que a predio com o modelo ARIMA tem
pouca habilidade de predio (Mtodo A), devido s limitaes da suposio de lineariedades
discutidas no Captulo 2. Os resultados obtidos com RNA (Mtodo B) so melhores, mas ainda
inferiores aos obtidos com o mtodo proposto (Mtodo C). Alguns resultados da predio do
modelo ARIMA e do mtodo proposto so apresentados nas Figura 6.3.
48

0.9 0.9

0.8 0.8

0.7 0.7
Cotao normalizada

Cotao normalizada
0.6 0.6

0.5 0.5

0.4 0.4

0.3 0.3

0.2 0.2
Srie original Srie real
0.1 0.1
Srie predita Srie predita
0 0
0 5 10 15 20 25 30 35 40 0 5 10 15 20 25 30 35 40
Evoluo diria Evoluo diria

(a) Predio da srie econmica do Grupo (b) Predio da srie econmica do Grupo
Po de Acar utilizando o modelo ITAUSA utilizando o modelo ARIMA.
ARIMA.

0.67 1
Srie Predita Srie Predita
0.66 Srie Original 0.98 Srie Original
0.65 0.96
Cotao normalizada

0.64
Cotao normalizada

0.94
0.63
0.92
0.62
0.9
0.61
0.88
0.6

0.59 0.86

0.58 0.84

0.82
0 5 10 15 20 25 30 35 40 0 5 10 15 20 25 30 35 40
Evoluo diria Evoluo diria

(c) Predio da srie econmica da Aracruz uti- (d) Predio da srie econmica do ITAUSA uti-
lizando o mtodo proposto. lizando o mtodo proposto.

0.78 0.92
Srie Predita Srie Predita
Srie Original Srie Original
0.76
0.9

0.74
Cotao normalizada

Cotao normalizada

0.88

0.72
0.86
0.7

0.84
0.68

0.82
0.66

0.64 0.8
0 5 10 15 20 25 30 35 40 0 5 10 15 20 25 30 35 40
Evoluo diria Evoluo diria

(e) Predio da srie econmica do Grupo Po (f) Predio da srie econmica da Cemig uti-
de Acar utilizando o mtodo proposto. lizando o mtodo proposto.

Figura 6.3: Predio de sries econmicas com o mtodo ARIMA e o mtodo proposto.
49

Finalmente, quando os trs mtodos so comparados, possvel notar que a adio de var-
iveis fundamentalistas e seleo de padres por meio do APS oferece em mdia uma melhora
de 76% em relao ao mtodo ARIMA e 47% em relao ao mtodo clssico baseado no modelo
tcnico e RNA. Alm disso, o uso do APS melhorou substancialmente o tempo de treinamento e
predio da RNA, em razo da reduo do nmero de padres de treinamento. A tcnica proposta
apresenta resultados pobres nas sries onde poucas variveis fundamentalista so adicionadas ao
modelo de dados utilizado na predio, oferecendo resultados similares ou inferiores ao mtodo B,
e pouco superiores ao mtodo A. O que leva a inferir que, de fato, as chamadas informaes fun-
damentalistas, so relevantes no estudo do problema de predio de sries temporais econmicas
de cotaes de aes de empresas estudadas neste trabalho.

Apesar de ser um modelo bastante utilizado por prossionais da rea de economia, o modelo
fundamentalista recebeu uma recente ateno da comunidade cientca da rea de predio de
sries. Entretanto, esta nova tendncia ainda no havia sido discutida e implementada nas
tcnicas de inteligncia articial como as redes neurais articiais.

6.5 Consideraes Finais

Neste Captulo foram apresentados os resultados obtidos com a tcnica proposta. Os resul-
tados foram comparados com os procedimentos de predio clssicos encontrados na literatura.
Demonstrou-se experimentalmente que a tcnica proposta possui uma capacidade de predio
melhor que as tcnicas tradicionais baseadas nos modelos tcnico e ARIMA.
50
51

Captulo 7

Concluses

Neste trabalho foi apresentado um mtodo de predio no linear de sries temporais econmi-
cas. O mtodo baseia-se no uso de ltro wavelet multiescala, modelos tcnicos e fundamentalista
de anlise de sries temporais econmicas e redes neurais articiais. As sries obtidas aps a
decomposio contm informaes sobre a tendncia da srie com o comportamento aleatrio
suavizado. Os resultados apresentados mostram que a transformada wavelet um ferramenta
eciente na suavizao da componente aleatria de sries temporais econmicas. O uso do algo-
ritmo de projees sucessivas na seleo de padres de treinamento, foi importante para reduzir
o tempo de treinamento da RNA, uma vez que o conjunto de padres foi reduzido de forma
considervel. Utilizando a RNA de Elman foi possvel fazer predies de cotaes futuras com a
adio de variveis fundamentalistas que inuenciam no comportamento da srie. A combinao
dos modelos tcnico e fundamentalista, caracterizado pela adio das variveis fundamentalistas
na srie histrica de preos apresentou um melhor resultado quando comparado com mtodos
tradicionais que so baseados somente no modelo tcnico.

7.1 Contribuies do Trabalho

Na anlise dos resultados obtidos foi possvel identicar algumas contribuies do trabalho
para a soluo do problema de predio de sries temporais econmicas. Os resultados apre-
sentados na tabela 6.2, indicam que no correto tratar uma srie econmica como uma srie
temporal pura, ou seja, fazer predies baseando-se somente em seu comportamento histrico. A
predies futuras sem variveis econmicas podem ser feitas, mas quais so as condies econmi-
cas pr-determinadas para estimar o comportamento futuro? Este trabalho demonstra que por
52

melhor que seja o mtodo de predio, extremamente relevante analisar os aspectos econmi-
cos relacionados ao problema. Essa abordagem foi inicialmente proposta no recente trabalho de
Lam (2004). Entretanto, este trabalho apresentou resultados similares aos do trabalho de Lam
(2004) em termos de erro de predio, porm com menos variveis fundamentalistas adicionadas
s sries, proporcionando um modelo mais robusto do que o proposto por Lam (Lam, 2004). Adi-
cionalmente, foi possvel constatatar que mtodos de seleo de variveis, podem ser aplicados ao
problema de seleo de padres de treinamento. O uso do APS para tal nalidade contituiu-se
em uma novidade na gama de aplicaes de tal mtodo.

Vale ressaltar tambm que as sries econmicas de pases subdesenvolvidos ou em desenvolvi-


mento so consideradas de comportamento hostil, ou seja, de difcil compreenso e predio
quando comparadas ao comportamento da maioria das sries econmicas obtidas em pases com
economia estvel.

7.2 Publicaes

A partir do estudo desenvolvido nesta dissertao de mestrado, foram elaborados dois artigos
cientcos, um j publicado na Lecture Notes in Computer Science (SOARES, A. S., PAIVA,
M. S. V, COELHO, C. J. Technical and Fundamental Analysis for the Forecast of Financial
Scrip Quotation: An Approach Employing Articial Neural Networks and Wavelet Transform.
SPRINGER - LECTURE NOTES IN COMPUTER SCIENCE, v.4493, p.1024 - 1032, 2007.) e
outro que na data da defesa desta dissertao encontrava-se em fase nal de reviso e submisso
com o ttulo provisrio Features Selection Based on Sucessive Algorithm Projections for Articial
Neural Networks in Financial Time Series Forecasting.

Os resultados tambm contribuiram em um captulo do livro Redes Neurais Articiais para


Engenheiros e Cientistas, de autoria do Professor Doutor Ivan Nunes da Silva, professor asso-
ciado do departamento de Engenharia Eltrica da Escola de Engenharia Eltrica de So Carlos,
na Universidade de So Paulo, que encontra-se em fase nal de publicao.

7.3 Limitaes

Apesar do uso do teste estatstico SCRC para a seleo das variveis fundamentalistas, o
limiar de deciso estabelecido constitui um ponto crtico. No foi estabelecido um teste de
53

hiptese para a incluso ou no da varivel.

O uso comercial do mtodo de predio deve levar em considerao critrios como desconto
de risco, taxa de mobilidade de capital para se comprar ou vender uma ao e clculo de incerteza
sobre a predio realizada.

7.4 Trabalho Futuros

A partir do desenvolvimento e apresentao dos resultados deste trabalho, foi possvel obser-
var algumas sugestes de trabalhos futuros:

O estudo de novas variveis fundamentalistas poder ser continuado.

Aprimoramento do ltro wavelet de suavizao da srie.

Uso de tcnicas de agrupamento de aprendizagem de mquina como bagging e subbaging.

Aprimorar o critrio de seleo de variveis, como por exemplo o uso de um teste estatstico
de hiptese nula de que a varivel ou no co-relacionada com a srie.

Aplicar o critrio de seleo de variveis sobre trechos da srie e no em toda a srie.


54
55

Referncias Bibliogrcas

Al-Deehani, T. M. (2006). Seasonality as an unobservable component: the case of kuwait stock


market. Applied Financial Economics 16 (6), 471478(8).

Al-Saad, K. (2005). Seasonality in stock returns: evidence from an emerging market. Applied
Financial Economics 15 (1), 6371.

Anastasiadis, A. D., G. D. Magoulas, e M. N. Vrahatis (2004). New globally convergent training


scheme based on the resilient propagation algorithm. Neurocomputing 64, 253270.

Arajo, M. C. U., T. C. B. Saldanha, R. K. H. Galvo, T. Yoneyama, H. C. Chame, e V. Visani


(2001). The successive projections algorithm for variable selection in spectroscopic multicom-
ponent analysis. Chemometrics and Intelligent Laboratory Systems 57 (2), 6573.

Attia, J. O. (1999). Fourier Analysis: Electronics and Circuit Analysis using MATLAB. Boca
Raton: CRC Press LLC.

Aussem, A. e F. Murtagh (1997). Combining neural network forecast on wavelet-transformed


time series. Connection Science 9 (1), 113122.

Box, G. e G. Jenkins (1976). Time series analysis, forecasting and control. Rev. Ed. San
Francisco: Holden Day .

Box, G., G. M. Jenkins, e G. Reinsel (1976). Time Series Analysis: Forecasting and Control (2
ed.). Prentice Hall.

Bracewell, R. N. (1988). Fast Fourier Transform and Its Applications (1 ed.). Prentice Hall.

Brown, S. J., W. N. Goetzmann, e A. Kumar (1998). The dow theory: William peter hamilton's
track record reconsidered. The Journal of Finance 53 (4), 13111333.
56

Cajueiro, D. O. e B. M. Tabak (2005). Possible causes of long-range dependence in the brazilian


stock market. Physica A: Statistical Mechanics and its Applications 345 Pages 635-645.(3),
635645.

Cerqueti, R. e G. Rotundo (2003). Microeconomic modeling of nancial time series with long
term memory. Proceedings of IEEE International Conference on Computational Intelligence
for Financial Engineering , 191198.

Claerbout, J. F. (1999). Fourier Transforms and Waves: in four lectures. Stanford University.

Clarke, B. (2000). Fourier Theory. Macquarie University.

Connor, J. T., R. D. Martin, e L. E. Atlas (1994). Recurrent neural networks and robust time
series prediction. IEEE Transactions on Neural Networks 5 (2), 240.

Daubechies, I. (1990). The wavelet transform, time-frequency localization and signalanalysis.


IEEE Transaction on Information Theory 36 (5), 9611005.

Dayho, J. E. (1990). Neural Network Architectures. Van Nostrand Reinhold.

Dhatt, M. S., Y. H. Kim, e S. Mukherji (1999a). Relations between stock returns and fundamental
variables: evidence from a segmented market. Asia-Pacic Financial Markets 6, 221233.

Dhatt, M. S., Y. H. Kim, e S. Mukherji (1999b). Relations between stock returns and fundamental
variables: Evidence from a segmented market. Asia-Pacic Financial Markets 6, 221233.

Diniz, H., L. de Andrade, A. de Carvalho, e M. de Andrade (1999). Architecture desgign of


articial neural networks based on box and jenkins models for time series prediction. Third
Internacional Conference on Computational Intelligence and Multimedia Applications , 2934.

Donoho, D. L. (1995). De-noising by soft-thresholding. IEEE Transactions on Information


Theory 41 (3), 613627.

Downie, T. e B. Silverman (1998). The discret multiple wavelet transform and thresholding
methods. IEEE Transactions on Information Theory 46 (9), 25582561.

Elliott, D. F. e K. R. Rao (1982). Fast Transforms: Algoritms, Analyses and Applications.


Florida - EUA: Academic Press, INC.

Elman, J. L. (1990). Finding structure in time. Cognitive Science 14 (1), 17921.


57

Fryzlewicz, P. Z. (2003). Wavelet Techniques for Time Series and Poisson Data. Tese de
doutorado, University of Bristol.

Galvo, R. K. H., T. C. B. Saldanha, T. Yoneyama, e M. C. U. D. Arajo (1999). Uma tcnica


para a reduo de cardinalidade de padres de entrada de uma rede neural articial. Proceedings
of the IV Brazilian Conference on Neural Networks , 124129.

Gencay, R., B. Whitcher, R. Gengay, e F. Selguk (2001). An Introduction to Wavelets and Other
Filtering Methods in Finance and Economics. Academic Press.

Granger, C. W. J. e M. J. Morris (1976). Time series modelling and interpretation. Journal of


the Royal Statistical Society 139 (2), 246257.

Grossberg, S. (1988). Nonlinear neural networks: Principles, mechanisms, and architectures.


Neural Networks 1 (1), 1761.

Grppo, G. S. (2004). Causabilidade das variveis macroeconmicas sobre o ibovespa. Maters


thesis, Escola Superior de Agricultura Luiz de Queiroz - Universidade de So Paulo, Piracicaba
- SP - Brasil.

Gurgul, H., R. Mestel, e C. Chleicher (2003). Stock market reactions to dividend announce-
ments: empirical evidence from the austrian stock market. Financial markets and portfolio
management 17 (3), 332350.

Hamilton, J. D. (1954). Time Series Analysis. New Jersey - USA: Princeton University Press.

Harrison, P. e C. Stevens (1976). Bayesian forecasting. Journal of The Royal Statistical Soci-
ety 38 (3), 205267. Series B.

Harvey, A. C. e P. Todd (1983). Forecasting economic time series with structural and box-jenkins
models: A case study. Journal of Business and Economic Statistics 1 (4), 299.

Haykin, S. (2001). Redes Neurais: Princpios e Prticas (2 ed.). Bookman.

Hernandez, E. e G. Weiss (1996). A First Course on Wavelets. CRC Press.

Hotta, L. K. (1988). Seasonal adjustment of brazilian time series. Journal of Econometrics 8 (1),
8395.

Huang, S.-J. e C.-T. Hsieh (2002). Coiet wavelet transform applied to inspect power
systemdisturbance-generated signals. IEEE Transactions on Aerospace and Electronic Sys-
tems 38 (1), 204210.
58

Ingle, V. K. e J. G. Proakis (2000). Digital Signal Processing. Bookware Companion Series.


Northeastem University: Brooks/Code Publishing Company.

Jaeger, R. M. (1990). Statistics: A Spectator Sport (Secord Edition ed.). London - U.K: Sage
Publications Inc.

Jain, L. (2001). Recurrent Neural Netoworks: Design and Applications. Departments of Physics
and Computer Science and Information Systems American University Washington, D.C.: CRC
Press.

Jang, G. S. (1991). An intelligent stock portfolio management system based on short-term trend
prediction using dual-module neural networks. International Conference on Articial Neural
Networks 1, 447452.

Kaiser, G. (1994). A Friendly Guide to Wavelets. University of Massachusetts at Lowell - USA:


Birkhuser.

Kedem, B. e K. Fokianos (2002). Regression Models for Time Series Analysis. University of
Maryland and Cyprus: John Wiley Sons.

Kolen, J. (1994). Exploring the Computational Capabilities of Recurrent Neural Networks. Ph.d.
thesis, The Ohio State University, USA.

Koskela, T., M. Lehtokangas, J. Saarinen, e K. Kaski (1996). Time series prediction with multi-
layer perceptron.

Kremer, S. (1995). On the computational power of elman-style recurrent networks. IEEE Trans.
on Neural Networks 6 (4), 10001004.

Lam, M. (2004). Neural network techniques for nancial performance prediction: integrating
fundamental and technical analysis. Decision Support Systems 37 (4), 567581.

Lameira, V. J. (2003). Negcios em Bolsas de Valores: Estratgias para Investimentos. Alaude.

Leonard, J. e M. A. Kramer (1990). Improvement of the backpropagation algorithm for training


neural networks. Computers chemical Engineer 14 (3), 337341.

Leybourne, S. J., B. P. M. McCabe, e A. R. Tremayne (1996). Can economic time series be


dierenced to stationarity? Journal of Business & Economic Statistics 14 (4), 43546.
59

Mallat, S. (1989a). A theory for multiresolution signal decomposition: The wavelet representa-
tion. IEEE Transaction on Pattern Analysis and Machine Intelligence 11 (7), 674693.

Mallat, S. (1999). A Wavelet Tour of Signal Processing (2 ed.). Academic Press.

Mallat, S. G. (1989b). A theory for multiresolution signal decomposition : The wavelet repre-
sentation. IEEE Transactions on Pattern Analysis and Machine Intelligence 11 (7), 647693.

Malliavin, P. e M. E. Mancino (2002). Fourier series method for measurement of multivariate


volaties. Finance and Stochastics 6 (1), 4961.

Matsuba, I. (1991). Neural sequential associator and its application to stock price prediction.
IECON 91 2, 14761479.

McCabe, B. P. M. e A. R. Tremayne (1995). Testing a time series for dirence stationarity. The
Annals of Statistics 23 (3), 10151028.

Mead, R. (1990). The Design of experiments: statistical principles for practical applications.
Cambridge University Press.

Mertins, A. (1996). Signal Analysis: Wavelets, Filter Banks, Time-Frequency Transforms and
Applications. University of Wollongong - Australia: John Wiley Sons.

Meyer, Y. (1993a). Wavelets: Algorithms and Applications. Society for Industrial and Applied
Mathematic.

Meyer, Y. (1993b). Wavelets: Algorithms and Applications. Society for Industrial and Applied
Mathematics. Philadelphia.

Morlet, J., A. Grossman, e R. Kronland-Martinet (1989). Reading and Understanding Continuous


Wavelet Transforms in Wavelets, Time-Frequency Methods and Phase Space. Marseille, France:
Springer.

Murphy, J. J. (1991). Intermarket Technical Analysis (Wiley Finance Editions ed.). New York:
John Wiley Sons.

Nagano, M. S., E. M. Merlo, e M. C. da Silva (2003). The fundamental variables and yours
impacts in scrips return tax in brazil. FAE 6 (2), 1328.

Niska, H., M. Heikkinen, e M. Kolehmainen (2006). Genetic algorithms and sensitivity analysis
applied to select inputs of a multi-layer perceptron for the prediction of air pollutant time-
series. Lecture Notes in Computer Science 4224, 224231.
60

O. Nerrand, P. Roussel-Ragot, L. P. G. D. (1993). Neural networks and nonlinear adaptive


ltering: Unifying concepts and new algorithms. Neural Computation 5 (2), 165199.

Osborn, C. E. (2006). Statistical Applications for Health Information Management (Second


Edition ed.). Jones and Bartlett.

Pereira, B. B. (1945). Anlise Espectral de Sries Temporais - Uma introduo para Engenharia,
Economia e Estatstica (1 ed.). Rio de Janeiro - Brasil: Arte Final Leasing Editorial LTDA.

Phillips, P. C. (1992). Bayes models and forecasts of australian macroeconomic time series.
Cowles Foundation Discussion Papers 1024, Cowles Foundation, Yale University. available at
http://ideas.repec.org/p/cwl/cwldpp/1024.html.

Pole, A. (1994). Applied Bayesian Forecasting and Time Series Analysis (1 ed.). Crc Press.

Pole, A., M. West, e J. Harrison (1996). Applied bayesian forecasting and time series analysis.
The Statistician 45 (1), 136137.

Pontes, M. J. C., R. K. H. Galvo, , M. C. U. de Arajo, P. N. T. Nogueira, O. D. P. Neto, G. E. J.


Teresa, e C. B. Saldanha (2005). The successive projections algorithm for spectral variable
selection in classication problems. Chemometrics and Intelligent Laboratory Systems 78 (1),
1118.

Qi, M. (1999). Nonlinear predictability of stock returns using nancial and economic variables.
Journal of Business and Economic Statistics 17 (4), 419429.

Racine, J. (2001). On the nonlinear predictability of stock returns using nancial and economic
variables. Journal of Business and Economic Statistics, 19 (3), 380382.

Raymer, P. M. L., W. F. Goodman, L. A. Kuhn, e A. K. Jain (2000). Dimensionality reduction


using genetic algorithms. IEEE Transactions on Evolutionary Computation 4 (2).

Renaud, O., J. Starck, e F. Murtagh (2005). Wavelet-based combined signal ltering and pre-
diction. IEEE Transaction on Systems, Man and Cybernetics 35 (6), 12411251.

Riedmiller, M. e H. Braun (1993). A direct adaptive method for faster backpropagation learning:
therprop algorithm. IEEE International Conference on Neural Networks 1, 586591.

Rumelhart, D. E. e J. L. McClelland (1986). Parallel Distributed Processing, Volume 1. The


MIT Press.
61

Russell, S. J. e P. Norvig (1995). Articial Intellligence: a modern approach. New Jersey:


Prentice-Hall Inc.

S, G. T. (1997). Mercado de Aes e Bolsas de Valores. Rio de Janeiro - Brasil: Aplicao


Editora Tcnica Ltda.

Saad, E. W., D. V. Prokhorov, e D. Wunsch (1998). Comparative study of stock trend predicion
using time delay, recurrent and probabilistic neural networks. IEEE Transactions on Neural
Networks 9 (6), 14561470.

Soltani, S. (2002). On the use of the wavelet decomposition for time series prediction. Neuro-
computing 48, 267277.

Spall, J. (1988). Bayesian Analysis of Time Series and Dynamic Models (1 ed.). Marcel Dekker.

Tavares, M. e M. Fonseca (1987). Anlise tcnica - Avaliao de Investimentos. Rio de Janeiro:


IBMEC.

Temizel, T. T. e K. Ahmad (2005). Are arima neural network hybirds better than single models?
Proceedings of International Joint Conference on Neural Networks 5, 31923197.

Walczak, S., I. Yegorova, e B. H. Andrews (2003). The eect of training set distributions for
supervised learning articial neural networks on classication accuracy. Information manage-
ment: support systems and multimedia technology , 93108.

Wang, J.-H. e J.-Y. Leu (1996). Stock market trend prediction using arima-based neural networks.
IEEE International conference on Neural Networks 4, 21602165.

Weigend, A. S., B. A. Huberman, e D. E. Rumelhart (1990). Predicting the future a connectionist


approach. International Journal of Neural Systems 1, 193209.

White, H. (1988). Economic prediction using neural networks: the case of ibm dailystock returns.
IEEE Internacional conference on Neural Networks 2, 451458.

Williams, R. J. e D. Zipser (1989). A learning algorithm for continually running fully recurrent
neural networks. Neural Computation 1, 270280.

Yao, J., C. L. Tan, e H.-L. Poh (1999). Neural networks for technical analysis: A study on klci.
International Journal of Theoretical and Applied Finance 2 (2), 221241.

Zancop, G. J. (2000). O que bolsa de valores. Editora Brasiliense.


62

Zhang, J. e A. J. Morris (1995). Dynamic process modeling using locally recurrent neural net-
works. Proceedings of the American Control Conference 4, 27672771.
63

Apndice A

Layout do arquivo de Dados da


BOVESPA

Cada arquivo disponibilizado pela BOVESPA contm informaes como nome e cdigo da
empresa, cdigo da ao, cdigo ISIN, tipo de mercado (a vista, termo, opes), especicao
(ON/PN), preos (anterior, abertura, mnimo, mdio, mximo, fechamento), quantidade de neg-
cios e volume negociado com o papel, dentre outros dados disponveis.

Aps a obteno do arquivo necessria a utilizao de um layout para a interpretao dos


dados extrados no formato .txt. possvel tambm a utilizao de planilhas em Excel. O layout
dividido em duas partes: cabealho e dados.

A.0.1 Cabealho

Tipo de registro Fixo 00 N(02) 01 02


Nome do arquivo Fixo COTAHIST.ANO X(13) 03 15
Cdigo da origem Fixo BOVESPA X(08) 16 23
Data da gerao do arquivo Formato AAAAMMDD N(08) 16 23
Reserva Preencher com brancos X(214) 32 245
64

A.0.2 Dados

Nome do campo - descrio Contedo Tipo e Pos. Pos.


tamanho ini- nal
cial
TIPREG - Tipo de registro Fixo 01 N(02) 01 02
Data do prego Formato AAAAM- N(02) 03 10
MDD
CODBDI - Cdigo BDI Utilizado para classi- X(02) 11 12
car as aes na emisso
do boletim dirio de in-
formaes
CODNEG - Cdigo de negociao X(12) 13 24
TPMERC - Tipo de mercado Cd. do mercado N(03) 25 27
em que a ao est
cadastrado
NOMRES - Nome resumido da em- X(12) 28 39
presa
ESPECI - Especicao do papel X(10) 40 49
PRAZOT - Prazo em dias X(03) 50 52
MODREF - Moed de referncia Moeda usada na data do X(04) 53 56
prego
PREABE - Preo de abertura da (11)V99 57 69
ao
PREMAX - Preo mximo da ao (11)V99 70 82
PREMED - Preo mdio da ao (11)V99 83 95
PREULT - Preo do ltimo negcio (11)V99 96 108
PREOFC - Preo da melhor oferta (11)V99 109 121
de compra
PREOFV - Preo da melhor oferta (11)V99 135 147
de venda
65

Nome do campo - descrio Contedo Tipo e Pos. Pos.


tamanho ini- nal
cial
TOTNFG - Nmero de negcios da N(05) 148 152
ao no dia
QUATOT - Quantidade de negcios N(18) 153 170
total
VOLTOT - Volume total da ao (16)V99 171 188
PREEXE - Preo para o mercado de (11)V99 189 201
opes
INDOPC - Indicador de correo de N(01) 202 202
preos
DATVEN - Data do vencimento formato N(08) 203
para mercado de opes AAAAM-
MDD
FATCOT - Fator de cotao 1 para Unitria e 1000 N(07) 211 217
para lote de mil
PTOEXE - Preo para opes em (07)V06 218 230
dlar
CODISI - Cdigo do papel no sis- X(12) 231 242
tema ISIN
DISMES - Nmero de distribuio 9(03) 243 245
da ao
66
67

Apndice B

Descrio das variveis fundamentalista


utilizadas

Valor de mercado: o ltimo preo pago por cada ao da empresa vezes o nmero total
de ttulos disponveis.

Lucro lquido: o total de vendas brutas da empresa subtrado pelo custo das mercadorias
vendidas, das despesas variveis e das despesas xas.

Taxa de juro bsica: a taxa xada pelo banco central, que serve de referncia para o
clculo do custo do dinheiro para emprstimos bancrios.

ndice BOVESPA: O ndice Bovespa um somatrio dos pesos (quantidade terica da


ao multiplicada pelo ltimo preo da mesma) das aes integrantes de uma carteira terica
formada pelas aes mais importantes da BOVESPA. Assim sendo, pode ser apurado, a qualquer
momento, por meio da Equao B.1.

n
X
Ibovespa = P (i)Q(i) (B.1)
i=1

onde n o nmero total de aes componentes da carteira terica, P o ltimo preo da ao e


Q a quantidade terica da ao i.

ndice de preos ao consumidor: O ndice de preos ao consumidor mede a variao de


preos para o consumidor com base nos gastos de quem ganha de um a vinte salrios mnimos,
ou seja, a grande maioria da populao. Este ndice importante pois se os preos variam muito
68

h risco de inao e consequentemente o risco de indicadores econmicos piores.

Mobilidade de capital: Mede o quanto a empresa est preparada nanceiramente para


atender gastos ou investimentos no programados. Uma empresa que tem mobilidade de capital
alto bem vista pelo mercado pois est preparada para eventuais emergencias em casos de crises
econmicas internas ou externas.

Risco pas: O Risco pas um mtodo mundialmente reconhecido que classica o risco
em se investir em um determinado pas. O risco determinado levando-se em considerao
diversos indicadores econmicos, nanceiros e polticos do pas como por exemplo dcit scal,
crescimento da economia, solidez das instituies, etc. O risco-pas funciona como termmetro
que mede a desconana dos investidores quanto ao cumprimento ou no do reembolso prometido
pelo devedor (no caso o pas) na data de vencimento dos ttulos por ele emitidos. Em outras
palavras, o investidor est interessado em quanto deveria ser recompensado por aplicar em papis
que embutem certa possibilidade de calote. Considerando-se o risco dos Estados Unidos como
zero, a taxa paga pelo governo desse pas ser a base comparativa de clculo utilizada pelo
investidor. Vrias instituies fazem o clculo do risco pas como por exemplo, Standard and
Poors, Moody's, JP Morgan, dentre outros.
69

Apndice C

Software de Predio

O software de predio foi criado a partir da necessidade de testar as tcnicas propostas no


problema de predio de srie temporais econmicas. Em uma primeira verso, o software era
executado em linha de comando, sendo que a interface grca apresentada na gura C.1, foi
desenvolvida especialmente para a apresentao nesta dissertao.

Figura C.1: Software de predio desenvolvido no MatLab.

O menu de seleo da srie econmica, permite ao usurio selecionar qual srie ser utilizada
70

no software. O menu de mtodo, permite ao usurio selecionar qual tipo de mtodo ser em-
pregado na predio, sendo que o resultado ser plotado em um grco de resultado esperado
versus resultado do mtodo.

Figura C.2: Exemplo de Resultado Obtido no Software de predio.