Você está na página 1de 10

XIV Encontro de modelagem Computacional

II Encontro de Ciência e Tecnologia de Materiais


Instituto Politécnico (IPRJ), Campus Regional da UERJ, Nova Friburgo/RJ, Brasil. 22-24 nov. 2011.
Associação Brasileira de Engenharia e Ciências Mecânicas – ABCM

ESTUDO COMPARATIVO UTILIZANDO REDE NEURAL PARA A PREVISÃO DE


TENDÊNCIAS EM UMA SÉRIE TEMPORAL FINANCEIRA

Gustavo Peixoto Hanaoka – gustavopph@gmail.com


Bruno Barroso – bbarrosobh@gmail.com
Felipe Dias Paiva – fpaiva@dcsa.cefetmg.br
Rodrigo Tomás Nogueira Cardoso – rodrigoc@des.cefetmg.br

Centro Federal de Educação Tecnológica, Modelagem Matemática e Computacional (MMC)


Av. Amazonas, 7675, 30510-000, Belo Horizonte, MG, Brasil.

Resumo: Este trabalho compara a utilização dos modelos de Redes Neurais Artificiais
Multi-Layer Perceptron, Elman e Narx, para a previsão de tendências em uma série
temporal utilizando os valores do ativo da Petrobrás (PETR4). É feita uma introdução
resumida das Redes Neurais Artificiais, e utilizando o Software MatLab são feitos
experimentos que consistem em treinamento e simulação da rede. Os resultados são
avaliados através da média e do desvio padrão dos índices de EMQ (Erro Médio
Quadrático), POCID (Percentage of Change in Direction), U de Theil r 2 e (Coeficiente de
Correlação), dispostos em tabelas e gráficos.

Keywords: Redes Neurais Artificiais (RNAs), Séries Temporais, Mercado Financeiro.

1. INTRODUÇÃO

A capacidade das Redes Neurais Artificiais (RNAs) de aproximarem funções complexas


não lineares, ainda que descontínuas, cria a esperança de se construir modelos cada vez mais
robustos capazes de gerarem resultados mais próximos da realidade.
De fato, no caso das séries temporais do mercado financeiro, que apresentam dados, em
geral, ruidosos e/ou caóticos, o emprego de RNAs tem se mostrado uma alternativa bastante
interessante.
Diante disso, os modelos de RNAs vêm sendo muito estudados como método para análise
e previsão de séries de ativos financeiros. Segundo (Mendenhall apud Abelém, 1994),
sucintamente pode-se definir uma série temporal como qualquer conjunto de observações
ordenadas no tempo.
Nesse trabalho, pretende-se fazer um estudo comparativo entre algumas arquiteturas da
rede, utilizando o Software MatLab R2010b, para previsão de tendências em uma série
temporal referente aos ativos da Petrobrás no período de 01 de fevereiro de 2008 a 11 de
novembro de 2010, código PETR4.
Desejamos, dessa forma, obter resultados que auxiliem trabalhos futuros envolvendo a
análise de séries temporais financeiras através da utilização de RNAs, buscando identificar o
melhor modelo para o estudo de séries dessa natureza
XIV Encontro de modelagem Computacional
II Encontro de Ciência e Tecnologia de Materiais
Instituto Politécnico (IPRJ), Campus Regional da UERJ, Nova Friburgo/RJ, Brasil. 22-24 nov. 2011.
Associação Brasileira de Engenharia e Ciências Mecânicas – ABCM

2. MERCADO FINANCEIRO: aleatório ou previsível?

O conceito de mercado eficiente protagoniza ainda hoje intensos debates na comunidade


acadêmica. Inúmeros estudiosos já se dedicaram à procura de dados passados que permitam
explicar e inferir valores futuros do mercado acionário, possibilitando, assim, ganhos
extraordinários. Contudo, apesar da grande quantidade de estudos, nada de revolucionário foi
descoberto, o que faz com que a teoria de mercados eficientes se torne base para muitas outras
teorias da administração financeira.
Segundo (Fama, 1991), a hipótese de mercado eficiente se comprova quando os preços
das ações refletem toda a informação disponível. (Alexander, 2000) complementa afirmando
que “a market is efficient with respect to particular set of information if it is impossible to
make abnormal profits (others than by chance) by using this set of information to formulate
buying and selling decisions”.
De acordo com (Brealey, 1998), caso o mercado de capitais seja eficiente, a “compra ou
venda de qualquer valor mobiliário ao preço vigente no mercado nunca será uma transação
com valor presente líquido positivo”. Ou seja, segundo os preceitos teóricos da Hipótese de
Mercado Eficiente (HME), a tarefa de prever preços futuros tendo como base
comportamentos passados de um ativo financeiro é um procedimento ineficaz, uma vez que a
distribuição de uma série financeira denota de um movimento browniano, que é concebido
por características randômicas e independentes.
Contudo, tal como a base dos estudos do biólogo Robert Brown (a teoria do movimento
browniano tem esse nome em sua homenagem), que trata do caminho aleatório de partículas
macroscópicas num fluído, foi contestada pelas ideias conceituais dos fractais, a distribuição
White Noise de uma série temporal de ativos financeiros também é questionada. Um dos
estudos de maior impacto nessa área é apresentado pelo americano Edgar E. Peters, que
adaptou o modelo desenvolvido na metade do século XX por Harold E. Hurst para avaliar o
comportamento randômico de uma série temporal financeira.
O estudo do hidrólogo Hurst teve como cenário de discussão as cheias do Rio Nilo. Seu
objetivo foi verificar se havia um padrão de memória ligada a esses eventos ou se estes
acontecimentos não passavam de eventos aleatórios independentes. Esses estudos, então,
culminaram no desenvolvimento da estatística conhecida como Coeficiente de Hurst (H).
Calculado o expoente Hurst, ter-se-á as seguintes possibilidades de resultado:
0H 0,5 : série antipersistente, há uma probalidade maior que 50 de um valor negativo
ser precedido de um positivo; H =0,5 : série apresenta randon walk; H 0,5 : série
persistente, há probabilidade de repetição de um valor concentra acima dos 50%. Sendo
assim, justifica-se precificar ativos financeiros com base em dados históricos, quando o
coeficiente de Hurst indicar um valor diferente de 0,5 .

3. REDES NEURAIS ARTIFICIAIS (RNAs)

Redes neurais artificiais são modelos matemáticos e computacionais que se assemelham


às estruturas neurais biológicas e que tem capacidade computacional de aprendizado e
generalização. Seu aprendizado se dá pela capacidade do modelo adaptar parâmetros ao meio
externo e melhorar gradativamente seu desempenho. Já a capacidade de generalizar é dada a
partir da utilização dos parâmetros ótimos após conclusão da aprendizagem (Braga, 2003).
Com inspiração no funcionamento das Redes Neurais Biológicas, o nascimento deste campo é
XIV Encontro de modelagem Computacional
II Encontro de Ciência e Tecnologia de Materiais
Instituto Politécnico (IPRJ), Campus Regional da UERJ, Nova Friburgo/RJ, Brasil. 22-24 nov. 2011.
Associação Brasileira de Engenharia e Ciências Mecânicas – ABCM

atribuído ao estudo no ano de 1943 dos pesquisadores McCulloch e Pitts, que fizeram a
primeira tentativa de criação de um modelo artificial de neurônio.
Desde então, várias metodologias foram criadas e vários temas dentro das RNAs vem
sendo estudadas e utilizadas nas mais diversas áreas. As redes neurais Perceptron e MLP
(Multi-Layer Perceptron) realizam sua aprendizagem através de treinamento supervisionado,
buscando através do ajuste de parâmetros a convergência em um número finito de iterações.
Segundo (Cybenko, 1989) a utilização de RNAs com uma camada intermediária pode
aproximar qualquer função contínua, já a utilização de duas camadas intermediárias permite a
aproximação de qualquer função matemática mesmo que descontínua.

3.1 Multi-Layer Perceptron

De acordo com (Valença, 2009) o Perceptron proposto por Rosenblatt é o modelo de rede
neural de menor complexidade computacional. Sucintamente, esse tipo de rede é útil para
mapear padrões em valores distintos e resolver problemas linearmente separáveis nos quais os
dados de treinamento pertencem a duas classes distintas.
As redes Perceptron Multi-Camadas (Multi-Layer Perceptron) são RNAs que possuem
além da camada de entrada e saída, camadas intermediárias de neurônios.
São justamente estas camadas as responsáveis pela aproximação de funções não-lineares.
Uma rede MLP com quatro entradas, 2 camadas intermediárias e 1 camada de saída é
apresentada na Fig. 1 acima.
Os valores de entrada para a camada intermediária são dados pelo soma ponderada dos
pesos multiplicada pelos valores de entrada, e assim sucessivamente, ou seja, a entrada de
uma camada posterior é igual à soma ponderada dos pesos pelos valores de saída da camada
anterior.
Uma rede MLP com uma camada escondida pode aproximar qualquer função contínua, e
uma MLP com 2 camadas escondidas é capaz de aproximar qualquer função não linear
mesmo que descontínua.
O algoritmo mais comumente utilizado para o treinamento desta rede é o
backpropagation. A ideia principal do backpropagation é retropropagar o erro cometido na
camada de saída para as camadas anteriores, com o objetivo de mudar os pesos sinápticos a
cada iteração e assim adequar a saída aos padrões de treinamento.

3.2 Rede Recorrente de Elman

Diferente da rede MLP, onde o fluxo de sinais se dá unicamente da camada de entrada


para a camada de saída, nas redes recorrentes, há fluxo de sinais que “realimentam” as
entradas, ou seja, o sinal de saída é tomado como entrada em dado ponto.
A Rede Elman, ou rede recorrente simples, foi descrita em (Elman, 1990) e é uma rede
em que a realimentação capacita a realização de tarefas que se estendem no tempo (Haykin,
2001). Esta característica das redes de Elman torna esta uma opção para análise de séries
temporais, já que há a capacidade de memorização.
Segundo (Haykin, 2001), nas redes de Elman os neurônios ocultos contêm conexões
recorrentes para uma camada de unidades de contexto que consiste de atrasos unitários. Os
XIV Encontro de modelagem Computacional
II Encontro de Ciência e Tecnologia de Materiais
Instituto Politécnico (IPRJ), Campus Regional da UERJ, Nova Friburgo/RJ, Brasil. 22-24 nov. 2011.
Associação Brasileira de Engenharia e Ciências Mecânicas – ABCM

neurônios ocultos têm assim um registro das suas ativações passadas, o que capacita a rede a
realizar tarefas de aprendizagem que se estendem no tempo.
Dessa forma, redes do tipo recorrente são de particular interesse na previsão de séries
temporais, já que a capacidade de realimentação capacita essas redes a reprocessar de forma
dinâmica o erro destas saídas.

3.3 Rede Narx (Nonlinear Autoregressive model process with eXogenous input)

Segundo (Diaconescu, 2008), a rede NARX (Nonlinar Autoregressive models with


eXogenous input) é uma poderosa classe de modelos que se mostram adequados para
modelagem de sistemas não lineares e especialmente séries temporais.
Uma qualidade importante das redes NARX é que o algoritmo de aprendizagem que
utiliza o gradiente-descendente se mostra mais eficaz nestas do que em outras redes, a
convergência é mais rápida e a qualidade de generalização é melhor.
Com a rede NARX podemos criar um Delay de entrada (input) e de feedback:

Figura 1: Rede Narx com 1:3 Input/Feedback Delay e 10 camadas


escondidas

4. METODOLOGIA

Neste trabalho foi utilizada a série PETR4, referente ao fechamento, abertura, mínimo e
máximo dos ativos da Petrobrás. Esta série é composta de 708 observações divididas em duas
partes: 637 pontos para treinamento, 70 pontos para simulação.
Foram utilizados oito índices para treinamento e simulação na tentativa de previsão do
valor de fechamento: abertura(1), fechamento(2), mínimo(3), máximo(4), sombra superior
(candlestick)(5), sombra inferior(6) (candlestick), corpo(7) (candlestick) e Ibovespa(8). A
numeração sobrescrita em cada índice representa de forma abreviada quais entradas estarão
sendo utilizadas. A tabela a seguir relaciona o tipo de entrada com o índice que a representa
ao longo do texto:

Identificação das Variáveis de Entrada


Índices 1 2 3 4 5 6 7 8
Variáveis Abertura Fechamento Mínimo Máximo Sombra Sup. Sombra Inf. Corpo Ibovespa
Tabela 1: Índices das entradas da rede

O candlestick é uma ferramenta para interpretar o movimento de preços das ações, seus
valores de sombra superior, sombra inferior e corpo são calculados pela diferença entre
XIV Encontro de modelagem Computacional
II Encontro de Ciência e Tecnologia de Materiais
Instituto Politécnico (IPRJ), Campus Regional da UERJ, Nova Friburgo/RJ, Brasil. 22-24 nov. 2011.
Associação Brasileira de Engenharia e Ciências Mecânicas – ABCM

máximo e o maior valor entre fechamento e abertura, mínimo e o menor valor entre
fechamento e abertura, fechamento e abertura, respectivamente.
Os parâmetros de abertura(1), fechamento(2), mínimo(3), máximo(4) e Ibovespa(8) foram
tratados (normalizados) com o ln (logaritmo natural) a fim de minimizar a variação entre estes
valores. Já os valores de candlestick (sombra superior (5), sombra inferior(6), corpo(7) foram
normalizados através da proporção de seus valores em relação ao tamanho total do candlestick
(máximo – mínimo).
Com estes dados organizados em uma tabela, foi gerado a matriz de correlação e um
dendrograma para auxiliar na escolha das entradas da rede com a intenção de minimizar o
tempo de execução dos experimentos e principalmente na melhoria dos resultados:

Correlação entre as variáveis de Entrada


1 2 3 4 5 6 7 8
1 1,0000 0,9928 0,9961 0,9971 -0,0834 0,0631 0,0148 0,7316
2 0,9928 1,0000 0,9961 0,9964 -0,0849 0,0736 0,0079 0,7333
3 0,9961 0,9961 1,0000 0,9948 -0,0569 0,0531 0,0025 0,7454
4 0,9971 0,9964 0,9948 1,0000 -0,0749 0,0449 0,0223 0,7216
5 -0,0834 -0,0849 -0,0569 -0,0749 1,0000 -0,1324 -0,6539 -0,0561
6 0,0631 0,0736 0,0531 0,0449 -0,1324 1,0000 -0,6634 -0,0057
7 0,0148 0,0079 0,0025 0,0223 -0,6539 -0,6634 1,0000 0,0467
8 0,7316 0,7333 0,7454 0,7216 -0,0561 -0,0057 0,0467 1,0000

Tabela 2: Correlação entre as variáveis de entrada da rede

Dendrograma dos Parâmetros de Entrada

250
Distância Euclidiana

200

150

100

50

0
1 4 2 3 5 6 7 8
Parâmetros de Entrada

Figura 2: Dendrograma para os dados de entrada.

Dessa forma, separamos as entradas em classes resultantes do dendrograma da Fig. 2 e os


dispomos na tabela a seguir, a fim de realizamos os testes com as entradas correspondentes a
diferentes classes, evitando a redundância de informação.

Divisão das Entradas em Classes


Classe 1 Classe 2 Classe 3
Índices PETR4 Índices Candlestick Índice Bovespa
Abertura Máximo Fechamento Mínimo Somb. Superior Somb. Inferior Corpo Ibovespa

Tabela 3: Separação das variáveis em classes

Como maneira de medir a qualidade da previsão, além da análise gráfica foram


consideradas outras quatro medidas.
EMQ (erro médio quadrático), dado pela fórmula:
XIV Encontro de modelagem Computacional
II Encontro de Ciência e Tecnologia de Materiais
Instituto Politécnico (IPRJ), Campus Regional da UERJ, Nova Friburgo/RJ, Brasil. 22-24 nov. 2011.
Associação Brasileira de Engenharia e Ciências Mecânicas – ABCM

n
1
EMQ= ∑  d − y 2
n 1 i i
(1)

POCID (percentage of change in direction), que mede a previsão em termos de mudanças


de sinais, ou seja, indica o quanto a previsão acompanhou a tendência da série real:
n
1
POCID= ∑ ai
n n−1
(2)
onde:
a i=1, se y i−1 x d i −10 ; a=0, caso contrário

U de Theil, que indica quanto os resultados estão melhores que a previsão trivial de dizer
que a melhor estimativa para o preço de amanhã é o preço de hoje (Abelém, 1994).
Qualquer valor inferior a 1 indica que é melhor usar a projeção do que se ater à previsão
trivial.


n
∑  d i − y i 2
1
U= (3)

∑ 
n
2
d i −d i−1 
1

O cálculo de r 2 indica o quanto as previsões estão próximas dos valores reais, quanto
mais próximo de 1 melhor é a previsão realizada (Valença, 2009).
n
∑  d j −d  y i − y 
2 1
r = n n (4)
2 2
∑  d j −d  ∑  y i−  y 
1 1
onde:
n=número de amostras;
d i =valor desejado no tempoi;
y i =valor obtido no tempoi;
d =média dos valores d;
y =média dos valores y;

Para cálculo do expoente de Hurst foi utilizado uma série financeira de 2.700
observações, acolhendo assim recomendações de (Feder apud Cajueiro, 2006), que sugere
uma quantidade mínima de 2.500 observações. A série contempla o período de 03 de janeiro
2000 a 25 de novembro de 2010. As informações foram conseguidas por meio do banco de
dados da Economática, sendo que as cotações diárias foram ajustadas (dividendos,
bonificações, split e insplit).
Foram utilizadas então as redes MLP e Elman com as mesmas configurações de entrada,
número de camadas escondidas, número de neurônios em cada camada.
XIV Encontro de modelagem Computacional
II Encontro de Ciência e Tecnologia de Materiais
Instituto Politécnico (IPRJ), Campus Regional da UERJ, Nova Friburgo/RJ, Brasil. 22-24 nov. 2011.
Associação Brasileira de Engenharia e Ciências Mecânicas – ABCM

5. RESULTADOS

Através da utilização do Software R, para cálculo do modelo de regressão/expoente de


Hurst, os parâmetros do modelo de regressão são significativos para um intervalo de
confiança de 99 . Além de atender os preceitos exigidos de homocedasticidade e normalidade
dos resíduos, acrescenta-se o fato da variável independente ( n ) explicar 99,39 das variações
da variável dependente ( R/ Sn ). Especificamente no que tange o resultado do expoente de
Hurst, deduz-se que a série do ativo PETR4 apresenta um comportamento persistente, uma
vez que H =0,5515 .
Dessa maneira, a série temporal das ações preferenciais da Petrobrás no período analisado
não atende ao preceito básico da hipótese de mercado eficiente, tampouco ao “passeio
aleatório”, independente da distribuição. Uma vez que os resultados indicam que é possível
identificar padrões de comportamento da série temporal do ativo PETR4, conclui-se que há
uma memória de longo prazo presente na série. Dado o resultado do expoente de Hurst, o
objetivo de precificar um ativo financeiro com base em dados passados tem seu grau de
pertinência elevado.
Dessa forma, o modelo proposto baseado na técnica de redes neurais iniciou-se à
averiguação da estrutura que melhor se adequa ao conjunto de dados disponíveis. Os valores
médios e o desvio padrão, para os índices de EMQ, POCID, U de Theil e R² , foram obtidos
através de 10 execuções de cada modelo.
O melhor índice previsto foi o de Abertura para os modelos de rede MLP e Elman. As
tabelas abaixo comparam ambos os modelos através da média e do desvio padrão dos
experimentos:
Previsão da Abertura (MÉDIA)
Rede MLP Rede Elman
Entradas
EMQ POCID U de Theil r² EMQ POCID U de Theil r²
2 0,000115 75,71 0,44 0,97 0,000114 75,86 0,43 0,97
2,5 0,000112 77,57 0,43 0,97 0,000112 78,00 0,43 0,97
2,3,4 0,000118 78,43 0,44 0,97 0,000115 77,43 0,44 0,97
2,5,8 0,000147 77,14 0,48 0,97 0,000129 77,29 0,46 0,97
2,3,5,8 0,000202 77,14 0,55 0,95 0,000186 76,43 0,52 0,97

Tabela 4: Média da Previsão da Abertura para as


redes MLP e Elman

Previsão da Abertura (DESVIO PADRÃO)


Rede MLP Rede Elman
Entradas
EMQ POCID U de Theil r² EMQ POCID U de Theil r²
2 0,000006 0,00 0,01 0,00 0,000008 0,45 0,02 0,00
2,5 0,000007 1,51 0,01 0,00 0,000006 1,00 0,01 0,00
2,3,4 0,000010 0,81 0,02 0,00 0,000014 1,76 0,03 0,00
2,5,8 0,000069 1,78 0,10 0,00 0,000015 1,96 0,03 0,00
2,3,5,8 0,000168 2,94 0,20 0,04 0,000188 2,05 0,21 0,01

Tabela 5: Desvio Padrão da Previsão da Abertura


para as redes MLP e Elman

Rede MLP - Previsão de Abertura Rede Elman - Previsão da Abertura


3.4 3.4
Saida Real Saida Real
Saida Simulada Saida Simulada
3.35 3.35
valor de abertura

valor de abertura

3.3 3.3

3.25 3.25

3.2 3.2

0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70
dias dias

Figura 3: Melhor previsão da Abertura Figura 4: Melhor previsão da Abertura


utilizando a rede MLP utilizando a rede Elman
XIV Encontro de modelagem Computacional
II Encontro de Ciência e Tecnologia de Materiais
Instituto Politécnico (IPRJ), Campus Regional da UERJ, Nova Friburgo/RJ, Brasil. 22-24 nov. 2011.
Associação Brasileira de Engenharia e Ciências Mecânicas – ABCM

Já a previsão de um certo índice (saída) utilizando ele próprio como entrada da rede, tanto
na rede MLP como na rede Elman, não dá resultados satisfatórios segundo os índices usados
para avaliação. Na Tabela 6 temos a previsão da abertura utilizando como entradas a
abertura(1) e o corpo(7) (candlestick).

Rede Elman – Previsão de Abertura Rede NARX – Previsão de Abertura


Entrada: Abertura Entrada: Abertura
EMQ POCID U de Theil r² EMQ POCID U de Theil r²
Média 0,000594 45,71 0,99 0,84 Média 0,000552 43,45 1,04 0,82
Desvio Padrão 0,000014 0,00 0,01 0,00 Desvio Padrão 0,000023 1,78 0,02 0,01

Tabela 6: Previsão da abertura utilizando a Tabela 7: Previsão da abertura utilizando a rede


abertura e o corpo do candlestick NARX

Este fato pode ser constatado também ao utilizarmos a rede NARX com um índice
qualquer, utilizando os Delay de entrada 1:3 e Feedback 1:3. Na Tabela 7 temos o resultado
da previsão da abertura utilizando o fechamento(2) do dia anterior. O resultado é semelhante a
utilização da MLP/Elman da Tabela 6.
Isso nos leva a pensar que este fato pode ter sido decorrente de uma memorização dessas
entradas por parte da rede, tornando o resultado da previsão mesmo que graficamente
semelhante na forma, deslocado no tempo. Para isso, fizemos um experimento com a rede
NARX com 90 pontos para simulação, dado o fato que esta rede é capaz de fazer a
memorização da entrada por ser uma rede recorrente autoregressiva.
Rede Elman - Previsão de Abertura - Entradas: Abertura, Corpo (candlestick) Rede NARX - Previsão da Abertura - Entrada: Fechamento
3.4 3.4
Saida Real Saida Real
Saida Simulada Saida Prevista
3.35 3.35
valor de abertura

valorde abertura

3.3 3.3

3.25 3.25

3.2 3.2

0 10 20 30 40 50 60 70 80 90
0 10 20 30 40 50 60 70
dias dias

Figura 5: Previsão da abertura utilizando a Figura 6: Previsão da abertura utilizando a


abertura e o corpo do candlestick rede NARX

6. CONCLUSÕES

Considerando a grande gama de artigos e experimentos já realizados utilizando métodos


da Inteligência Computacional para auxiliar na análise do Mercado Financeiro, chegamos à
conclusão de que quanto mais trabalhos expositivos de diferentes combinações de tentativas
de obtenção de resultados satisfatórios, maior a chance de aprimorarmos os métodos já
utilizados e ou criarmos métodos mais eficientes para este propósito.
Dessa forma, pelos experimentos realizados, fica claro que, dada a série utilizada neste
trabalho como um exemplo de série complexa, é sempre necessário fazer a normalização e
classificação dos dados com o auxilio de algum aparato estatístico a fim de escolher as
melhores entradas para treinamento da rede neural.
Pudemos constatar que, ao utilizarmos certas entradas para o treinamento da rede, não
necessariamente uma quantidade maior de entradas resultará em uma previsão melhor, mas
sim uma quantidade de entradas que representem o maior número de classes diferentes,
evitando assim a redundância de informações. Além disso, quanto maior o número de
informações, mais indícios encontramos que a rede se perde, fato este representado pelo
XIV Encontro de modelagem Computacional
II Encontro de Ciência e Tecnologia de Materiais
Instituto Politécnico (IPRJ), Campus Regional da UERJ, Nova Friburgo/RJ, Brasil. 22-24 nov. 2011.
Associação Brasileira de Engenharia e Ciências Mecânicas – ABCM

overfitting, ou seja, há treinamento excessivo da rede e o resultado da previsão acaba sendo


pior.
Além disso, computacionalmente existem alternativas heurísticas como algoritmos
genéticos para otimização de pesos da rede, usos de outros tipos de rede, e até mesmo
ilimitadas configurações distintas das mesmas redes usadas neste trabalho.
Quanto às redes testadas, pudemos notar que ao utilizarmos a informação de entrada para
prever esta como saída não leva a um resultado satisfatório, apresentando como exemplo a
Fig. 5 em que a abertura é utilizada para prever a abertura do próximo dia. Fica claro ao
analisarmos a Tabela 6 que os resultados para os índices avaliativos não foram bons, assim
como podemos observar na Fig. 5 que o gráfico se mostra “deslocado” no eixo das ordenadas
que representa o tempo (dias), mesmo caso observado ao utilizarmos a rede NARX.
Possivelmente, esse fato ocorre devido à memorização destas entradas, uma vez que a
rede utiliza, nesse caso, apenas a abertura como informação para calcular a abertura do dia
seguinte, praticamente desprezando a informação das outras entradas. Dessa forma, o
resultado que se obtém é praticamente igual ao do dia anterior, por isso o gráfico se mostra
parecido, porém com um dia de atraso.
Ao compararmos as redes MLP e Elman, não obtivemos diferenças significativas na
utilização destas para o mesmo propósito. Ambas apresentaram resultados bastante próximos
em relação aos índices de avaliação, tanto para a média como para o desvio padrão.
Nota-se, portanto, que há indícios de que algumas variáveis são melhores que outras para
a previsão, o que pode ser observado pela tabela de correlação e também pelos valores obtidos
da Tab. 2.
Por fim, entende-se que os resultados deste trabalho serão de grande utilidade em
trabalhos posteriores, em que será estudado a influência de eventos para o cálculo do retorno
normal.

REFERÊNCIAS

Abelém, A. J. G. (1994), Redes Neurais Artificiais na Previsão de Séries Temporais.

Alexander, G. J.; Sharper, W. F.; BAILEY, J. V. (2000), Fundamentals of investments.3rd. ed. New Jersey
Prentice Hall.

Braga, A. de P. Carvalho, A. C. P. de P. L. F. de. Ludemir, T. B. (2003), Redes neurais artificiais : teoria e


aplicações. – 2. ed.- Rio de Janeiro : LTC.

Brealey, R. A.; Myers, S. C. (1998). Princípios de finanças empresariais. 5. ed. Lisboa: McGraw-Hill de
Portugal.

Brockwell, P. J.; Davis, R. A. (1996), Introduction to Time Series andForecasting. New York, USA : Springer
Verlag

Chu, C. W. e Z; Guoqiang, P. (2003), A comparative study of linear and nonlinear models for agregate retail
sales forecasting. International Journal of Production Economics. pp. 217-23.

De Gooijer, J. G.; Kumar, K. (1992), Some recent developments in non-linear times series modeling, testing
and forecasting. International Journal of Forecasting. 8, pp. 135-156.

Diaconescu, A. E. (2008), The use of NARX neural networks to predict chaotic time series. WSEAS
TRANSACTIONS on COMPUTER RESEARCH, Issue 3, Vol. 3
XIV Encontro de modelagem Computacional
II Encontro de Ciência e Tecnologia de Materiais
Instituto Politécnico (IPRJ), Campus Regional da UERJ, Nova Friburgo/RJ, Brasil. 22-24 nov. 2011.
Associação Brasileira de Engenharia e Ciências Mecânicas – ABCM

Elman, J. L. (1990) , Finding Structure in Time. Cognitive Science, 14, 179-211.

Fama, E. F. (1991), Efficient capital markets: II.Journal of Finance, Oxford, v. 46, n. 5, p. 1575-1617, dec.

Feder, J. (1988), Fractals. New York: Plenum Press.

Gately, E. (1996), Neural Networks for financial forecasting. 1 ed. EUA, Jonh Wiley & Sons, Inc.

Haykin, S. (2001), Redes Neurais: princípios e prática. 2 ed. Porto Alegre: Bookman

Mhendehall, W. (1993). et. al. Statistic for management and economics. 7. ed. E.U.A: Wadsworth Inc.

Morettin, P.A. & Toloi, C.M.C. (2004), Análise de Séries Temporais. Editora Edgard Blücher Ltda. 535 p.

Ribeiro, C. O., Miranda B.; Widonsck, C. (2005), “Redes Neurais aplicadas à previsão de volatilidade do
mercado futuro de álcool”. XXV Encontro Nacional de Engenharia de Produção – Porto Alegre, RS,
Brasil.

Stagge, P., Husken. (2011), Recurrent Neural Netwoks for Time Series Classification. Online
http://www.dsc.ufcg.edu.br/~brunoc/ANP/revisaoElman.html em 8 de Julho de 2011.

Tsungnan Lin, B. G. H.; Peter Tino, C., L. G. (1996), Learning long-term dependencies in NARX recurrent
networks, IEEE Transactions on Neural Networks, Vol. 7, No. 6, pp. 1329-1351.

Valença, M. (2005), Aplicando Redes Neurais: um guia completo. Olinda, PE : Ed. Do autor, 284 p.: Il.

Yang Gao, M. J. E. (2005), NARMAX time series model prediction: feedforward and recurrent fuzzy neural
network approaches, Fuzzy Sets and Systems. Vol. 150, No. 2, pp. 331-350.

COMPARATIVE STUDY USING NEURAL NETWORK FOR PREDICTING


TRENDS IN FINANCIAL TIME SERIES

Abstract: This paper compares the use of models of Artificial Neural Networks Multi-
LayerPerceptron, Elman and Narx, for predicting trends in time series using the values of the
assets of Petrobras (PETR4). It made a brief introduction of artificial neural networks, and
using the software MatLab are made experiments consisting of training and network
simulation. The results are evaluated through the mean and standard deviation of the RMSE
indices (Mean Square Error), POCID (Percentage of Change in Direction), U de Theil and r 2
(correlation coefficient), arranged in tables and graphs.

Keywords: Artificial Neural Networks(ANN), Time Series, Financial Market.

Você também pode gostar