Você está na página 1de 14

PREVENDO O MERCADO DE AÇÕES BRASILEIRO

UTILIZANDO MACHINE LEARNING


Gustavo Carvalho Santos – gustavocavsantos@gmail.com
UNIVERSIDADE FEDERAL DE UBERLÂNDIA- UFU/FEELT

Flávio Barboza - flmbarboza@ufu.br


UNIVERSIDADE FEDERAL DE UBERLÂNDIA – UFU/FAGEN

Antônio Cláudio Paschoarelli Veiga - acpveiga@ufu.br


UNIVERSIDADE FEDERAL DE UBERLÂNDIA- UFU/FEELT

Área: 3. - PESQUISA OPERACIONAL


Sub-Área: 3.7 – INTELIGÊNCIA COMPUTACIONAL

Resumo: A predição de movimento nos preços do mercado de ações tem sido uma área
importante na pesquisa de algoritmos de machine learning nos últimos anos, devido a seu
conteúdo complexo e dinâmico. Além disso, a volatilidade típica do mercado de ações
torna a tarefa da previsão mais difícil. Dessa forma, este artigo tem como objetivo propor
uma metodologia que preveja a tendência das ações de três empresas brasileiras
negociadas na bolsa de valores brasileira. Por conseguinte, deseja-se facilitar o
reconhecimento de movimentações no mercado, além de auxiliar a tomada de decisão
para investidores com pouca experiência. Ademais, este trabalho propõe comparar as
predições dos papeis usando três poderosos algoritmos de aprendizado de máquina,
conhecidos como Random Forest, Redes Neurais Artificiais e Support Vector Machines.
Além disso, é proposto o uso de uma nova função (kernel-SVM) - utilizada para
reconhecimento de imagens - para contornar o problema das previsões. Indicadores
técnicos (tais como o Índice de Força Relativa, o oscilador estocástico, entre outros), são
usados como entradas para treinar os modelos. Por fim, os resultados são avaliados por
meio de indicadores estatísticos como acurácia, precisão, recall e especificidade.

Palavras-chaves: Aprendizado de Máquina; Ibovespa; Previsão; Classificação; Mercado


de ações;
XXVII SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO
Economia Circular e Suas Interfaces Com A Engenharia De Produção
Bauru, SP, Brasil, 11 a 13 de novembro de 2020

FORECASTING THE BRAZILIAN STOCK MARKET


USING MACHINE LEARNING
Abstract: The prediction of movement in stock market prices has been an important area
in the research of machine learning algorithms in recent years, due to its complex and
dynamic content. In addition, typical stock market volatility makes forecasting more
difficult. Thus, this article aims to propose methodology that predicts the trend of the
shares of three Brazilian companies traded on the Brazilian stock exchange. Therefore, we
want to facilitate the re-cognition of movements in the market, in addition to assisting
decision-making for investors with little experience. Furthermore, this work proposes to
compare the predictions of the stocks using three powerful machine learning algorithms,
known as Random Forest, Artificial Neural Networks and Support Vector Machines. In
addition, it is proposed to use a new function (kernel-SVM) - used for image recognition -
to solve the prediction problem. Technical indicators (such as the Relative Strength Index,
the stochastic oscillator, among others) are used as inputs to train the models. Finally, the
results are evaluated using statistical indicators such as accuracy, precision, recall and
specificity.

Keywords: Machine Learning; Ibovespa; Predicting; Classification, Stock Market.

2
XXVII SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO
Economia Circular e Suas Interfaces Com A Engenharia De Produção
Bauru, SP, Brasil, 11 a 13 de novembro de 2020

1. INTRODUÇÃO

Entrever os movimentos dos preços do mercado de ações é um trabalho muito


desafiador em virtude das muitas indeterminações envolvidas e as muitas variáveis que
controlam o valor de mercado em um determinado dia, como condições econômicas,
sentimentos dos investidores em relação a uma empresa em particular e eventos políticos.
Dessa forma, os mercados de títulos são suscetíveis a mudanças rápidas, causando flutuações
aleatórias no preço das ações.
Conforme Khaidem et al. (2016), as séries do mercado de valores são comumente
dinâmicas, não paramétricas, caóticas e ruidosas e, desse modo, a direção dos preços no
mercado de ações é classificada como um processo aleatório, com flutuações mais acentuadas
em janelas de tempo curto. No entanto, alguns ativos geralmente tendem a desenvolver
tendências lineares em longo prazo. Dessa forma, devido à natureza caótica e altamente
volátil do comportamento dos papéis, os investimentos neles possuem alto risco. Para
minimizar esse fato, é necessário um conhecimento avançado no movimento dos preços no
futuro.
Em vista disso, este artigo pretende prever a direção do preço das ações de três
empresas brasileiras presentes na IBOVESPA, como uma alternativa aos preços de
fechamento, uma vez que pode ajudar a minimizar os riscos de investimento das operações do
dia. Para isso, este estudo utiliza três algoritmos de machine learning - Random Forest, Redes
neurais artificiais e Support Vector Machines – além de definir as variáveis que mais
influenciam nas tendências dos preços das participações diárias das seguintes empresas
brasileiras: Vale (VALE3), Petrobras (PETR4), Itaú Unibanco (ITUB4).

2. TRABALHOS RELACIONADOS
A utilização de algoritmos para prever tendências futuras nos preços do mercado de
ações contradiz uma regra básica em finanças denominada Hipótese do Mercado Eficiente e
(MALKIEL; FAMA, 1970). Ela afirma que os preços atuais das ações refletem (dentro da
perspectiva mais conservadora) totalmente todas as informações relevantes. Dessa maneira, se
alguém obtiver uma vantagem aferindo dados históricos de ações, todo o mercado se
perceberá desse benefício e, como efeito, o preço do papel será corrigido. Essa é uma teoria
altamente questionável e frequentemente contestada. Ainda que geralmente seja aceita,
existem muitos pesquisadores que rejeitam essa suposição usando algoritmos que podem

3
XXVII SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO
Economia Circular e Suas Interfaces Com A Engenharia De Produção
Bauru, SP, Brasil, 11 a 13 de novembro de 2020

modelar dinâmicas mais complexas do sistema financeiro o (MALKIEL, 2003).


Nesse sentido, segundo Khaidem et al. (2016), diferentes algoritmos têm sido
utilizados para prever o sentido das ações, como SVM (Support Vector Machine), Redes
Neurais Artificiais, Regressão Linear, KNN (K-Nearest Neighbors) e o Classificador Naive
Bayes. Isto posto, a literatura revela que o SVM tem sido usado na maioria das vezes nesse
tipo de pesquisa. No entanto, como demonstra o trabalho de e Khaidem et al. (2016), o uso de
algoritmos de ensemble learning (Random Forests) permaneceram pouco explorados no
problema de previsão do mercado.
Assim sendo, este trabalho visa a empregar o método de aprendizado de conjunto
conhecido como Floresta Aleatória para construir um dos modelos preditivos propostos.
Floresta aleatória (Random Forest) é uma infinidade de árvores de decisão cuja saída é dada
pela classificação majoritária do conjunto das árvores individuais. No trabalho citado, os
resultados variam entre 84.5 e 94.5% de acurácia, sujeitando-se a janela de tempo prevista.
No que tange à predição do mercado usando Redes Neurais, Laboissiere, Fernandes e
Lage (2015) elaboraram um modelo para prever os preços máximos e mínimos de alguns
ativos do setor energético, sendo eles: Companhia Energética do Rio Grande do Norte -
COSERN (CSRN3), Companhia Energética de Brasilia - CEB (CEBR3) e CPFL Energia S.A.
(CPFE3). Todavia, diferentemente do modelo citado anteriormente que emprega Random
Forest, esse último trata a previsão como um problema de regressão. Desse modo, os
resultados são mensurados usando métricas como: MAE (Mean Absolute Error), MAPE
(Mean Absolute Percentage Error) e RMSE (Root Mean Square Error).

3. METODOLOGIA
Os dados da série temporal são coletados, suavizados e os indicadores técnicos
extraídos. Indicadores técnicos são parâmetros que fornecem informações sobre o
comportamento esperado dos preços dos papéis no futuro. Essas medidas são então usadas
para treinar os três algoritmos propostos. Os detalhes de cada etapa serão discutidos a seguir.

3.1 Base de Dados


A base de dados usada nesse trabalho compreende um período de cinco anos
(11/02/2015 até 10/02/2020). Dessa maneira, os dados diários de fechamento, abertura, alta e
baixa dos ativos pesquisados foram obtidos. Os dados de cada papel foram divididos em
treinamento e teste, sendo a validação equivalente a 20% da série temporal prevista.

4
XXVII SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO
Economia Circular e Suas Interfaces Com A Engenharia De Produção
Bauru, SP, Brasil, 11 a 13 de novembro de 2020

As tabelas 1 e 2 ilustram como as classes “+1” (Movimento de alta) e “0” (Movimento


de baixa) estão distribuídas para o dataset de cada ativo.
TABELA 1 – Dados de Treinamento.

Analisando a distribuição dos números de cada classe, é possível observar que há uma
maior predominância da classe positiva em relação à negativa. Outro ponto é que, à medida
que o período de previsão aumenta, o desbalanceamento das classes também aumenta.

TABELA 2 – Dados
de Validação.

3.2 Prè-processamento dos dados


Primeiramente, as séries temporais dos dados de abertura, fechamento, máxima e
mínima são suavizadas exponencialmente. A suavização exponencial aplica mais peso às
observações recentes e pesos exponencialmente decrescentes às observações anteriores. A
fórmula de uma série suavizada exponencialmente pode ser calculada recursivamente como:
S 0 =Y 0
S t =α∗Y t +(1−α )∗S t−1

Onde α é o fator de suavização e 0 < α < 1. Valores maiores de α reduzem o nível de


suavização. Quando α = 1, a variável suavizada torna-se igual à observação real. O valor

5
XXVII SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO
Economia Circular e Suas Interfaces Com A Engenharia De Produção
Bauru, SP, Brasil, 11 a 13 de novembro de 2020

suavizado St pode ser calculado assim que duas observações estiverem disponíveis. Essa
suavização remove variações aleatórias ou ruído dos dados históricos, permitindo que o
modelo identifique facilmente a tendência de preços de longo prazo no comportamento do
preço das ações. Dessa forma, os indicadores técnicos são então calculados a partir dos dados
suavizados da série temporal (KHAIDEM et al., 2016) . A classe a ser prevista no n-ésimo
dia é calculada da seguinte forma:
ClasseN =Sinal ( FechamentoN+d −Fechamento N )

Onde d indica o número de dias após os quais a previsão será feita. Quando o valor da
classe é +1, isso denota que há uma mudança positiva no preço após ddias da previsão. Já o
valor -1 indica que há uma mudança negativa, também após d dias da data em que foi feita a
estimativa.

3.3 Extração dos Atibutos


Os três algoritmos de machine learning referidos empregam atributos específicos para
realização do treinamento e previsão dos papéis. Para isso, são calculados alguns indicadores
técnicos. Segundo Khaidem et al. (2016) , esses são parâmetros importantes calculados a
partir de dados de séries temporais que visam prever a direção do mercado financeiro. São
ferramentas amplamente utilizadas pelos investidores para verificar sinais de baixa ou alta. Os
indicadores técnicos usados estão listados abaixo:
 Índice de força relativa (Relative Strength Index – RSI)
 Oscilador Estocástico (Stochastic Oscillator - %K)
 Convergência e divergência da média móvel (Moving Average Convergence
Divergence-MACD)
 Taxa de mudança dos preços (Price Rate of Change – PROC)
 Indicador Saldo de Volume (On-Balance Volume – OBV)
 Oscilador Williams %R

3.4 Redes Neurais Artificiais


Conforme Bishop (2006), o termo 'rede neural' tem suas origens nas tentativas de
encontrar representações matemáticas do processamento de informações em sistemas
biológicos. Uma das principais características das RNAs (Redes Neurais Artificiais) é a
capacidade de aprender não apenas por meio de exemplos, mas também de generalizar a partir
das informações aprendidas.

6
XXVII SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO
Economia Circular e Suas Interfaces Com A Engenharia De Produção
Bauru, SP, Brasil, 11 a 13 de novembro de 2020

FIGURA 1 – Perceptron.

Fonte: Laboissiere, Fernandes e Lage (2015).

O neurônio artificial da figura 1 consiste em um modelo matemático com n terminais


de entrada (x1,x2,..,xn-1 e xn, representando os dendritos) e um único terminal de saída (y,
representando o axônio). O comportamento é simulado por meio de pesos sinápticos (w1,
w2,.., wn-1 e wn), cujos valores podem ser positivos ou negativos. Já o viés do neurônio é
representado por um valor limiar b. A função de ativação g é responsável por processar as
informações recebidas (entradas ponderadas recebidas e o valor limite do neurônio) e fornecer
uma saída para o neurônio, (LABOISSIERE; FERNANDES; LAGE, 2015).
O neurônio artificial opera da seguinte maneira:
 Os sinais são submetidos às entradas;
 Cada sinal é multiplicado pelo seu respectivo peso sináptico;
 É realizada uma soma entre os sinais de entrada ponderados e o neurônio;
 O valor limite é calculado;
 Esta informação é processada pela função de ativação do neurônio;
 Um sinal de saída é produzido.

A figura 2 ilustra o processo em que os dados são processados através das camadas de
uma rede neural profunda. Neste trabalho, foi desenvolvida uma RNA com 3 camadas
escondidas. A primeira e segunda possuem 12 neurônios, já a terceira possui 3. A função de
ativação empregada nas células foi a Rectified Linear Unit (ReLU). Matematicamente, essa
função é definida como:
Y=max ( 0 ,x )
Onde Y é o sinal de resposta do neurônio e x o valor de sua entrada.

7
XXVII SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO
Economia Circular e Suas Interfaces Com A Engenharia De Produção
Bauru, SP, Brasil, 11 a 13 de novembro de 2020

FIGURA 2 – Arquitetura de uma RNA.

3.5 Random Forest


Random Forest é um método de aprendizado conjunto para classificação e regressão
que opera construindo várias árvores de decisão no momento do treinamento e produzindo a
classe que é o modo das saídas geradas por árvores individuais. O algoritmo foi desenvolvido
por Leo Breiman e Adele Cutler (BREIMAN, 2001). O termo veio de florestas de decisão
aleatória que foram propostas pela primeira vez por Ho (1995). O método combina a ideia de
"ensacamento" de Breiman e a seleção aleatória de recursos, introduzidos independentemente
por Ho (1995) e Amit e Geman (1997) para construir uma coleção de árvores de decisão com
variação controlada.
Assim como em Barboza, Kimura e Altman (2017) o algoritmo de RF desenvolvido
neste trabalho segue Yeh, Chi e Lin (2014):
1. Cria-se subconjuntos aleatórios do conjunto pai, compostos por um número arbitrário
de observações e recursos diferentes.
2. Cada subconjunto da etapa 1 produz uma árvore de decisão e todos os elementos do
conjunto têm uma classe (correta ou não).
3. Para cada elemento, a floresta recebe um grande número de votos. A classe com mais
votos é escolhida como a classificação mais provável do elemento.

3.6 Support Vector Machine


O algoritmo de máquinas de vetores de suporte (SVM) foi desenvolvido por Cortes e
Vapnik (1995). Vários estudos relatam que essa técnica, geralmente, é capaz de fornecer
maior precisão de classificação do que os outros algoritmos existentes (HSU; LIN, 2002),
(JOACHIMS, 1998). Na última década, o SVM surgiu como um importante método de
aprendizado para resolver problemas de classificação e regressão em vários campos,

8
XXVII SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO
Economia Circular e Suas Interfaces Com A Engenharia De Produção
Bauru, SP, Brasil, 11 a 13 de novembro de 2020

principalmente na biologia computacional, finanças e categorização de textos. Isso se deve em


parte a mecanismos internos, para garantir uma boa generalização que leva a previsões
precisas, o uso de funções (kernels) para modelar distribuições não lineares e a capacidade de
treinar relativamente rápido em grandes conjuntos de dados, usando novas técnicas de
otimização matemática (APOSTOLIDIS-AFENTOULIS, 2015).
Esse trabalho propõe a utilização de dois kernels diferentes para realizar as previsões.
O primeiro, RBF (Radial Basis Function), é comumente usado em algoritmos de machine
learning. Já o segundo, chamado de GHI (Generalized Histogram Intersection), foi
desenvolvido por Boughorbel, Tarel e Boujemaa (2005) visando à aplicação em
reconhecimento de imagens. No entanto, este artigo prova que o ultimo também se
demonstrou eficaz no reconhecimento de tendencias em ações.

3.6 Parâmetros Estatisticos


De acordo com os resultados das previsões obtidas pelos modelos, é possível decidir
sobre a compra ou venda das ações das empresas pesquisadas. Dessa maneira, é necessário
obter medidas estatísticas que provem a confiabilidade do algoritmo. Os parâmetros usados
para avaliar a robustez de um classificador binário são acurácia, precisão, recall (também
conhecido como sensibilidade) e especificidade. As fórmulas para calcular esses parâmetros
são apresentadas abaixo:
t p + tn
Acurácia =
t p + tn + f p + f n
tp
Precisão=
t p +f p
tp
Recall=
t p +f n
tn
Especificidade=
t n +f p

onde,
tp = Número de previsões de alta classificadas corretamente;
tn = Número de previsões de baixa classificadas corretamente;
fp = Número de previsões de alta classificadas incorretamente;
fn = Número de previsões de baixa classificadas incorretamente.

9
XXVII SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO
Economia Circular e Suas Interfaces Com A Engenharia De Produção
Bauru, SP, Brasil, 11 a 13 de novembro de 2020

4. RESULTADOS
Os algoritmos citados foram treinados para gerarem previsões de 30, 60 e 90 dias.
Desse modo, foi possível observar o comportamento das previsões em diferentes janelas de
tempo. As tabelas 3, 4 e 5 exibem os resultados obtidos para o períodos pesquisados
respectivamente.

TABELA 3 - Previsão 30 dias.

Para as previsões de 30 dias, é possível observar que para o ativo VALE3, o algoritmo
RF demonstrou maior acurácia (96%). No entanto, para as outras ações pesquisadas os dois
kernels SVM utilizados obtiveram resultados superiores - porém não atingiram o mesmo valor
do título anterior. Já as previsões da RNA foram muito inferiores se comparadas às
estimativas dos outros modelos.

TABELA 4 - Previsão 60 dias.

10
XXVII SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO
Economia Circular e Suas Interfaces Com A Engenharia De Produção
Bauru, SP, Brasil, 11 a 13 de novembro de 2020

De outro modo, para o período de 60 dias, os modelos - RF, SMV-GHI e SVM-RBF -


obtiveram a maior acurácia (97% no ativo PETR4). No entanto, da mesma maneira citada
anteriormente, a RNA se demostrou menos eficaz que os outros algoritmos utilizados.
Para o período de previsão de 90 dias, em linhas gerais, os resultados obtidos se
demonstraram melhores em comparação as outras janelas de tempo pesquisadas. O algoritmo
SVM-RBF atingiu a maior acurácia (97%) para os ativos PETR4 e ITUB4. Apesar dos
melhores resultados alcançados pela RNA nesta janela, estes ainda se mantiveram menores
comparados aos outros modelos usados.

TABELA 5 - Previsão 90 dias.

4.1 Curvas ROC


Outra forma para avaliar o desempenho de um classificador binário é usando o
parâmetro ROC (Característica de Operação do Receptor), esse é um método gráfico em que
uma curva é desenhada plotando a taxa de verdadeiros positivos contra a taxa de falso
positivos em vários valores limites. A curva ROC mostra a relação entre sensibilidade e
especificidade, quando essa se aproxima da borda esquerda e da borda superior do gráfico
ROC, isso indica que o teste é preciso. Assim, quanto mais próxima ela estiver da borda
superior e esquerda, mais preciso será o teste. No entanto, se ela estiver próxima da diagonal
de 45 graus do espaço ROC, isso significa que o teste não é preciso (KHAIDEM et al., 2016).
As figuras 3, 4 e 5 ilustram o calculo da curva ROC para os modelos desenvolvidos
aplicados aos papeis previstos:

11
XXVII SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO
Economia Circular e Suas Interfaces Com A Engenharia De Produção
Bauru, SP, Brasil, 11 a 13 de novembro de 2020

FIGURA 3 – Curvas ROC VALE3.

É possível observar nas três ações pesquisadas que, de forma geral, a medida que se
aumentam os dias de previsão, a precisão dos algoritmos aumenta. Isso fica mais claro ao
analisar os gráficos do modelo RNA. No entanto, os outros (RF, SVM-GHI, SVM-RBF)
também demonstram uma pequena melhora com o aumento dos dias previstos.

FIGURA 4 – Curvas ROC PETR4.

Para as ações ITUB4, foi possível observar através da curva ROC que para o modelo
RNA houve uma piora dos resultados de 60 dias em relação às previsões de 30 dias.

FIGURA 5 – Curvas ROC ITUB4.

12
XXVII SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO
Economia Circular e Suas Interfaces Com A Engenharia De Produção
Bauru, SP, Brasil, 11 a 13 de novembro de 2020

5. CONCLUSÕES
Prever a tendência do mercado de ações é realmente muito complexo devido à sua
natureza caótica. No entanto, nos últimos anos, as técnicas de aprendizado de máquina se
mostraram eficazes na previsão desses papéis. Neste artigo, comparamos três classificadores,
as Redes Neurais Artificiais, muito usadas atualmente, o Random Forest e o Support Vector
Machine. Por conseguinte, esses dois últimos modelos produziram resultados
impressionantes. Já a RNA demonstrou pouca capacidade de alcançar a acurácia dos outros
algoritmos citados. Além disso, o kernel SVM-GHI, usado para reconhecimento de imagens,
demonstrou ser uma contribuição muito eficaz para resolver os problemas de previsão,
apresentando resultados parecidos com os outros modelos apresentados (RF e SVM-RBF).
A eficiência das previsões foi avaliada através do cálculo de vários parâmetros, como
acurácia, precisão, recall e especificidade. Para todos os conjuntos de dados que foram usados
- VALE3, PETR4 e ITUB4 - foi possível obter uma acurácia no intervalo de 91 a 97%,
utilizando RF e SMV, e 71 a 89% através da RNA. As curvas ROC também foram plotadas
para avaliar os modelos. Desse modo, elas provaram graficamente a superioridade do Random
Forest e SVM em relação à Rede Neural.
Para mais, o algoritmo desenvolvido pode ser usado para novas estratégias de
negociação ou para executar o gerenciamento de portfólio de ações na área pesquisada.

5.1 Trabalhos Futuros


Para trabalhos futuros, a ideia é construir modelos para prever tendências em
diferentes horizontes de tempo, em termos de horas ou minutos,por exemplo. Além disso,
diferentes algoritmos de aprendizado de máquina, como as Redes Neurais Recorrentes,
também podem ser testados quanto à sua robustez na previsão desse mercado. Ademais,
deseja-se facilitar a operação das previsões através da elaboração de uma interface gráfica que
tenha comunicação direta com o banco de dados dessas ações, simplificando a atuação do
usuário deste software.

13
XXVII SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO
Economia Circular e Suas Interfaces Com A Engenharia De Produção
Bauru, SP, Brasil, 11 a 13 de novembro de 2020

REFERÊNCIAS

AMIT, Y.; GEMAN, D. Shape Quantization and Recognition with Randomized Trees.
Neural Computation, 1997.

APOSTOLIDIS-AFENTOULIS, V. Svm classification with linear and rbf kernels. 07


2015.

BARBOZA, F.; KIMURA, H.; ALTMAN, E. Machine learning models and bankruptcy
prediction. Expert Systems with Applications, 2017.

BISHOP, C. M. Pattern Recoginiton and Machine Learning. [S.l.: s.n.], 2006.

BOUGHORBEL, S.; TAREL, J. P.; BOUJEMAA, N. Generalized histogram intersection


kernel for image recognition. In: Proceedings - International Conference on Image
Processing, ICIP. [S.l.: s.n.], 2005.

BREIMAN, L. Random forests. Machine Learning, 2001.

CORTES, C.; VAPNIK, V. Support-Vector Networks. Machine Learning, 273–297 1995.

HO, T. K. Random decision forests. In: Proceedings of the International Conference on


Document Analysis and Recognition, ICDAR. [S.l.: s.n.], 1995.

HSU, C. W.; LIN, C. J. A comparison of methods for multiclass support vector machines.
IEEE Transactions on Neural Networks, 2002.

JOACHIMS, T. Text categorization with support vector machines: Learning with many
relevant features. In: Lecture Notes in Computer Science (including subseries Lecture
Notes in Artificial Intelligence and Lecture Notes in Bioinformatics). [S.l.: s.n.], 1998.

KHAIDEM, L. et al. Predicting the direction of stock market prices using random forest.
04 2016.

LABOISSIERE, L. A.; FERNANDES, R. A.; LAGE, G. G. Maximum and minimum


stock price forecasting of Brazilian power distribution companies based on artificial
neural networks. Applied Soft Computing Journal, 2015.

MALKIEL, B. G. The efficient market hypothesis and its. In: Journal of Economic
Perspectives. [S.l.: s.n.], 2003.

MALKIEL, B. G.; FAMA, E. F. Efficient capital markets: A review of theory and


empirical work*. The Journal of Finance, v. 25, n. 2, p. 383–417, 1970.

YEH, C. C.; CHI, D. J.; LIN, Y. R. Going-concern prediction using hybrid random
forests and rough set approach. Information Sciences, 2014.

14

Você também pode gostar