Você está na página 1de 50

FUNDAÇÃO GETULIO VARGAS

ESCOLA DE ECONOMIA DE SÃO PAULO

CAROLINA CALIÓ NOGUEIRA

PREVISIBILIDADE NO MERCADO ACIONÁRIO


UTILIZANDO MACHINE LEARNING

São Paulo
2019
CAROLINA CALIÓ NOGUEIRA

PREVISIBILIDADE NO MERCADO ACIONÁRIO


UTILIZANDO MACHINE LEARNING

Dissertação apresentada à Escola de Econo-


mia de São Paulo da Fundação Getulio Var-
gas como requisito para obtenção de título de
mestre em Economia.

Orientador: Emerson Fernandes Marçal

São Paulo
2019
Nogueira, Carolina Calió.
Previsibilidade no mercado acionário utilizando machine learning / Carolina Calió
Nogueira. - 2019.
48 f.

Orientador: Emerson Fernandes Marçal.


Dissertação (mestrado profissional MPFE) – Fundação Getulio Vargas, Escola de
Economia de São Paulo.

1. Mercado de ações - Previsão. 2. Aprendizado do computador. 3. Arvores de


decisão. 4. Análise de regressão logística. I. Marçal, Emerson Fernandes. II.
Dissertação (mestrado profissional MPFE) – Escola de Economia de São Paulo. III.
Fundação Getulio Vargas. IV. Título.

CDU 336.76

Ficha Catalográfica elaborada por: Isabele Oliveira dos Santos Garcia CRB SP-010191/O
Biblioteca Karl A. Boedecker da Fundação Getulio Vargas - SP
CAROLINA CALIÓ NOGUEIRA

PREVISIBILIDADE NO MERCADO ACIONÁRIO


UTILIZANDO MACHINE LEARNING

Dissertação apresentada à Escola de Econo-


mia de São Paulo da Fundação Getulio Var-
gas como requisito para obtenção de título de
mestre em Economia.

Data de aprovação: / /

Banca examinadora:

Prof. Dr. Emerson Fernandes Marçal


FGV-EESP (Orientador)

Prof. Dr. Paulo Sergio Tenani


FGV-EESP

Prof. Dr. Diego Mendonça de Prince


UNIFESP
Agradecimentos

Agradeço a meu orientador Emerson pelo compartilhamento de conhecimento e


paciência ao longo deste ano. Agradeço também a minha família, aos meus pais, meus
irmão e meu namorado pelo apoio.
Resumo
Este trabalho busca verificar a existência de previsibilidade no mercado acionário brasileiro.
Para fazer a análise foi utilizado o índice IBRX e 40 fatores de risco para cada empresa
que compõem o índice. Os fatores de risco foram obtidos através do terminal da Bloomberg,
entre janeiro de 2008 e junho de 2018. O estudo foi feito com auxílio de Machine Learning
em que foram realizadas regressões logísticas e árvores de decisão para cada uma das
empresas. A partir do estudo, pode-se observar evidências de previsibilidade no mercado
brasileiro, resultado análogo ao encontrado por Gu et al. (2018), que verificaram resultados
parecidos no mercado norte americano, com estudo que serviu de base para este trabalho.

Palavras-chave: previsibilidade, IBRX, Machine Learning, regressões logísticas e arvores


de decisão
Abstract
This work seeks to verify the existence of predictability in the Brazilian stock market. To
conduct this analysis, it was used the Brazilian stock market index (IBRX) and 40 risk
factors, for each company. The risk factors were obtained through the Bloomberg terminal,
between January 2008 and June 2018. This study was carried out with Machine Learning
apparatus, where logistic regressions and decision trees were performed. It was found signs
of predictability in the Brazilian stock market. A similar result was verified by Gu et al.
(2018) in North American stock market, their work was the bases of this research.

Keywords: predictability, IBRX, Machine Learning, logistics regression, decision tree


Lista de ilustrações

Figura 1 – Regressão Logística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15


Figura 2 – Diagrama da Árvore de Decisão . . . . . . . . . . . . . . . . . . . . . . 23
Lista de tabelas

Tabela 1 – Fatores de Risco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19


Tabela 2 – Empresas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
Tabela 3 – Teste Dickey-Fuller . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Tabela 4 – Resultado da Regressão Logística . . . . . . . . . . . . . . . . . . . . . 22
Tabela 5 – Regressão Logística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Tabela 6 – Resultado da Árvore de Decisão . . . . . . . . . . . . . . . . . . . . . . 24
Sumário

1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2 REVISÃO DA LITERATURA . . . . . . . . . . . . . . . . . . . . . . 11
2.1 Finanças Comportamentais/Risco/Mercados Imperfeitos . . . . . . . 11
2.2 Machine Learning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3 Fatores de Risco . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

3 METODOLOGIA . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

4 DADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

5 RESULTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

6 EXTENSÕES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

7 CONCLUSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

APÊNDICE A – CÓDIGOS . . . . . . . . . . . . . . . . . . . . . . 32
A.1 Regressão Logística . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
A.2 Árvore de Decisão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

APÊNDICE B – DEFINIÇÕES DAS VARIÁVEIS OBTIDAS PELO


TERMINAL DA BLOOMBERG . . . . . . . . . . 36
10

1 Introdução

A principal motivação deste trabalho é verificar se existe previsibilidade no mercado


acionário brasileiro, observando se os fatores de risco, obtidos através do terminal da
Bloomberg, conseguem explicar a variação de preço das empresas que compõe o índice do
IBRX.
Importante ressaltar que o uso do IBRX se deu por ser o índice das cem maiores
empresas brasileiras, país de analise. Com isso é possível captar as empresas que o investidor
mais acompanha, bem como seus fatores de risco. Os fatores escolhidos no trabalho vão
desde volatilidade e momento até fatores mais fundamentais como variação de caixa. Ao
todo foram utilizados quarenta fatores de risco para cada uma das empresas, de 2008 até
metade de 2018, com frequência diária.
O presente trabalho foi realizado com base no estudo de Gu et al. (2018), os quais
verificaram a previsibilidade no mercado acionário americano utilizando Machine Learning.
Para isso eles estudaram se os fatores de risco conseguiam explicar a variação no preço
de ações. Os autores fizeram modelos nos quais os fatores de risco eram as variáveis
explicativas e o preço a variável explicada.
O trabalho de Gu et al. (2018) é completo e passa por modelos simples de regressão
até modelos complexos de redes neurais. Eles chegaram à conclusão de que para os modelos
de árvores de decisão e redes neurais, existem evidencias de que os preços são explicados
pelos fatores de risco, ou seja, existe previsibilidade.
A análise retratada neste documento buscou fazer um estudo semelhante, porém
retratando o Brasil. Assim como os autores citados anteriormente, fez-se uso de Machine
Learning e os modelos aplicados foram de regressão logística e árvore de decisão. Para o
mercado acionário brasileiro, o resultado também se mostra melhor para árvores de decisão
do que para regressão logística, no entanto esta variação não é tão acentuada quanto a
observada com dados norte-americanos.
Tem-se como conclusão principal deste trabalho a evidência de que existe previsibi-
lidade no mercado acionário brasileiro. A consequência direta deste resultado indica que é
possível obter maiores lucros e tomar melhores decisões de investimento observando os
fatores de risco.
11

2 Revisão da Literatura

2.1 Finanças Comportamentais/Risco/Mercados Imperfeitos


Existem diversas evidências de que é possível observar padrões no mercado, e a
difusão da análise gráfica é uma prova disto. A exemplo de Blume et al. (1994) com o
estudo que mostrava que existem informações contidas no volume de negociação e Taylor
and Allen (1992) que estudaram como a previsão apenas utilizando analise gráfica se
comporta, sem utilizar nenhuma informação fundamentalista sobre as empresas. Porém, a
explicação para a existência de padrões não é unânime.
Sob a ótica de finanças comportamentais tomar uma decisão é a parte final de
um processo repleto de análises e associações. No entanto, estas decisões muitas vezes
são tomadas a partir de julgamentos tendenciosos. Ainda pela explicação das finanças
comportamentais, indivíduos fazem escolhas de maneira associativa e são possivelmente
influenciados pelo meio em que estão inseridos.
Dentre os vieses cognitivos contidos na literatura temos o fator de autoconfiança,
explorada por Barber and Odean (2001), que obtiveram resultados curiosos, isto é, quanto
mais um indivíduo investe, pior é seu desempenho. E o efeito de disposição em que
Hirshleifer (2001) mostra que pessoas não aceitam que terão prejuízo e postergam a
realização da perda e com isso acabam tendo prejuízos maiores
Paralelamente a ideia contida no parágrafo anterior, a hipótese de mercados efici-
entes, testada em diversos trabalhos como os de Malkiel (2003) e Friedman (1953), nos diz
que os preços dos ativos refletem toda a informação disponível sobre eles, como em Fama
et al. (1969). O lucro, então, seria possível pelo risco associado a cada operação. A hipótese
de mercados eficientes, no entanto, não explica a existência de bolhas na economia.
No final da década de sessenta surgiram os primeiros trabalhos com evidências
contrárias a hipótese de mercados eficientes. Malkiel and Fama (1970) conseguiram
encontrar evidências de que existe correlação serial entre retornos, ou seja, os retornos do
mercado não seguem um processo de martingal. Aproximadamente dez anos mais tarde,
Shiller (1980), verificou que os preços das ações negociadas são muito mais voláteis do que
seu valor patrimonial.
A hipótese de que os mercados não são eficientes se da por imperfeições encontradas,
como é o caso da assimetria de informação. Chan et al. (2004) propôs um método de
incorporação de informação por ruídos encontrados nos retornos de ações. Segundo o autor,
sinais que contém informações sobre empresas são dados e o erro de previsão de preço está
relacionado a estes sinais.
Capítulo 2. Revisão da Literatura 12

2.2 Machine Learning


O segundo tema que é abordado neste trabalho é a ferramenta utilizada para
que seja possível realizar a análise de dados. Tal ferramenta é conhecida como Machine
Learning que vem ganhando espaço atualmente em estudos em diversas áreas inclusive em
finanças. Um exemplo de utilização do Machine Learning, em outra área de pesquisa, é
a categorização de genes para descobrir se tratam-se de genes cancerígenos Guyon et al.
(2002). Um estudo recente realizado por Gu et al. (2018) mostra didaticamente alguns dos
ferramentais de Machine Learning aplicados no mercado acionário norte-americano.
Os autores evidenciados no parágrafo anterior tinham como objetivo entender se
existem benefícios na utilização de técnicas de Machine Learning na precificação de ações,
dado uma gama bastante grande de fatores de risco. Com o aumento de fatores, a tendência
é que regressões que não se utilizam de técnicas avançadas para elencar coeficientes tenham
baixo desempenho. Pode-se dizer que um dos maiores ganhos com a utilização de Machine
Learning é não precisar escolher com antecedência quais são os fatores a serem utilizados
e deixar que os próprios modelos decidam a relevância de cada fator na explicação da
variável dependente.
Gu et al. (2018) fizeram um estudo testando diversos modelos de previsão (regressões,
árvore de decisão e redes neurais) a fim de verificar qual deles era capaz de prever o preço
futuro das ações. O período analisado por eles foi de março de 1957 até dezembro de 2016,
utilizando 94 fatores de risco. Os dados deles tiveram frequência mensal e ao todo foram
estudadas aproximadamente 30 mil ações, dos índices de NYSE, AMEX e NASDAQ.

2.3 Fatores de Risco


O terceiro tópico a ser explicitado são os fatores de risco. Existe uma literatura
bastante vasta neste campo dizendo quais são os melhores fatores explicativos do desem-
penho no mercado acionário. No entanto os trabalhos têm conclusões divergentes, não
existe consenso. Bone and Ribeiro (2002) chegaram a conclusão que a variável dia da
semana é capaz de prever retornos das ações no mercado brasileiro. Já Cutler et al. (1988)
identificou uma correlação entre o preço das ações e noticias sobre as empresas. Holthausen
and Leftwich (1986) verificaram que o rating das empresas acabam influenciando em seus
preços.
O estudo de fatores de risco começou com Markowitz (1952) com a ideia de que os
preços eram consequência da variação do ativo e da média de seus retornos. Posteriormente
foi criado por Sharpe (1964) o Capital Asset Pricing Model (CAPM) em que o modelo de
precificação de ativos se dá pelo beta multiplicado pelo prêmio de risco e através do retorno
esperado (livre de risco). Depois de ser aceito por uns e criticado por outros pesquisadores,
Capítulo 2. Revisão da Literatura 13

o CAPM ganhou uma nova versão, Fama and French (1993) criaram o modelo do CAPM
com três fatores, levando em consideração o fator de risco, o tamanho da empresa e o Book
to Market. Atualmente o estudo sobre fatores de risco é bastante amplo, a seguir têm-se
alguns exemplos de pesquisas mais recentes.
Hwang and Rubesam (2018) utilizaram-se da técnica bayesiana de seleção de
variáveis, utilizando regressão multivariada e chegaram a conclusão que o único fator capaz
de explicar o retorno em ações individuais, no período de 1980 até 2016, foi o excesso de
retorno de mercado. Além disso, eles observaram que a seleção de fatores varia conforme o
período estudado, a analise foi realizada em diferentes subamostras de tempo.
Existem trabalhos indicando que as anomalias de mercado não são problemas de
descasamento de informação. Cochrane (2011) alega que são problemas de taxa de desconto.
Isto significa que alguns estudiosos pensam que os esforços para realizar previsões de
retorno deveriam ser focados na taxa de desconto.
A existência de uma gama relativamente grande de novos fatores surgindo a cada
momento (zoo of factors) faz com que cresça tanto a literatura destinada aos fatores
quanto também a discussão sobre quais fatores de risco melhor explica o retorno. Quando
eram poucos os fatores analisados, os testes estatísticos para determinar se cada um
era significativo e se explicava a variação de preço das ações eram mais simples, eram
basicamente testes de hipóteses individuais. Com o aumento dos fatores de risco, técnicas
mais avançadas precisaram ser criadas. Feng et al. (2017) criaram uma metodologia para
verificar se cada novo fator de risco adicionado é significativo ou não.
Ainda sobre o zoo of factors, o trabalho de Feng et al. (2017) indicou os trabalhos
de Cochrane (2011), Harvey et al. (2016), McLean and Pontiff (2016) e Hou and Robinson
(2006) como exemplos de pesquisas que mostram uma quantidade grande e diversa de
fatores de risco.
No Brasil, pesquisas sobre este tema são bastante comuns. de Fátima Santana
and Rathke (2019) tentaram verificar se um modelo estatístico de apreçamento de ativos
performava melhor do que o modelo de quatro fatores de Carhart (1997). Para isso eles
fizeram uma análise com dados em time series e cross section, sendo que o modelo de
quatro fatores se mostrou melhor na análise do mercado brasileiro. No entanto os resultados
não foram satisfatórios, ou seja, não houve evidência de prêmio de risco.
Outro exemplo de análise no mercado brasileiro foi feita por da Costa Jr and
Neves (2000), que através de uma regressão múltipla buscaram encontrar relações entre
os retornos das ações e variáveis que eles denominaram como fundamentalistas (beta,
relação entre preço e lucro, relação entre preço e valor patrimonial e o valor de mercado).
O resultado mostrou que todas as variáveis são responsáveis pelo retorno das ações, no
entanto a que mais se destaca é o beta.
14

3 Metodologia

Como já foi dito anteriormente, a ferramenta utilizada para a análise dos dados é
o Machine Learning. No entanto, o conceito de Machine Learning é muito amplo, neste
trabalho são utilizadas dois métodos de análise de dados. Estes métodos são: Regressão
Logística e Árvore de Decisão.
O software usado no trabalho é o Anaconda e a linguagem dele é o Python. Pode-
se dizer que a maior vantagem de utilizar o Anaconda é que ele já tem ferramentas e
bibliotecas fundamentais para a análise de dados como: Scikit-Learn, Jupyter Notebook,
Numpy, Matplotlib e Pandas
Um modelo que se utiliza de Machine Learning passa pelo treino e teste de dados a
fim de verificar se é um bom preditor. Os dados, que estão ordenados em ordem crescente
cronologicamente, são subdivididos em dados de treino e dados de teste. O ideal é que
a maior parte dos dados seja destinada ao treino e o restante ao teste. Neste trabalho,
5% foi destinado ao teste e 95% ao treino. Assim sendo, verifica-se se os dados de treino
e de teste são iguais à variável explicada. Se for, é porque os coeficientes das variáveis
explicativas são bons previsores.

     
a11 · · · a1n b1 y
 previsão1
 .. . . . ..
    
 . .. ..  ·  ..  = 
   
.

 (3.1)
     
an1 · · · ann bn yprevisãon
   
y y
 real1   previsão1 
.. ..
. = . (3.2)
   
 
   
yrealn yprevisãon

Em que a matriz A é composta pelas variáveis explicativas, a matriz B pelos


coeficientes e a matriz Y pela previsão.
A previsão pode ser conceituada como o resultado da análise de variáveis explicativas
a partir de dados passados. O que este trabalho busca é um modelo generalizado, ou seja,
busca um modelo que os coeficientes sejam bons para prever os dados de treino e de teste.
É possível encontrar modelos que os dados de treino são muito precisos e chegam a ser
praticamente idênticos aos dados reais, no entanto ao expandir e realizar o teste com estes
coeficientes nos dados de teste eles acabam sendo pouco explicativos, por não ser um
modelo generalizado.
Outro ponto a ser discutido é a complexidade do modelo. Quanto mais variáveis
adicionadas, melhor fica o ajuste do modelo dentro de cada amostra, porém sua complexi-
Capítulo 3. Metodologia 15

dade também aumenta, aumentando o risco de overfitting. Portanto, existe um trade-off


entre complexidade e acuracidade dos dados de teste.
Overfitting – muitos parâmetros desnecessários de entrada (modelo muito complexo)
Underfitting – parâmetros importantes de entrada omitidos (complexidade menor)
Após a extração dos fatores de risco por meio do terminal da Bloomberg, eles foram
importados no Anaconda, que através dos algoritmos tanto de regressão logística como
de árvore de decisão (apêndice A) foram realizadas as previsões de variação de preço por
ação. A metodologia buscou seguir o roteiro de pesquisa de Gu et al. (2018), no entanto a
frequência de dados foi diária, ao em vez de mensal, as quantidades de fatores de risco
foi menor (40 fatores), e os modelos estudados foram apenas de regressão logística e de
árvore de decisão.

Regressão Logística
Em um modelo de regressão logística, a variável resposta é binária, neste caso, a
variável resposta assume dois valores possíveis, ou seja, o preço da ação pode aumentar ou
pode diminuir.
De acordo com Müller et al. (2016), nas regressões lineares, o retorno é realizado
pela soma ponderada dos fatores. Contudo, em regressões logísticas, o valor de retorno
fica contido entre 1 e -1. Caso o retorno seja positivo ele será classificado como 1, e caso
seja negativo será classificado como -1. Para regressões logísticas lineares, que é o caso
neste trabalho, a resposta y acaba formando uma reta que divide as classificações.

yreal = B0 + B1 A1 + B2 A2 + · · · + Bn An + ε (3.3)

yprevisão = B̂A (3.4)

Figura 1 – Regressão Logística


Capítulo 3. Metodologia 16

Etapas da análise:

1. Importação dos dados: fatores de risco (variáveis explicativas), valor da ação em cada
período de tempo (variável explicada) e importação da função LogisticRegression,
para isto será utilizado o Scikit-learn;

2. Atribuição de dados ao código;

3. Separação de dados entre treinos e teste;

4. Verificar coeficiente e intercepto. O intercepto será uma variável flutuante e o


coeficiente será um vetor;

5. Encontrar a acuracidade dos dados de treino e teste;

6. Verificar se o score de treino e o score do teste são parecidos, se forem é sinal de


underfitting, se o treino for muito maior do que o teste é sinal overfitting.

Quanto maior for a amostra melhor é o resultado da regressão logística. Ele não
funciona bem para grandes quantidades de fatores, que é o caso da análise feita neste
trabalho.

Árvore de Decisão
Árvores de decisão não fazem mais parte de modelos lineares de tomada de decisão.
Elas são estruturas em blocos de decisão do tipo se verdadeiro então e se falso então. Cada
decisão é um nó e cada resposta à decisão é uma ramificação (verdadeiro ou falso). Pelo seu
formato, que se assemelha a uma árvore, o processo ganhou o nome de árvore de decisão.
Cada nó, em uma árvore de decisão, é chamado de teste, sendo que cada teste
verifica se o fator é maior ou menor do que o valor do teste. O algoritmo busca todas as
possibilidades de teste e escolhe aquele que melhor representa a variável em questão. O
processo então é realizado novamente.
Um dos grandes problemas deste método é o overfitting, que é bastante comum.
Para evitá-lo é preciso limitar a quantidade de ramificações do processo, sendo que nesse
caso foi limitado a quatro ramificações. Para tornar o processo mais simples e também
para que os resultados sejam mais satisfatórios, a variável resposta (preço da ação) é
transformada em uma variável categórica.
Etapas da análise:

1. Transformação da variável resposta em variável categórica;


Capítulo 3. Metodologia 17

2. Importação dos dados: fatores de risco (variáveis explicativas), valor da ação em cada
período de tempo (variável explicada) e importação da função Árvore de Decisão
categórica, para isto será utilizado o Scikit-learn;

3. Atribuição de dados ao código;

4. Limitar a ramificação da árvore (para evitar overfitting);

5. Separação de dados entre treino e teste;

6. Encontrar a acuracidade dos dados de treino e teste;

7. Verificar se o score de treino e o score do teste são parecidos, se forem é sinal de


underfitting, se o treino for muito maior do que o teste é sinal overfitting;

8. Encontrar a importância de cada fator na árvore de decisão.


18

4 Dados

Tendo em vista que o objetivo do presente trabalho é verificar se o mercado acionário


brasileiro toma decisão baseado em fatores de risco é preciso que as ações escolhidas para
a análise sejam ações de maior visibilidade. Para isso, foram escolhidas as ações quem
compõe o índice IBRX.
Importante ressaltar que o índice IBRX foi escolhido para a análise uma vez que as
empresas que o compõe são as de maior visibilidade no mercado. Além disso os fatores de
risco foram escolhidos não apenas porque estão presentes em Gu et al. (2018), mas também
pelo fato de serem fatores que o mercado acompanha para realizar as suas tomadas de
decisão.
Os dados foram extraídos de 2008 até junho de 2018, do terminal da Bloomberg.
Foram extraídos 40 fatores de risco e a variável resposta será a direção do preço da ação
(se irá subir ou se irá cair). No entanto nem todas as empresas possuem os 40 fatores
calculados para todo o período. Os dados extraídos possuem frequência diária.
Para saber se a utilização da variável explicativa deve ser feita em nível ou em
variação percentual foi feito um teste de Dickey-Fuller para verificar se a variável é
estacionária ou não. Os testes são realizados individualmente, as variáveis estacionárias
permaneceram com valor absoluto, já as não estacionárias entraram na base como variação
percentual.
As variáveis utilizadas na análise podem ser encontradas na Tabela 1. Para elencar
os fatores de risco, foram utilizados como base os fatores do trabalho de Gu et al. (2018), na
pesquisa dos autores citados anteriormente, foram utilizados 94 fatores, no entanto como
não havia todos os fatores já calculados no terminal da Bloomberg para ações brasileiras,
no presente trabalho são utilizados 40 variáveis.
O índice IBRX é composto pelas 100 maiores ações da bolsa brasileira, no entanto,
nem todas as empresas possuem dados desde 2008. Para escolher quais empresas estariam
no estudo, optou-se por escolher aquelas que tinham mais do que 70% dos fatores de risco
preenchidos em 2008 (Tabela 2).
Nesta tabela pode-se verificar quais foram os fatores usados nos modelos juntamente
com o percentual de informação de cada um deles.
Capítulo 4. Dados 19

Tabela 1 – Fatores de Risco


Capítulo 4. Dados 20

Tabela 2 – Empresas
21

5 Resultados

Antes de os modelos serem gerados foi preciso decidir se cada fator de risco
seria analisado em nível ou com variação percentual. Para isto foi feito um teste de
estacionaridade para cada variável, teste esse desenvolvido por Dickey and Fuller (1979).
A hipótese nula do teste de Dickey-Fuller é que a série de tempo é não estacionária,
ou seja, dado um processo autoregressivo simples:

yt = ρyt−1 + ut (5.1)

tem-se que:

H0 : ρ = 1

A tabela a seguir mostra os resultados obtidos.

Tabela 3 – Teste Dickey-Fuller

A variável resposta do modelo é a variação do preço. Esta variação é uma resposta


binária, informando se o preço da ação irá crescer ou decrescer no período seguinte.

Regressão Logística
Utilizando o modelo de regressão logística para as 71 empresas analisadas , em 38
delas o modelo conseguiu prever em mais do que 50%, os dados de teste (acertou mais da
metade da previsão fora da amostra). No entanto, fazendo-se o seguinte teste de hipótese:

H0 : Acuracidade de treino é igual a 50% (5.2)


Capítulo 5. Resultados 22

16 delas podem ser consideradas maiores do que 50%, ou seja, o modelo é capaz
de prever de fato a variação em 22% das empresas. São elas: BEEF3, BRAP4, BBDC3,
BBDC4, BEEF3, BRAP4, BRFS3, BRKM5, BRML3, BRSR6, BTOW3, CCRO3, CESP6,
CMIG4, CPLE6, CSAN3. O resultado completo pode ser observado na Tabela 4.

Tabela 4 – Resultado da Regressão Logística

Fazendo uso do teste não paramétrico de predição de desempenho proposto por


Pesaran and Timmermann (1992), verifica-se que o resultado não se altera, isto é, o modelo
consegue ser capaz de prever apenas o resultado de 16 empresas. O objetivo deste teste é
flexibilizar o resultado pelas variâncias.

P̂ − P̂∗
Sn =  1/2 (5.3)
ˆ P̂ ) − var(
var( ˆ P̂∗ )

Em que segundo Hausman (1978) P̂ é o estimador de resultados positivos e P̂∗ o


de resultados nulos.
A seguir, há um exemplo da empresa Minerva (BEEF3) com os parâmetros estima-
dos, para a regressão logística e o diagrama da árvore de decisão.
Capítulo 5. Resultados 23

Tabela 5 – Regressão Logística

Figura 2 – Diagrama da Árvore de Decisão


Capítulo 5. Resultados 24

Árvore de Decisão
Utilizando o modelo de árvore de decisão para as 71 empresas analisadas , em
37 delas o modelo conseguiu prever em mais do que 50%, os dados de teste (acertou
mais da metade da previsão fora da amostra). No entanto, fazendo-se o teste de hipótese
(5.2) tem-se que 18 delas podem ser consideradas maiores do que 50%, ou seja, o modelo
é capaz de prever de fato a variação em apenas 25% das empresas. São elas: ABEV3,
BBDC3, BEEF3, BRSR6, BTOW3, CSMG3, CYRE4, EMBR3, ENBR3, GFSA3, ITSA4,
LAME3, MRVE3, PETR3, PETR4, PSSA3, SLCE3, TIMP3. O resultado completo pode
ser observado na Tabela 6.

Tabela 6 – Resultado da Árvore de Decisão

Realizando o teste não paramétrico de predição de desempenho para a árvore de


decisão, têm-se os mesmos resultados que o teste de hipótese simples.
É possível evidenciar que a árvore de decisão se mostra melhor preditora de
resultados do que a regressão logística, o que vai ao encontro dos resultados obtidos no
Capítulo 5. Resultados 25

trabalho de Gu et al. (2018). A diferença do mercado norte americano para o brasileiro, no


entanto, é que ele se mostrou mais previsível do que o brasileiro. Porém, é valido ressaltar
que no trabalho citado anteriormente, fez-se uso de mais fatores de risco do que neste
presente trabalho. O aumento na quantidade de fatores pode beneficiar ainda mais a
previsão, principalmente da árvore de decisão.
Comparando os resultados com os obtidos em pesquisas realizadas no mercado
acionário brasileiro, chega-se a conclusões parecidas. Ao estudar sobre previsibilidade no
mercado brasileiro, Boainain and Valls Pereira (2009) perceberam que o padrão gráfico
consegue prever resultados. A análise gráfica estudada por eles foi de ”cabeça - ombro
- cabeça” e o resultado foi bastante positivo, mostrando que mesmo com os custos de
operação, a análise gráfica se mostra significativa.
Embora não existam muitos trabalhos sobre previsibilidade de empresas brasileiras
utilizando Machine Learning, existem pesquisas que mostram evidências de previsibilidade
na bolsa brasileira, como é o caso de Rostagno et al. (2004). Eles conseguiram determinar
alguns fatores de risco que explicam o preço de ações.
26

6 Extensões

Dado que foram encontradas evidências de previsibilidade no mercado acionário


brasileiro, utilizando os modelos de regressão logística e de árvore de decisão é possível
incorporar outras variáveis aos modelos deste trabalho e expandir a análise para outros
modelos mais complexos como os de redes neurais.
Além de técnicas mais avançadas de análise de dados, outra etapa a ser aprofundada
seria a construção de estratégias de investimentos utilizando os resultados obtidos. Boainain
and Valls Pereira (2009) fizeram uso da metodologia de Bootstrap com o objetivo de
construir estatísticas e verificar se existia evidências de previsibilidade no mercado brasileiro,
utilizando análise gráfica.
Machado et al. (2015) fizeram um algoritmo capaz de avaliar estratégias de compra
e venda de ações (inclusive com o preço da operação já incluído no cálculo), porém com
base na análise gráfica, assim como Boainain and Valls Pereira (2009). Tanto a lógica
do algoritmo desenvolvido na estratégia de investimento quanto a análise de Bootstrap
poderiam ser ferramentas importantes para os próximos passos deste trabalho.
27

7 Conclusão

Era esperado que a análise de arvore de decisão fosse melhor do que a análise
de regressão logística. De fato, se considerar apenas os testes estatísticos que foram
significativos, a árvore de decisão se mostra melhor, porém apenas um pouco melhor do
que a regressão logística.
Outra conclusão importante é o fato de existir uma pequena evidência de que
o mercado brasileiro é previsível. Esta conclusão pode ser utilizada para explorar mais,
não apenas estes modelos, como outros mais complexos, redes neurais é um exemplo.
Pode-se incorporar também outras variáveis explicativas aos modelos, como notícias sobre
as empresas e índices de recomendação.
28

Referências

Barber, B. M. and T. Odean (2001). Boys will be boys: Gender, overconfidence, and
common stock investment. The quarterly journal of economics 116 (1), 261–292.

Blume, L., D. Easley, and M. O’hara (1994). Market statistics and technical analysis: The
role of volume. The Journal of Finance 49 (1), 153–181.

Boainain, P. G. and P. L. Valls Pereira (2009). "ombro-cabeça-ombro": Testando a


lucratividade do padrão gráfico de anáise técnica no mercado de ações brasileiro. Revista
Brasileira de Finanças 7 (3).

Bone, R. B. and E. P. Ribeiro (2002). Eficiência fraca, efeito dia-da-semana e efeito feriado
no mercado acionário brasileiro: uma análise empírica sistemática e robusta. Revista de
Administração Contemporânea 6 (1), 19–37.

Carhart, M. M. (1997). On persistence in mutual fund performance. The Journal of


finance 52 (1), 57–82.

Chan, W. S., R. Frankel, and S. P. Kothari (2004). Testing behavioral finance theories
using trends and consistency in financial performance. Journal of Accounting and
Economics 38, 3–50.

Cochrane, J. H. (2011). Presidential address: Discount rates. The Journal of finance 66 (4),
1047–1108.

Cutler, D. M., J. M. Poterba, and L. H. Summers (1988). What moves stock prices?

da Costa Jr, N. C. and M. B. Neves (2000). Variáveis fundamentalistas e os retornos das


ações. Revista Brasileira de Economia 54 (1), 123–137.

de Fátima Santana, V. and A. A. T. Rathke (2019). A statistical factor asset pricing


model versus the 4-factor model. Brazilian Review of Finance 16 (4), 545–572.

Dickey, D. A. and W. A. Fuller (1979). Distribution of the estimators for autoregressive


time series with a unit root. Journal of the American statistical association 74 (366a),
427–431.

Fama, E. F., L. Fisher, M. C. Jensen, and R. Roll (1969). The adjustment of stock prices
to new information. International economic review 10 (1), 1–21.

Fama, E. F. and K. R. French (1993). Common risk factors in the returns on stocks and
bonds. Journal of financial economics 33 (1), 3–56.
Referências 29

Feng, G., S. Giglio, and D. Xiu (2017). Taming the factor zoo. Fama-Miller Working
Paper 24070.

Friedman, M. (1953). The case for flexible exchange rates.

Gu, S., B. Kelly, and D. Xiu (2018). Empirical asset pricing via machine learning. Technical
report, National Bureau of Economic Research.

Guyon, I., J. Weston, S. Barnhill, and V. Vapnik (2002). Gene selection for cancer
classification using support vector machines. Machine learning 46 (1-3), 389–422.

Harvey, C. R., Y. Liu, and H. Zhu (2016). . . . and the cross-section of expected returns.
The Review of Financial Studies 29 (1), 5–68.

Hausman, J. A. (1978). Specification tests in econometrics. Econometrica: Journal of the


econometric society, 1251–1271.

Hirshleifer, D. (2001). Investor psychology and asset pricing. The Journal of Finance 56 (4),
1533–1597.

Holthausen, R. W. and R. W. Leftwich (1986). The effect of bond rating changes on


common stock prices. Journal of Financial Economics 17 (1), 57–89.

Hou, K. and D. T. Robinson (2006). Industry concentration and average stock returns.
The Journal of Finance 61 (4), 1927–1956.

Hwang, S. and A. Rubesam (2018). Searching the factor zoo.

Machado, E. J., R. Oliveira, A. C. M. Pereira, M. Gerais, and B. H.-B. B. Horizonte-Brazil


(2015). Proposal and implementation of machine learning and deep learning models for
stock markets.

Malkiel, B. G. (2003). The efficient market hypothesis and its critics. Journal of economic
perspectives 17 (1), 59–82.

Malkiel, B. G. and E. F. Fama (1970). Efficient capital markets: A review of theory and
empirical work. The journal of Finance 25 (2), 383–417.

Markowitz, H. (1952). Portfolio selection. The journal of finance 7 (1), 77–91.

McLean, R. D. and J. Pontiff (2016). Does academic research destroy stock return
predictability? The Journal of Finance 71 (1), 5–32.

Müller, A. C., S. Guido, et al. (2016). Introduction to machine learning with Python: a
guide for data scientists. "O’Reilly Media, Inc.".
Referências 30

Pesaran, M. H. and A. Timmermann (1992). A simple nonparametric test of predictive


performance. Journal of Business & Economic Statistics 10 (4), 461–465.

Rostagno, L. M., G. O. Kloeckner, and J. L. Becker (2004). Previsibilidade de retorno das


ações na bovespa: um teste envolvendo o modelo de fator de retorno esperado. Revista
Brasileira de Finanças 2 (2), 183–206.

Sharpe, W. F. (1964). Capital asset prices: A theory of market equilibrium under conditions
of risk. The journal of finance 19 (3), 425–442.

Shiller, R. J. (1980). Do stock prices move too much to be justified by subsequent changes
in dividends?

Taylor, M. P. and H. Allen (1992). The use of technical analysis in the foreign exchange
market. Journal of international Money and Finance 11 (3), 304–314.
Apêndices
APÊNDICE A – Códigos

A.1 Regressão Logística

import xlrd

import csv

def csv_from_excel ():

wb = xlrd.open_workbook('XXXX')

sh = wb.sheet_by_index(0)

arquivo = open('arquivo.csv','w')

wr = csv.writer (arquivo, quoting = csv.QUOTE_ALL)

for rownum in range (sh.nrows):

wr.writerow (sh.row_values(rownum))

arquivo.close()

csv_from_excel()

import datetime as dt

import pandas as pd

import numpy as np

import matplotlib.pylab as plt

import sklearn as sklearn

from matplotlib.pylab import rcParams

rcParams['figure.figsize'] = 15,6

data = pd.read_csv('arquivo.csv')

print (data.head())

print ('n\Data Types:')

print (data.dtypes)

#raw_data['Dates'] = pd.to_datetime(raw_data['Dates'], format = '%Y-%m')

import datetime as dt

df = pd.read_csv('arquivo.csv');

df['Dates'] = pd.to_datetime(df['Dates'])

df.info()

df

#dateparse = lambda dates: pd.datetime.datetime(dates, '%Y-%m')

data = pd.read_csv('arquivo.csv', index_col = 'Dates')

print(data.head())
data.index

data = data['2008-1-1':'2018-06-30']

from sklearn.linear_model import LogisticRegression

from sklearn.svm import LinearSVC

X= data.drop(['PX_LAST'], axis=1)

y= data['PX_LAST']

print (X)

print(y)

X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.051,shuffle=False)

print("Test set predictions:\n{}".format([y_test])[:5000])

logreg= LogisticRegression(C=100).fit(X, y)

print ("lr.coef_: {}".format(logreg.coef_))

print ("lr.intercept_: {}".format(logreg.intercept_))

print ("Training set score: {:.2f}".format(logreg.score(X_train,y_train)))

print ("Test set score: {:.2f}".format(logreg.score(X_test,y_test)))

y_test.to_excel('XXXX', encoding= 'utf-8', index= False)


A.2 Árvore de Decisão

import xlrd

import csv

def csv_from_excel ():

wb = xlrd.open_workbook('XXXX')

sh = wb.sheet_by_index(0)

arquivo = open('arquivo.csv','w')

wr = csv.writer (arquivo, quoting = csv.QUOTE_ALL)

for rownum in range (sh.nrows):

wr.writerow (sh.row_values(rownum))

arquivo.close()

csv_from_excel()

import datetime as dt

import pandas as pd

import numpy as np

import matplotlib.pylab as plt

import sklearn as sklearn

from matplotlib.pylab import rcParams

rcParams['figure.figsize'] = 15,6

data = pd.read_csv('arquivo.csv')

print (data.head())

print ('n\Data Types:')

print (data.dtypes)

#raw_data['Dates'] = pd.to_datetime(raw_data['Dates'], format = '%Y-%m')

import datetime as dt

df = pd.read_csv('arquivo.csv');

df['Dates'] = pd.to_datetime(df['Dates'])

df.info()

df

#dateparse = lambda dates: pd.datetime.datetime(dates, '%Y-%m')

data = pd.read_csv('arquivo.csv', index_col = 'Dates')

print(data.head())
data.index

data = data['2008-1-1':'2018-06-30']

from sklearn.tree import DecisionTreeClassifier

from sklearn.model_selection import train_test_split

X= data.drop(['PX_LAST'], axis=1)

y= data['PX_LAST']

print (X)

print(y)

X_train, X_test, y_train, y_test = train_test_split(X,y,test_size=0.051,shuffle=False)

print(y_test)

tree= DecisionTreeClassifier(max_depth=4).fit(X_train,y_train)

print ("Training set score: {:.2f}".format(tree.score(X_train,y_train)))

print ("Test set score: {:.2f}".format(tree.score(X_test,y_test)))

print ("Feature importances:\n{}".format(tree.feature_importances_))

y_test.to_excel('XXXX', encoding= 'utf-8', index= False)

from sklearn.tree import export_graphviz

export_graphviz(tree, out_file= "tree.dot",class_names=["positivo","negativo","0"],impurity =


False, filled = True)

import graphviz

from IPython.display import display

with open("tree.dot") as f:

dot_graph = f.read()

display(graphviz.Source(dot_graph))

from sklearn.metrics import confusion_matrix

tree_pred = tree.predict(X_test)

confusion = confusion_matrix(y_test,tree_pred)

print("Confusion matrix: n{}".format(confusion))


36

APÊNDICE B – Definições das Variáveis


Obtidas pelo Terminal da Bloomberg

ASSET− GROWTH
Um aumento ou redução percentual do total de ativos, comparando o período atual
com o mesmo período do ano anterior. Calculado por:

(Ativo total − Ativo total do mesmo periodo do ano anterior ) × 100


(B.1)
Ativo total mesmo período do ano anterior

No qual: Ativo total é BS035, BS− TOT− ASSET

IS− ABNORMAL− ITEM


Itens extraordinários:
Valor bruto de lucros (ou prejuízos) extraordinários/excepcionais. Inclui Pesquisa e
desenvolvimento em andamento/adquirida, Aquisição de empresa/Despesas com fusão,
Considerações contingentes, Desvalorização cambial, Quitação de dívida/Liquidação de
dívida/Refinanciamento de dívida, Alienação de ativos, Derivativos/Hedge/Market to Mar-
ket, Reduções/Baixas, Pagamentos de seguros, Liquidação jurídica/Litígios, Fechamento
de instalações/usinas, Contabilidade de compra, Investimentos realizados, Reestrutura-
ção/Indenização, Combustíveis sintéticos.
Exclui: Amortização de ativos intangíveis e despesas com compensação com base
em ações.

IS− NET− ABNORMAL− ITEMS


Itens anormais, excepcionais ou únicos, valor líquido dos efeitos tributários. Este
campo inclui lucros ou prejuízos de investimentos realizados, encargos de reestruturação,
encargos/lucros não recorrentes, encargos/lucros incomuns, encargos/lucros especiais,
encargos de reserva, grandes reduções, despesas com cisão/liquidação, despesas com fusão,
despesas de aquisição, despesas com venda de subsidiária, perdão de dívida, redução de
goodwill, despesas de desenvolvimento, pesquisa adquirida e outros itens únicos. Refira-se a
(IS095, IS− ABNORMAL− ITEM) para números de Itens extraordinários antes de impostos
e (IS096, IS− TAX− EFF− ON− ABNORMAL− ITEM) para o Efeito tributário em itens
extraordinários.
APÊNDICE B. Definições das Variáveis Obtidas pelo Terminal da Bloomberg 37

Números divulgados em milhões; a Substituição de formato de escala (DY339,


SCALING− FORMAT) pode ser usada para exibir unidades para o campo.

AVERAGE− BID− ASK− SPREAD− %


Média de todos os spreads de compra/venda. Os pontos de compra/venda utilizados
para o cálculo correspondem às cotações recebidas para o período indicado pelo intervalo
de Calc (PX393, CALC− INTERVAL) (valor padrão é cinco dias), se encerrando no dia
de negociação completa anterior à data indicada pela substituição de data final (PX392,
END− DATE− OVERRIDE (valor padrão é dia mais recente de negociação concluída).
Para que um dia de negociação contribua ao cálculo, deve haver pelo menos dez pontos
válidos de spread de compra/venda no dia. O campo retorna valores apenas quando mais
de 50% dos dias de negociação no período forem elegíveis para contribuição no cálculo. A
substituição do intervalo de Calc (PX393, CALC− INTERVAL) suporta apenas períodos
de um (1D) a 30 (30D) dias.

AVERAGE− BID− ASK− SPREAD


Média de todos os spreads de compra/venda. Os pontos de compra/venda utilizados
para o cálculo correspondem às cotações recebidas para o período indicado pelo intervalo
de Calc (PX393, CALC− INTERVAL) (valor padrão é cinco dias), se encerrando no dia
de negociação completa anterior à data indicada pela substituição de data final (PX392,
END− DATE− OVERRIDE (valor padrão é dia mais recente de negociação concluída).
Para que um dia de negociação contribua ao cálculo, deve haver pelo menos dez pontos
válidos de spread de compra/venda no dia. O campo retorna valores apenas quando mais
de 50% dos dias de negociação no período forem elegíveis para contribuição no cálculo. A
substituição do intervalo de Calc (PX393, CALC− INTERVAL) suporta apenas períodos
de um (1D) a 30 (30D) dias.

PX− TO− BOOK− RATIO

Ültimo Preço
(B.2)
Valor contábil por açâo
No qual:
Último preço é PR005, PX− LAST
Valor contábil por ação é RR020, BOOK− VAL− PER− SH
Dados do período de divulgação mais recente (trimestral, semestral ou anual)
usados no cálculo.
Portfólio:
APÊNDICE B. Definições das Variáveis Obtidas pelo Terminal da Bloomberg 38

Calculado como o Valor total de mercado (IN089, INDX− MARKET− CAP) dividido
pela soma do Valor contábil de holdings. Contribuições são calculadas como o Valor contábil
por ação (RR020, BOOK− VAL− PER− SH) do ativo multiplicado pelo número de ações
mantidas.

FCF− TO− TOTAL− DEBT


Fluxo de caixa livre dos últimos 12 meses como um múltiplo do total da dívida em
curto e longo prazo. Calculado por:

Fluxo de caixa livre dos últimos 12 meses


(B.3)
Dívida total
No qual:
Fluxo de caixa livre dos últimos 12 meses é RR843, TRAIL− 12M− FREE− CASH− FLOW
Dívida total é RR251, SHORT− AND− LONG− TERM− DEBT
Obs.: Se o denominador for zero, a divisão não será significativa e não será calculada.

NET− DEBT− TO− CASHFLOW


Divisão da dívida total de uma empresa pelo fluxo de caixa dos últimos 12 meses
de operações. Unidade: Real. Calculado por:

Divida liquida
(B.4)
Fluxo de caixa de operações
No qual:
Dívida líquida é RR208, NET− DEBT
Caixa de operações dos últimos 12M é RR824, TRAIL− 12M− CASH− FROM− OPER

CF− CASH− FROM− OPER


Valor total do fluxo de caixa gerado pelas operações de uma empresa. O efeito
de Alterações no capital de giro não relacionadas ao fluxo de caixa no fluxo de caixa de
operações pode ser positivo ou negativo. Redução em ativos circulantes ou aumento de
passivos circulantes, aumenta o fluxo de caixa de operações, enquanto um aumento em
ativos circulantes ou redução em passivos circulantes diminui o fluxo de caixa de operações.
É calculado por:
Lucro líquido + Depreciação e amortização + Outros ajustes não relacionados ao
fluxo de caixa + Alterações no capital de giro não relacionadas ao fluxo de caixa
No qual:
APÊNDICE B. Definições das Variáveis Obtidas pelo Terminal da Bloomberg 39

Lucro líquido é CF010, CF− NET− INC


Depreciação e amortização é CF011, CF− DEPR− AMORT
Outros ajustes não relacionados ao caixa é CF012, CF− OTHER− NON− CASH− ADJUST
Alterações no capital de giro não relacionadas ao fluxo de caixa é:
CF013, CF− CHNG− NON− CASH− WORK− CAP
Total do fluxo de caixa de atividades operacionais:
Soma do Lucro líquido, Depreciação e amortização, Outros ajustes não relacionados
ao fluxo de caixa e alterações no capital de giro não relacionada ao fluxo de caixa.

PX− TO− CASH− FLOW


A proposição preço/fluxo de caixa é a divisão do preço da ação, dividido pelo fluxo
de caixa por ação (RR839). Média das ações em circulação é usada no cálculo do fluxo de
caixa por ação.
O valor do fluxo de caixa por ação é calculado com uma base de 12 meses conse-
cutivos, quando disponível. Últimos valores são calculados pela soma dos últimos quatro
trimestres.
Índice de ações:
Divisão dada por preço atual/fluxo de caixa. Calculado com o último preço
(PR005, PX− LAST) dividido pelo fluxo de caixa por ação dos últimos 12M (RR022,
CASH− FLOW− PER− SH).
Portfólio:
Calculado como o Valor total de mercado (IN089, INDX− MARKET− CAP) di-
vidido pela soma de Fluxos de caixa de holdings. Contribuições são calculadas como
o valor do Fluxo de caixa por ação dos últimos 12M [Caixa de operações (CF015,
CF− CASH− FROM− OPER) dividido por Ações em circulação (BS081, BS− SH− OUT)] do
ativo, multiplicado pelo número de ações mantidas.

PX− TO− FREE− CASH− FLOW


Medida de avaliação que compara o preço de mercado da empresa ao seu nível de
fluxo de caixa livre dos últimos 12 meses por ação. Calculado por:

último preço
(B.5)
FCL últimos 12 meses por açâo
No qual:
Último preço é PR005, PX− LAST
APÊNDICE B. Definições das Variáveis Obtidas pelo Terminal da Bloomberg 40

FCL últimos 12 meses por ação é:


RR840, TRAIL− 12M− FREE− CASH− FLOW− PER− SH

EQY− SH− OUT


O número total de ações em circulação atuais. Estes dados podem ter sido obtidos
de relatórios anuais, semestrais e trimestrais, arquivos Edgar, comunicados à imprensa
ou Bolsas de valores de maio de 2000 até a presente data. Até maio de 2000, os dados
diários de ações em circulação são compostos de dados de relatórios intermediários e
anuais apenas para todas as empresas da classe de ações únicas, e não retorna dados para
empresas de várias ações. Valor cotado em milhões. Refira-se a valor real de ações em
circulação (DS381, EQY− SH− OUT− REAL) para o número não arredondado do valor de
ações ou ações em circulação (BS081, BS− SH− OUT) para ações em circulação históricas.
Na maioria dos países, o número de ações em circulação pode incluir ações em tesouraria,
se existentes. Quando a divulgação permite, a Bloomberg faz o possível para remover as
ações canceladas e em tesouraria, em uma base oportuna.
As ações em circulação de todas as Bolsas de Valores dos países a seguir não
incluem ações em tesouraria do número de ações em circulação. Refira-se a DS555,
EQY− PRIM− SECURITY− COMP− EXCH para o código da Bolsa de valores de composite
do ativo primário:
Argentina (RA) , Bahamas (BM), Bangladesh (BD), Barbados (BA), Bermuda
(BH), Canadá (CN), Geórgia (GG), Ilhas Guernsey-Channel (GU), Índia (EM), Israel (IT),
Irlanda (ID), Jamaica (JA), Malásia (MC), Malta (VM), Nova Zelândia (NZ), Paquistão
(PA), Panamá (PP), Filipinas (PM), Cingapura (SP), Sri Lanka (SL), Trinidade e Tobago
(TP), Reino Unido (LN), Estados Unidos (EUA), Vietnã (VN), Tailândia (TB)
Ações em circulação são atualizadas em um ticker primário (ID043,
ID− BB− PRIM− SECURITY− FLAG como ’Y’). Ações em circulação de tickers
secundários não são mantidas, mas retornam de ações em circulação do ticker principal.
American Depository Receipts (ADR) /Global Depository Receipts (GDR):
Número de ações equivalentes subjacentes. Para ações em circulação ADR/GDR
reais, refira-se a ADRs em circulação (AD031, ADR− SH− OUT).
Para unidades, é a soma das ações em circulação de todos os ativos-objeto, dividida
pelo número de ativos que compõem uma unidade.

NUM− OF− EMPLOYEES


Número de funcionários por empresa, baseado no número de equivalência de
funcionários de horário integral. Se indisponível, então o número de funcionários de horário
APÊNDICE B. Definições das Variáveis Obtidas pelo Terminal da Bloomberg 41

integral é usado, excluindo funcionários de meio período.

IS− EPS
Lucro por ação:
Lucro por ação (LPA) é a parte do lucro de uma empresa que é alocado a cada
acionista. É calculado com base no lucro líquido disponível para acionistas de ações
ordinárias divididas pela média ponderada básica de ações em circulação. Este campo
retorna o lucro por ação Bottom-line quando as configurações de FPDF para ’Ajustes
não-GAAP.’ Substituição ajustada (DT094, FA− ADJUSTED) pode ser marcada com ’Y’
para retornar dados ajustados para excluir itens extraordinários. Unidade: Real
Brasil:
Lucro por ação é calculado com base no lote de cotação da empresa. Refira-se a
Volume de lote de cotação (PR091, PX− QUOTE− LOT− SIZE) para o lote de cotação.
INDEX:
Este campo retorna o agregado de todas as contribuições de ações. Cada contribuição
de ações é calculada como:

Lucro básico por valor de ação × número respectivo de ações no índice × Taxa FX
Divisor do índice × Fator de cobertura
(B.6)
No qual:
Lucros básicos por ação é IS061,IS− EPS
Número de ações de um ativo no índice pode ser obtido em MEMB
Taxa FX é aplicada aos ativos que tenham uma moeda fundamental
EQY− FUND− CRNCY diferente do divisor do índice é IN018, INDX− DIVISOR
Fator de cobertura é definido como:

cap de mercado nâo utilizado


1− (B.7)
cap de mercado do índice
No qual:
Cap de mercado não utilizado é a soma da cap de mercado dos ativos que não
possuem uma contribuição de ações para o valor do índice.
Cap de mercado do ativo é o último preço (PR005,PX− LAST) multiplicado pelo
Número de ações em circulação (IS060, IS− AVG− NUM− SH− FOR− EPS)
Cap de mercado de índice é a soma da cap de mercado dos ativos.
APÊNDICE B. Definições das Variáveis Obtidas pelo Terminal da Bloomberg 42

REAL− SHR− PX− MOMENTUM


A variação percentual nos últimos 6 meses da média móvel de um mês do preço da
ação, relativa a um índice de benchmark.

TRAIL− 12M− INC− TAX− EXP


Calculado pela soma de quatro trimestres, dois semestres ou anual de Despesas com
imposto de renda (IS038, IS− INC− TAX− EXP). Valor divulgado em milhões; a Substituição
do formato de escala (DY339, SCALING− FORMAT) pode ser usada para alterar as
unidades de exibição deste campo.

ANN− RETURN− ON− ASSET


Medida que indica a capacidade de uma empresa de empregar seus ativos para
gerar lucros em porcentagem. A média de ativos totais consiste nos valores reportados
divulgados pela empresa ou na média dos saldos iniciais e finais. Calculado da seguinte
forma:

Lucro líquido − Total de dividendos em preferreds em dinheiro


× 100 (B.8)
Média ativos totais

No qual:
Lucro líquido é IS050, NET− INCOME
Dividendos em preferreds é IS051, IS− TOT− CASH− PFD− DVD
Média de ativos totais é BS902, BS− AVERAGE− TOTAL− ASSETS. Caso a em-
presa não divulgue, BS035, BS− TOT− ASSET é utilizado.

PE− RATIO
Divisão do preço de uma ação pelos lucros por ação de uma empresa. Para
todos os países não mencionados abaixo, é calculado como o Último Preço (PR005,
PX− LAST) dividido pelo LPA dos últimos 12 meses antes de Itens extraordinários (RR819,
TRAIL− 12M− EPS− BEF− XO− ITEM) ou pelo LPA básico antes de Itens extraordinários
(IS064, IS− EARN− BEF− XO− ITEMS− PER− SH), se existirem apenas rendimentos anuais.
EUA e Canadá:
Calculado como o Último preço (PR005, PX− LAST) dividido pelo LPA diluído de
op cont dos últimos 12 meses (RR844, T12M− DIL− EPS− CONT− OPS) ou pelo LPA diluído
de op contínuas (IS147, IS− DIL− EPS− CONT− OPS), se existirem apenas rendimentos
anuais.
Índice:
APÊNDICE B. Definições das Variáveis Obtidas pelo Terminal da Bloomberg 43

Divisão de Lucros/Preço atual. Calculado como o Último preço (PR005, PX− LAST)
dividido pelo último LPA ponderado (IN001, T12− EPS− AGGTE). Apenas P/E anual
está disponível, todas as substituições para FUND− PER resultarão no mesmo valor.
RR900 não será calculado se o lucro por ação for negativo.
Portfólio:
Calculado como o valor total de mercado (IN089, INDX− MARKET− CAP) dividido
pela soma de contribuições de lucros de holdings. Contribuições são calculadas como o valor
dos lucros por ação para relação (RX219, EPS− FOR− RATIOS) do título multiplicado
pelo número de ações mantidas.

TOTAL− CAP− EXPEND− GROWTH


Medida de crescimento do total de despesas de capital em um ano. Unidade em
porcentagem. Calculado por:

Despesas de capital do período atual - Despesas de capital do período anterior


(B.9)
Despesas de capital do periodo anterior

No qual:
Despesas de capital é RR014, CAPITAL− EXPEND

EMPLOYEES− SEQUENTIAL− GROWTH


Taxa de crescimento período a período em dividendos por ação (DPS). Calculado
por:

Número de funcionários do período atual


× 100 (B.10)
( Número de funcionários do mesmo período do ano anterior )2

No qual:
Número de funcionários é RR121, NUM− OF− EMPLOYEES

EMPLOYEES− 5− YEAR− GROWTH


Uma taxa de crescimento geométrico em número de funcionários durante cinco
anos. Calculado por:

( Número de funcionários ano atual )0,2


− 100 (B.11)
Número de funcionários mesmo periodo 5 anos anteriores

VOLATILITY− 30D
APÊNDICE B. Definições das Variáveis Obtidas pelo Terminal da Bloomberg 44

Medida do risco das movimentações do preço de um ativo, calculada com base no


desvio padrão das alterações logarítmicas diárias de preço históricas. A volatilidade do
preço durante 30 dias equivale ao desvio padrão anual da alteração de preço relativa para
o preço de fechamento dos 30 dias de pregão mais recentes, expresso em porcentagem.

VOLATILITY− 90D
Medida do risco das movimentações do preço de um ativo, calculada com base no
desvio padrão das alterações logarítmicas diárias de preço históricas. A volatilidade do
preço durante 90 dias equivale ao desvio padrão anual da alteração de preço relativa para
o preço de fechamento dos 90 dias de pregão mais recentes, expresso em porcentagem.
Moedas:
Ativos de moeda não-CDS não são aceitos para dados históricos.

VOLATILITY− 360D
Uma medida do risco das movimentações de preço de um ativo, calculada com base
no desvio padrão das variações logarítmicas diárias históricas de preço. Uma volatilidade
de preço de 360 dias equivale ao desvio padrão anualizado da variação de preço relativa do
preço de fechamento dos últimos 360 dias de negociação, expressa como uma porcentagem.
Ao observar o valor corrente, o último ponto de preço será o preço de negociação mais
recente do ativo.
Moedas:
Ativos cambiais não CDS (Swaps de crédito) não são suportados para dados
históricos.

RSI− 30D
Indicador sem tendência que mede o momentum de um título para determinar se
está na condição sobrecomprada ou sobrevendida. As leituras do índice Relative Strength
(RSI) oscilam em uma escala de 0 a 100. Uma leitura entre 70 e 80 indica uma condição
sobrecomprada e uma provável correção para baixo. Leituras entre 30 e 20 são consideradas
uma condição sobrevendida e indicam uma correção para cima iminente. Alertas mais
significativos de correções ocorrem quando existe uma divergência ou convergência entre o
preço e RSI. Os rendimentos são interpretados inversamente dos preços, acima de 70 é
sobrevenda e abaixo de 30 é sobrecompra. Preços de fechamento dos dias anteriores serão
utilizados para determinar os componentes RSI. A data mais recente pode ser encontrada no
campo Atualização dados técnicos (HT039, EQY− STATS− LAST− UPDATE). A fórmula
APÊNDICE B. Definições das Variáveis Obtidas pelo Terminal da Bloomberg 45

RSI é:

100
RSI = 100 − 1+AvgUp (B.12)
Avg Down

No qual:
Average Up = a média de todas as variações dia-dia em que o ativo fechou em alta
para o dia durante o período.
Average Down = a média de todas as variações negativas para o período. Este
escore RSI é para um ativo durante um período de 30 dias.
Ações:
O cálculo deste campo ignora as configurações do usuário e calcula com base nos
critérios seguintes:
Dividendos normais em dinheiro = False (ajusta precificação histórica para refletir
caixa regular, interino, 1o-5o interino, lucro, estimada, distribuição de participação, final,
juros sobre capital, distribuição, prorateio)
Dividendos extraordinários em dinheiro = True (ajusta precificação histórica para
refletir caixa especial, liquidação, lucros de capital, lucros de capital LP, lucros de capital
CP, lucros, retorno de capital, resgate de direitos, diversos, premium de retorno, resgate
de direitos de preferred, recursos/direitos, recursos/compartilhados, recursos/warrants)

FNCL− LVRG
Mede a média de ativos pela média de ações. Unidade: Real.
Calculado por:

Média ativo total


(B.13)
Média do total de capital ordinário
Obs.: Média é a média do saldo inicial e final do mesmo período.
No qual:
Ativo total é BS035, BS− TOT− ASSET
Total de capital ordinário é RR010, TOT− COMMON− EQY

OPERATING− ROA
Medida de quão lucrativamente uma empresa é capaz de implantar seus ativos
APÊNDICE B. Definições das Variáveis Obtidas pelo Terminal da Bloomberg 46

operacionais para gerar lucros operacionais. Unidade: Real. Calculado por:

Lucro operacional últimos 12 meses


Ativo total saldo inicial + Ativo total saldo final × 100 (B.14)
2

No qual:
Lucro operacional últimos 12M é RR803, TRAIL− 12M− OPER− INC

RETURN− ON− INV− CAPITAL


Indica a eficiência de uma empresa na utilização das fontes de capital (ações e
dívida) investidas em suas operações. Média de capital investido é a média do saldo inicial
e final do capital total investido (RX215, TOTAL− INVESTED− CAPITAL).
Calculado por:

T12M lucro operacional líquido após impostos


× 100 (B.15)
Média de capital investido
No qual:
T12M lucro operacional líquido após impostos é RX216,
TRAIL− 12M− NET− OP− PROF− AFTER− TAX
Capital investido é RX215, TOTAL− INVESTED− CAPITAL
Média de capital investido é calculada com base na média do capital investido,
para o período atual e o capital investido para o mesmo período de um ano atrás.
ROIC não será computado se:

1. A média ano após ano do capital investido for negativa;

2. A Taxa efetiva de imposto ou a Taxa efetiva de impostos dos últimos 12 meses não
estiver disponível.

EQY− WEIGHTED− AVG− PX


Benchmark de negociação calculado pela divisão do valor total negociado (soma
do preço multiplicado pelo volume de negociação) pelo volume total (soma dos volumes
de negociação), levando em conta todas as transações qualificadas.
Dependendo dos códigos de condição da transação e os códigos de condição incluídos
no cálculo do VWAP definido pela Bloomberg, uma operação pode ou não ser considerada
qualificada. Valores históricos também podem ser ajustados no recebimento de negociações
qualificadas com atraso.
APÊNDICE B. Definições das Variáveis Obtidas pelo Terminal da Bloomberg 47

RETURN− ON− ASSET


Indicador de quão lucrativa uma empresa é em relação ao seu patrimônio total, em
porcentagem. Retorno sobre ativos dá uma ideia de quão eficaz é a gestão ao utilizar seus
ativos para gerar lucros.
Calculado por:

Lucro líquido dos últimos 12M


× 100 (B.16)
Média do total de ativos
No qual:
Lucro líquido dos últimos 12M é RR813, TRAIL− 12M− NET− INC
Média do total de ativos é a média do saldo inicial e final de BS035, BS− TOT− ASSET

EARNINGS− RELATED− IMPLIED− MOVE


Alteração de percentual absoluta no preço em torno da próxima data dos resultados
estimados das opções de volatilidades. A movimentação em percentual diária implícita
deriva da volatilidade implícita do primeiro e do segundo mês (VL130 & VL144) na maioria
dos casos. Exibe N.A. caso qualquer uma destas condições for atendida:

1. Dias até o anúncio é maior do que dias para vencimento do segundo mês ou menor
do que 1;

2. Dados de volatilidade incompletos para volatilidade do primeiro ou do segundo mês;

3. Suposições de modelo no resultado atual de dados do mercado em variância de evento


negativa. As mesmas condições N.A. se aplicam a esses vencimentos.

RETURN− COM− EQY


Medida da rentabilidade de uma empresa ao revelar o valor de lucro gerado por
uma empresa com o dinheiro investido pelos acionistas, em porcentagem. Calculado por:

Lucro liquido disponivel aos acionistas de açôes ordinárias dos U12M


× 100 (B.17)
Média do patrimônio liquido total

No qual:
Lucro líquido disponível aos acionistas de ações ordinárias dos U12M é T0089,
TRAIL− 12M− NET− INC− AVAI− COM− SHARE
Média do patrimônio líquido total é a média do saldo inicial e do saldo final de
RR010, TOT− COMMON− EQY
APÊNDICE B. Definições das Variáveis Obtidas pelo Terminal da Bloomberg 48

Caso o saldo inicial ou final do patrimônio líquido total seja negativo, o retorno
sobre o patrimônio não será calculado.
Refere-se ao Retorno sobre o patrimônio líquido ajustado (F1169,
RETURN− ON− COMMON− EQUITY− ADJUSTED) para o valor ajustado que
exclui o impacto dos itens extraordinários.

SALES− TO− CASH


O índice de giro do caixa e equivalentes a caixa mede a eficácia de uma empresa
em relação à utilização do seu caixa, valores reais. Calculado por:

Receita
(B.18)
Caixa e equivalentes a caixa
No qual:
Receita é IS010, SALES− REV− TURN
Caixa e equivalente a caixa é BS010, BS− CASH− NEAR− CASH− ITEM

SALES− GROWTH
Um aumento ou diminuição percentual da receita de vendas, comparando o período
atual com o mesmo período ano anterior. Calculado por:

Receita do período atual − Receita do mesmo periodo do ano anterior) × 100


Receita do mesmo periodo do ano anterior
(B.19)
No qual:
Receita é IS010, SALES− REV− TURN
Crescimento da receita não é calculado se houver sinais de alterações da receita do
ano anterior ao período atual.

PX− TO− SALES− RATIO


A divisão de preço pelas vendas é dada pelo último preço de uma ação dividido por
vendas por ação. A média das ações em circulação é usada no cálculo de vendas por ação.
Vendas por ação é calculado com base nos últimos 12 meses, quando disponível.
Últimos valores são calculados pela soma dos últimos quatro trimestres.
Portfólio:
Calculado como o Valor total de mercado (IN089, INDX− MARKET− CAP) dividido
pela soma das contribuições de vendas dos últimos 12 meses de holdings. Contribuições
APÊNDICE B. Definições das Variáveis Obtidas pelo Terminal da Bloomberg 49

são calculadas como o valor das vendas por ação nos últimos 12M (RR800 dividido por
BS081) do ativo, multiplicado pelo número de ações mantidas.

PX− VOLUME
Número total de ações negociadas de um ativo no dia atual. Se o ativo não foi
negociado, é o número total de ações do último dia de negociação do ativo. Se uma Bolsa
envia o preço de fechamento oficial sem um volume, o retorno é ’0’.
Se a Bolsa não enviar dados de preço de fechamento, o retorno refletirá os últimos
dados recebidos da Bolsa. A fonte de precificação utilizada deve ser definida para exibir o
volume; caso contrário, o campo retorna em branco. Expresso em unidades.

TURNOVER
Valor total negociado na moeda do ativo. Este valor representa todos os preços de
negociação, multiplicados pelo número de ações relacionadas a cada preço. Este valor é
então somado.
Índice de ações:
Valor total negociado na moeda do índice. Este valor representa todos os preços de
negociação para cada ativo que pertence ao índice, multiplicados pelo número de ações
referentes a cada preço. Este valor é então totalizado para cada ativo e somado para o
índice. O valor é escalonado por um fator de 1000.

PX− LAST
Último preço para o ativo.
Ações:
Retorna o último preço fornecido pela Bolsa. Para ativos negociados de segunda a
sexta-feira, esse campo será preenchido somente se essas informações forem fornecidas pela
Bolsa nos últimos 30 dias de negociação. Para ofertas públicas iniciais (IPO), o dia antes
do primeiro dia de negociação real pode retornar o preço da IPO. Para todos os outros
ativos, esse campo será preenchido somente se essas informações forem fornecidas pela
Bolsa nos últimos 30 dias corridos. Aplica-se a ações ordinárias, recibos, warrants e fundos
de investimento imobiliário (REITs).

Você também pode gostar