Você está na página 1de 30

PYTHON PARA FINANÇAS: ANÁLISE DE DADOS E MACHINE LEARNING

Parte 1 – Finanças Parte 2 – Machine Learning em Finanças


CONTEÚDO
• Visualização de dados financeiros • Previsões de preços com séries temporais
• Taxa de retorno de ações • Classificação de empresas para investimento a longo
• Cálculo de risco prazo
• Alocação e otimização de portfólios • Agrupamento de empresas similares
• Precificação de ativos com CAPM (Capital Asset Pricing • Análise de sentimentos em textos financeiros
Model) • ANEXO: Programação básica em Python
• Simulações Monte Carlo para previsões de preços
VISUALIZAÇÃO DE DADOS FINANCEIROS

• Extração de preços de ações da Internet


• Gráficos
• Normalização para comparação do
desempenho de empresas
• Exercício – análise de preços de
empresas de diversos setores da
economia
TAXA DE RETORNO DE AÇÕES

• Taxa de retorno simples


• Taxa de retorno logarítmico
• Exercício – análise de carteiras
TAXA DE RETORNO SIMPLES

14,99 16,07 − 14,99 $%&ç( )*+,- − $%&ç( *+*/*,-


!" = ∗ 100 = 7,20 !" = ∗ 100
16,07 14,99 $%&ç( *+*/*,-
14,99
16,07
15,20 15,20 − 12,42
12,42 !" = ∗ 100 = −18,28
12,42 Dividendos: 0,25
Taxa compra: 10,00
Taxa venda: 2,50
11,84 78,66 − 11,84 16,07 + 0,25 − 14,99
!" = ∗ 100 = 564,09 !" = ∗ 100 = 8,87
78,66 11,84 14,99
100 ações inicial: 14,99 * 100 = 1.499
;<,=> ?>>,;= 100 ações final: 16,07 * 100 = 1.607
00,23 !" = ∗ 100 = 10.900
>>,;= 100 ações dividendos: 0,25 * 100 = 25,00
25,30
Lucro = (1.607 + 25,00) – 1.499 – 10,00 – 2,50 = 120,50

35,73 27,93 − 35,73 1629,50 − 1509


!" = ∗ 100 = −21,83 !" = ∗ 100 = 7,98
27,93 35,73 1509
TAXA DE RETORNO LOGARÍTMICA

14,99 16,07 '()ç% +,-.$


!" = $%& ∗ 100 = 6,95 !" = $%& ∗ 100
16,07 14,99 '()ç% ,-,/,.$
14,99
16,07
15,20 15,20
12,42 !" = $%& ∗ 100 = −20,19
12,42 Dividendos: 0,25
Taxa compra: 10,00
Taxa venda: 2,50
11,84 78,66 16,07 + 0,25
!" = $%& ∗ 100 = 189,32 !" = $%& ∗ 100 = 8,50
78,66 11,84 14,99
100 ações inicial: 14,99 * 100 = 1.499
=>,?@ 100 ações final: 16,07 * 100 = 1.607
00,23 !" = $%& ∗ 100 = 468,87
@@,=? 100 ações dividendos: 0,25 * 100 = 25,00
25,30
Lucro = (1.607 + 25,00) – 1.499 – 10,00 – 2,50 = 120,50

35,73 27,93 1629,50


!" = $%& ∗ 100 = −24,63 !B = $%& ∗ 100 = 7,68
27,93 35,73 1509
TAXA DE RETORNO DE UMA CARTEIRA
Pesos
!" = 33,23 * 0,2 = 6,64

0,2 = 2,37
!" = 11,87 *

!" = 38,35 * 0,2 = 7,67

!" = 101,24 * 0,2 = 20,24

!" = 10,43 * 0,2 = 2,08 Taxa de retorno: 39


TAXA DE RETORNO DE UMA CARTEIRA
Pesos
!" =33,23 * 0,1 = 3,23

0,2 = 2,37
!" = 11,87 *

!" = 38,35 * 0,2 = 7,67

!" = 101,24 * 0,4 = 40,49

!" = 10,43 * 0,1 = 1,04 Taxa de retorno: 54,8


CÁLCULO DE RISCOS

• Variância, desvio padrão e coeficiente de variação


• Covariância e correlação
• Riscos em portfólio de ações
• Risco sistemático e não sistemático
• Sharpe ratio – próximo módulo!
• Exercício – cálculo de riscos em carteiras
VARIÂNCIA, DESVIO PADRÃO E COEFICIENTE DE VARIAÇÃO

-11,86 63,73 74,52 20,42 -33,29 -128,06


22 = 4
102 = 100
−11,86 + 63,73 + 74,52 + 20,42 + −33,29 + (−128,06)
= −2,42
6
De
sv
io
Desvio = -9,44 66,14 76,94 22,84 -30,86 -125,64 o quão longe os
valores estão do
-9,442 + 66,142 + 76,942 + 22,842 + -30,862 + -125,642 “valor esperado”
89,11 + 4374,49 + 5919,76 + 521,66 + 952,33 + 15785,64
27642,99 / 6 = 4607,16
“Erro” se substituirmos pelo
Desvio padrão = 4607,16 = 67,87 valor da média

67,87
12 = . 100 = −2801,02%
−2,42
COVARIÂNCIA, COEFICIENTE DE CORRELAÇÃO E
COEFICIENTE DE DETERMINAÇÃO
Tamanho (m2) Preço !" − !$ %" − %$ (!" − !$) ∗ (%" − %)

30 57.000 -14,5 -16.250 235.625


39 69.000 -5,5 -4.250 23.375
49 77.000 4,5 3.750 16.875
60 90.000 15,5 16.750 259.625
44,5 (média) 73.250 (média)
535.500 (soma)
12,92 (dp) 13.865,42 (dp)
∑(*/ − *)̅ ∗ (,/ − ,)
$ ):;(*, ,) )> *, , = )92
) *, , = )9 *, , =
1 −1 <=> * ∗ <=>(,) )> *, , = 0,992
535.500 178500,00
) *, , = = 178500,00 )9 *, , = = 0,99 )> *, , = 0,98
3 12,92 ∗ 13865,42
> 0, variáveis se movem juntas 98% da variável dependente
consegue ser explicada pelas
< 0, variáveis se movem em direções opostas
= 0, variáveis são independentes variáveis explanatórias
COEFICIENTE DE CORRELAÇÃO

Correlação Interpretação
0,00 a 0,19 ou 0,00 a -0,19 Correlação bem fraca
0,20 a 0,39 ou -0,20 a -0,39 Correlação fraca
0,40 a 0,69 ou -0,40 a -0,69 Correlação moderada
0,70 a 0,89 ou -0,70 a -0,89 Correlação forte
0,90 a 1,00 ou -0,90 a -1,00 Correlação muito forte
CORRELAÇÃO NÃO É CAUSA
RISCO DE UM PORTFÓLIO

0,65 0,22 0,5 0,65 0,22


= 0,5 + 0,5
0,22 0,29 0,5 0,22 0,29
0,32 0,11 0,43
+ =
0,11 0,14 0,25

0,43 0,5 0,21


= = 0,33 Desvio padrão = 0,33 = 0,57
0,25 0,5 0,12 Variância
ALOCAÇÃO E OTIMIZAÇÃO DE PORTFÓLIOS

• Definição de pesos para as ações


• Sharpe ratio
• Cálculo de Markowitz
• Alocação randômica de pesos
• Algoritmos de otimização
• Hill climb (subida da encosta)
• Simulated annealing (têmpera
simulada)
• Algoritmo genético
• Exercício
TEORIA BÁSICA

Valor para investir: R$ 5.000,00


SHARPE RATIO

• Calcula o retorno do investimento comparado com o risco


• Rp: retorno esperado do porfólio
• Rf: retorno sem riscos (risk-free)
• Sigma p: desvio padrão do portfólio

Fonte: https://education.howthemarketworks.com/sharpe-ratio-beginner/
Fonte: https://www.crystalbull.com/sharpe-ratio-better-with-log-returns/
HILL CLIMB (SUBIDA DA ENCOSTA)

• Começa com uma solução randômica e procura pelos


melhores vizinhos
• Vai para o ponto com a maior “curvatura”
• Definir uma porcentagem ligeiramente
maior ou ligeiramente menor
• [50%, 50%] = 1.6
• [40%, 60%] = 1.7
• [35%, 65%] = 1.8
SIMULATED ANNEALING (TÊMPERA SIMULADA)

• Inspirado na Física
• Processo de aquecer um metal e deixa-lo
esfriar lentamente
• Átomos tendem a se mexer bastante
no início e gradualmente entram em
baixos estados de energia

Fonte: https://mecanicafacil-ra.blogspot.com/2016/12/tratamento-termico-tempera.html
SIMULATED ANNEALING (TÊMPERA SIMULADA)

• Começa com uma solução aleatória utilizando uma variável


que representa a temperatura (começa alta e abaixa no
decorrer do algoritmo)
• Algum dos números é alterado durante cada repetição
• [10%, 20%, 70%] = [10%, 15%, 75%]
• Se a solução é pior que a anterior, ainda existe uma
probabilidade de selecioná-la
• Vai para uma solução ruim para depois
encontrar uma solução boa
ALGORITMO GENÉTICO

Critério
Criar população Sim Listar melhores
Avaliar população de
inicial parada
indivíduos
[10 30 40 10 10] 0.3 Não
[00 10 50 20 20] 1.5 Crossover
[70 10 20 00 00] 2.0 Selecionar pais [70 10 20 00 00]
[10 20 10 10 50] 1.8
[30 50 10 10 00] 1.3 [10 20 10 10 50]
Indivíduos [70 10 20 10 50]
Crossover/reprodução
Cromossomo [10 20 10 00 00]
Gene Operadores
genéticos Mutação
Mutação [70 10 20 00 00]
População [70 09 21 00 00]
antiga
Avaliar população

Definir população
sobrevivente
CAPM (CAPITAL ASSET PRICING MODEL) – MODELO DE
PRECIFICAÇÃO DE ATIVOS
• Teoria
• Introdução a regressão linear
• Parâmetros BETA e ALPHA
• Cálculo CAPM para um ativo e para portfólios
• Exercício
CAPM (CAPITAL ASSET PRICING MODEL)

• Descreve as relações entre o retorno esperado e o risco, comparando o


portfólio com o mercado (IBOVESPA)
• Rm: retorno esperado
• Rf: retorno sem riscos (risk-free)
• Beta: comparação entre a carteira e o mercado
• = 1 fortemente correlacionado com o mercado,
• < 1 (defensivo) menos volátil que o mercado
• > 1 (agressivo) mais volátil: 1.15 é 15% mais volátil que o mercado
• Adicionar ativos “defensivos” (< 1) no portfólio indica que o risco da carteira
será menor
• Leitura CAPM: se alguém investir na carteira, ganhará 13% de retorno para
se compensado pelo risco que está correndo
SIMULAÇÕES MONTE CARLO PARA PREVISÕES DE PREÇOS

• Teoria e fórmulas matemáticas


• Previsões de preços futuros
• Exercício
MONTE CARLO

• Uso de dados do passado para criar simulações de vários


cenários futuros (média, variância e desvio padrão)
• Entender o impacto do risco e incerteza para ajudar na
tomada de decisão (o que teria acontecido em cada situação)
• São utilizados números randômicos
MONTE CARLO

• Preço de hoje = preço de ontem . er Preço hoje / preço ontem


• Usamos o movimento Browniano para modelar r
• Drift: direção que as taxas de retorno tiveram no passado
• Volatilidade: variável aleatória
• Retorno diário
SÉRIES TEMPORAIS EM BASES FINANCEIRAS

• Previsões com ARIMA


• Previsões com o Facebook Prophet
• Exercício
CLASSIFICAÇÃO DE EMPRESAS

• Base de dados do TCC do Eduardo Franciscon


• Análise exploratória e tratamento dos dados
• Previsão se a empresa é boa, média ou ruim
para investir no longo prazo
• Importância das características
• Exercício
AGRUPAMENTO DE EMPRESAS SIMILARES

• Base de dados do TCC do Eduardo Franciscon


• Obtenção do número de clusters
• Agrupamento com k-means
• Exercício
CLASSIFICAÇÃO E EXPLORAÇÃO DE TEXTOS FINANCEIROS

• Nuvem de palavras
• Extração de entidades nomeadas
• Classificação de textos positivos e negativos

Você também pode gostar