Escolar Documentos
Profissional Documentos
Cultura Documentos
Uso de técnicas de deep learning para criação de uma nova abordagem para
otimização de carteiras
FEA-RP/USP. Avenida Centenário, nº 1080 - São Dimas; 13.416-000 Piracicaba, São Paulo, Brasil
1
Trabalho apresentado para obtenção do título de especialista em
Finanças e Controladoria – 2021
Uso de técnicas de deep learning para criação de uma nova abordagem para
otimização de carteiras
Resumo
Abstract
Modern portfolio theory, better known as portfolio theory or the Markowitz Model,
explains how investors should take decisions in order to optimize their investment portfolios,
minimizing risks and rationally pricing assets. This theory is based on the notion that
diversifying an investment portfolio generates portfolios with a better risk-return ratio. The
development of portfolio optimization models, as well as the Markowitz Model, originates in the
economic-financial area. Despite being a theme that emerged in the 1950s, the search by
managers to expand the diversification of their portfolios by investing in shares of different
investment funds, in a way that risks are controlled, has resulted in a growing interest academic
in the selection of portfolios formed by investment funds. It is true that most of these works that
have been developed still address the use of more traditional modeling techniques, such as
Santos (2016) and Caldeira et al. (2014), who use a Multivariate Garch to optimize portfolio
selection with Conditional and Heteroscedastic Factorial Correlation models, respectively.
However, the stochastic limitations that more traditional methods, as well as the Markowitz
Model itself, make the application of Machine Learning and Deep Learning techniques to
portfolio selection gain more and more space. Works such as those by Zhu et al. (2011) and
2
Trabalho apresentado para obtenção do título de especialista em
Finanças e Controladoria – 2021
Li et al. (2019) are examples of relevant results of how the use of AI can optimize the
performance of the Markowitz Model for portfolio selection. Thus, this project aims to advance
in the area of AI applied to portfolio selection, through the proposal to present to academia a
new model based on an artificial neural network for portfolio optimization, which is, in some
scenarios, competitive to the Multivariate Markowitz model for risk reduction, or return
maximization. To demonstrate the performance of the proposed solution, we carried out a
practical application to bonds and indices: SeP 500, T. Bill, T.Bonds and Baa Corp Bonds, in
order to draw comparative analyzes between traditional and proposed models.
Keywords: deep learnig, markowitz, neural network, optimization, portfolio.
Introdução
3
Trabalho apresentado para obtenção do título de especialista em
Finanças e Controladoria – 2021
se a média aritmética dos retornos esperados dos ativos ponderados pelas suas proporções
na carteira. Matematicamente, o retorno pode ser representado pela seguinte equação:
Para Markowitz, a definição do risco de uma carteira é mais complexa do que a simples
soma dos riscos dos ativos que a compõem. Para estimar a dimensão do risco, se faz
necessário uma avaliação da correlação existente entre os ativos da carteira. Seja o
coeficiente de correlação variando no intervalo de -1 a +1, segundo Markowitz (1952), quanto
mais próximo de -1 for o valor dessa correlação, maiores os indícios que os retornos dos
ativos movem-se em direções opostas e, vice-versa para situações em que a correlação for
próxima a +1. Em suma, o coeficiente de correlação terá valor positivo quando os rendimentos
positivos de um ativo estiverem associados aos rendimentos positivos de outro ativo, ou caso
os rendimentos negativos de um ativo estiverem associados aos rendimentos negativos de
outro, no mesmo período.
Assim, nesse conceito, o cálculo do risco envolve, além dos riscos individuais
ponderados pela participação de cada ativo na carteira, considerações acerca de um risco
conjunto, referente à correlação entre esses ativos, a covariância. Ou seja, assumindo Rp
como variável aleatória, sua variabilidade pode ser mensurada da seguinte forma:
Abrindo essa variância em uma demonstração para uma carteira de dois ativos é
possível particioná-la em três termos, referentes ao risco de cada ativo separadamente e ao
risco conjunto dos dois ativos. Observa-se na equação a seguir que o último termo, referente
ao risco conjunto dos dois ativos pode tomar tanto valores negativos quanto positivos, uma
vez que 𝜎1,2 representa a correlação entre eles. Já 𝜎𝑖 , para i = 1 ou 2, representa o desvio
padrão do retorno dos ativos, separadamente.
4
Trabalho apresentado para obtenção do título de especialista em
Finanças e Controladoria – 2021
Na equação abaixo, observa-se uma situação de uma carteira com $n$ ativos. Pode-
se entender que conforme cresce a carteira, os termos são adicionados à equação da
variância do retorno, de forma que seu cálculo se torne cada vez mais complexo, tornando
necessário o uso métodos números de otimização.
𝑉𝑎𝑟(𝑅𝑝) = 𝜔12 𝜎12 + 𝜔22 𝜎22 + . .. + 𝜔𝑛2 𝜎𝑛2 + 2𝜔1 𝜔2 𝜎1,2 + . . . + 2𝜔𝑛−1 𝜔𝑛 𝜎𝑛−1,𝑛 (5)
5
Trabalho apresentado para obtenção do título de especialista em
Finanças e Controladoria – 2021
6
Trabalho apresentado para obtenção do título de especialista em
Finanças e Controladoria – 2021
Materiais e Métodos
7
Trabalho apresentado para obtenção do título de especialista em
Finanças e Controladoria – 2021
é a otimização por média-variância. Essa metodologia, proposta por Markowitz (1952), traz
como suposição básica que as preferências de um investidor podem ser representadas por
uma função utilidade que relaciona o retorno esperado e a variância da carteira. Assim, os
investidores deveriam escolher a carteira de ativos com a menor variabilidade entre um infinito
número de portfólios que proporcionassem um determinado retorno ou, de forma equivalente,
para um determinado nível de risco, deveriam escolher o portfólio que resultasse no maior
retorno esperado. Contudo, existem outras funções de otimização do risco, derivadas da
função de média-variância ou não, que podem auxiliar na busca da alocação ótima da carteira.
Otimização de Mínima-variância, introduzido por Best e Grauer (1992), e Otimização Naive,
em que os pesos são equalizados igualmente entre os ativos, são exemplos muito usuais de
funções de otimização. Neste trabalho, adaptamos a função de média-variância de Markowitz
(1952), a fim de minimizar √𝑉𝑎𝑟(𝑅𝑝) através da correlação Spearman ao invés da correlação
de Pearson. Isso implica que, na equação:
𝑉𝑎𝑟(𝑅𝑝) = 𝜔12 𝜎12 + 𝜔22 𝜎22 + . .. + 𝜔𝑛2 𝜎𝑛2 + 2𝜔1 𝜔2 𝜎1,2 + . . . + 2𝜔𝑛−1 𝜔𝑛 𝜎𝑛−1,𝑛 , (6)
onde, 𝜎𝑖2 : é a variância o i-ésimo ativo em postos, bem como 𝜎𝑖−1,𝑖: é a covariância entre os
8
Trabalho apresentado para obtenção do título de especialista em
Finanças e Controladoria – 2021
bem sequer aos dados com os quais foi treinado, temos o chamado underfitting. Desta forma,
o que buscamos é o "balanço ótimo", o ponto no qual a complexidade da rede encontrada é
máxima possível para entregar um menor viés com uma variabilidade controlada. A Figura 2,
a seguir ilustra, teoricamente, esse conceito de busca pelo balanço ótimo.
Além da rede MLP e da função de otimização não paramétrica, uma terceira importante
implementação teórica foi introduzida: a de combinação de modelos. Na teoria de combinação
de modelos de regressão, chamamos de modelos de modelos básicos aqueles que podem
ser usados como base para construção de modelos mais complexos. Na maioria das vezes,
esses modelos básicos não funcionam tão bem sozinhos porque têm um viés alto ou porque
têm alta variabilidade. Então, a ideia da combinação de modelos de regressão é tentar reduzir
o viés e/ou a variância de tais modelos básicos, combinando vários deles para criar um modelo
ensemble que obtenha melhores desempenhos. Esse modelo ensemble, também conhecido
como comitê de learners, tem três principais tipos de meta-algoritmos tradicionais de
combinação:
● Bagging, que muitas vezes considera modelos básicos homogêneos, os treina
independentemente uns dos outros em paralelo e os combina seguindo algum tipo de
processo determinístico de média ou mediana;
9
Trabalho apresentado para obtenção do título de especialista em
Finanças e Controladoria – 2021
10
Trabalho apresentado para obtenção do título de especialista em
Finanças e Controladoria – 2021
Posto isso, a elaboração prática proposta nesse trabalho obedece ao seguinte script
de passo a passo:
1- Análise de linearidade e teste de aderência à distribuição normal nos retornos dos
ativos da carteira.
2- Simular as alocações de carteira mediante método de Markowitz (1952)
3- Estimar fronteira eficiente de Markowitz (1952)
4- Estimar fronteira eficiente através do ensamble MLP
5- Comparar fronteiras eficientes
A análise acerca da linearidade foi avaliada visualmente entre os ativos 2 a 2,
estabelecendo-se os coeficientes de correlação de Pearson (r). Para o teste de aderência à
distribuição normal, utilizamos o teste de Shapiro-Wilk. Este, testa hipótese nula que uma
amostra de retorno de ativos tem distribuição normal. Para maiores detalhes acerca desse
teste, ver por exemplo, Bolfarine, Heleno e Bussab (2005).
Ao que se refere ao modelo ensamble MLP, a estratégia adotada para
desenvolvimento e validação do algoritmo se deu através do método de leave-one-out
adaptado. O leave-one-out tradicional é uma técnica de validação e treinamento de modelos
que pode ser considerada um caso específico do método k-fold, com k igual ao número total
de dados N. Nesta abordagem são realizados N cálculos de erros, um para cada dado.
Basicamente, neste trabalho, para avaliarmos a capacidade de generalização das redes MLP,
particionamos o conjunto de dados em subconjuntos de treinamento e teste, de forma que o
conjunto de teste fosse uma previsão futura do retorno, dado os 4 últimos retornos
observados. Assim, ordenando a amostra de forma crescente no tempo, excetuando as 4
primeiras observações, todas constarão, em algum momento, no subconjunto de teste. Para
maiores detalhes acerca das principais técnicas de data splitting e validação cruzada, ver por
exemplo, T., Tibshirani, R., Friedman, J., e Franklin, J. (2009).
Para a aplicação do modelo proposto, fizemos uso da base de dados fornecida por
Aswath Damodaran, no seu portal online [2], acerca dos retornos históricos (1928 – 2020) dos
títulos e índices: SeP 500, T. Bill, T.Bonds e Baa Corp Bonds. A implementação de todo
trabalho foi realizada em linguagem de programação Pyhton, no ambiente do
Google Colaboratory. O uso do Python permite a utilização da biblioteca neuralnetwork para
construção do modelo MLP, assim como outras bibliotecas para construção das demais
etapas do algoritmo descrito acima, nesta seção. Os códigos desenvolvidos para construção
do trabalho foram disponibilizados através do link [1], da plataforma GitHub. Estando assim,
disponível para consulta pública.
11
Trabalho apresentado para obtenção do título de especialista em
Finanças e Controladoria – 2021
Resultados e Discussão
Conforme script da seção anterior, a etapa seguinte foi, mediante estimar a fronteira
eficiente de Markowitz (1952). Para isso, estipulamos alguns platôs de risco, minimizando-o
como o algoritmo de mínimos quadrados sequenciais, ou simplesmente SLSQP (do inglês,
sequential least squares programming algorithm). A escolha desse algoritmo foi por,
12
Trabalho apresentado para obtenção do título de especialista em
Finanças e Controladoria – 2021
Figura 5. Fronteira eficiente estimada por SLSQP através da proposta de Markowitz (1952)
Fonte: Resultados originais da pesquisa
13
Trabalho apresentado para obtenção do título de especialista em
Finanças e Controladoria – 2021
Considerações Finais
Referências
Caldeira, J. F.; Moura, G. V.; Santos, A. A. P.; Tessari, C. 2014. Seleção de carteiras com
modelos fatoriais hetero-cedásticos: aplicação para fundos de fundos multimercados.RAM.
Revista de Administração Mackenzie, 15(2):127–161
14
Trabalho apresentado para obtenção do título de especialista em
Finanças e Controladoria – 2021
Hamada, M.; Valdez, E. et al. 2004. CAPM and option pricing with elliptical distributions.
School of Finance andEconomics, University of Technology, Sydney
Hastie, T.; Tibshirani, R; Friedman, J. 2009. "Linear methods for regression." The elements of
statistical learning. Springer, New York, NY, 43-99.
Heaton, J.; Polson, N. G.; Witte, J. 2016. Deep portfolio theory.arXiv preprint arXiv:1605.07230
Hu, Y -J.; Lin, S -J. 2019. Deep reinforcement learning for optimizing finance portfolio
management. In2019 AmityInternational Conference on Artificial Intelligence (AICAI), pages
14–20. IEEE
Rather, A. M.; V. Sastry, V.; Agarwal, A. 2017. Stock market prediction and portfolio selection
models: a survey.Opsearch, 54(3):558–579, 2017
Shen, W.; Wang, J. 2017. Portfolio selection via subset resampling. InProceedings of the
Thirty-First AAAI Conferenceon Artificial Intelligence, pages 1517–1523
15