09 06 Alvim

PUC
ISSN 0103-9741 Monografias em Cincia da Computao n 06/09
Aprendizado de Mquina para Intraday Traders do Mercado Acionrio

Leandro Guimares Marques Alvim Ruy Luiz Milidi
Departamento de Informtica
PONTIFCIA UNIVERSIDADE CATLICA DO RIO DE JANEIRO RUA MARQUS DE SO VICENTE, 225 - CEP 22451-900 RIO DE JANEIRO - BRASIL
Monograas em Ci encia da Computac a o, No. 06/09 Editor: Prof. Carlos Jos e Pereira de Lucena
ISSN: 0103-9741 Fevereiro, 2009
Aprendizado de M aquina para Intraday Traders do Mercado Acion ario

Leandro Guimar aes Marques Alvim, Ruy Luiz Milidiu
leandrouff@gmail.com, milidiu@inf.puc-rio.br
Abstract. In this paper we investigate current strategies for Automated Intraday Traders of the Market and the state of the art of Machine Learning techniques. Based on this studies, we propose a new Intraday Trader which buys when prices are beginning to rise and sells when they start to fall, based on VWAP information of market stock prices. The trader strategy uses two market advisors: an interday detector of buy/sell candidate days and an intraday detector of buy/sell instants of candidate days. For the interday detector we use a SVM predictor to classify wether the next day VWAP will rise or fall. For the intraday detector, we use a committee of SVR and PLS to forecast daily VWAP, aiming at buying/selling below/above the VWAP, respectively. For testing the new trader, we use the LearnTrade Framework that supports: nancial time series predictors, simulation resources for automated traders and a dataset of Bovespa. Promissing results were obtained with maximum prot of 75% for stocks with positive mean returns and 3.7% for stocks with negative mean returns. Keywords: Intraday Traders, Aprendizado de M aquina, LearnTrade. Resumo. Neste trabalho, investigamos as recentes estrat egias para Automated Intraday Traders do mercado acion ario e t ecnicas do estado da arte de Aprendizado de M aquina. Com base nestes estudos, propomos uma nova estrat egia para traders baseada na informac a o do VWAP. Nesta estrat egia uma compra e feita quando o VWAP do ativo est a para subir e uma venda e feita quando o VWAP do ativo est a para descer. Para esta estrat egia, utilizamos dois detectores de entrada e sa da do mercado: um detector interday para alertar um dia candidato de compra/venda e um detector intraday para alertar, dentro do dia candidato, um instante candidato de compra/venda. Para o detector interday, utilizamos um preditor SVM para classicar uma alta/queda de VWAPs futuros de forma a escolher o dia candidato. Para o detector intraday utilizamos um comit e do SVR com PLS para predic a o do VWAP do dia de forma a escolher o instante do dia em que o prec o encontrase abaixo/acima do VWAP para compra/venda, respectivamente . Para os experimentos, utilizamos o framework LearnTrade que prov e preditores de s eries temporais, um ambiente de simulac a o para Automated Intraday Traders e um conjunto de dados da Bovespa. Os resultados obtidos s ao promissores, com ganhos de at e 75% para ativos de retorno m edio positivo e de at e 3.7% para ativos de retorno m edio negativo. Palavras-chave: Intraday Traders, Aprendizado de M aquina, LearnTrade.
Respons avel por publica coes : Rosane Teles Lins Castilho Assessoria de Biblioteca, Documentac a o e Informac a o PUC-Rio Departamento de Inform atica Rua Marqu es de S ao Vicente, 225 - G avea 22451-900 Rio de Janeiro RJ Brasil Tel. +55 21 3527-1516 Fax: +55 21 3527-1530 E-mail: bib-di@inf.puc-rio.br Web site: http://bib-di.inf.puc-rio.br/techreports/
ii
1 Introdu ca o
O interesse no mercado nanceiro vem aumentando nas ultimas d ecadas incluindo operadores de mercado, formuladores de pol ticas de mercado e acad emicos. Tal interesse focaliza-se em tr es dom nios: predic a o, tomada de decisoes e gerenciamento de riscos. A predic a o do mercado nanceiro (prec os de ac o es e ndices nanceiros) tem sido considerada como uma das aplicac oes mais desaadoras e vem sendo estudada extensivamente por pesquisadores e prossionais de mercado. A predic a o e negociac a o no mercado de ac oes obtiveram popularidade nunca antes atingida nos principais mercados nanceiros mundiais. H a basicamente duas razoes para o sucesso de ferramentas de predic a o do mercado nanceiro. Primeiramente, elas fornecem um meio efetivo de protec a o dos investidores contra riscos potenciais do mercado. Em segundo lugar, elas criam novas oportunidades de retorno de lucros para especuladores. A capacidade de predizer com precis ao os ndices do mercado de ac oes tem implicac oes e signicados profundos tanto para pesquisadores quanto para os prossionais de mercado [Leung et al., 2000]. dif E cil realizar previsoes de curto e longo prazo ecientemente. Vasta literatura se acumulou durante v arios anos, com relac a o a ` validade do EMH (Efcient Market Hypothesis), relativo ao mercado de ac o es. Uma implicac a o importante do EMH e que nenhum investidor est a em posic a o de conseguir oportunidades de lucro n ao exploradas pela predic a o de prec os futuros baseado nos do passado. Por outro lado, um grande numero de pesquisadores, investidores, analistas, operadores e outros, usa t ecnicas diversas para predizer o ndice de ac oes e os prec os das mesmas, contrariamente ao que aconselham muitos estudos acad emicos, que fazem a hipotese de que a previs ao de prec os de ac o es do mercado e futil. Outro dom nio, principal motivador deste trabalho, e o de tomada de decisoes para Intraday Traders. Em contraposic a o a ` s an alises t ecnica e fundamentalista, em que h a a necessidade de um acompanhamento e an alise de um especialista , na a rea de Intraday Traders n ao h a a necessidade deste acompanhamento. A partir de dados historicos da bolsa de valores, o Trader deve inferir quais operac oes (compra e venda) realizar, quanto e quando operar. Nesta a rea de Intraday Traders, podem ser encontrados trabalhos acad emicos interessantes em [Silaghi et al., 2005, Sherstov and Stone, 2005] em que s ao abordados diversos tipos de t ecnicas utilizadas para tomada de decisoes. Na sec a o 2, investigamos o estado da arte de Intraday Traders e m etodos de Aprendizado de M aquina. Nas sec oes 3 e 4, estudamos os problemas de classicac a o, baseado nos artigos [Gunn, 1998] e [Ben-Hur and Weston, ], e regress ao, respectivamente. Ainda nestas duas sec oes estudamos os algoritmos de Aprendizado de M aquina: SVM [Boser et al., 1992], baseados tamb em nos artigos [Gunn, 1998] e [Ben-Hur and Weston, ], e PLS[Wold et al., 1983a, Wold et al., 1983b]. Na sec a o 5, s ao descritos dois preditores de Aprendizado de M aquina para Intraday Traders. Na sec a o 6, revisamos algumas estrat egias para Intraday Traders e propomos uma nova estrat egia baseada no VWAP cujo objetivo e a maximizac a o do lucro. Na sec a o 7, descrevemos a ferramenta utilizada para os experimentos, que cont em os preditores e o simulador do Trader. Na sec a o 8, mostramos experimentos e an alises dos resultados obtidos a partir das novas estrat egias. Por m, nas sec oes 9 e 10 conclu mos o trabalho e propomos algumas id eias para trabalhos futuros.
2 Preditores Financeiros e Intraday Traders

Em [Silaghi et al., 2005] s ao revisadas algumas estrat egias de Intraday Traders baseadas em prec o e em livro de ordem. O estudo mostra um comparativo das estrat egias que foram desenvolvidas e experimentadas no framework PXS (Penn Exchange Simulator). Os melhores resultados obtidos foram de estrat egias combinadas e que utilizavam, al em de informac oes do prec o, informac o es do livro de ordens. Em [Sherstov and Stone, 2005], e feito um estudo comparativo de tr es estrat egias para Intraday Traders que foram desenvolvidas e experimentados no framework PXS (Penn Exchange Simulator). Dentre as estrat egias tem-se: Aprendizado por reforc o, MM (Market Making Agent) e Acompanhamento de Tend encia de Prec os (Trend Following). A estrat egia MM demonstrou-se superior e foi a ganhadora da competic a o PLAT (PennLehman Automated Trading) de 2003. Ao contr ario de outras abordagens, que utilizam predic o es de prec o, em [Choey and Weigend, 1997] foi proposta uma estrat egia n ao-linear baseada na maximizac a o do Indice de Sharpe. Neste trabalho um novo modelo e expresso por uma rede neural cuja sa da bin aria corresponde a uma posic a o de risco ou livre de risco. Ainda neste trabalho, o algoritmo de treinamento de gradiente descendente foi modicado de forma a incorporar o risco. Resultados a partir de experimentos com s eries articiais e reais foram expressivos. Em [Briza and Jr, 2008] e utilizado o m etodo de Otimizac a o por Enxame de Part culas (PSO) a partir de um conjunto de dados de prec o di ario e ndices de an alise t ecnica. O objetivo da estrat egia foi o de maximizar o retorno percentual e minimizar o risco. O estudo mostrou que a estrat egia superou, na maioria dos experimentos, uma estrat egia que utiliza somente ndices de an alise t ecnica. Em [Leung et al., 2000] foi realizado um estudo que indica que o modelo SVM (Support Vector Machine) atinge maior precis ao preditiva e melhora a qualidade da predic a o em comparac a o com outros modelos abordados no estudo, tais como redes neurais, regress ao de oresta randomica e um modelo ARIMA linear. O modelo SVM pode ser usado como uma ferramenta alternativa de predic a o para dividendos do Nifty Index e conduz a melhores resultados, de acordo com medidas tradicionais de precis ao para predic oes, tais como erros m nimos quadr aticos m edios e com crit erios nanceiros, tais como medidas ajustadas baseadas em risco para dividendos. Em [Boyarshinov, 2005] um extenso estudo pode ser encontrado sobre Aprendizado de M aquina em Financ as. O estudo aborda gerac a o de conjunto o timo para treinamento supervisionado, m etricas de avaliac a o e algoritmos de Aprendizado de M aquina para Intraday Traders
3 Classica ca o
3.1 Classicadores Lineares
d, y Considere um problema de separar um conjunto de dados D = {(xi, yi)} n i=1 , x {1, 1} em duas classes distintas. Representamos como x a matriz que cont em n exemplos xi do problema. Cada exemplo xi e um vetor linha x com d dimensoes e que possui uma resposta yi associada. Podemos representar um classicador linear pelo produto
escalar wT x em que temos o hiperplano de separac a o: f (x) = wT x + b (1)
tal que w e o vetor de pesos, que em um espac o de duas dimensoes e coeciente angular de uma reta. J a b, ou bias, corresponde ao coeciente linear da mesma. Exemplos s ao classicados como positivos quando f (x) > 0. Na gura 1 os pontos que est ao acima do hiperplano satisfazem f (x) > 0. Analogamente, quando f (x) < 0 temos a classicac a o dos exemplos negativos em que os pontos encontram-se abaixo do hiperplano. Quando a divis ao dos exemplos de um problema e feita por um hiperplano, ent ao, estamos lidando com um problema de classicac a o linear. Caso contr ario, temos um problema de classicac a o n ao-linear.
Figure 1: Classicador Linear.
3.2 Classicadores N ao-Lineares

Uma das vantagens da utilizac a o de modelagens lineares e a simplicidade do algoritmo de treinamento. Para um conjunto elevado de exemplos, o treinamento e eciente em comparac a o a uma classicador baseado numa modelagem n ao-linear. Em vista disto, porque n ao aproveitar o maquin ario de um classicador linear para produzir um classicador n ao-linear? Veremos a seguir, duas abordagens que calcadas nesta id eia. A primeira abordagem e a de mapear explicitamente os dados para uma dimens ao maior, atuando no espac o de caracter sticas. A seguir temos um exemplo: f (x) = wT (x) + b (2)
tal que (x) e uma func a o n ao-linear. Por exemplo, se tiv essemos trabalhando em um espac o de duas dimensoes ter amos um mapeamento da seguinte forma: 2 T (3) (x) = (x2 1 , 2x1 x2 , x2 ) Com este mapeamento ter amos: 2 wT (x) = w1 x2 1 + w2 2x1 x2 + w3 x2 , 3 (4)
tal que, esta seria a nova representac a o dos dados em uma dimens ao superior. Por em, este tipo de pr atica leva a um aumento quadr atico de memoria para armazenamento das caracter sticas. O tempo torna-se quadr atico, tamb em, para computo das func o es n ao-lineares. Para um problema representado num espac o elevado de atributos, estas duas consequ encias, muitas vezes, tornam a modelagem impratic avel. Uma alternativa a este problema e o emprego de Func oes de Nucleo. Ao inv es de mapear e computar explicitamente os atributos, as Func o es de Nucleo utilizam-se de um artif cio bastante interessante. Seja o vetor de pesos representado por uma combinac a o linear dos exemplos na forma:
n
w=
i=1
i xT i x
(5)
e aplicando uma func a o n ao-linear no espac o de caracter sticas:

n
f (x) =
i=1
i (xi )T (x) + b
(6)
ter amos uma representac a o em termos da vari avel , que e conhecida como Representac a o Dual. Por em, como descrito anteriormente, este tipo de modelagem e invi avel para um elevado numero de atributos. Seja a Func a o de Nucleo: k(x, x) = (x)T (x ) teremos: f (x) =
i=1 n
(7)
i k(x, xi ) + b
(8)
Como veremos a seguir, na equac a o (9), a grande vantagem da utilizac a o de Func oes de Nucleo, al em de resolver o problema da n ao-linearidade, e a eci encia do seu c alculo em comparac a o ao mapeameno expl cito de func oes n ao-lineares. Como exemplo temos: 2 2 2 (x)(z ) = (x2 1 , 2x1 x2 , x2 )(z1 , 2z1 z2 , z2 ) 2 2 2 2 (9) = x1 z1 + 2x1 x2 z1 z2 + x2 z2 T 2 = (x z) que para resolver (x)(z ) basta computar o quadrado do produto interno (x T z)2 . Existem v arios tipos de Func oes de Nucleo que podem ser utilizadas. Dentre elas, as func o es Polinomial, Gaussiana de Base Radial, Sigmoide e outras. Estudos sugerem a utilizac a o de Func oes de Base Radial, que demonstraram acur acia superior a ` s demais Func oes de Nucleo. Na equac a o (10) tem-se a func a o Gaussiana de Base Radial: Em que > 0 e o par ametro que controla a largura da Gaussiana. Cabe ressaltar que, para que seja explorado o potencial das Func oes de Nucleo quanto a n ao-linearidade o treinamento do algoritmo de Aprendizado de M aquina deve ser ajustado para tal. k(x, x) = exp( ||x x||2 ) (10)
3.3 M aquina de Vetores de Suporte (SVM)

M aquina de Vetores de Suporte s ao o estado da arte para algoritmos classicadores e regressivos. O SVM foi desenvolvido por Vapnik [Boser et al., 1992] e colaboradores do laboratorio AT&T no nal da d ecada de 90. SVM e amplamente utilizado na a rea de bioinform atica e recentemente vem sendo utilizado na a rea de nanc as para predic a o de s eries 4
Figure 2: Classicador N ao-Linear. temporais com excelente desempenho Mueller et al.[Mueller et al., 1997]. As principais motivac oes do desenvolvimento do SVM foram elevada capacidade de generalizac a o, robustez em grandes dimensoes e convexidade da func a o objetivo. Dentre estas tr es caracter sticas, devemos ressaltar a terceira. A aplicac a o de SVM para um dado problema implica na otimizac a o de uma func a o quadr atica que possui apenas um m nimo local, sendo que este e global. Operar em uma func a o objetivo com este tipo de caracter stica e uma grande vantagem. Isto porque o excesso de m nimos locais diculta o processo de converg encia do algoritmo de aprendizado. 3.3.1 Classica ca o de M axima Margem
Seja um Classicador Linear cujo hiperplano de separac a o e mostrado na gura 3 e os pontos circulados os Vetores de Suporte, denomina-se margem m(h) a dist ancia entre os Vetores de Suporte e o hipeplano h de separac a o. Numa representac a o geom etrica denotaremos (x+)x como sendo os pontos mais pr oximos do hiperplano de separac a o, T e o vetor unit ario na direc a o de w. w o vetor de suporte com norma ||w|| = w w e o w Os hiperplanos de contorno, paralelos a h, s ao representados da forma: h+ = wT x+ + b = a para pontos positivos e h = wT x + b = a (11) (12)
para pontos negativos, sendo a > 0 para as duas equac oes. Fazendo a = 1, somando-se os dois hiperplanos e dividindo por ||w|| teremos, nalmente: 1 1 T (x+ x ) = m(h) = w 2 ||w|| (13)
Figure 3: Margem. 3.3.2 O Problema Primal
1 Para uma clasicac a o de m axima margem o SVM busca maximizar w , ou seja, minimizar 2 w . O que nos leva ao problema: 1 minimizarw,b ||w ||2
(14)
sujeito
a:yi (wT xi
+ b) 1, i = 1, .., n.
Esta formulac a o e conhecida como Margem R gida. Isto porque possui restric oes rigorosas, que n ao consideram os exemplos que est ao al em de sua margem. Para problemas de classicac a o n ao-linear este tipo de formulac a o acaba por ser um entrave. Em vista disto, queremos que as restric oes possam maximizar a margem desclassicando alguns exemplos que est ao al em da margem. Note que este tipo de exibilidade na restric a o evita que outliers atrapalhem a generalizac a o do modelo, pois podem ser os exemplos desclassicados. Assim teremos a nova formulac a o, adaptada para: minimizarw,b h(w, ) = sujeito a:yi (wT xi
1 ||w||2
(15)
+ b) 1 i , i = 1, .., n.
Em que 0 1 e a margem de erro. Quando < 0 tem-se uma Vari avel de Folga, que e quando um exemplo encontra-se na margem de erro. Quando > 1, ent ao temos uma desclassicac a o, ou seja, um exemplo que ultrapassou a margem. Com isto, o objetivo agora e o de classicar os exemplos de modo a maximizar a margem minimizando a a o, quantidade de Vari aveis de Folga. Para isto, devemos introduzir C i=1 i na restric levando ao problema de otimizac a o: minimizarw,b h(w, ) = sujeito a: yi (wT x
i 1 ||w||2
+C
i
i=1 i
(16) 0
+ b) 1 i ,
Este tipo de formulac a o e chamado de margem ex vel e foi introduzido por Cortes em [Cortes and Vapnik, 1995]. A soluc a o para este problema, da equac a o (16), pode resolvida 6
na forma:
2 h(w, b, , ) = 1 2 ||w|| + C
n i=1 i n j =1 i i ,
tal que, e s ao os Multiplicadores de Lagrange. O Lagrangiano h(w, b, , ) deve ser minimizado com relac a o a w, b, x e maximizado com relac a o a e . 3.3.3 O Problema Dual
n T i=1 i (yi (w xi
+ b) 1 + i ) +
(17)
Para resolver o Problema Dual transformamos o Lagrangiano, na equac a o (17), em: max W (, ) = max, minw,b,x h(w, b, , , ) , tal que, que o m nimo de w, b, com relac a o ao Lagrangiano h ser a dado por:
h b h w h
(18)
=0
n i=1 i yi
=0 (19)
=0w=
n i=1 i yi xi
= 0 i + i = C
em que > 0 s ao os os pontos que encontram-se na margem. Estes pontos s ao conhecidos com os Vetores de Suporte. A partir das equac oes 17,18 e 19 resolvemos: maximizar sujeito a :
n i=1 i
1 2
n i=1
n j =1 yi yj i j xi xj
n i=1 yi i
(20)
= 0, 0 i C.
4 Regress ao
4.1 O Problema de Regress ao
O problema de regress ao consiste em modelar vari aveis explicadoras (vari aveis independentes) de forma a estimar uma ou mais vari aveis cont nuas de resposta (vari aveis dependentes) de um conjunto de dados do problema. Seja x conjunto de vari aveis independentes e y as vari aveis dependentes, em que x i e yi correspondem ao i- esimo vetor linha de x e y respectivamente, podemos explicar y i a partir de: yi = (xi ) +
i
(21)
que na verdade que dizer que y e uma func a o dependente de (x i ) com adic a o do que podemos chamar de res duo de y i , expresso por i . O problema de regress ao consiste, fundamentalmente em estimar (xi ), ou seja, encontrar ( xi ) que satisfac a 21.
4.2 Regress ao por Vetores de Suporte (SVR)

O SVM pode ser aplicado para o problema de regress ao com o emprego de uma Func a o de Erro alternativa [Smola and Scholkopf, 2004]. Existem v arios tipos de Func oes de Erro: Quadr atica, Laplaciana, Huber, -insens vel e outras. A func a o Quadr atica e equivalente ao o crit erio do erro de m nimos quadrados. A func a o Laplaciana e menos sens vel a Outliers do que a Quadr atica. As func oes Quadr atica e Laplaciana devem ser utilizadas quando se conhece a distribuic a o dos dados. J a para uma distribuic a o desconhecida dos dados, deve ser utilizada a func a o de Huber. Por m, a func a o -insens vel, que foi proposta por Vapnik. Esta func a o consegue trabalhar com um conjunto de vetores de suporte esparsos. A seguir descreveremos o SVR com o emprego da Func a o de Erro -insens vel. Seja a func a o regress ao: 1 h(w, ) = ||w||2 + C 2 em que, C e uma constante e L(y ) = podemos resolver na forma:
+ i i + i i i,
(22)
s ao as Vari aveis de Folga. Seja a func a o -insens vel se |f (x) y | < caso contr ario (23)
0 |f (x) y |
max, W (, ) = max, 1 2 +
l i=1 l j =1 (i i )(j j )xi xj +
i (yi )l i=1 i (yi + )
(24)
sujeito a 0 i , i C, i = 1, ..., l e ao os Multiplicadores de Lagrange. Resolvendo esta equac a o teremos a tal que, i e i s soluc a o para a func a o de regress ao dada por: w =
l (i i )xi i=1 l (i i )i=1 = 0,
b = 1 (xr + xs ) 2w sujeito a: i i = 0 i = 1, ..., l
(25)
4.3 Regress ao Baseada em Proje ca o

Quando a forma funcional , da equac a o (21), e conhecida, podemos estimar a partir do m etodo de m nimos quadrados n ao-linear ou at e mesmo linear, sendo que, quando o numero de caracter sticas de x e elevado, a diculdade do problema de regress ao aumenta demasiadamente e torna-se impratic avel a regress ao. A soluc a o para este tipo de problema foi subdividir o modelo em modelos menores: ( xi ) =
n T rj (wj xi ) j =1
(26)
T e em que wj um vetor unit ario denominado de Vetor de Carga e r j e uma func a o de suavizac a o denominada de Func a o de Ridge. Podemos chamar este m etodo de Regress ao Baseada em Projec a o. A seguir, introduziremos dois m etodos baseados em projec a o que podem ser encontrados em diversos trabalhos na literatura acad emica.
4.4 An alise Por Componentes Principais (PCA)

O objetivo central do PCA Apud [Shlens, 2005] e o de resumir a informac a o dos dados entrada. Como consequ encias deste resumo dos dados temos: eliminac a o de ru do, reduc a o da dimensionalidade e o fato da informac a o poder ser melhor entendida. Este resumo e feito decompondo a matriz original em um produto de duas matrizes menores (submodelos) que s ao chamadas de Carga e Pontuac a o. Com estes submodelos, a matriz dos dados pode ser expressa por uma combinac a o linear destes. Sobre uma o tica geom etrica, o PCA tenta achar os hiperplanos se encaixem melhor entre os exemplos. Estes encaixes s ao obtidos atrav es da minizac a o da soma dos erros quadr aticos de cada exemplo. Seja xT x = Cov (x, x) = V ar (x) (27) uma matriz quadrada, sim etrica e com suas colunas normalizadas (Z-Score). Atrav es da Decomposic a o Espectral de Jordan, chegamos a: xT x = wwT (28)
em que w(p,p) e uma matriz de autovetores xT x e = diag(1 , .., p ) cujos elementos n ao T nulos s ao os autovalores de x x e est ao ordenados como 1 2 ... p 0. Seja t = xw (29) tal que t e a matriz de Pontuac a o. Seja wk = (w1 , ..., wk ) a matriz com os k primeiros vetores coluna da matriz w. Sobre uma otica geom etrica, os autovetores da matriz w forp mam uma base no espac o R e que combinados com os dados de x, ou seja, realizando projec oes de x em w produzem o que chamamos de Pontuac oes de Componentes Principais. Com estas componentes, poderemos realizar uma estimativa parcial x para x da seguinte forma: x = tk wT (30) Com isto, x pode ser expresso pela sua projec a o como sendo: x= x+ tal que e o erro da estimativa do modelo. (31)
4.5 Regress ao Por M nimos Quadrados Parciais (PLS)

Introduzido por Wold em [Wold et al., 1983b, Wold et al., 1983a], o m etodo de regress ao por m nimos quadrados parciais foi inicialmente utilizado na a rea de quimioterapia para an alises de cromatograas e espectrometrias. Al em destas a reas, o PLS vem sendo aplicado cada vez mais em outras a reas como: marketing, processamento de imagens e nanc as. Para este m etodo, bons resultados podem ser obtidos quando existe uma alta colinearidade entre as caracter sicas. Al em disto, o numero de caracter sticas maior do 9
que o numero de exemplos muitas vezes n ao e um entrave para o m etodo. O PLS apresenta diversas caracter sticas interessantes como: a reduc a o da dimensionalidade, numero baixo iterac oes, utilizado para estudo dos dados e utilizado como preditor. Como o PCA, o PLS tamb em reduz a dimensionalidade do espac o de x. No entanto, o PLS extrai as Vari aveis de Pontuac a o do modelo a partir da: xT y = Cov (x, y) (32)
em que o termo a ` esquerda da igualdade e a matriz de covari ancia com os exemplos padronizados pela Z-Score. Para assegurar que este termo possui autovalores reais, positivos e seja quadrada utiliza-se como matriz de entrada: xT yyT x (33)
Para melhor esclarecimento do algoritmo, dividiremos este em duas etapas: Determinac a o da Estrutura Latente e Predic a o. 4.5.1 Determina ca o da Estrutura Latente
Nesta fase, o PLS aprende com os dados de treinamento. Podemos dividir esta fase em quatro subfases: Inicializac a o, Carga e Pontuac a o, Coecientes de Regress ao e Estimativa do Submodelo. Na fase de Inicializac a o, s ao efetuadas duas copias dos dados: x k=0 , copia de x e o mesmo para y, em que k o ndice da k- esima iterac a o do algoritmo. Na fase de Carga e Pontuac a o, e necess ario primeiramente, encontrar os autovetores (vetores de Carga) w que expliquem a matriz, na equac a o (33). Para isto, reca mos em dois casos: seja y(p,q) em que q = 1. De acordo com [Renteria, 2003], w pode ser obtido por: wk = xT k 1 y k 1 (34)
e neste caso estamos tratando do algoritmo PLS1 [Renteria, 2003]. J a para o segundo caso, algoritmo PLS2[Renteria, 2003], em que q > 1, ou seja, multiplas vari aveis dependentes, deve ser utilizado um m etodo de extrac a o de autovetores. Geralmente utiliza-se o m etodo dos M nimos Quadrados Parciais N ao-Linear (NIPALS) [Golub and Van Loan, 1996] via m etodo das pot encias. Apos a determinac a o dos vetores de Carga, determina-se o Vetor de Pontuac a o t k. Assim temos: t k = x k 1 w k (35) Na fase seguinte, determinamos o que chamamos de Coecientes de Regress ao, da seguinte forma:
1 T T bk = [(tT k tk ) tk xk 1 ] =
xT k 1 tk tT k tk yT k 1 tk tT k tk (36)
pk =
1 T (tT k tk ) tk yk 1
e por m teremos a fase de Estimativa do Submodelo, que procede da seguinte forma: yk = yk1 tqT xk = xk1 tbT k (37)
Apos a fase de estimativas, o processo se repete at e o numero de iterac oes desejadas. Note que, realizar k iterac oes e o mesmo que utilizar k vari aveis latentes. 10
4.5.2
Predi ca o
Apos a determinac a o da estrutura latente, ou melhor, a fase de aprendizado, deve-se, para a fase de Predic a o, capturar os vetores de carga e os coecientes de regress ao aprendidos. Com estes dados, poderemos estimar cada y i a partir dos submodelos aprendidos. Assim, a fase de predic a o pode ser descrita em tr es etapas: determinac a o da Vetor de Pontuac a o, na equac a o (35), com o Vetor de Carga aprendido, predic a o de y na forma: yk = yk1 + tpT (38)
e por m o c alculo do res duo, como na equac a o (37), mas somente para xk . Este processo se repete para o mesmo numero k de fatores aprendidos na fase de regress ao.
5 Preditores Financeiros
Preditores de s eries temporais nanceiras s ao de fundamental import ancia para Intraday Traders. O conhecimento acurado do valor do prec o de um determinado ativo em instantes futuros ou at e mesmo sua variac a o, pode ser de grande valia para a reas como a de tomada de decisoes e a de gerenciamento de risco.
5.1 Preditor Classicador de Comportamento de S eries Financeiras

A classicac a o do comportamento de s eries nanceiras e bastante utilizada para Intraday Traders. Por exemplo, na a rea de tomada de decisoes, o conhecimento de uma poss vel alta do prec o do ativo em um instante futuro conrma uma decis ao de compra da ac a o para o instante de negociac a o. De forma an aloga, tem-se para a venda, em que uma poss vel queda do prec o do ativo ratica a decis ao de compra. Para este trabalho, utilizamos um classicador SVM para detectar altas e quedas de prec o m edio do dia seguinte. No campo de gerenciamento de risco, classicadores podem atuar como seletores de ativos de baixo risco que compoem uma carteira . Al em disto, podem atuar como detectores de situac oes de risco, indicando momentos oportunos de entrada e sa da no mercado acion ario.
5.2 Preditor Regressivo de S eries Financeiras

Assim como a classicac a o do comportamento de s eries nanceiras, a predic a o de valores futuros pode ser bastante util para uma boa estrat egia de tomada de decis ao. Por exemplo, veja o caso da predic a o de prec o m edio futuro: se em determinado instante deste mesmo dia o prec o do ativo encontra-se abaixo de seu prec o m edio, uma operac a o de compra neste instante pode ser considerada uma barganha se a predic a o do prec o m edio for acurada. Isto porque estamos comprando por um valor abaixo do prec o de mercado do ativo. Analogamente, uma venda acima do prec o m edio do dia e uma boa operac a o, considerando-se que se no in cio do dia, compra-se abaixo do prec o m edio, existe grande chance de se vender por um prec o acima do prec o m edio dentro deste mesmo dia. Para
11
este trabalho, desenvolvemos tr es preditores regressivos: SVR, PLS e um comit e de SVR e PLS. Todos os tr es preditores s ao para prec o m edio do dia. Al em da a rea de tomada de decis ao, devemos mencionar a a rea de negociac a o algor timica. Nesta, s ao desenvolvidas estrat egias de execuc a o de ordens para as corretoras. Estas estrat egias objetivam, al em de maximizar o lucro com a taxa de corretagem por execuc a o de ordem, minimizar o impacto de mercado causado por estas execuc oes. O impacto de mercado e causado quando um volume nanceiro negociado est a acima do volume m edio de mercado para um dado ativo. As consequ encias s ao variac oes do prec o do ativo tanto para alta quanto para queda. Predic o es de volume ncanceiro, quantidade e prec o m edio do ativo auxiliam estas estrat egias de execuc a o.
6 Intraday Traders
Nesta sec a o introduziremos alguns conceitos b asicos de Intraday Traders tanto para execuc a o de uma ordem quanto para uma estrat egia de negociac a o.
6.1 Algoritmo de Envio de Ordens do Trader

Antes de entrarmos em detalhes das estrat egias de negociac a o devemos conhecer o funcionameno o algoritmo de execuc a o de ordens do Trader. Para isso, consideremos o seguinte pseudo-codigo: Algorithm 1 : sendOrders while marketIsOpen do state updateMarket, updateWallet orders computeStrategy(state) orders valid(orders) if orders = void then (matchedOrders,unmatchedOrders) sendOrders(orders) storeOrders(matchedOrders,unmatchedOrders) end if end while No algoritmo 1, marketIsOpen e a condic a o necess aria que faz com que o Trader opere na horas em que o mercado est a aberto. State representa todas as informac oes de mercado necess arias para que o Trader efetue sua estrat egia. As funcoes updateMarket e updateWallet atualizam, respectivamente, as informac oes do mercado e da carteira do Trader. A func a o computeStrategy e respons avel pela estrat egia de negociac a o do Trader. A func a o valid e respons avel por vericar se as ordens s ao v alidas e est ao de acordo com os dados da carteira. Por m, temos a func a o sendOrders que envia as ordens a uma corretora ou a um simulador. A func a o sendOrders tamb em retorna as ordens executadas. importante considerar que, StoreOrders e um log de execuc a o das ordens do Trader. E como estamos trabalhando com dados de historico, n ao ser a considerado o casamento das ordens de entrada e sa da de mercado.
12
6.2 Revis ao de Estrat egias para Intraday Traders

Baseado em estudos de [Silaghi et al., 2005, Sherstov and Stone, 2005] faremos uma revis ao de estrat egias para Intraday Traders. As estrat egias que ser ao vistas podem ser divididas em tr e classes . A primeira classe e a das estrat egias baseadas no comportamento do prec o das ac oes, que levam em considerac a o os dados do passado e presente para inferir algo com relac a o a ` decis ao futura a ser tomada. A segunda classe de estrat egias e a baseada na informac a o do livro de ordens. Este livro de ordens cont em informac o es como a quantidade de compradores e vendedores para uma dada ac a o. Por m, a terceira classe de estrat egias, que cont em tanto a informac a o do livro de ordens quanto a informac a o do comportamento do prec o da ac a o. Veremos a seguir algumas estrat egias que se enquadram em uma das duas primeiras classes descritas aqui. 6.2.1 Acompanhamento de Tend encia de Pre cos
Esta estrat egia, da classe 1, e baseada exclusivamente na variac a o do prec o da ac a o ao longo do tempo funcionando do seguinte modo: primeiramente, calculam-se duas retas de regress ao com janelas de tempo distintas. A primeira reta representa uma tend encia a longo prazo. J a a segunda reta representa uma tend encia a curto prazo. A partir da informac a o do coeciente angular das duas retas de tend encia, verica-se o sinal destes coecientes. Caso ambos os coecientes sejam positivos, ent ao e efetuada uma ordem de compra. Caso ambos sejam negativos, e feita uma venda. Caso contr ario o Trader mant em-se inoperante. A seguir temos o algoritmo da estrat egia. Algorithm 2 : computeStrategy slope1 makeRegression(prices,longWindow) slope2 makeRegression(prices,shortWindow) if slope1 > 0 and slope2 > 0 then placeBuyOrder else if slope1 < 0 and slope2 < 0 then placeSellOrder end if end if
6.2.2
Acompanhamento Reverso de Tend encia de Pre cos
Esta estrat egia e semelhante a ` estrat egia de Acompanhamento de Tend encia de Prec os. No entanto, a tomada de decis ao e reversa. Isto signica que, o Trader entra no mercado quando h a uma suspeita de queda de prec os. De forma an aloga, o Trader sai do mer` princ cado quando h a uma suspeita de alta de prec os. A pio, a tomada de decis ao deste tipo de estrt egia parece pouco intuitiva. No entanto, segundo [Silaghi et al., 2005], este tipo de estrat egia explora as microvariac oes do prec o do ativo. Os resultados obtidos em [Silaghi et al., 2005] demonstram que este tipo de estrat egia muitas vezes acaba por superar a estrat egia de Acompanhamento de Tend encia de Prec os.
13
6.2.3
Pre co M edio Ponderado pela Quantidade (VWAP)
O VWAP e uma m etrica muito utilizada pelas corretoras que desejam executar suas ordens de forma a causar o m nimo impacto de mercado poss vel. O VWAP corresponde ao volume ncnaceiro transacionado em um determinado per odo dividido pelo numero de ac oes daquele mesmo per odo. Al em das corretoras, o VWAP tamb em pode ser util para Intraday Traders. Uma boa estimativa do prec o m edio de um ativo ou at e mesmo sua variac a o ao longo do tempo ajuda o Trader a comprar abaixo e vender acima do prec o m edio de mercado. O VWAP pode ser expresso por: V W AP =
n i=1 Qi Pi n i=1 Qi
(39)
tal que Qi e a quantidade de ac oes negociadas no instante i e P i e o prec o da ac a o no instante i. Nesta estrat egia, da classe 2, o VWAP e utilizado como o prec o de equil brio do mercado. O funcionamento desta estrat egia se d a da seguinte forma: primeiramene, calculase o VWAP do dia para todo o mercado. Se o prec o das primeiras ordens de entrada de mercado estiverem acima do VWAP, ent ao o Trader sai do mercado. Se o prec o das primeiras ordens de sa da de mercado estiverem abaixo do VWAP, ent ao e feita uma entrada de mercado. Caso contr ario, o Trader mat em-se inoperante. Algorithm 3 : computeStrategy vwap computeVWAP(orders) if buyPrice > vwap then placeBuyOrder else if sellPrice < vwap then placeSellOrder end if end if
6.2.4
Livro de Ordens Est aticas Desbalanceadas (SOBI)
SOBI e da classe 2 de estrat egias e apresenta resultados muito bons. Em [Silaghi et al., 2005, Sherstov and Stone, 2005] podem ser encontrados resultados interessantes deste tipo de estrat egia que, muitas vezes, acaba por superar as demais estrat egias descritas. Nesta estrat egia calcula-se, separadamente, dois VWAPs. Um para o livro de compras e outro para o livro de vendas. Com a informac a o do ultimo prec o transacionado, calculamse duas diferenc as com relac a o aos VWAPs de compra e venda. Com estas diferenc as, compara-se as duas e fazem-se as seguintes vericac oes: caso a diferenc a do VWAP de venda seja maior do que a de compra, o que quer dizer que o prec o subir a, ent ao faz-se uma compra; caso a diferenc a do VWAP de compra seja maior do que a de venda, o prec o descer a, ent ao faz-se uma venda; caso contr ario, mantenha-se inoperante.
14
Algorithm 4 : computeStrategy buyVwap computeBuyVWAP(buyOrders) sellVwap computeSellVWAP(sellOrders) if buyVwap - lastTradePrice > sellVwap - lastTradePrice then placeBuyOrder else if buyVwap - lastTradePrice < sellVwap - lastTradePrice then placeSellOrder end if end if
6.3 Estrat egia Proposta: Estrat egia de Revers ao de VWAP

Para esta estrat egia utilizamos dois do que podemos chamar de detectores. Detectores s ao respons aveis por alertar ao Trader quando e o momento de entrar e sair do mercado. Dentre os dois detectores, o primeiro, detector interday, e respons avel por alertar qual dia deve-se entrar ou sair do mercado. O segundo, e um detector intraday, que e respons avel por avisar qual e o instante do dia em que o Trader deve entrar ou sair do mercado. O detector interday, e um preditor classicador bin ario de variac oes de VWAP entre dias. Este detector classicar a uma alta ou queda entre os VWAPs do dia atual e seguinte. Com este tipo de classicac a o, podemos implementar uma estrat egia que opere somente em reversoes de classicac a o. Por exemplo, se do dia anterior para o atual houve uma queda do VWAP e se o detector classica como uma alta de VWAP para o dia posterior, ent ao temos uma revers ao. Esta revers ao indica um dia de entrada no mercado. De forma inversa temos uma revers ao para uma sa da do mercado. O detector intraday, e um preditor regressivo de VWAP do dia atual. Com esta informac a o, podemos escolher um instante de entrada ou sa da de mercado apropriados. Um ponto de entrada apropriado seria quando o prec o do ativo estivesse abaixo do VWAP estimado do dia. De forma an aloga, um ponto de sa da do mercado seria quando o prec o do ativo estivesse acima do VWAP predito do dia.
Figure 4: Estrat egia 2. Na gura 4, a linha azul representa o prec o do ativo, a linha verde o VWAP estimado 15
do dia e o intervalo de barras verticais representa um dia de negociac a o. Para o primeiro dia, o detector interday avisa que e o dia atual e um dia aprpriado para entrada no mercado. Dentro deste mesmo dia, o detector intraday escolha um instante dentro do dia para fazer uma compra por um prec o abaixo do VWAP do dia. Da mesma forma ocorre para o segundo dia. No entanto, os detectores informam o momento de sa da do mercado. Como podemos notar, a compra e feita abaixo da linha verde e a venda acima da linha verde. Algorithm 5 : computeStrategy vwapSeries makeSeries(orders) currChange predictVWAPChange(vwapSeries) vwap predictVWAP(vwapSeries) if (currChange = 1 and lastChange = -1) and (currPrice < vwap) then placeBuyOrder else if (currChange = -1 and lastChange = 1) and (currPrice > vwap) then placeSellOrder end if end if lastChange currChange
7 O Framework LearnTrade
Para implemetac a o e experimentos dos Intraday Traders e dos preditores de Aprendizado de M aquina foi desenvolvido, em paralelo, o framework LearnTrade. O objetivo central deste framework e dar suporte a `s a reas de predic a o, tomada de decisoes e gerenciamento de riscos. Desenvolvido com t ecnicas de padroes de projetos e com enfoque no f acil manuseio, LearnTrade permite desenvolvimento a gil de experimentos. Em uma combinac a o da linguagem Python, a biblioteca num erica Numpy e a linguagem C, o framework atinge, al em do desenvolvimento a gil, bom desempenho. Atualmente, o LearnTrade est a dividido em duas camadas: uma para Preditores de S eries Financeiras e outra para Intraday Traders. Na camada de preditores, o LearnTrade prov e algoritmos de regress ao e classicac a o do estado da arte de Aprendizado de M aquina para S eries Temporais Financeiras. Podem ser encontrados, tamb em, uma s erie de recursos para realizac a o de experimentos como: m etodos de validac a o, construtores de modelos, ferramentas de pr e-processamento e pos-processamento dos dados, um pacote para uma an alise estat stica dos dados, medidores de performance, mapeadores de resultados e gr acos de qualidade para visualizac a o de s eries temporais e erros de validac a o. Na camada de Intraday Traders, o LearnTrade fornece um simulador com carteira, log de transac o es e alguns exemplos de estrat egias de negociac a o. O simulador trabalha com dados tanto em tempo real quanto em modo simulado. Para os dados em tempo real, estes s ao obtidos do repositorio da Yahoo Financ as. J a para dados em modo simulado, o framework prov e um historico de dados de ativos de alta liquidez e m edia liquidez da Bovespa.
16
8 Experimentos
Para este trabalho, foi selecionado um conjunto de dados de transac oes intraday de dez ativos da bovespa. Os ativos s ao: PETR3, PETR4, VALE5, BBDC4, GOAU5, ITAU4, ITSA4, USIM5, UBBR11 e CSNA3. Os dados encontram-se num intervalo de dois anos com in cio em 2006 e m no in cio de 2008, totalizando 460 dias. Dentre estes 460 dias, foram utilizados 360 dias para treino e 100 dias para teste. A partir desta sec a o, utilizaremos algumas denic oes e m etricas para avaliac a o de ativos e Intraday Traders que s ao comumente encontradas na literatura. Seja uma sequ encia de prec os S = s, i = 1, n em que s i e o prec o da sequ encia no tempo discreto i, podemos experssar o retorno como sendo: si si1 ri = (40) si tal que ri e o retorno da sequ encia no tempo i, s i e si1 correspondem, respectivamente, aos valores da sequ encia nos instantes i e i 1. A segunda e o retorno m edio que e : rm = 1 n
n i=1
si si1 si
(41)
tal que rm corresponde a m edia de todos os retornos da sequ encia. A terceira m etrica e o Indice de Sharpe, que pode ser expresso por: is = rm f rm (42)
tal que rm corresponde a m edia de todos os retornos da sequ encia, f r m o retorno m edio de um capital livre de risco no mesmo per odo e e o desvio padr ao da sequ encia de retorno S . O Indice de Sharpe, proposto por William F. Sharpe, tem como objetivo avaliar o ganho sobre a volatilidade do ativo. Esta m etrica foi aplicada, inicialmente, para avaliar o risco de ativos. No entanto, este tipo de m etrica pode ser utilizado, tamb em, para avaliar o desempenho de Intraday Traders como em [Silaghi et al., 2005, Sherstov and Stone, 2005]. O Indice de Sharpe est a diretamente relacionado a conabilidade da estrat egia de negociac a o do Trader. Quanto maior for este ndice, maior a conabilidade do Trader para o ativo.
8.1 An alise dos Dados

Baseado em [Varga, 2001] podemos avaliar os ativos pelo retorno m edio e pelo Indice de Sharpe. Com relac a o a essas duas m etricas podemos separar os ativos em tr es grupos distintos. O primeiro grupo, que cont em os ativos PETR3,PETR4 e CSNA5, e o grupo dos ativos de alto retorno e baixo risco. O segundo grupo, que cont em VALE5, USIM5,BBDC4 e UBBR11, e o grupo dos ativos de m edio retorno e risco moderado. J a para o ultimo grupo, temos os ativos GOAU4, ITAU4 e ITSA4, que cont em os ativos de retorno baixo ou negativo e com um risco alto de investimento. A primeira coluna da tabela 1, corresponde apenas ao retorno obtido pela compra do ativo no primeiro dia e venda no ultimo dia de operac a o. Nas guras 5,6 e 7 nos mostram o retorno acumulado dos dez ativos em um per odo de 100 dias. Podemos notar que muitos dos ativos est ao fortemente correlacionados. Em 17
Ativo PETR3 PETR4 CSNA3 VALE5 UBBR11 USIM5 BBDC4 GOAU4 ITAU4 ITSA4
Table 1: M etricas por Ativo Retorno Retorno M edio Indice de Sharpe 67.81 % 63.96 % 52.08 % 14.32 % 11.27 % 11.90 % 3.23 % 7.04 % -0.39 % -9.18 % 0.46 % 0.43 % 0.35 % 0.06 % 0.07 % 0.03 % 0.01 % -0.01 % -0.03 % -0.14 % 2.61 2.49 2.42 0.36 0.45 0.21 0.06 -0.07 -0.23 -1.04
Figure 5: Retorno Acumulado dos Ativos termos dessa correlac a o entre ativos, podemos dividir os ativos em dois grupos: PETR3 e PETR4 no grupo 1 e os demais ativos no grupo 2. O importante deste tipo de an alise e notar que, construir modelos especializados para cada grupo, pode levar a construc a o de modelos multiativos.
8.2 Preditor Classicador da Varia ca o do VWAP

Como m etrica de qualidade para o problema de classicac a o, foram utilizados dois tipos de m etricas: Acur acia (tp + tn) AC = (43) (tp + tn + f p + f n) tal que tp s ao os verdadeiros positivos,tn s ao os verdadeiros negativos, f p s ao os falsos positivos e f n s ao os falsos negativos. A acur acia mede o numero de acertos com relac a o ao total de respostas poss veis. Uma outra m etrica, muito utilizada para problemas em que se tem classicac a o bin aria na a rea de Aprendizado de M aquina e o MCC (Coe-
18
Figure 6: Retorno Acumulado dos Ativos
Figure 7: Retorno Acumulado dos Ativos ciente de Correlac a o de Mathews) que pode ser expresso por: M CC = tp tn f p f n (tp + f p) + (tp + f n) + (tn + f p) + (tn + f n) (44)
Um dos pontos fortes do MCC e que, mesmo com classes de tamanhos bem distintos pode-se ter uma estimativa boa da qualidade da classicac a o. O MCC retorna valores entre -1 e 1, em que 1 representa uma predic a o perfeita, 0 um passeio aleatorio e -1 uma predic a o inversa. Em nosso caso, foi multiplicado o resultado do MCC por 100 de forma a car mais claro para an alise. Como podemos observar o unico resultado desfavor avel foi para o ativo USIM5, os demais ativos apresentam um MCC maior do que zero o que representa um classicador melhor do que um passeio aleatorio. Da mesma forma, podemos dizer sobre a acur acia, que teve seu unico resultado abaixo de 50% para a USIM5. Sobre estes resultados, tanto do MCC quanto da acur acia, ainda h a muito a melhorar com outras modelagens, t ecnicas de pre-processamento e classicadores auxiliares. No entanto, como veremos adiante, podemos chegar a resultados bastantes expressivos com este preditor.
19
Table 2: Preditor Classicador da Variac a o do VWAP Ativo Acur acia MCC ITAU4 ITSA4 BBDC4 UBBR11 CSNA3 PETR3 GOAU4 VALE5 PETR4 USIM5 59.60% 59.60% 55.56% 57.58% 56.57% 57.58% 57.58% 52.53% 53.54% 43.43% 23% 18.30% 10.02% 18.73% 9.63% 8.42% 6.62% 4.94% 3.97% -10.41%
8.3 Preditor Regressivo do VWAP

Para avaliar a qualidade da predic a o do preditor de prec o m edio do dia, foi utilizada a m etrica de erro relativo, dada por:
n m
=
i=1
||
y i yi || yi
(45)
tal que yi e a resposta certa, y i e a resposta estimada e m e o erro relativo m edio para todas as respostas estimadas. Em contrapartida a m etricas de erro quadr atico, como a m edia do erro quadr atico (MSE), que s ao estimativas de erro global extremamente sens veis a ` ordem de grandeza dos valores de sa da, o erro relativo n ao sofre este tipo de problema, pois e uma m etrica percentual de erro. Table 3: Preditor PLS do VWAP in cio do dia meio do dia m edia global 2.18% 1.73% 1.80% 2.04% 1.83% 1.79% 1.80% 1.65% 2.18% 1.80% 0.67% 0.46% 0.53% 0.36% 0.50% 0.44% 0.39% 0.53% 0.40% 0.80% 0.82% 0.55% 0.75% 0.56% 0.70% 0.53% 0.56% 0.55% 0.54% 0.93%
Ativo PETR3 USIM5 CSNA3 VALE5 UBBR11 BBDC4 ITAU4 ITSA4 PETR4 GOAU4
Como podemos observar, os resultados de erro relativo apresentam-se baixos. Isto porque a vari ancia do VWAP ao longo do dia e muito baixa, o que requer um preditor com erro relativo muito baixo. Dentro de um dia, a variac a o do VWAP e em centavos de real. Podemos notar, tamb em que, ao passar do dia, o erro dos preditores cai bastante e no meio do dia a predic a o j a abaixo de 1% de erro relativo, o que j a nos d a um preditor regressivo de qualidade. 20
Ativo PETR3 USIM5 CSNA3 VALE5 UBBR11 BBDC4 ITAU4 ITSA4 PETR4 GOAU4
Table 4: Preditor SVR do VWAP in cio do dia meio do dia m edia global 2.16% 1.73% 1.83% 2.04% 1.80% 1.83% 1.80% 1.66% 2.15% 1.81% 0.54% 0.46% 0.52% 0.36% 0.52% 0.46% 0.40% 0.50% 0.57% 0.63% 0.80% 0.58% 0.78% 0.58% 0.73% 0.59% 0.60% 0.55% 0.68% 0.78%
Analisando os preditores regressivos PLS e SVR, podemos chegar a conclus ao de que uma combinac a o dos dois preditores pode vir a melhorar o resultado global do erro relativo. Table 5: Preditor SVR+PLS do VWAP in cio do dia meio do dia m edia global 2.16% 1.73% 1.80% 2.04% 1.81% 1.81% 1.79% 1.65% 2.16% 1.81% 0.53% 0.44% 0.51% 0.35% 0.50% 0.43% 0.38% 0.48% 0.45% 0.69% 0.77% 0.54% 0.73% 0.54% 0.69% 0.54% 0.56% 0.52% 0.59% 0.82%
Ativo
PETR3 USIM5 CSNA3 VALE5 UBBR11 BBDC4 ITAU4 ITSA4 PETR4 GOAU4
Como podemos observar na tabela 6, obtivemos uma melhorar dos resultados com a utilizac a o do comit e de SVR e PLS. Os unicos resultados que n ao obtiveram melhora foram para GOAU4 e BBDC4.
8.4 Estrat egia de Revers ao de VWAP

Os experimentos da tabela 7, descrevem a atuac a o do Trader em um per odo de 100 dias com um capital inicial de RS 10.000. Como podemos observar, na coluna Lucro das tabelas, os experimentos acabam por reetir a realidade sobre os melhores ativos a investir. De acordo com o esperado, os ativos com maior retorno, na tabela 1, acabam por gerar melhores resultados ao Trader em comparac a o aos ativos de baixo retorno. Da mesma forma podemos analisar sobre o ponto de vista do risco. Os ativos com menor risco, na tabela 1, proporcionaram maior retorno para o Trader, dado o menor risco que os ativos possu am. Mesmo que o leitor n ao recorra a utilizac a o de Intraday Traders, este estudo pode orientar na selec a o de ativos com carteira mais rent avel. 21
Table 6: Erro Relativo Global dos Preditores Regressivos Ativo SVR PLS PLS+SVR PETR3 USIM5 CSNA3 VALE5 UBBR11 BBDC4 ITAU4 ITSA4 PETR4 GOAU4 0.80% 0.58% 0.78% 0.58% 0.73% 0.59% 0.60% 0.55% 0.68% 0.78% 0.82% 0.55% 0.75% 0.56% 0.70% 0.53% 0.56% 0.55% 0.54% 0.93% 0.77% 0.54% 0.73% 0.54% 0.69% 0.54% 0.56% 0.52% 0.59% 0.82%
Table 7: Estrat egia de Revers ao de VWAP

Ativo PETR4 PETR3 CSNA3 USIM5 VALE5 GOAU4 ITSA4 ITAU4 UBBR11 BBDC4 Lucro 75.00% 66.75% 63.36% 27.52% 15.53% 5.17% 3.73% 1.87% -3.56% 1.62% Ind. Sharpe 2.45 2.70 4.03 1.83 0.75 0.09 0.02 -0.08 -0.87 -0.11 Par Compra/Venda 4.68% 6.67% 4.52% 2.75% 1.29% 0.25% 0.20% 0.12% -0.16% 0.07% Operac oes 31% 19% 27% 19% 23% 39% 35% 30% 42% 43%
9 Conclusoes
Neste trabalho foi proposta uma nova estrat egia de VWAP para Intraday Traders do mercado acion ario. Esta estrat egia utilizou dois detectores autom aticos de VWAP. Um detector classicador SVM para a escolha do dia de negociac a o e um segundo detector com objetivo de escolher um instante dentro dia que fosse apropriado para negociac a o. Os resultados obtidos s ao signicativos e com ganhos de at e 75% para ativos de retorno m edio positivo e de at e 3.7% para ativos de retorno m edio negativo.
10 Trabalhos Futuros
Como trabalhos futuros, pretende-se aplicar novos tipos de preditores que auxiliem ao Trader a ` tomada de decisoes mais seguras. Uma opc a o seria ircorporar o Indice de Sharpe na modelagem do preditor. Com isto, ter amos detectores do retorno dado o risco de entrar e sair do mercado. Modelagens deste tipo podem ser encontradas em [Boyarshinov, 2005, Choey and Weigend, 1997]. Investir em melhores preditores regressivos de VWAP do dia pode melhorar a qualidade do comit e de preditores. Al em disso, a adic a o de um numero maior de preditores pode contribuir, tamb em, para a melhora do comit es. 22
Figure 8: Retorno Acumulado do Trader.
Figure 9: Retorno Acumulado do Trader. Outro trabalho que pode ser explorado, e o da criac a o detectores de m edio e longo prazo. Estes detectores indicariam tend encias futuras do comportamento do ativo. Por exemplo, o Trader poderia investir em uma estrat egia mais arriscada para tend encias, a longo prazo, de alta do prec o do ativo. Da mesma forma, o Trader pode utilizar uma estrat egia conservadora quando detectar uma tend encia de queda a longo prazo.
References
[Ben-Hur and Weston, ] Ben-Hur, A. and Weston, J. A User?s Guide to Support Vector Machines. [Boser et al., 1992] Boser, B. E., Vapnik, V. N., and Guyon, I. M. (1992). A training algorithm for optimal margin classiers. In Proceedings of the 5th Annual ACM Workshop on Computational Learning Theory, pages 144152. ACM Press. [Boyarshinov, 2005] Boyarshinov, V. (2005). Machine learning in computacional nance. cs.rpi.edu. 23
Figure 10: Retorno Acumulado do Trader. [Briza and Jr, 2008] Briza, A. and Jr, P. N. (2008). . . . for historical market data using multiobjective particle swarm optimization of technical indicators. Proceedings of the 2008 GECCO conference companion on . . . . [Choey and Weigend, 1997] Choey, M. and Weigend, A. (1997). Nonlinear trading models through sharpe ratio maximization. International Journal Of Neural Systems. [Cortes and Vapnik, 1995] Cortes, C. and Vapnik, V. (1995). Support vector networks. In Machine Learning, pages 273297. [Golub and Van Loan, 1996] Golub, G. H. and Van Loan, C. F. (1996). Matrix computations (3rd ed.). Johns Hopkins University Press, Baltimore, MD, USA. [Gunn, 1998] Gunn, S. (1998). Support vector machines for classication and regression. ISIS Technical Report. [Leung et al., 2000] Leung, M. T., Daouk, H., and Chen, A. (April 2000). Forecasting stock indices: A comparison of classication and level estimation models. International Journal of Forecasting, 16:173190(18). [Mueller et al., 1997] Mueller, K., Smola, A., Raetsch, G., and Schoelkopf, B. (1997). Predicting time series with support vector machines. Lecture Notes In Computer Science. [Renteria, 2003] Renteria, R. (2003). Algoritmos para Regress ao por M nimos Quadrados Parciais. PhD thesis, Pontif cia Universidade Catolica do Rio de Janeiro. [Sherstov and Stone, 2005] Sherstov, A. and Stone, P. (2005). Three automated stocktrading agents: A comparative study. Lecture Notes In Computer Science. [Shlens, 2005] Shlens, J. (2005). A tutorial on principal component analysis. http://www.snl.salk.edu/ shlens/pub/notes/pca.pdf. [Silaghi et al., 2005] Silaghi, G., Cluj-Napoca, R., and Robu, V. (2005). An agent strategy for automated stock market trading combining price and order book information. Computational Intelligence Methods and Applications.
24
[Smola and Scholkopf, 2004] Smola, A. and Scholkopf, B. (2004). A tutorial on support vector regression. Statistics and Computing. [Varga, 2001] Varga, G. (2001). Indice de sharpe e outros indicadores de performance aplicados a fundos de ac o es brasileiros. Revista de Administra ca o Contempor anea. [Wold et al., 1983a] Wold, S., Albano, C., Esbensen, K., Hellberg, S., Johansson, E., and Sjostrom, H. (1983a). Pattern recognition: Finding and using regularities in multivariate data. In Proceedings Iufost Conf Food Research and Data Analysis. Applied Science Publications. [Wold et al., 1983b] Wold, S., Martens, H., and Wold, H. (1983b). The multivariate calibration problem in chemistry solved by the pls method. In Proceedings Conf. Matrix Pencils, pages 286293. Springer Verlag.
25

09 06 Alvim

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

09 06 Alvim

Enviado por

Direitos autorais:

Formatos disponíveis

PUC

ISSN 0103-9741 Monografias em Cincia da Computao n 06/09

Aprendizado de Mquina para Intraday Traders do Mercado Acionrio

ISSN: 0103-9741 Fevereiro, 2009

Aprendizado de M aquina para Intraday Traders do Mercado Acion ario

2 Preditores Financeiros e Intraday Traders

escalar wT x em que temos o hiperplano de separac a o: f (x) = wT x + b (1)

Figure 1: Classicador Linear.

3.2 Classicadores N ao-Lineares

e aplicando uma func a o n ao-linear no espac o de caracter sticas:

3.3 M aquina de Vetores de Suporte (SVM)

Figure 3: Margem. 3.3.2 O Problema Primal

4.2 Regress ao por Vetores de Suporte (SVR)

i (yi )l i=1 i (yi + )

b = 1 (xr + xs ) 2w sujeito a: i i = 0 i = 1, ..., l

4.3 Regress ao Baseada em Proje ca o

4.4 An alise Por Componentes Principais (PCA)

4.5 Regress ao Por M nimos Quadrados Parciais (PLS)

5.1 Preditor Classicador de Comportamento de S eries Financeiras

5.2 Preditor Regressivo de S eries Financeiras

6.1 Algoritmo de Envio de Ordens do Trader

6.2 Revis ao de Estrat egias para Intraday Traders

Acompanhamento Reverso de Tend encia de Pre cos

Pre co M edio Ponderado pela Quantidade (VWAP)

Livro de Ordens Est aticas Desbalanceadas (SOBI)

6.3 Estrat egia Proposta: Estrat egia de Revers ao de VWAP

8.1 An alise dos Dados

8.2 Preditor Classicador da Varia ca o do VWAP

Figure 6: Retorno Acumulado dos Ativos

8.3 Preditor Regressivo do VWAP

8.4 Estrat egia de Revers ao de VWAP

Table 7: Estrat egia de Revers ao de VWAP

Figure 8: Retorno Acumulado do Trader.

Você também pode gostar