Escolar Documentos
Profissional Documentos
Cultura Documentos
Departamento de Informtica
PONTIFCIA UNIVERSIDADE CATLICA DO RIO DE JANEIRO RUA MARQUS DE SO VICENTE, 225 - CEP 22451-900 RIO DE JANEIRO - BRASIL
Monograas em Ci encia da Computac a o, No. 06/09 Editor: Prof. Carlos Jos e Pereira de Lucena
Abstract. In this paper we investigate current strategies for Automated Intraday Traders of the Market and the state of the art of Machine Learning techniques. Based on this studies, we propose a new Intraday Trader which buys when prices are beginning to rise and sells when they start to fall, based on VWAP information of market stock prices. The trader strategy uses two market advisors: an interday detector of buy/sell candidate days and an intraday detector of buy/sell instants of candidate days. For the interday detector we use a SVM predictor to classify wether the next day VWAP will rise or fall. For the intraday detector, we use a committee of SVR and PLS to forecast daily VWAP, aiming at buying/selling below/above the VWAP, respectively. For testing the new trader, we use the LearnTrade Framework that supports: nancial time series predictors, simulation resources for automated traders and a dataset of Bovespa. Promissing results were obtained with maximum prot of 75% for stocks with positive mean returns and 3.7% for stocks with negative mean returns. Keywords: Intraday Traders, Aprendizado de M aquina, LearnTrade. Resumo. Neste trabalho, investigamos as recentes estrat egias para Automated Intraday Traders do mercado acion ario e t ecnicas do estado da arte de Aprendizado de M aquina. Com base nestes estudos, propomos uma nova estrat egia para traders baseada na informac a o do VWAP. Nesta estrat egia uma compra e feita quando o VWAP do ativo est a para subir e uma venda e feita quando o VWAP do ativo est a para descer. Para esta estrat egia, utilizamos dois detectores de entrada e sa da do mercado: um detector interday para alertar um dia candidato de compra/venda e um detector intraday para alertar, dentro do dia candidato, um instante candidato de compra/venda. Para o detector interday, utilizamos um preditor SVM para classicar uma alta/queda de VWAPs futuros de forma a escolher o dia candidato. Para o detector intraday utilizamos um comit e do SVR com PLS para predic a o do VWAP do dia de forma a escolher o instante do dia em que o prec o encontrase abaixo/acima do VWAP para compra/venda, respectivamente . Para os experimentos, utilizamos o framework LearnTrade que prov e preditores de s eries temporais, um ambiente de simulac a o para Automated Intraday Traders e um conjunto de dados da Bovespa. Os resultados obtidos s ao promissores, com ganhos de at e 75% para ativos de retorno m edio positivo e de at e 3.7% para ativos de retorno m edio negativo. Palavras-chave: Intraday Traders, Aprendizado de M aquina, LearnTrade.
Respons avel por publica coes : Rosane Teles Lins Castilho Assessoria de Biblioteca, Documentac a o e Informac a o PUC-Rio Departamento de Inform atica Rua Marqu es de S ao Vicente, 225 - G avea 22451-900 Rio de Janeiro RJ Brasil Tel. +55 21 3527-1516 Fax: +55 21 3527-1530 E-mail: bib-di@inf.puc-rio.br Web site: http://bib-di.inf.puc-rio.br/techreports/
ii
1 Introdu ca o
O interesse no mercado nanceiro vem aumentando nas ultimas d ecadas incluindo operadores de mercado, formuladores de pol ticas de mercado e acad emicos. Tal interesse focaliza-se em tr es dom nios: predic a o, tomada de decisoes e gerenciamento de riscos. A predic a o do mercado nanceiro (prec os de ac o es e ndices nanceiros) tem sido considerada como uma das aplicac oes mais desaadoras e vem sendo estudada extensivamente por pesquisadores e prossionais de mercado. A predic a o e negociac a o no mercado de ac oes obtiveram popularidade nunca antes atingida nos principais mercados nanceiros mundiais. H a basicamente duas razoes para o sucesso de ferramentas de predic a o do mercado nanceiro. Primeiramente, elas fornecem um meio efetivo de protec a o dos investidores contra riscos potenciais do mercado. Em segundo lugar, elas criam novas oportunidades de retorno de lucros para especuladores. A capacidade de predizer com precis ao os ndices do mercado de ac oes tem implicac oes e signicados profundos tanto para pesquisadores quanto para os prossionais de mercado [Leung et al., 2000]. dif E cil realizar previsoes de curto e longo prazo ecientemente. Vasta literatura se acumulou durante v arios anos, com relac a o a ` validade do EMH (Efcient Market Hypothesis), relativo ao mercado de ac o es. Uma implicac a o importante do EMH e que nenhum investidor est a em posic a o de conseguir oportunidades de lucro n ao exploradas pela predic a o de prec os futuros baseado nos do passado. Por outro lado, um grande numero de pesquisadores, investidores, analistas, operadores e outros, usa t ecnicas diversas para predizer o ndice de ac oes e os prec os das mesmas, contrariamente ao que aconselham muitos estudos acad emicos, que fazem a hipotese de que a previs ao de prec os de ac o es do mercado e futil. Outro dom nio, principal motivador deste trabalho, e o de tomada de decisoes para Intraday Traders. Em contraposic a o a ` s an alises t ecnica e fundamentalista, em que h a a necessidade de um acompanhamento e an alise de um especialista , na a rea de Intraday Traders n ao h a a necessidade deste acompanhamento. A partir de dados historicos da bolsa de valores, o Trader deve inferir quais operac oes (compra e venda) realizar, quanto e quando operar. Nesta a rea de Intraday Traders, podem ser encontrados trabalhos acad emicos interessantes em [Silaghi et al., 2005, Sherstov and Stone, 2005] em que s ao abordados diversos tipos de t ecnicas utilizadas para tomada de decisoes. Na sec a o 2, investigamos o estado da arte de Intraday Traders e m etodos de Aprendizado de M aquina. Nas sec oes 3 e 4, estudamos os problemas de classicac a o, baseado nos artigos [Gunn, 1998] e [Ben-Hur and Weston, ], e regress ao, respectivamente. Ainda nestas duas sec oes estudamos os algoritmos de Aprendizado de M aquina: SVM [Boser et al., 1992], baseados tamb em nos artigos [Gunn, 1998] e [Ben-Hur and Weston, ], e PLS[Wold et al., 1983a, Wold et al., 1983b]. Na sec a o 5, s ao descritos dois preditores de Aprendizado de M aquina para Intraday Traders. Na sec a o 6, revisamos algumas estrat egias para Intraday Traders e propomos uma nova estrat egia baseada no VWAP cujo objetivo e a maximizac a o do lucro. Na sec a o 7, descrevemos a ferramenta utilizada para os experimentos, que cont em os preditores e o simulador do Trader. Na sec a o 8, mostramos experimentos e an alises dos resultados obtidos a partir das novas estrat egias. Por m, nas sec oes 9 e 10 conclu mos o trabalho e propomos algumas id eias para trabalhos futuros.
3 Classica ca o
3.1 Classicadores Lineares
d, y Considere um problema de separar um conjunto de dados D = {(xi, yi)} n i=1 , x {1, 1} em duas classes distintas. Representamos como x a matriz que cont em n exemplos xi do problema. Cada exemplo xi e um vetor linha x com d dimensoes e que possui uma resposta yi associada. Podemos representar um classicador linear pelo produto
tal que w e o vetor de pesos, que em um espac o de duas dimensoes e coeciente angular de uma reta. J a b, ou bias, corresponde ao coeciente linear da mesma. Exemplos s ao classicados como positivos quando f (x) > 0. Na gura 1 os pontos que est ao acima do hiperplano satisfazem f (x) > 0. Analogamente, quando f (x) < 0 temos a classicac a o dos exemplos negativos em que os pontos encontram-se abaixo do hiperplano. Quando a divis ao dos exemplos de um problema e feita por um hiperplano, ent ao, estamos lidando com um problema de classicac a o linear. Caso contr ario, temos um problema de classicac a o n ao-linear.
tal que (x) e uma func a o n ao-linear. Por exemplo, se tiv essemos trabalhando em um espac o de duas dimensoes ter amos um mapeamento da seguinte forma: 2 T (3) (x) = (x2 1 , 2x1 x2 , x2 ) Com este mapeamento ter amos: 2 wT (x) = w1 x2 1 + w2 2x1 x2 + w3 x2 , 3 (4)
tal que, esta seria a nova representac a o dos dados em uma dimens ao superior. Por em, este tipo de pr atica leva a um aumento quadr atico de memoria para armazenamento das caracter sticas. O tempo torna-se quadr atico, tamb em, para computo das func o es n ao-lineares. Para um problema representado num espac o elevado de atributos, estas duas consequ encias, muitas vezes, tornam a modelagem impratic avel. Uma alternativa a este problema e o emprego de Func oes de Nucleo. Ao inv es de mapear e computar explicitamente os atributos, as Func o es de Nucleo utilizam-se de um artif cio bastante interessante. Seja o vetor de pesos representado por uma combinac a o linear dos exemplos na forma:
n
w=
i=1
i xT i x
(5)
f (x) =
i=1
i (xi )T (x) + b
(6)
ter amos uma representac a o em termos da vari avel , que e conhecida como Representac a o Dual. Por em, como descrito anteriormente, este tipo de modelagem e invi avel para um elevado numero de atributos. Seja a Func a o de Nucleo: k(x, x) = (x)T (x ) teremos: f (x) =
i=1 n
(7)
i k(x, xi ) + b
(8)
Como veremos a seguir, na equac a o (9), a grande vantagem da utilizac a o de Func oes de Nucleo, al em de resolver o problema da n ao-linearidade, e a eci encia do seu c alculo em comparac a o ao mapeameno expl cito de func oes n ao-lineares. Como exemplo temos: 2 2 2 (x)(z ) = (x2 1 , 2x1 x2 , x2 )(z1 , 2z1 z2 , z2 ) 2 2 2 2 (9) = x1 z1 + 2x1 x2 z1 z2 + x2 z2 T 2 = (x z) que para resolver (x)(z ) basta computar o quadrado do produto interno (x T z)2 . Existem v arios tipos de Func oes de Nucleo que podem ser utilizadas. Dentre elas, as func o es Polinomial, Gaussiana de Base Radial, Sigmoide e outras. Estudos sugerem a utilizac a o de Func oes de Base Radial, que demonstraram acur acia superior a ` s demais Func oes de Nucleo. Na equac a o (10) tem-se a func a o Gaussiana de Base Radial: Em que > 0 e o par ametro que controla a largura da Gaussiana. Cabe ressaltar que, para que seja explorado o potencial das Func oes de Nucleo quanto a n ao-linearidade o treinamento do algoritmo de Aprendizado de M aquina deve ser ajustado para tal. k(x, x) = exp( ||x x||2 ) (10)
Figure 2: Classicador N ao-Linear. temporais com excelente desempenho Mueller et al.[Mueller et al., 1997]. As principais motivac oes do desenvolvimento do SVM foram elevada capacidade de generalizac a o, robustez em grandes dimensoes e convexidade da func a o objetivo. Dentre estas tr es caracter sticas, devemos ressaltar a terceira. A aplicac a o de SVM para um dado problema implica na otimizac a o de uma func a o quadr atica que possui apenas um m nimo local, sendo que este e global. Operar em uma func a o objetivo com este tipo de caracter stica e uma grande vantagem. Isto porque o excesso de m nimos locais diculta o processo de converg encia do algoritmo de aprendizado. 3.3.1 Classica ca o de M axima Margem
Seja um Classicador Linear cujo hiperplano de separac a o e mostrado na gura 3 e os pontos circulados os Vetores de Suporte, denomina-se margem m(h) a dist ancia entre os Vetores de Suporte e o hipeplano h de separac a o. Numa representac a o geom etrica denotaremos (x+)x como sendo os pontos mais pr oximos do hiperplano de separac a o, T e o vetor unit ario na direc a o de w. w o vetor de suporte com norma ||w|| = w w e o w Os hiperplanos de contorno, paralelos a h, s ao representados da forma: h+ = wT x+ + b = a para pontos positivos e h = wT x + b = a (11) (12)
para pontos negativos, sendo a > 0 para as duas equac oes. Fazendo a = 1, somando-se os dois hiperplanos e dividindo por ||w|| teremos, nalmente: 1 1 T (x+ x ) = m(h) = w 2 ||w|| (13)
1 Para uma clasicac a o de m axima margem o SVM busca maximizar w , ou seja, minimizar 2 w . O que nos leva ao problema: 1 minimizarw,b ||w ||2
(14)
sujeito
a:yi (wT xi
+ b) 1, i = 1, .., n.
Esta formulac a o e conhecida como Margem R gida. Isto porque possui restric oes rigorosas, que n ao consideram os exemplos que est ao al em de sua margem. Para problemas de classicac a o n ao-linear este tipo de formulac a o acaba por ser um entrave. Em vista disto, queremos que as restric oes possam maximizar a margem desclassicando alguns exemplos que est ao al em da margem. Note que este tipo de exibilidade na restric a o evita que outliers atrapalhem a generalizac a o do modelo, pois podem ser os exemplos desclassicados. Assim teremos a nova formulac a o, adaptada para: minimizarw,b h(w, ) = sujeito a:yi (wT xi
1 ||w||2
(15)
+ b) 1 i , i = 1, .., n.
Em que 0 1 e a margem de erro. Quando < 0 tem-se uma Vari avel de Folga, que e quando um exemplo encontra-se na margem de erro. Quando > 1, ent ao temos uma desclassicac a o, ou seja, um exemplo que ultrapassou a margem. Com isto, o objetivo agora e o de classicar os exemplos de modo a maximizar a margem minimizando a a o, quantidade de Vari aveis de Folga. Para isto, devemos introduzir C i=1 i na restric levando ao problema de otimizac a o: minimizarw,b h(w, ) = sujeito a: yi (wT x
i 1 ||w||2
+C
i
i=1 i
(16) 0
+ b) 1 i ,
Este tipo de formulac a o e chamado de margem ex vel e foi introduzido por Cortes em [Cortes and Vapnik, 1995]. A soluc a o para este problema, da equac a o (16), pode resolvida 6
na forma:
2 h(w, b, , ) = 1 2 ||w|| + C
n i=1 i n j =1 i i ,
tal que, e s ao os Multiplicadores de Lagrange. O Lagrangiano h(w, b, , ) deve ser minimizado com relac a o a w, b, x e maximizado com relac a o a e . 3.3.3 O Problema Dual
n T i=1 i (yi (w xi
+ b) 1 + i ) +
(17)
Para resolver o Problema Dual transformamos o Lagrangiano, na equac a o (17), em: max W (, ) = max, minw,b,x h(w, b, , , ) , tal que, que o m nimo de w, b, com relac a o ao Lagrangiano h ser a dado por:
h b h w h
(18)
=0
n i=1 i yi
=0 (19)
=0w=
n i=1 i yi xi
= 0 i + i = C
em que > 0 s ao os os pontos que encontram-se na margem. Estes pontos s ao conhecidos com os Vetores de Suporte. A partir das equac oes 17,18 e 19 resolvemos: maximizar sujeito a :
n i=1 i
1 2
n i=1
n j =1 yi yj i j xi xj
n i=1 yi i
(20)
= 0, 0 i C.
4 Regress ao
4.1 O Problema de Regress ao
O problema de regress ao consiste em modelar vari aveis explicadoras (vari aveis independentes) de forma a estimar uma ou mais vari aveis cont nuas de resposta (vari aveis dependentes) de um conjunto de dados do problema. Seja x conjunto de vari aveis independentes e y as vari aveis dependentes, em que x i e yi correspondem ao i- esimo vetor linha de x e y respectivamente, podemos explicar y i a partir de: yi = (xi ) +
i
(21)
que na verdade que dizer que y e uma func a o dependente de (x i ) com adic a o do que podemos chamar de res duo de y i , expresso por i . O problema de regress ao consiste, fundamentalmente em estimar (xi ), ou seja, encontrar ( xi ) que satisfac a 21.
(22)
s ao as Vari aveis de Folga. Seja a func a o -insens vel se |f (x) y | < caso contr ario (23)
0 |f (x) y |
max, W (, ) = max, 1 2 +
l i=1 l j =1 (i i )(j j )xi xj +
(24)
sujeito a 0 i , i C, i = 1, ..., l e ao os Multiplicadores de Lagrange. Resolvendo esta equac a o teremos a tal que, i e i s soluc a o para a func a o de regress ao dada por: w =
l (i i )xi i=1 l (i i )i=1 = 0,
(25)
(26)
T e em que wj um vetor unit ario denominado de Vetor de Carga e r j e uma func a o de suavizac a o denominada de Func a o de Ridge. Podemos chamar este m etodo de Regress ao Baseada em Projec a o. A seguir, introduziremos dois m etodos baseados em projec a o que podem ser encontrados em diversos trabalhos na literatura acad emica.
em que w(p,p) e uma matriz de autovetores xT x e = diag(1 , .., p ) cujos elementos n ao T nulos s ao os autovalores de x x e est ao ordenados como 1 2 ... p 0. Seja t = xw (29) tal que t e a matriz de Pontuac a o. Seja wk = (w1 , ..., wk ) a matriz com os k primeiros vetores coluna da matriz w. Sobre uma otica geom etrica, os autovetores da matriz w forp mam uma base no espac o R e que combinados com os dados de x, ou seja, realizando projec oes de x em w produzem o que chamamos de Pontuac oes de Componentes Principais. Com estas componentes, poderemos realizar uma estimativa parcial x para x da seguinte forma: x = tk wT (30) Com isto, x pode ser expresso pela sua projec a o como sendo: x= x+ tal que e o erro da estimativa do modelo. (31)
que o numero de exemplos muitas vezes n ao e um entrave para o m etodo. O PLS apresenta diversas caracter sticas interessantes como: a reduc a o da dimensionalidade, numero baixo iterac oes, utilizado para estudo dos dados e utilizado como preditor. Como o PCA, o PLS tamb em reduz a dimensionalidade do espac o de x. No entanto, o PLS extrai as Vari aveis de Pontuac a o do modelo a partir da: xT y = Cov (x, y) (32)
em que o termo a ` esquerda da igualdade e a matriz de covari ancia com os exemplos padronizados pela Z-Score. Para assegurar que este termo possui autovalores reais, positivos e seja quadrada utiliza-se como matriz de entrada: xT yyT x (33)
Para melhor esclarecimento do algoritmo, dividiremos este em duas etapas: Determinac a o da Estrutura Latente e Predic a o. 4.5.1 Determina ca o da Estrutura Latente
Nesta fase, o PLS aprende com os dados de treinamento. Podemos dividir esta fase em quatro subfases: Inicializac a o, Carga e Pontuac a o, Coecientes de Regress ao e Estimativa do Submodelo. Na fase de Inicializac a o, s ao efetuadas duas copias dos dados: x k=0 , copia de x e o mesmo para y, em que k o ndice da k- esima iterac a o do algoritmo. Na fase de Carga e Pontuac a o, e necess ario primeiramente, encontrar os autovetores (vetores de Carga) w que expliquem a matriz, na equac a o (33). Para isto, reca mos em dois casos: seja y(p,q) em que q = 1. De acordo com [Renteria, 2003], w pode ser obtido por: wk = xT k 1 y k 1 (34)
e neste caso estamos tratando do algoritmo PLS1 [Renteria, 2003]. J a para o segundo caso, algoritmo PLS2[Renteria, 2003], em que q > 1, ou seja, multiplas vari aveis dependentes, deve ser utilizado um m etodo de extrac a o de autovetores. Geralmente utiliza-se o m etodo dos M nimos Quadrados Parciais N ao-Linear (NIPALS) [Golub and Van Loan, 1996] via m etodo das pot encias. Apos a determinac a o dos vetores de Carga, determina-se o Vetor de Pontuac a o t k. Assim temos: t k = x k 1 w k (35) Na fase seguinte, determinamos o que chamamos de Coecientes de Regress ao, da seguinte forma:
1 T T bk = [(tT k tk ) tk xk 1 ] =
xT k 1 tk tT k tk yT k 1 tk tT k tk (36)
pk =
1 T (tT k tk ) tk yk 1
e por m teremos a fase de Estimativa do Submodelo, que procede da seguinte forma: yk = yk1 tqT xk = xk1 tbT k (37)
Apos a fase de estimativas, o processo se repete at e o numero de iterac oes desejadas. Note que, realizar k iterac oes e o mesmo que utilizar k vari aveis latentes. 10
4.5.2
Predi ca o
Apos a determinac a o da estrutura latente, ou melhor, a fase de aprendizado, deve-se, para a fase de Predic a o, capturar os vetores de carga e os coecientes de regress ao aprendidos. Com estes dados, poderemos estimar cada y i a partir dos submodelos aprendidos. Assim, a fase de predic a o pode ser descrita em tr es etapas: determinac a o da Vetor de Pontuac a o, na equac a o (35), com o Vetor de Carga aprendido, predic a o de y na forma: yk = yk1 + tpT (38)
e por m o c alculo do res duo, como na equac a o (37), mas somente para xk . Este processo se repete para o mesmo numero k de fatores aprendidos na fase de regress ao.
5 Preditores Financeiros
Preditores de s eries temporais nanceiras s ao de fundamental import ancia para Intraday Traders. O conhecimento acurado do valor do prec o de um determinado ativo em instantes futuros ou at e mesmo sua variac a o, pode ser de grande valia para a reas como a de tomada de decisoes e a de gerenciamento de risco.
11
este trabalho, desenvolvemos tr es preditores regressivos: SVR, PLS e um comit e de SVR e PLS. Todos os tr es preditores s ao para prec o m edio do dia. Al em da a rea de tomada de decis ao, devemos mencionar a a rea de negociac a o algor timica. Nesta, s ao desenvolvidas estrat egias de execuc a o de ordens para as corretoras. Estas estrat egias objetivam, al em de maximizar o lucro com a taxa de corretagem por execuc a o de ordem, minimizar o impacto de mercado causado por estas execuc oes. O impacto de mercado e causado quando um volume nanceiro negociado est a acima do volume m edio de mercado para um dado ativo. As consequ encias s ao variac oes do prec o do ativo tanto para alta quanto para queda. Predic o es de volume ncanceiro, quantidade e prec o m edio do ativo auxiliam estas estrat egias de execuc a o.
6 Intraday Traders
Nesta sec a o introduziremos alguns conceitos b asicos de Intraday Traders tanto para execuc a o de uma ordem quanto para uma estrat egia de negociac a o.
12
Esta estrat egia, da classe 1, e baseada exclusivamente na variac a o do prec o da ac a o ao longo do tempo funcionando do seguinte modo: primeiramente, calculam-se duas retas de regress ao com janelas de tempo distintas. A primeira reta representa uma tend encia a longo prazo. J a a segunda reta representa uma tend encia a curto prazo. A partir da informac a o do coeciente angular das duas retas de tend encia, verica-se o sinal destes coecientes. Caso ambos os coecientes sejam positivos, ent ao e efetuada uma ordem de compra. Caso ambos sejam negativos, e feita uma venda. Caso contr ario o Trader mant em-se inoperante. A seguir temos o algoritmo da estrat egia. Algorithm 2 : computeStrategy slope1 makeRegression(prices,longWindow) slope2 makeRegression(prices,shortWindow) if slope1 > 0 and slope2 > 0 then placeBuyOrder else if slope1 < 0 and slope2 < 0 then placeSellOrder end if end if
6.2.2
Esta estrat egia e semelhante a ` estrat egia de Acompanhamento de Tend encia de Prec os. No entanto, a tomada de decis ao e reversa. Isto signica que, o Trader entra no mercado quando h a uma suspeita de queda de prec os. De forma an aloga, o Trader sai do mer` princ cado quando h a uma suspeita de alta de prec os. A pio, a tomada de decis ao deste tipo de estrt egia parece pouco intuitiva. No entanto, segundo [Silaghi et al., 2005], este tipo de estrat egia explora as microvariac oes do prec o do ativo. Os resultados obtidos em [Silaghi et al., 2005] demonstram que este tipo de estrat egia muitas vezes acaba por superar a estrat egia de Acompanhamento de Tend encia de Prec os.
13
6.2.3
O VWAP e uma m etrica muito utilizada pelas corretoras que desejam executar suas ordens de forma a causar o m nimo impacto de mercado poss vel. O VWAP corresponde ao volume ncnaceiro transacionado em um determinado per odo dividido pelo numero de ac oes daquele mesmo per odo. Al em das corretoras, o VWAP tamb em pode ser util para Intraday Traders. Uma boa estimativa do prec o m edio de um ativo ou at e mesmo sua variac a o ao longo do tempo ajuda o Trader a comprar abaixo e vender acima do prec o m edio de mercado. O VWAP pode ser expresso por: V W AP =
n i=1 Qi Pi n i=1 Qi
(39)
tal que Qi e a quantidade de ac oes negociadas no instante i e P i e o prec o da ac a o no instante i. Nesta estrat egia, da classe 2, o VWAP e utilizado como o prec o de equil brio do mercado. O funcionamento desta estrat egia se d a da seguinte forma: primeiramene, calculase o VWAP do dia para todo o mercado. Se o prec o das primeiras ordens de entrada de mercado estiverem acima do VWAP, ent ao o Trader sai do mercado. Se o prec o das primeiras ordens de sa da de mercado estiverem abaixo do VWAP, ent ao e feita uma entrada de mercado. Caso contr ario, o Trader mat em-se inoperante. Algorithm 3 : computeStrategy vwap computeVWAP(orders) if buyPrice > vwap then placeBuyOrder else if sellPrice < vwap then placeSellOrder end if end if
6.2.4
SOBI e da classe 2 de estrat egias e apresenta resultados muito bons. Em [Silaghi et al., 2005, Sherstov and Stone, 2005] podem ser encontrados resultados interessantes deste tipo de estrat egia que, muitas vezes, acaba por superar as demais estrat egias descritas. Nesta estrat egia calcula-se, separadamente, dois VWAPs. Um para o livro de compras e outro para o livro de vendas. Com a informac a o do ultimo prec o transacionado, calculamse duas diferenc as com relac a o aos VWAPs de compra e venda. Com estas diferenc as, compara-se as duas e fazem-se as seguintes vericac oes: caso a diferenc a do VWAP de venda seja maior do que a de compra, o que quer dizer que o prec o subir a, ent ao faz-se uma compra; caso a diferenc a do VWAP de compra seja maior do que a de venda, o prec o descer a, ent ao faz-se uma venda; caso contr ario, mantenha-se inoperante.
14
Algorithm 4 : computeStrategy buyVwap computeBuyVWAP(buyOrders) sellVwap computeSellVWAP(sellOrders) if buyVwap - lastTradePrice > sellVwap - lastTradePrice then placeBuyOrder else if buyVwap - lastTradePrice < sellVwap - lastTradePrice then placeSellOrder end if end if
Figure 4: Estrat egia 2. Na gura 4, a linha azul representa o prec o do ativo, a linha verde o VWAP estimado 15
do dia e o intervalo de barras verticais representa um dia de negociac a o. Para o primeiro dia, o detector interday avisa que e o dia atual e um dia aprpriado para entrada no mercado. Dentro deste mesmo dia, o detector intraday escolha um instante dentro do dia para fazer uma compra por um prec o abaixo do VWAP do dia. Da mesma forma ocorre para o segundo dia. No entanto, os detectores informam o momento de sa da do mercado. Como podemos notar, a compra e feita abaixo da linha verde e a venda acima da linha verde. Algorithm 5 : computeStrategy vwapSeries makeSeries(orders) currChange predictVWAPChange(vwapSeries) vwap predictVWAP(vwapSeries) if (currChange = 1 and lastChange = -1) and (currPrice < vwap) then placeBuyOrder else if (currChange = -1 and lastChange = 1) and (currPrice > vwap) then placeSellOrder end if end if lastChange currChange
7 O Framework LearnTrade
Para implemetac a o e experimentos dos Intraday Traders e dos preditores de Aprendizado de M aquina foi desenvolvido, em paralelo, o framework LearnTrade. O objetivo central deste framework e dar suporte a `s a reas de predic a o, tomada de decisoes e gerenciamento de riscos. Desenvolvido com t ecnicas de padroes de projetos e com enfoque no f acil manuseio, LearnTrade permite desenvolvimento a gil de experimentos. Em uma combinac a o da linguagem Python, a biblioteca num erica Numpy e a linguagem C, o framework atinge, al em do desenvolvimento a gil, bom desempenho. Atualmente, o LearnTrade est a dividido em duas camadas: uma para Preditores de S eries Financeiras e outra para Intraday Traders. Na camada de preditores, o LearnTrade prov e algoritmos de regress ao e classicac a o do estado da arte de Aprendizado de M aquina para S eries Temporais Financeiras. Podem ser encontrados, tamb em, uma s erie de recursos para realizac a o de experimentos como: m etodos de validac a o, construtores de modelos, ferramentas de pr e-processamento e pos-processamento dos dados, um pacote para uma an alise estat stica dos dados, medidores de performance, mapeadores de resultados e gr acos de qualidade para visualizac a o de s eries temporais e erros de validac a o. Na camada de Intraday Traders, o LearnTrade fornece um simulador com carteira, log de transac o es e alguns exemplos de estrat egias de negociac a o. O simulador trabalha com dados tanto em tempo real quanto em modo simulado. Para os dados em tempo real, estes s ao obtidos do repositorio da Yahoo Financ as. J a para dados em modo simulado, o framework prov e um historico de dados de ativos de alta liquidez e m edia liquidez da Bovespa.
16
8 Experimentos
Para este trabalho, foi selecionado um conjunto de dados de transac oes intraday de dez ativos da bovespa. Os ativos s ao: PETR3, PETR4, VALE5, BBDC4, GOAU5, ITAU4, ITSA4, USIM5, UBBR11 e CSNA3. Os dados encontram-se num intervalo de dois anos com in cio em 2006 e m no in cio de 2008, totalizando 460 dias. Dentre estes 460 dias, foram utilizados 360 dias para treino e 100 dias para teste. A partir desta sec a o, utilizaremos algumas denic oes e m etricas para avaliac a o de ativos e Intraday Traders que s ao comumente encontradas na literatura. Seja uma sequ encia de prec os S = s, i = 1, n em que s i e o prec o da sequ encia no tempo discreto i, podemos experssar o retorno como sendo: si si1 ri = (40) si tal que ri e o retorno da sequ encia no tempo i, s i e si1 correspondem, respectivamente, aos valores da sequ encia nos instantes i e i 1. A segunda e o retorno m edio que e : rm = 1 n
n i=1
si si1 si
(41)
tal que rm corresponde a m edia de todos os retornos da sequ encia. A terceira m etrica e o Indice de Sharpe, que pode ser expresso por: is = rm f rm (42)
tal que rm corresponde a m edia de todos os retornos da sequ encia, f r m o retorno m edio de um capital livre de risco no mesmo per odo e e o desvio padr ao da sequ encia de retorno S . O Indice de Sharpe, proposto por William F. Sharpe, tem como objetivo avaliar o ganho sobre a volatilidade do ativo. Esta m etrica foi aplicada, inicialmente, para avaliar o risco de ativos. No entanto, este tipo de m etrica pode ser utilizado, tamb em, para avaliar o desempenho de Intraday Traders como em [Silaghi et al., 2005, Sherstov and Stone, 2005]. O Indice de Sharpe est a diretamente relacionado a conabilidade da estrat egia de negociac a o do Trader. Quanto maior for este ndice, maior a conabilidade do Trader para o ativo.
Ativo PETR3 PETR4 CSNA3 VALE5 UBBR11 USIM5 BBDC4 GOAU4 ITAU4 ITSA4
Table 1: M etricas por Ativo Retorno Retorno M edio Indice de Sharpe 67.81 % 63.96 % 52.08 % 14.32 % 11.27 % 11.90 % 3.23 % 7.04 % -0.39 % -9.18 % 0.46 % 0.43 % 0.35 % 0.06 % 0.07 % 0.03 % 0.01 % -0.01 % -0.03 % -0.14 % 2.61 2.49 2.42 0.36 0.45 0.21 0.06 -0.07 -0.23 -1.04
Figure 5: Retorno Acumulado dos Ativos termos dessa correlac a o entre ativos, podemos dividir os ativos em dois grupos: PETR3 e PETR4 no grupo 1 e os demais ativos no grupo 2. O importante deste tipo de an alise e notar que, construir modelos especializados para cada grupo, pode levar a construc a o de modelos multiativos.
18
Figure 7: Retorno Acumulado dos Ativos ciente de Correlac a o de Mathews) que pode ser expresso por: M CC = tp tn f p f n (tp + f p) + (tp + f n) + (tn + f p) + (tn + f n) (44)
Um dos pontos fortes do MCC e que, mesmo com classes de tamanhos bem distintos pode-se ter uma estimativa boa da qualidade da classicac a o. O MCC retorna valores entre -1 e 1, em que 1 representa uma predic a o perfeita, 0 um passeio aleatorio e -1 uma predic a o inversa. Em nosso caso, foi multiplicado o resultado do MCC por 100 de forma a car mais claro para an alise. Como podemos observar o unico resultado desfavor avel foi para o ativo USIM5, os demais ativos apresentam um MCC maior do que zero o que representa um classicador melhor do que um passeio aleatorio. Da mesma forma, podemos dizer sobre a acur acia, que teve seu unico resultado abaixo de 50% para a USIM5. Sobre estes resultados, tanto do MCC quanto da acur acia, ainda h a muito a melhorar com outras modelagens, t ecnicas de pre-processamento e classicadores auxiliares. No entanto, como veremos adiante, podemos chegar a resultados bastantes expressivos com este preditor.
19
Table 2: Preditor Classicador da Variac a o do VWAP Ativo Acur acia MCC ITAU4 ITSA4 BBDC4 UBBR11 CSNA3 PETR3 GOAU4 VALE5 PETR4 USIM5 59.60% 59.60% 55.56% 57.58% 56.57% 57.58% 57.58% 52.53% 53.54% 43.43% 23% 18.30% 10.02% 18.73% 9.63% 8.42% 6.62% 4.94% 3.97% -10.41%
=
i=1
||
y i yi || yi
(45)
tal que yi e a resposta certa, y i e a resposta estimada e m e o erro relativo m edio para todas as respostas estimadas. Em contrapartida a m etricas de erro quadr atico, como a m edia do erro quadr atico (MSE), que s ao estimativas de erro global extremamente sens veis a ` ordem de grandeza dos valores de sa da, o erro relativo n ao sofre este tipo de problema, pois e uma m etrica percentual de erro. Table 3: Preditor PLS do VWAP in cio do dia meio do dia m edia global 2.18% 1.73% 1.80% 2.04% 1.83% 1.79% 1.80% 1.65% 2.18% 1.80% 0.67% 0.46% 0.53% 0.36% 0.50% 0.44% 0.39% 0.53% 0.40% 0.80% 0.82% 0.55% 0.75% 0.56% 0.70% 0.53% 0.56% 0.55% 0.54% 0.93%
Ativo PETR3 USIM5 CSNA3 VALE5 UBBR11 BBDC4 ITAU4 ITSA4 PETR4 GOAU4
Como podemos observar, os resultados de erro relativo apresentam-se baixos. Isto porque a vari ancia do VWAP ao longo do dia e muito baixa, o que requer um preditor com erro relativo muito baixo. Dentro de um dia, a variac a o do VWAP e em centavos de real. Podemos notar, tamb em que, ao passar do dia, o erro dos preditores cai bastante e no meio do dia a predic a o j a abaixo de 1% de erro relativo, o que j a nos d a um preditor regressivo de qualidade. 20
Ativo PETR3 USIM5 CSNA3 VALE5 UBBR11 BBDC4 ITAU4 ITSA4 PETR4 GOAU4
Table 4: Preditor SVR do VWAP in cio do dia meio do dia m edia global 2.16% 1.73% 1.83% 2.04% 1.80% 1.83% 1.80% 1.66% 2.15% 1.81% 0.54% 0.46% 0.52% 0.36% 0.52% 0.46% 0.40% 0.50% 0.57% 0.63% 0.80% 0.58% 0.78% 0.58% 0.73% 0.59% 0.60% 0.55% 0.68% 0.78%
Analisando os preditores regressivos PLS e SVR, podemos chegar a conclus ao de que uma combinac a o dos dois preditores pode vir a melhorar o resultado global do erro relativo. Table 5: Preditor SVR+PLS do VWAP in cio do dia meio do dia m edia global 2.16% 1.73% 1.80% 2.04% 1.81% 1.81% 1.79% 1.65% 2.16% 1.81% 0.53% 0.44% 0.51% 0.35% 0.50% 0.43% 0.38% 0.48% 0.45% 0.69% 0.77% 0.54% 0.73% 0.54% 0.69% 0.54% 0.56% 0.52% 0.59% 0.82%
Ativo
PETR3 USIM5 CSNA3 VALE5 UBBR11 BBDC4 ITAU4 ITSA4 PETR4 GOAU4
Como podemos observar na tabela 6, obtivemos uma melhorar dos resultados com a utilizac a o do comit e de SVR e PLS. Os unicos resultados que n ao obtiveram melhora foram para GOAU4 e BBDC4.
Table 6: Erro Relativo Global dos Preditores Regressivos Ativo SVR PLS PLS+SVR PETR3 USIM5 CSNA3 VALE5 UBBR11 BBDC4 ITAU4 ITSA4 PETR4 GOAU4 0.80% 0.58% 0.78% 0.58% 0.73% 0.59% 0.60% 0.55% 0.68% 0.78% 0.82% 0.55% 0.75% 0.56% 0.70% 0.53% 0.56% 0.55% 0.54% 0.93% 0.77% 0.54% 0.73% 0.54% 0.69% 0.54% 0.56% 0.52% 0.59% 0.82%
9 Conclusoes
Neste trabalho foi proposta uma nova estrat egia de VWAP para Intraday Traders do mercado acion ario. Esta estrat egia utilizou dois detectores autom aticos de VWAP. Um detector classicador SVM para a escolha do dia de negociac a o e um segundo detector com objetivo de escolher um instante dentro dia que fosse apropriado para negociac a o. Os resultados obtidos s ao signicativos e com ganhos de at e 75% para ativos de retorno m edio positivo e de at e 3.7% para ativos de retorno m edio negativo.
10 Trabalhos Futuros
Como trabalhos futuros, pretende-se aplicar novos tipos de preditores que auxiliem ao Trader a ` tomada de decisoes mais seguras. Uma opc a o seria ircorporar o Indice de Sharpe na modelagem do preditor. Com isto, ter amos detectores do retorno dado o risco de entrar e sair do mercado. Modelagens deste tipo podem ser encontradas em [Boyarshinov, 2005, Choey and Weigend, 1997]. Investir em melhores preditores regressivos de VWAP do dia pode melhorar a qualidade do comit e de preditores. Al em disso, a adic a o de um numero maior de preditores pode contribuir, tamb em, para a melhora do comit es. 22
Figure 9: Retorno Acumulado do Trader. Outro trabalho que pode ser explorado, e o da criac a o detectores de m edio e longo prazo. Estes detectores indicariam tend encias futuras do comportamento do ativo. Por exemplo, o Trader poderia investir em uma estrat egia mais arriscada para tend encias, a longo prazo, de alta do prec o do ativo. Da mesma forma, o Trader pode utilizar uma estrat egia conservadora quando detectar uma tend encia de queda a longo prazo.
References
[Ben-Hur and Weston, ] Ben-Hur, A. and Weston, J. A User?s Guide to Support Vector Machines. [Boser et al., 1992] Boser, B. E., Vapnik, V. N., and Guyon, I. M. (1992). A training algorithm for optimal margin classiers. In Proceedings of the 5th Annual ACM Workshop on Computational Learning Theory, pages 144152. ACM Press. [Boyarshinov, 2005] Boyarshinov, V. (2005). Machine learning in computacional nance. cs.rpi.edu. 23
Figure 10: Retorno Acumulado do Trader. [Briza and Jr, 2008] Briza, A. and Jr, P. N. (2008). . . . for historical market data using multiobjective particle swarm optimization of technical indicators. Proceedings of the 2008 GECCO conference companion on . . . . [Choey and Weigend, 1997] Choey, M. and Weigend, A. (1997). Nonlinear trading models through sharpe ratio maximization. International Journal Of Neural Systems. [Cortes and Vapnik, 1995] Cortes, C. and Vapnik, V. (1995). Support vector networks. In Machine Learning, pages 273297. [Golub and Van Loan, 1996] Golub, G. H. and Van Loan, C. F. (1996). Matrix computations (3rd ed.). Johns Hopkins University Press, Baltimore, MD, USA. [Gunn, 1998] Gunn, S. (1998). Support vector machines for classication and regression. ISIS Technical Report. [Leung et al., 2000] Leung, M. T., Daouk, H., and Chen, A. (April 2000). Forecasting stock indices: A comparison of classication and level estimation models. International Journal of Forecasting, 16:173190(18). [Mueller et al., 1997] Mueller, K., Smola, A., Raetsch, G., and Schoelkopf, B. (1997). Predicting time series with support vector machines. Lecture Notes In Computer Science. [Renteria, 2003] Renteria, R. (2003). Algoritmos para Regress ao por M nimos Quadrados Parciais. PhD thesis, Pontif cia Universidade Catolica do Rio de Janeiro. [Sherstov and Stone, 2005] Sherstov, A. and Stone, P. (2005). Three automated stocktrading agents: A comparative study. Lecture Notes In Computer Science. [Shlens, 2005] Shlens, J. (2005). A tutorial on principal component analysis. http://www.snl.salk.edu/ shlens/pub/notes/pca.pdf. [Silaghi et al., 2005] Silaghi, G., Cluj-Napoca, R., and Robu, V. (2005). An agent strategy for automated stock market trading combining price and order book information. Computational Intelligence Methods and Applications.
24
[Smola and Scholkopf, 2004] Smola, A. and Scholkopf, B. (2004). A tutorial on support vector regression. Statistics and Computing. [Varga, 2001] Varga, G. (2001). Indice de sharpe e outros indicadores de performance aplicados a fundos de ac o es brasileiros. Revista de Administra ca o Contempor anea. [Wold et al., 1983a] Wold, S., Albano, C., Esbensen, K., Hellberg, S., Johansson, E., and Sjostrom, H. (1983a). Pattern recognition: Finding and using regularities in multivariate data. In Proceedings Iufost Conf Food Research and Data Analysis. Applied Science Publications. [Wold et al., 1983b] Wold, S., Martens, H., and Wold, H. (1983b). The multivariate calibration problem in chemistry solved by the pls method. In Proceedings Conf. Matrix Pencils, pages 286293. Springer Verlag.
25