Escolar Documentos
Profissional Documentos
Cultura Documentos
INSTITUTO DE FSICA
GRADUAO EM BACHARELADO EM FSICA
2013
Sumrio
1 Introduo 4
2 Mercado de Capitais 6
2.1 Mercado Primrio e Mercado Secundrio . . . . . . . . . . . . 6
2.2 Bolsa de Valores . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3 S&P 500 e o comportamento do mercado . . . . . . . . . . . . 8
3 Probabilidade 10
3.1 Probabilidade Marginal e Denies . . . . . . . . . . . . . . . 10
3.2 Probabilidade Multivariacional . . . . . . . . . . . . . . . . . . 11
3.3 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.4 Covarincia e Correlao . . . . . . . . . . . . . . . . . . . . . 13
4 Teoria da Informao 14
4.1 Contedo Informacional de Shannon . . . . . . . . . . . . . . 14
4.2 Entropia Informacional de Shannon . . . . . . . . . . . . . . . 15
4.3 Entropia Multivariacional . . . . . . . . . . . . . . . . . . . . 16
4.4 Informao Mtua . . . . . . . . . . . . . . . . . . . . . . . . 18
5 Clculos e Resultados 19
5.1 Mtodo Numrico . . . . . . . . . . . . . . . . . . . . . . . . . 19
5.2 Correlao x Informao Mtua . . . . . . . . . . . . . . . . . 20
5.3 Informao Mtua Mdia . . . . . . . . . . . . . . . . . . . . . 26
6 Concluso 29
1
Resumo
Sabendo que caractersticas marcantes no comportamento do mer-
cado de capitais como crashes e bubbles podem ser identicadas pela
entropia informacional, neste trabalho pretendemos estudar o mercado
utilizando algumas variveis da teoria da informao. Primeiro faze-
mos uma comparao entre a correlao e a informao mtua de uma
srie temporal da bolsa de valores de Nova Iorque a m de conrmar
que a informao mtua representa melhor o comportamento do mer-
cado. Por m nos focamos exclusivamente na informao mtua a m
de entender melhor seu comportamento em relao ao comportamento
do mercado.
2
Abstract
Knowing that remarkable features in the capital market's behavior
such as crashes and bubbles can be identied by information entropy,
in this work we intend to study the market using some information
theory variables. First, we make a comparison between the correlation
and the mutual information of a time series of the New York stock
exchange to conrm that mutual information best represents the mar-
ket's behavior. Last, we focus exclusively on the mutual information
to better understand it's behavior in relation to the market's one.
3
1 Introduo
4
garmos bolsa de valores e ao ndice estudado. Em segundo lugar, zemos
uma breve introduo a algumas variveis da teoria de probabilidades que
so teis para o maior entendimento do trabalho. Depois zemos uma apre-
sentao mais detalhada da teoria da informao e suas variveis de maior
importncia. Por m, explicamos o mtodo numrico utilizado, apresenta-
mos alguns resultados e nossa concluso.
5
2 Mercado de Capitais
6
valores mobilirios e outros ativos de forma transparente. Alm de oferecer
um ambiente para a negociao dos ttulos nelas registrados, orientar e s-
calizar os servios prestados por seus intermedirios, facilitar a divulgao
constante de informaes sobre as empresas e sobre os negcios que se reali-
zam sob seu controle, as bolsas propiciam liquides s aplicaes de mdio e
longo prazos por intermdio de um mercado contnuo representado por seus
preges dirios [1].
Os movimentos de uma bolsa de valores so captados atravs de ndices
(ou indicadores) chamados ndice de bolsa de valores. Cada bolsa de valores
tem seu(s) ndice(s).
Alguns exemplos das principais bolsas de valores e seus respectivos ndi-
ces:
Dow Jones
S&P 500
Nikkei 225
FTSE 100
DAX-30
Ibovespa
7
2.3 S&P 500 e o comportamento do mercado
8
1400
1300
1200
1100
Alta (USD)
1000
900
800
700
600
0 50 100 150 200 250 300 350 400 450
t (dias)
9
3 Probabilidade
Aqui comearemos a denir a base terica e algumas das variveis [10, 11] usa-
das neste trabalho. Ser apresentado apenas o caso discreto, pois foi o usado
no trabalho devido aos clculos computacionais, mas todas podem tambm
ser denidas no caso contnuo, apenas trocando o somatrio por uma integral.
e a varincia de X
2
V ar(X) X = h(X hXi)2 i = hX 2 i hXi2 , (2)
10
3.2 Probabilidade Multivariacional
P (x = ai , y = bj )
P (x = ai |y = bj ) = , (6)
P (y = bj )
se P (y = bj ) 6= 0.
11
Na notao simplicada temos que
P (x, y)
P (y|x) = , (7)
P (x)
se P (x) 6= 0.
e tambm
X X
P (y) = P (x, y) = P (y|x)P (x). (10)
x x
Dos resultados acima derivados em (7), (8) e (9), segue diretamente que:
12
usado recursivamente para melhorarmos nossa estimativa de uma distribui-
o de probabilidades. No prximo captulo ser apresentada uma varivel
que pode ser muito til em combinao com este resultado.
XY hXY i hXihY i
Corr(X, Y ) XY = =q q , (12)
X Y hX 2 i hXi2 hY 2 i hY i2
13
4 Teoria da Informao
Neste captulo comeamos a denio das variveis que so de maior im-
portncia para o presente trabalho, atravs das quais faremos as anlises
para a investigao do comportamento do mercado de capitais. De novo nos
focaremos apenas no caso discreto, que o de interesse devido aos clcu-
los computacionais, mas todas as variveis tambm esto denidas no caso
contnuo, com a simples substituio do somatrio pela integral.
14
Espera-se que o contedo de informao associado a duas mensagens in-
dependentes, com probabilidades P (x1 ) = p1 e P (x2 ) = p2 , seja dado pela
soma dos contedos de informao dessas mensagens. Ou seja, espera-se que
s(x1 x2 ) = s(x1 )+s(x2 ). Esta propriedade tambm vericada pela denio
do contedo informacional:
1 1 1
s(x1 x2 ) = log2 = log2 + log2 = s(x1 ) + s(x2 ).
p1 p2 p1 p2
S bits (X) log2 (|AX |), com igualdade se, e somente se,
P (x) = 1/|AX | para todo x.
15
No caso de nosso interesse |AX | = n, onde n o nmero de bins que
usamos para dividir os dados para a obteno das probabilidades. Disto, e
da segunda propriedade acima listada, segue que:
S bits (X)
S(X) 1,
log2 (n)
onde
X 1
S(X) = P (x) logn (14)
x P (x)
log2 (1/pi )
a entropia normalizada, pois = logn (1/pi ).
log2 (n)
X X 1
S(X, Y ) = P (x, y) logn . (15)
xAX yAY P (x, y)
16
A entropia conjunta aditiva para variveis aleatrias independentes:
X 1
S(X|y = bj ) = P (x|y = bj ) logn . (16)
xAX P (x|y = bj )
17
DKL (P ||Q) 0
onde foi usada a equao (17). Ela satisfaz I(X; Y ) = I(Y ; X), ou seja,
simtrica: a quantidade mdia de informao que obtemos de X ao conhecer
Y a mesma que obtemos de Y ao conhecer X .
18
Figura 2: Relao entre Entropia Conjunta, Entropia Marginal, Entropia Condici-
onal e Informao Mtua.
5 Clculos e Resultados
N N
1 X 1 X
hh(t)i = h (t), hh(t)2 i = [h (t)]2 , (19)
N =1 N =1
e a varincia (2)
N
1 X
t2 = [h (t) hh(t)i]2 . (20)
N =1
19
De (12), (19) e (20) calculamos a correlao entre dois dias t e t0 como
hh(t)h(t0 )i hh(t)ihh(t0 )i
Corr(t, t0 ) = q q , (21)
hh(t)2 i hh(t)i2 hh(t0 )2 i hh(t0 )i2
1 PN
onde hh(t)h(t0 )i = N
h (t)h (t0 ). Repetindo o clculo para todos os
=1
pares de dias obtemos uma matriz de correlao entre todos os dias.
20
em t = t0 .
Cada grco possui cinco curvas superpostas de cinco dias adjacentes,
pois, para dias sucientemente prximos, tanto a correlao quanto a IM
variam de maneira semelhante a medida que o tempo passa, e aqui no
estamos interessados nos valores absolutos da correlao e da IM, mas apenas
numa comparao qualitativa de seus comportamentos.
Abaixo segue os grcos com t0 situado em quatro diferentes momentos
da srie temporal que julgamos importantes para a comparao, quais sejam
eles: o comeo da srie temporal, momentos antes da crise estourar (Figura
3); em torno do dia de menor valor das aes (Figura 4); no meio da srie
temporal (Figura 5); e por ltimo no nal da srie temporal (Figura 6).
1 0.55
t0=1 t0=1
t0=2 t0=2
0.98 t0=3 0.5 t0=3
t0=4 t0=4
t0=5 0.45 t0=5
0.96
0.4
Corr(t0,t)
0.94
I(t0;t)
0.35
0.92
0.3
0.9
0.25
0.88 0.2
0.86 0.15
0 50 100 150 200 250 300 350 400 450 500 0 50 100 150 200 250 300 350 400 450 500
t (dias) t (dias)
21
sentam mnimos de acordo com os mnimos dos valores das aes, no entanto
ca evidente que, enquanto a correlao oscila bastante com o tempo, tor-
nando difcil identicar quando ocorre um valor mnimo signicativo, a IM
apresenta apenas trs mnimos bem denidos, oscilando pouco com a passa-
gem do tempo. Da IM ca tambm claro que h um vale aproximadamente
entre t = 90 e t = 170, de novo em perfeito acordo com o que nos mos-
tra a Figura 1. Do grco da correlao no conseguimos tirar esta mesma
informao.
Outro ponto que ca evidente nesta comparao a escala. Enquanto a
correlao se mantm durante praticamente todo o tempo oscilando entre 1 e
0.9, ou seja, mesmo os menores valores ainda apresentam uma alta correlao
com os primeiros dias, a IM em t = 60 j baixou de 0.5 para menos de 0.2,
mostrando que junto com a queda da bolsa houve tambm uma grande queda
na informao compartilhada com os primeiros dias.
1 0.55
t0=133 t0=133
t0=134 t0=134
t0=135 0.5 t0=135
0.98
t0=136 t0=136
t0=137 0.45 t0=137
0.96
0.4
Corr(t0,t)
I(t0;t)
0.94 0.35
0.3
0.92
0.25
0.9
0.2
0.88 0.15
-150 -100 -50 0 50 100 150 200 250 300 350 400 -150 -100 -50 0 50 100 150 200 250 300 350 400
t - t0 (dias) t - t0 (dias)
22
comeo da srie temporal, onde aconteceu a crise e houve grandes variaes
nos preos das aes.
Na Figura 4 podemos perceber claramente que no intervalo 30 t
30, referente ao perodo entre t = 105 e t = 175 da Figura 1, onde ocorreu os
menores valores das aes, a IM cai bastante rpido, descendo de I 0.55
para I 0.3, enquanto que a correlao varia muito pouco, permanecendo
entre 1 e 0.98. Portanto, mesmo em meio crise, a correlao nos diz que os
dias prximos a t0 parecem bastante correlacionados com ele, o que pode ser
verdade para qualquer outro perodo da bolsa, enquanto que a IM apresenta
uma queda grande, o que atpico para dias adjacentes, como veremos a
seguir. Tanto a IM quanto a correlao diminuem mais rapidamente para
t < 0, em direo crise, do que para t > 0, em direo recuperao
do mercado.
1 0.55
t0=245 t0=245
t0=246 t0=246
0.99 t0=247 0.5 t0=247
t0=248 t0=248
0.98 t0=249 t0=249
0.45
0.97
Corr(t0,t)
0.4
I(t0;t)
0.96
0.35
0.95
0.3
0.94
0.93 0.25
0.92 0.2
-250 -200 -150 -100 -50 0 50 100 150 200 250 -250 -200 -150 -100 -50 0 50 100 150 200 250
t - t0 (dias) t - t0 (dias)
23
Figura 1, perto do primeiro mnimo da crise. Apesar disso, se no tivsse-
mos a priori a informao da crise, devido grande oscilao da correlao,
poderia ser difcil assinalar algum comportamento importante neste ponto.
Para a IM podemos ver que em torno de t = 0 ela decresce mais lenta-
mente do que no cenrio anterior, variando entre 0.5 e 0.35 (contra 0.55 e 0.3).
Entretanto, o que ca mais evidente, que para t > 0 a IM decresce mais
uniformemente, lembrando uma lei de potncia, enquanto que para t < 0
h uma queda abrupta de t 75 at t 110, este ltimo sendo refe-
rente t = 135 na Figura 1, o dia de menor valor das aes, e permanecendo
prximo a este valor I 0.23 em todo o intervalo 250 t 110, que
o perodo que caracteriza a crise, 1 t 135 na Figura 1, onde os valores
das aes estiveram em queda.
Mesmo que no tivssemos conhecimento da crise a IM poderia indicar
um acontecimento importante no intervalo 250 t 110.
1 0.55
t0=401 t0=401
0.99 t0=402 t0=402
t0=403 0.5 t0=403
t0=404 t0=404
0.98 t0=405 t0=405
0.45
0.97
0.4
Corr(t0,t)
0.96
I(t0;t)
0.35
0.95
0.3
0.94
0.25
0.93
0.92 0.2
0.91 0.15
-450 -400 -350 -300 -250 -200 -150 -100 -50 0 50 100 -450 -400 -350 -300 -250 -200 -150 -100 -50 0 50 100
t - t0 (dias) t - t0 (dias)
24
400 t 230, que referente aos dias 1 t 175 na Figura 1, sendo
este o perodo de grande oscilao nos preos das aes, englobando j o in-
cio da recuperao do mercado, que aconteceu a partir de t = 135 (na Figura
1). H um mnimo que se destaca em t 345, referente ao dia t 60,
que o segundo dia de menor valor das aes, o primeiro grande mnimo aps
o comeo da queda. Como foi destacado tambm nos outros grcos, apesar
deste mnimo mais evidente, h uma grande oscilao durante esse perodo, o
que diculta identicar se alguma destas variaes est relacionada a algum
evento importante.
No grco da IM podemos ver que no intervalo 100 t 100 ela
decresce de maneira bastante semelhante para ambos os lados, o que no era
observado nos casos anteriores, onde era sempre perceptvel uma assimetria
mesmo em intervalos pequenos em torno de t = 0. Podemos ver tambm
que para t < 0 a IM decresce de maneira uniforme at t 230, onde
ca evidente uma queda brusca, assim como na correlao. Diferente do que
acontece na correlao, o mnimo da IM em t 270, referente ao dia
t 135 na Figura 1, que o dia de menor valor das aes. Assim como
nos casos anteriores, a IM se mantm sem grandes oscilaes, mesmo no
perodo da crise, tornando assim mais fcil a identicao de um mnimo e
sua possvel relao com algum evento importante.
25
5.3 Informao Mtua Mdia
26
0.6 0.6
Intervalo 1
Intervalo 2
0.55 Intervalo 3 0.5
Intervalo 4
Intervalo 5
0.5 Intervalo 6
Intervalo 7
Intervalo 8 0.4
0.45
<I>
<I>
0.4
0.3 Intervalo 1
Intervalo 2
0.35 Intervalo 3
Intervalo 4
Intervalo 5
0.3 Intervalo 6
Intervalo 7
Intervalo 8
0.25 0.2
5 10 15 20 25 30 35 40 45 50 1 10
(dias) (dias)
27
0.58 0.18
0.17
0.57
0.16
0.56 0.15
0.14
0.55
0.13
a
b
0.54
0.12
0.53 0.11
0.1
0.52
0.09
0.51 0.08
1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8
Intervalo Intervalo
0.565
0.56
0.555
0.55
0.545
<S>
0.54
0.535
0.53
0.525
0.52
0.515
1 2 3 4 5 6 7 8
Intervalos
28
tempo. Como vimos na Seo 5.2, a IM parece decrescer mais rapidamente
no perodo da crise, tambm apresentando mnimos mais acentuados nos me-
nores valores das aes. Aqui podemos vericar isto atravs de b. Podemos
ver que o maior valor de b no intervalo 1, onde houve a maior queda no
valor das aes, mostrando que de fato a IM decresceu mais rapidamente no
comeo da crise do que em qualquer outro perodo. Acompanhando na Fi-
gura 1, vemos que nos intervalos 2 e 3, apesar dos preos continuarem caindo,
a amplitude na oscilao do valor das aes foi menor, e acompanhando o
comportamento de b, vemos que ele diminui e permanece praticamente cons-
tante nesses dois intervalos, indicando que a IM decresceu mais lentamente
em relao ao intervalo 1, mas ainda assim mais rpido do que em outro
intervalo. Aps estes intervalos o mercado comea a se recuperar, h uma
menor oscilao e o valor das aes comea a subir. Podemos ver que h uma
grande queda em b, portanto a IM decresce mais lentamente. O valor volta
a crescer um pouco nos intervalos 5 e 8, onde, na Figura 1, podemos ver que
houve ligeiras quedas no valor das aes, mas b continua abaixo do valor dos
primeiros intervalos. Os menores valores, que so pelo menos a metade do
valor no intervalo 1, ocorrem nos intervalos 6 e 7, que so os intervalos onde
o valor das aes continua crescendo e oscilando pouco.
Disto vemos b pode estar relacionado com a volatilidade do mercado,
mostrando que a IM sensvel variao dos valores das aes, decrescendo
mais rapidamente quando h grandes oscilaes.
6 Concluso
29
aes subiam (spin up) ou desciam (spin down). Outro ponto demonstrado
em [8] que o mercado pode ser explicado atravs da interao entre pares
de empresas. A partir disso, nossa abordagem para o clculo da entropia
informacional foi diferente, se baseando diretamente no valor das aes em
cada dia e construindo uma distribuio de probabilidades para cada par
de empresas. Como as variveis da teoria da informao dependem apenas
das distribuies de probabilidade, com isto podemos calcular uma matriz
da entropia conjunta (15) para todos os pares de empresas e utilizando a
equao (18) segue diretamente o clculo de uma matriz para a informao
mtua para todos os mesmos pares.
Primeiro zemos uma comparao entre a correlao temporal e a IM
temporal, que pode ser vista como uma correlao generalizada sensvel
dependncia no-linear entre duas variveis aleatrias [18]. Desta compara-
o pudemos concluir que a IM de fato uma medida superior em comparao
com a correlao para o comportamento do mercado. Enquanto a correlao
tem uma tendncia a variar bastante com o tempo, tornando difcil identi-
car quando ocorre algum acontecimento mais importante, a IM mostra um
decrescimento mais uniforme, apresentando grandes variaes apenas quando
o mercado tambm apresenta um comportamento anmalo.
Depois, estudando mais diretamente apenas o comportamento da IM,
tentamos determinar como seu comportamento se relaciona com o compor-
tamento do mercado. Para isto calculamos os parmetros que caracterizam
uma lei de potncia para diferentes curvas da IM mdia em diferentes inter-
valos da srie temporal. Disto vimos que o parmetro referente a constante
de proporcionalidade est relacionado com a entropia mdia do intervalo,
embora sozinho no consiga explicar o comportamento da entropia. O par-
metro referente ao expoente de decaimento mostrou uma relao maior com
o comportamento do mercado, mostrando que de fato a IM decresce mais ra-
pidamente em perodos de grande volatilidade do mercado, o que faz sentido
se pensarmos principalmente na analogia usada em [8], pois em momentos
de grande volatilidade as empresas tendem a se comportar mais individual-
mente, mudando sua orientao com maior frequncia, e assim dicultando
uma visualizao da tendncia geral do mercado, enquanto que em pero-
30
dos normais ou de ps-crise, as empresas se comportem de maneira mais
uniforme.
Alguns pontos que poderiam ser usados para melhorar nossas estimativas
seriam um estudo do nmero timo de bins para a maximizao da entropia,
o uso do teorema de Bayes junto com a divergncia de Kullback-Leibler
[14, 15] para a obteno de uma distribuio de probabilidades que nos desse
um ganho de informao, e tambm o mtodo apresentado em [18] para
estimarmos os erros em nosso clculos da entropia e IM.
O uso da teoria da informao em estudos do mercado de capitais re-
cente, mas j bastante difundido no estudo de redes neurais [16, 17]. Futu-
ramente poderamos trocar nossa anlise temporal por uma anlise estrutural
(espacial), utilizando a IM para estabelecer uma matriz de conexes entre as
empresas e ento aplicar mtodos j conhecidos do estudo de redes neurais,
redes complexas e fsica estatstica.
31
Referncias
[1] BM&FBovespa, Introduo ao Mercado de Capitais,
http://www.bmfbovespa.com.br/pt-br/a-bmfbovespa/download/merccap.pdf
[4] T.K.D. Peron, L. da Fontoura Costa, F.A. Rodrigues, The structure and
resilience of nancial market networks, Chaos: An Interdisciplinary Jour-
nal of Nonlinear Science 22 (2012) 013117.
[9] http://nance.yahoo.com/
32
[11] David MacKay, Information Theory, Inference and Learning Algo-
rithms, Cambridge University Press (2003).
[12] Luiz Henrique Alvez Monteiro, Sistemas Dinmicos, Seo 10.5 - Entro-
pia Informacional de Shannon, Editora Livraria da Fsica (2011).
[18] Mark S. Roulston, Estimating the erros on measured entropy and mutual
information, Physica D, 125, 285-294 (1999).
33