Você está na página 1de 34

UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL

INSTITUTO DE FSICA
GRADUAO EM BACHARELADO EM FSICA

Anlise do comportamento do Mercado de Capitais


atravs da Teoria da Informao

Trabalho de Concluso de Curso apresentado ao curso de


Bacharelado em Fsica - Pesquisa Bsica, do Instituto de Fsica
da Universidade Federal do Rio Grande do Sul, como um
pr-requisito para a obteno do grau de Bacharel em Fsica.

Cssio Murilo vila

Orientador: Prof. Dr. David Dominguez

2013
Sumrio
1 Introduo 4

2 Mercado de Capitais 6
2.1 Mercado Primrio e Mercado Secundrio . . . . . . . . . . . . 6
2.2 Bolsa de Valores . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.3 S&P 500 e o comportamento do mercado . . . . . . . . . . . . 8

3 Probabilidade 10
3.1 Probabilidade Marginal e Denies . . . . . . . . . . . . . . . 10
3.2 Probabilidade Multivariacional . . . . . . . . . . . . . . . . . . 11
3.3 Teorema de Bayes . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.4 Covarincia e Correlao . . . . . . . . . . . . . . . . . . . . . 13

4 Teoria da Informao 14
4.1 Contedo Informacional de Shannon . . . . . . . . . . . . . . 14
4.2 Entropia Informacional de Shannon . . . . . . . . . . . . . . . 15
4.3 Entropia Multivariacional . . . . . . . . . . . . . . . . . . . . 16
4.4 Informao Mtua . . . . . . . . . . . . . . . . . . . . . . . . 18

5 Clculos e Resultados 19
5.1 Mtodo Numrico . . . . . . . . . . . . . . . . . . . . . . . . . 19
5.2 Correlao x Informao Mtua . . . . . . . . . . . . . . . . . 20
5.3 Informao Mtua Mdia . . . . . . . . . . . . . . . . . . . . . 26

6 Concluso 29

1
Resumo
Sabendo que caractersticas marcantes no comportamento do mer-
cado de capitais como crashes e bubbles podem ser identicadas pela
entropia informacional, neste trabalho pretendemos estudar o mercado
utilizando algumas variveis da teoria da informao. Primeiro faze-
mos uma comparao entre a correlao e a informao mtua de uma
srie temporal da bolsa de valores de Nova Iorque a m de conrmar
que a informao mtua representa melhor o comportamento do mer-
cado. Por m nos focamos exclusivamente na informao mtua a m
de entender melhor seu comportamento em relao ao comportamento
do mercado.

2
Abstract
Knowing that remarkable features in the capital market's behavior
such as crashes and bubbles can be identied by information entropy,
in this work we intend to study the market using some information
theory variables. First, we make a comparison between the correlation
and the mutual information of a time series of the New York stock
exchange to conrm that mutual information best represents the mar-
ket's behavior. Last, we focus exclusively on the mutual information
to better understand it's behavior in relation to the market's one.

3
1 Introduo

O mercado nanceiro pode ser visto como um sistema complexo onde a


interao entre agentes leva a uma auto-organizao que dene a direo do
mercado. Aqui interpretamos interao num sentido mais amplo, de m-
tua ou recproca inuncia, e os agentes podem ser tanto as aes como os
investidores. Sistemas complexos so de grande interesse por exibirem um
comportamento coletivo emergente causado, a priori, por regras de intera-
o simples entre os muitos elementos que constituem o sistema. Sabe-se
que o mercado exibe caractersticas como sincronizao [2], reorganizao es-
trutural [3, 4], leis de potncia [5, 6], hierarquia e no-aleatoriedade [7]. Foi
demonstrado tambm que a estrutura do mercado pode ser explicada atravs
da interao entre pares [8].
Dadas essas consideraes, faz sentido pensar em uma modelagem esta-
tstica como abordagem natural para estudar o mercado. De fato, este o
objetivo do presente trabalho. Aqui zemos uso de variveis da teoria da
informao para investigar o comportamento do mercado. Em [8] mostrou-
se que a entropia informacional pode servir para identicar irregularidades
no mercado nanceiro, como crashes ou bubbles da bolsa. Neste trabalho
zemos uma anlise de uma srie temporal dos valores de alta de aes das
empresas constituintes do ndice S&P500 da bolsa de valores de Nova Iorque
atravs da informao mtua, uma varivel da teoria da informao denida
a partir da entropia informacional de duas variveis aleatrias.
Primeiramente zemos uma comparao da informao mtua com a cor-
relao entre os dias da srie temporal analisada para vericar que a informa-
o mtua nos d uma melhor representao do comportamento do mercado.
Posteriormente zemos um estudo mais aprofundado da informao mtua
em diferentes intervalos da srie temporal a m de identicar parmetros que
caracterizem a transmisso da informao e como ela est relacionada com o
comportamento do mercado.
O trabalho est dividido da seguinte maneira: primeiro feita uma breve
introduo ao mercado de capitais, explicando seu funcionamento at che-

4
garmos bolsa de valores e ao ndice estudado. Em segundo lugar, zemos
uma breve introduo a algumas variveis da teoria de probabilidades que
so teis para o maior entendimento do trabalho. Depois zemos uma apre-
sentao mais detalhada da teoria da informao e suas variveis de maior
importncia. Por m, explicamos o mtodo numrico utilizado, apresenta-
mos alguns resultados e nossa concluso.

5
2 Mercado de Capitais

O mercado de capitais um sistema de distribuio de valores mobilirios


que tem o objetivo de proporcionar liquidez aos ttulos de emisso de empre-
sas e viabilizar seu processo de capitalizao. constitudo pelas bolsas, cor-
retoras e outras instituies nanceiras autorizadas. Nele os principais ttulos
negociados so as aes (representativos do capital de empresas), debntures
(emprstimos tomados via mercado por empresas) e derivativos (contratos
no qual se estabelecem pagamentos futuros), o que permite a circulao de
capital para custear o desenvolvimento econmico [1].
O mercado de capitais subdividido em Mercado Primrio e Mercado
Secundrio.

2.1 Mercado Primrio e Mercado Secundrio

No mercado primrio onde ocorre o lanamento de novas aes ao p-


blico, isto , onde os valores mobilirios circulam pela primeira vez e onde
a empresa obtm o capital para seus empreendimentos, pois o dinheiro da
venda vai para a empresa. J no mercado secundrio so feitas as demais
negociaes dos ttulos colocados em circulao pelo mercado primrio, como
compra, venda ou simples troca dos ttulos entre os possuidores, e a empresa
j no tem mais contato com o dinheiro proveniente dessas negociaes.
As negociaes no mercado secundrio se do nas bolsas de valores e no
mercado de balco (onde ocorrem as negociaes de aes de empresas no
registradas na bolsa de valores).
Nosso foco no presente trabalho na bolsa de valores.

2.2 Bolsa de Valores

As bolsas de valores so locais que oferecem as condies e os sistemas


necessrios para a realizao de negociaes de compra e venda de ttulos,

6
valores mobilirios e outros ativos de forma transparente. Alm de oferecer
um ambiente para a negociao dos ttulos nelas registrados, orientar e s-
calizar os servios prestados por seus intermedirios, facilitar a divulgao
constante de informaes sobre as empresas e sobre os negcios que se reali-
zam sob seu controle, as bolsas propiciam liquides s aplicaes de mdio e
longo prazos por intermdio de um mercado contnuo representado por seus
preges dirios [1].
Os movimentos de uma bolsa de valores so captados atravs de ndices
(ou indicadores) chamados ndice de bolsa de valores. Cada bolsa de valores
tem seu(s) ndice(s).
Alguns exemplos das principais bolsas de valores e seus respectivos ndi-
ces:

Bolsa de Valores de Nova Iorque (New York Stock Exchange - NYSE)

 Dow Jones
 S&P 500

Bolsa de Valores de Tquio

 Nikkei 225

Bolsa de Valores de Londres

 FTSE 100

Bolsa de Valores de Frankfurt

 DAX-30

Bolsa de Valores de So Paulo (BM&FBovespa)

 Ibovespa

Neste trabalho nos focamos no ndice S&P 500 da bolsa de valores de


Nova Iorque.

7
2.3 S&P 500 e o comportamento do mercado

O ndice S&P 500, ou Standard & Poor's 500, baseado na capitalizao


do mercado das 500 empresas lderes do mercado americano como denido
pela Standard & Poor. As 500 empresas so escolhidas por um comit ba-
seadas em critrios bem denidos, como capitalizao de mercado, liquidez,
durao do tempo de capital aberto e classicao setorial, entre outros, so-
mando oito critrios no total. Sendo assim, as 500 empresas no so constan-
tes e ocorrem variaes de ano para ano sem data especca para a alterao,
podendo ocorrer em qualquer ms, embora, de fato, poucas empresas sejam
alteradas de um ano para o outro.
um dos ndices comumente mais seguidos e muitos o consideram a
melhor representao do mercado americano.
Neste trabalho usamos dados de 349 empresas referentes a 495 dias de
mercado, abrangendo o perodo de 25 de agosto de 2008 a 20 de agosto de
2010. Para fazer os clculos precisamos que todas as empresas tenham par-
ticipado dos mesmos dias de mercado, portanto, como dito acima, havendo
substituies de algumas empresas de um ano para o outro, isso nos impede
de usar todas as 500 presentes do ndice. Ainda assim, mesmo algumas em-
presas que foram constantes no perodo que analisamos no tinham dados
disponveis em todos os 495 dias, portanto tivemos que fazer uma ltragem
am de manter apenas aquelas com dados disponveis em toda a srie tem-
poral utilizada, restando assim as 349.
A base de dados utilizada [9] continha os valores das variveis Open, High,
Low, Close e Volume, referentes respectivamente aos valores de abertura,
alta, baixa, fechamento e volume de aes negociadas da empresa. Escolhe-
mos por nos focar no valor de alta das aes.
Podemos observar na Figura 1 que j no comeo da srie temporal, por
volta de t = 6, representando o comeo de setembro de 2008, os valores das
aes comeam a diminuir, com uma queda abrupta comeando aproxima-
damente em t = 25, representando o m do mesmo ms.

8
1400

1300

1200

1100
Alta (USD)

1000

900

800

700

600
0 50 100 150 200 250 300 350 400 450
t (dias)

Figura 1: Valores de alta em dlares americanos do ndice S&P500, abrangendo o


perodo de 495 dias de mercado entre 25/08/2008 e 20/08/2010.

O que estamos vendo aqui foi o comeo da crise do subprime de 2008-2009,


ou subprime mortgage crisis, que foi uma crise nanceira desencadeada pela
quebra das instituies de crdito dos Estados Unidos, que concediam em-
prstimos hipotecrios de alto risco. H um mnimo global aproximadamente
em t = 135, que o dia 9 de maro de 2009, onde as aes das empresas
alcanaram os menores valores durante a crise. Desde ento podemos notar
uma tendncia de recuperao do mercado.

9
3 Probabilidade
Aqui comearemos a denir a base terica e algumas das variveis [10, 11] usa-
das neste trabalho. Ser apresentado apenas o caso discreto, pois foi o usado
no trabalho devido aos clculos computacionais, mas todas podem tambm
ser denidas no caso contnuo, apenas trocando o somatrio por uma integral.

3.1 Probabilidade Marginal e Denies

Dada uma varivel aleatria X , x o resultado que a varivel aleatria


assume de um dos possveis valores do conjunto AX = {a1 , a1 , ..., aI }, com
probabilidade PX = {p1 , p2 , ..., pI }, de maneira que P (x = ai ) = pi com
P
pi 0 e ai AX P (x = ai ) = 1.

Por simplicidade de notao muitas vezes usaremos P (x = ai ) = P (x) e


P P
ai AX P (x = ai ) = x P (x).

A partir disto dizemos que o valor esperado (ou mdia ponderada) da


varivel aleatria X
X
hXi = xP (x), (1)
x

e a varincia de X

2
V ar(X) X = h(X hXi)2 i = hX 2 i hXi2 , (2)

de maneira que o desvio padro de X ca


q q
X V ar(X) = hX 2 i hXi2 . (3)

10
3.2 Probabilidade Multivariacional

Probabilidade Conjunta - Dadas duas variveis aleatrias X e Y ,


onde x e y so, respectivamente, os resultados que as v.a. X e Y assu-
mem, com x AX = {a1 , a1 , ..., aI } e y AY = {b1 , b1 , ..., bJ }, dizemos que
P (x = ai , y = bj ) = P (x, y) a probabilidade conjunta.

X e Y no so necessariamente independentes, de maneira que P (x, y) =


P (x)P (y) se, e somente se, X e Y so variveis aleatrias independentes.

Probabilidade Marginal - Da probabilidade conjunta obtemos a pro-


babilidade marginal P (x) pela soma:
X
P (x = ai ) = P (x = ai , y). (4)
yAY

De maneira similar, usando a notao simplicada, a probabilidade mar-


ginal P (y) :
X
P (y) = P (x, y). (5)
x

Onde conclumos que


X
P (x, y) = 1.
xy

Probabilidade Condicional - A probabilidade condicional dada por:

P (x = ai , y = bj )
P (x = ai |y = bj ) = , (6)
P (y = bj )

se P (y = bj ) 6= 0.

L-se P (x = ai |y = bj ) como "a probabilidade que x seja igual a ai dado


que y igual a bj ".

11
Na notao simplicada temos que

P (x, y)
P (y|x) = , (7)
P (x)

se P (x) 6= 0.

As equaes (6) e (7) no esto denidas para P (y) = P (x) = 0. A partir


delas podemos reescrever a probabilidade conjunta (5) como:

P (x, y) = P (x|y)P (y) = P (y|x)P (x). (8)

A partir de (4), (5) e (8) reescrevemos as probabilidades marginais como:


X X
P (x) = P (x, y) = P (x|y)P (y), (9)
y y

e tambm

X X
P (y) = P (x, y) = P (y|x)P (x). (10)
x x

3.3 Teorema de Bayes

Dos resultados acima derivados em (7), (8) e (9), segue diretamente que:

P (x|y)P (y) P (x|y)P (y)


P (y|x) = =P 0 0
,
P (x) y 0 P (x|y )P (y )

onde y assume um valor xo, no qual estamos interessados, e y 0 a varivel


que soma sobre todos os valores possveis do conjunto AY .
Este resultado conhecido como o Teorema de Bayes. No usamos expli-
citamente o teorema de Bayes neste trabalho, mas um resultado importante
que segue diretamente de tudo que precisamos denir at aqui e que pode ser

12
usado recursivamente para melhorarmos nossa estimativa de uma distribui-
o de probabilidades. No prximo captulo ser apresentada uma varivel
que pode ser muito til em combinao com este resultado.

3.4 Covarincia e Correlao

Dadas duas variveis aleatrias X e Y , de (2) temos que a covarincia


entre elas

Cov(X, Y ) XY = hX, Y i = h(X hXi)(Y hY i)i = hXY i hXihY i,


(11)
de maneira que XX = 2
X .

A correlao [10] entre X e Y denida, a partir de (3) e (11), como:

XY hXY i hXihY i
Corr(X, Y ) XY = =q q , (12)
X Y hX 2 i hXi2 hY 2 i hY i2

onde 1 XY 1. Para XY = 1, X e Y esto completamente corre-


lacionadas e possuem o mesmo comportamento. Para XY = 1, X e Y
esto correlacionadas, mas possuem comportamentos em sentidos opostos.
Se XY = 0, X e Y so independentes.

13
4 Teoria da Informao
Neste captulo comeamos a denio das variveis que so de maior im-
portncia para o presente trabalho, atravs das quais faremos as anlises
para a investigao do comportamento do mercado de capitais. De novo nos
focaremos apenas no caso discreto, que o de interesse devido aos clcu-
los computacionais, mas todas as variveis tambm esto denidas no caso
contnuo, com a simples substituio do somatrio pela integral.

4.1 Contedo Informacional de Shannon

O signicado terico da palavra informao no muito diferente do que


se tem conhecimento pelo senso-comum: uma mensagem considerada infor-
mativa se ela diz algo que era desconhecido ou pouco esperado. Isto signica
que as mensagens menos provveis transportam mais informao. A partir
desta ideia podemos chegar importante concluso de que se for possvel
medir a probabilidade de ocorrncia de uma mensagem, ento, de forma si-
milar, tambm podemos medir seu contedo de informao [12].

O contedo informacional de Shannon de um resultado, medido em bits,


denido como sendo
1
s(x) log2 , (13)
P (x)
onde a referncia nominal feita a Claude Shannon [13], que desenvolveu
sozinho praticamente toda a Teoria da Informao.

Esta frmula corrobora a noo de que a quantidade de informao au-


menta se a probabilidade de uma mensagem tende a zero, enquanto no outro
extremo, quando a probabilidade de uma mensagem P (x) = 1, ou seja,
quando se sabe exatamente o que ser transmitido, a quantidade de infor-
mao recebida nula: s(x) = 0.

14
Espera-se que o contedo de informao associado a duas mensagens in-
dependentes, com probabilidades P (x1 ) = p1 e P (x2 ) = p2 , seja dado pela
soma dos contedos de informao dessas mensagens. Ou seja, espera-se que
s(x1 x2 ) = s(x1 )+s(x2 ). Esta propriedade tambm vericada pela denio
do contedo informacional:
1 1 1
s(x1 x2 ) = log2 = log2 + log2 = s(x1 ) + s(x2 ).
p1 p2 p1 p2

4.2 Entropia Informacional de Shannon

A entropia informacional (ou entropia marginal) [11, 13] de uma varivel


aleatria X denida como sendo a mdia (1) do contedo informacional
(13) de um resultado:
X X 1
S bits (X) s(x)P (x) = P (x) log2 ,
xAX x P (x)

com a conveno que P (x) = 0 0 log 1/0 = 0, visto que


limt0+ t log 1/t = 0.

Aqui a entropia, assim como o contedo informacional, medida em bits.

Duas propriedades importantes da entropia:

S(X) 0, com igualdade se, e somente se, P (x) = 1 para um x;

A entropia maximizada se PX uniforme:

S bits (X) log2 (|AX |), com igualdade se, e somente se,
P (x) = 1/|AX | para todo x.

Aqui |AX | denota o nmero de elementos do conjunto AX .

15
No caso de nosso interesse |AX | = n, onde n o nmero de bins que
usamos para dividir os dados para a obteno das probabilidades. Disto, e
da segunda propriedade acima listada, segue que:

S bits (X)
S(X) 1,
log2 (n)
onde
X 1
S(X) = P (x) logn (14)
x P (x)
log2 (1/pi )
a entropia normalizada, pois = logn (1/pi ).
log2 (n)

Redundncia - A partir da segunda propriedade da entropia, ainda po-


demos denir a redundncia da varivel aleatria X como:
S bits (X)
R1 ,
log2 (|AX |)
onde, no caso de nosso interesse, para |AX | = n, R = 1 S(X).

A entropia de X tambm chamada de incerteza de X . De agora em


diante adotaremos apenas a entropia normalizada neste trabalho.

4.3 Entropia Multivariacional

Aqui seguimos com a denio de entropia, expandindo o conceito para


duas variveis aleatrias [11].

Entropia Conjunta - Dadas duas variveis aleatrias X e Y , substi-


tuindo a probabilidade marginal P (x) pela probabilidade conjunta P (x, y)
em (14), e somando sobre x e y , segue que a entropia conjunta :

X X 1
S(X, Y ) = P (x, y) logn . (15)
xAX yAY P (x, y)

16
A entropia conjunta aditiva para variveis aleatrias independentes:

S(X, Y ) = S(X) + S(Y ) se, e somente se, P (x, y) = P (x)P (y).

Entropia Condicional e Equivocao - A entropia condicional de X


dado que y = bj a entropia da distribuio de probabilidades P (x|y = bj ).
Usando P (x|y) no lugar de P (x) em (14) e somando sobre x temos:

X 1
S(X|y = bj ) = P (x|y = bj ) logn . (16)
xAX P (x|y = bj )

A entropia condicional de X dado Y a mdia (1) sobre y da entropia


condicional (16) de X dado y :
" #
X X X 1
S(X|Y ) = P (y)S(X|y) = P (y) P (x|y) logn
yAY yAY xAX P (x|y)
X 1 X 1
= P (y)P (x|y) logn = P (x, y) logn ,
xy P (x|y) xy P (x|y)

onde tambm foi usada a equao (8).

Este resultado tambm conhecido como a equivocao de X sobre Y .


Ela mede a incerteza mdia que resta sobre X quando Y conhecida.

As entropias conjunta, condicional e marginal esto relacionadas por:

S(X, Y ) = S(X) + S(Y |X) = S(Y ) + S(X|Y ). (17)

Entropia Relativa ou Divergncia de Kullback-Leibler - A diver-


gncia de Kullback-Leibler [14, 15], tambm chamada de entropia relativa ou
ganho de informao, entre duas distribuies de probabilidade P (x) e Q(x),
denidas sobre o mesmo conjunto AX ,
X P (x)
DKL (P ||Q) = P (x) logn .
x Q(x)

Ela satisfaz a desigualdade de Gibbs :

17
DKL (P ||Q) 0

com igualdade apenas se P = Q. Note que no geral a entropia relativa no


simtrica sob a troca das distribuies P e Q: no geral DKL (P ||Q) 6=
DKL (Q||P ), ento, embora algumas vezes DKL tambm seja chamada de
"distncia KL", ela no estritamente uma distncia.
A DKL no foi usada neste trabalho, mas pode ser muito til em conjunto
com o teorema de Bayes (Seo 3.3). Com a DKL podemos fazer uma com-
parao entre uma nova distribuio de probabilidades, gerada a partir do
teorema de Bayes, e a velha, e assim vericar se houve ganho de informao.
Tambm pode ser aplicada recursivamente.

4.4 Informao Mtua

Uma quantidade muito importante na teoria da informao, que tambm


a mais importante no presente trabalho, a qual usaremos para estudar o
comportamento do mercado de capitais, a informao mtua [16, 17]. Ela
mede a reduo mdia na incerteza sobre x quando sabemos o valor de y ; ou,
em outras palavras, a quantidade mdia de informao que pode ser obtida
de X quando conhecemos Y . Ela denida como:

I(X; Y ) S(X) S(X|Y ) = S(X) + S(Y ) S(X, Y ), (18)

onde foi usada a equao (17). Ela satisfaz I(X; Y ) = I(Y ; X), ou seja,
simtrica: a quantidade mdia de informao que obtemos de X ao conhecer
Y a mesma que obtemos de Y ao conhecer X .

18
Figura 2: Relao entre Entropia Conjunta, Entropia Marginal, Entropia Condici-
onal e Informao Mtua.

5 Clculos e Resultados

5.1 Mtodo Numrico

O estudo foi realizado sobre os valores de alta das aes de N = 349


empresas durante T = 495 dias. Depois de escolhido o nmero de bins n,
que precisa ser o mesmo para todos os dias, para cada dia t {1, 2, ..., T }
0
calculamos o tamanho do bin como bt = [hmax (t) hmin (t)]/n, onde deno-
minamos como h (t) o valor de alta no tempo t das aes de uma empresa
{1, 2, ..., N }. De agora em diante nos referiremos a h (t) apenas como o
valor das aes da empresa no tempo t, cando subentendido que so os
valores de alta.
Assim, a mdia e a mdia do quadrado dos valores das aes no dia t so

N N
1 X 1 X
hh(t)i = h (t), hh(t)2 i = [h (t)]2 , (19)
N =1 N =1

e a varincia (2)

N
1 X
t2 = [h (t) hh(t)i]2 . (20)
N =1

19
De (12), (19) e (20) calculamos a correlao entre dois dias t e t0 como

hh(t)h(t0 )i hh(t)ihh(t0 )i
Corr(t, t0 ) = q q , (21)
hh(t)2 i hh(t)i2 hh(t0 )2 i hh(t0 )i2
1 PN
onde hh(t)h(t0 )i = N
h (t)h (t0 ). Repetindo o clculo para todos os
=1
pares de dias obtemos uma matriz de correlao entre todos os dias.

A IM pode ser calculada diretamente atravs das entropias (18), e as


entropias so variveis que dependem apenas das distribuies de probabili-
dades, ento para calcularmos a matriz da IM entre todos os dias precisamos
apenas construir uma matriz de probabilidades conjuntas.
Para construir a matriz de probabilidades conjuntas, a cada par de dias
calculamos a frequncia relativa com que os valores das aes estavam con-
tidos em um determinado bin. Para cada valor de h (t) calculamos [h (t)
0
hmin (t)]/bt para vericar a qual bin pertence o valor h (t). Dessa maneira
criamos uma distribuio de frequncias de onde tiramos a frequncia relativa
de cada bin. As entropias so calculadas somando sobre todos os bins.

5.2 Correlao x Informao Mtua

A informao mtua pode ser vista como uma correlao generalizada,


mas sensvel a qualquer relao entre as variveis, e no apenas dependncia
linear [18]. Aqui faremos uma comparao entre a informao mtua e a
correlao entre os dias da srie temporal estudada. Usamos n = 36 bins.
Em todos os grcos abaixo t0 foi um parmetro mantido xo e foram
plotadas as curvas das correlaes e IM de todos os outros dias t em relao
a t0 , por isso em todos os grcos ocorre um pico em t = t0 , pois a correlao
dele com ele mesmo Corr(t0 , t0 ) = 1, e a partir de (18) vemos que a IM
dele com ele mesmo I(t0 ; t0 ) = S(t0 ), que a prpria informao contida
naquele dia, pois nenhum outro dia compartilha mais informao com ele do
que ele prprio, ou seja, S(t0 ) I(t0 ; t) para todo t com igualdade apenas

20
em t = t0 .
Cada grco possui cinco curvas superpostas de cinco dias adjacentes,
pois, para dias sucientemente prximos, tanto a correlao quanto a IM
variam de maneira semelhante a medida que o tempo passa, e aqui no
estamos interessados nos valores absolutos da correlao e da IM, mas apenas
numa comparao qualitativa de seus comportamentos.
Abaixo segue os grcos com t0 situado em quatro diferentes momentos
da srie temporal que julgamos importantes para a comparao, quais sejam
eles: o comeo da srie temporal, momentos antes da crise estourar (Figura
3); em torno do dia de menor valor das aes (Figura 4); no meio da srie
temporal (Figura 5); e por ltimo no nal da srie temporal (Figura 6).

1 0.55
t0=1 t0=1
t0=2 t0=2
0.98 t0=3 0.5 t0=3
t0=4 t0=4
t0=5 0.45 t0=5
0.96
0.4
Corr(t0,t)

0.94
I(t0;t)

0.35
0.92
0.3
0.9
0.25

0.88 0.2

0.86 0.15
0 50 100 150 200 250 300 350 400 450 500 0 50 100 150 200 250 300 350 400 450 500
t (dias) t (dias)

Figura 3: Esquerda: correlao. Direita: informao mtua. t0 {1, 2, 3, 4, 5},


situado no comeo da srie temporal, pouco antes da crise.

Na Figura 3 podemos perceber que tanto a correlao quanto a IM apre-


sentam um mnimo em t 135, de acordo com o mnimo global dos valores
das aes na Figura 1. Podemos observar tambm que em ambos os grcos
ocorre um primeiro mnimo por volta de t 60, que em comparao com
a Figura 1 vemos que o segundo mnimo mais evidente da srie temporal,
sendo a primeira grande queda aps o crash da bolsa. H ainda um terceiro
mnimo em t 220, ainda de acordo com uma ligeira queda nos valores das
aes aps o comeo da recuperao do mercado.
Neste primeiro intervalo vemos que tanto a correlao quando a IM apre-

21
sentam mnimos de acordo com os mnimos dos valores das aes, no entanto
ca evidente que, enquanto a correlao oscila bastante com o tempo, tor-
nando difcil identicar quando ocorre um valor mnimo signicativo, a IM
apresenta apenas trs mnimos bem denidos, oscilando pouco com a passa-
gem do tempo. Da IM ca tambm claro que h um vale aproximadamente
entre t = 90 e t = 170, de novo em perfeito acordo com o que nos mos-
tra a Figura 1. Do grco da correlao no conseguimos tirar esta mesma
informao.
Outro ponto que ca evidente nesta comparao a escala. Enquanto a
correlao se mantm durante praticamente todo o tempo oscilando entre 1 e
0.9, ou seja, mesmo os menores valores ainda apresentam uma alta correlao
com os primeiros dias, a IM em t = 60 j baixou de 0.5 para menos de 0.2,
mostrando que junto com a queda da bolsa houve tambm uma grande queda
na informao compartilhada com os primeiros dias.

1 0.55
t0=133 t0=133
t0=134 t0=134
t0=135 0.5 t0=135
0.98
t0=136 t0=136
t0=137 0.45 t0=137
0.96
0.4
Corr(t0,t)

I(t0;t)

0.94 0.35

0.3
0.92
0.25
0.9
0.2

0.88 0.15
-150 -100 -50 0 50 100 150 200 250 300 350 400 -150 -100 -50 0 50 100 150 200 250 300 350 400
t - t0 (dias) t - t0 (dias)

Figura 4: Esquerda: correlao. Direita: informao mtua. t0 {133, ..., 137},


em torno do dia de menor valor das aes. As aes atingiram seus menores valores
em t = 135.

Aqui e nas prximas duas guras plotamos as curvas em funo de t


t t0 para estabelecer uma distncia a partir do ponto de mximo e assim
compararmos como a IM e a correlao se comportam para t > t0 e t < t0 ,
sendo o sentido de t crescente a recuperao do mercado, onde o mercado
tende a se comportar mais uniformemente, e o sentido de t decrescente o

22
comeo da srie temporal, onde aconteceu a crise e houve grandes variaes
nos preos das aes.
Na Figura 4 podemos perceber claramente que no intervalo 30 t
30, referente ao perodo entre t = 105 e t = 175 da Figura 1, onde ocorreu os
menores valores das aes, a IM cai bastante rpido, descendo de I 0.55
para I 0.3, enquanto que a correlao varia muito pouco, permanecendo
entre 1 e 0.98. Portanto, mesmo em meio crise, a correlao nos diz que os
dias prximos a t0 parecem bastante correlacionados com ele, o que pode ser
verdade para qualquer outro perodo da bolsa, enquanto que a IM apresenta
uma queda grande, o que atpico para dias adjacentes, como veremos a
seguir. Tanto a IM quanto a correlao diminuem mais rapidamente para
t < 0, em direo crise, do que para t > 0, em direo recuperao
do mercado.

1 0.55
t0=245 t0=245
t0=246 t0=246
0.99 t0=247 0.5 t0=247
t0=248 t0=248
0.98 t0=249 t0=249
0.45
0.97
Corr(t0,t)

0.4
I(t0;t)

0.96
0.35
0.95
0.3
0.94

0.93 0.25

0.92 0.2
-250 -200 -150 -100 -50 0 50 100 150 200 250 -250 -200 -150 -100 -50 0 50 100 150 200 250
t - t0 (dias) t - t0 (dias)

Figura 5: Esquerda: correlao. Direita: informao mtua. t0 {245, ..., 249},


situado no meio da srie temporal.

Na Figura 5 plotamos as cinco curvas centradas em torno do meio da srie


temporal, para tentarmos comparar melhor o perodo da crise com o perodo
de recuperao do mercado. Aqui ca evidente a assimetria entre ambos os
lados, t < 0 e t > 0, em ambos os grcos.
No grco da correlao vemos que para t < 0 h uma oscilao maior,
enquanto que para t > 0 o comportamento mais uniforme. Para t < 0
h um mnimo que parece se destacar em t 180, referente t 67 na

23
Figura 1, perto do primeiro mnimo da crise. Apesar disso, se no tivsse-
mos a priori a informao da crise, devido grande oscilao da correlao,
poderia ser difcil assinalar algum comportamento importante neste ponto.
Para a IM podemos ver que em torno de t = 0 ela decresce mais lenta-
mente do que no cenrio anterior, variando entre 0.5 e 0.35 (contra 0.55 e 0.3).
Entretanto, o que ca mais evidente, que para t > 0 a IM decresce mais
uniformemente, lembrando uma lei de potncia, enquanto que para t < 0
h uma queda abrupta de t 75 at t 110, este ltimo sendo refe-
rente t = 135 na Figura 1, o dia de menor valor das aes, e permanecendo
prximo a este valor I 0.23 em todo o intervalo 250 t 110, que
o perodo que caracteriza a crise, 1 t 135 na Figura 1, onde os valores
das aes estiveram em queda.
Mesmo que no tivssemos conhecimento da crise a IM poderia indicar
um acontecimento importante no intervalo 250 t 110.

1 0.55
t0=401 t0=401
0.99 t0=402 t0=402
t0=403 0.5 t0=403
t0=404 t0=404
0.98 t0=405 t0=405
0.45
0.97
0.4
Corr(t0,t)

0.96
I(t0;t)

0.35
0.95
0.3
0.94
0.25
0.93

0.92 0.2

0.91 0.15
-450 -400 -350 -300 -250 -200 -150 -100 -50 0 50 100 -450 -400 -350 -300 -250 -200 -150 -100 -50 0 50 100
t - t0 (dias) t - t0 (dias)

Figura 6: Esquerda: correlao. Direita: informao mtua. t0 {401, ..., 405},


situado perto do m da srie temporal.

Na Figura 6 plotamos as cinco curvas centradas em torno de um dia no


nal da srie temporal, para vermos como a correlao e a IM decrescem
estando afastadas das grandes variaes dos preos causadas pela crise.
Aqui podemos ver que, ao contrrio dos outros grcos, a correlao de-
cresce mais uniformemente para ambos os lados at t 175 e nal-
mente caindo bruscamente em t 230, oscilando bastante no perodo

24
400 t 230, que referente aos dias 1 t 175 na Figura 1, sendo
este o perodo de grande oscilao nos preos das aes, englobando j o in-
cio da recuperao do mercado, que aconteceu a partir de t = 135 (na Figura
1). H um mnimo que se destaca em t 345, referente ao dia t 60,
que o segundo dia de menor valor das aes, o primeiro grande mnimo aps
o comeo da queda. Como foi destacado tambm nos outros grcos, apesar
deste mnimo mais evidente, h uma grande oscilao durante esse perodo, o
que diculta identicar se alguma destas variaes est relacionada a algum
evento importante.
No grco da IM podemos ver que no intervalo 100 t 100 ela
decresce de maneira bastante semelhante para ambos os lados, o que no era
observado nos casos anteriores, onde era sempre perceptvel uma assimetria
mesmo em intervalos pequenos em torno de t = 0. Podemos ver tambm
que para t < 0 a IM decresce de maneira uniforme at t 230, onde
ca evidente uma queda brusca, assim como na correlao. Diferente do que
acontece na correlao, o mnimo da IM em t 270, referente ao dia
t 135 na Figura 1, que o dia de menor valor das aes. Assim como
nos casos anteriores, a IM se mantm sem grandes oscilaes, mesmo no
perodo da crise, tornando assim mais fcil a identicao de um mnimo e
sua possvel relao com algum evento importante.

25
5.3 Informao Mtua Mdia

Nesta seo nos focamos na IM para tentar estabelecer parmetros que


relacionem seu comportamento com o comportamento do mercado de capi-
tais. Primeiro estabelecemos uma janela temporal de T = 50 dias, e ento
dividimos a srie temporal em 8 intervalos de T dias, sendo eles:

Intervalo 1: dia ti = 1 ao tf = 50;

Intervalo 2: dia ti = 51 ao tf = 100;

Intervalo 3: dia ti = 101 ao tf = 150;

Intervalo 4: dia ti = 151 ao tf = 200;

Intervalo 5: dia ti = 201 ao tf = 250;

Intervalo 6: dia ti = 251 ao tf = 300;

Intervalo 7: dia ti = 301 ao tf = 350;

Intervalo 8: dia ti = 351 ao tf = 400.

Aps isso calculamos I(t0 ; t0 ) onde t0 {t0 , t0 + 1, ..., t0 + T }. Em cada


intervalo calculamos uma curva com t0 = ti , ento a janela T deslocada de
t = 1 dia e calculamos uma nova curva com t0 = ti +1, repetindo isto at que
t0 = tf . Assim, geramos 50 curvas diferentes em cada intervalo e fazemos a
mdia entre elas a m de obtermos uma curva suavizada representando cada
intervalo.

26
0.6 0.6
Intervalo 1
Intervalo 2
0.55 Intervalo 3 0.5
Intervalo 4
Intervalo 5
0.5 Intervalo 6
Intervalo 7
Intervalo 8 0.4
0.45
<I>

<I>
0.4
0.3 Intervalo 1
Intervalo 2
0.35 Intervalo 3
Intervalo 4
Intervalo 5
0.3 Intervalo 6
Intervalo 7
Intervalo 8
0.25 0.2
5 10 15 20 25 30 35 40 45 50 1 10
(dias) (dias)

Figura 7: Curvas representando a IM mdia dos diferentes intervalos da srie tem-


poral. Na esquerda as curvas suavizadas reais, e na direita o t em escala log-log.

Para as curvas da Figura 7 tamos uma lei de potncia do tipo f ( ) =


a b a m de determinarmos os parmetros a e b com que varia a IM nos
diferentes intervalos. Os parmetros esto na Figura 8.
Como o parmetro a a constante de proporcionalidade, e a mdia da IM
nos pontos de mximo, onde I(t0 ; t0 ) = S(t0 ), a prpria entropia mdia do
intervalo, esperaramos que houvesse alguma relao entre a e hSi. Plotamos
a entropia mdia dos mesmos intervalos na Figura 9 para comparao. De
fato se percebe uma semelhana entre ambos, mas h algumas diferenas,
sendo as mais explcitas no intervalo 3, onde a entropia mdia menor que
no intervalo 2, mas o parmetro a cresce do intervalo 2 para o 3, e no inter-
valo 4, onde hSi aumenta em relao ao 3, mas a diminui. Mesmo onde o
comportamento semelhante tambm h uma diferena, embora no muito
grande, nos valores de a e hSi. Como a e b esto relacionados, era de se
esperar que o parmetro a sozinho no nos desse uma representao exata
de hSi.

27
0.58 0.18

0.17
0.57
0.16
0.56 0.15

0.14
0.55
0.13
a

b
0.54
0.12

0.53 0.11

0.1
0.52
0.09

0.51 0.08
1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8
Intervalo Intervalo

Figura 8: Parmetros a (esquerda) e b (direita) nos diferentes intervalos.

0.565

0.56

0.555

0.55

0.545
<S>

0.54

0.535

0.53

0.525

0.52

0.515
1 2 3 4 5 6 7 8
Intervalos

Figura 9: Entropia mdia dos diferentes intervalos da srie temporal.

O parmetro b est relacionado com a taxa de decaimento da IM com o

28
tempo. Como vimos na Seo 5.2, a IM parece decrescer mais rapidamente
no perodo da crise, tambm apresentando mnimos mais acentuados nos me-
nores valores das aes. Aqui podemos vericar isto atravs de b. Podemos
ver que o maior valor de b no intervalo 1, onde houve a maior queda no
valor das aes, mostrando que de fato a IM decresceu mais rapidamente no
comeo da crise do que em qualquer outro perodo. Acompanhando na Fi-
gura 1, vemos que nos intervalos 2 e 3, apesar dos preos continuarem caindo,
a amplitude na oscilao do valor das aes foi menor, e acompanhando o
comportamento de b, vemos que ele diminui e permanece praticamente cons-
tante nesses dois intervalos, indicando que a IM decresceu mais lentamente
em relao ao intervalo 1, mas ainda assim mais rpido do que em outro
intervalo. Aps estes intervalos o mercado comea a se recuperar, h uma
menor oscilao e o valor das aes comea a subir. Podemos ver que h uma
grande queda em b, portanto a IM decresce mais lentamente. O valor volta
a crescer um pouco nos intervalos 5 e 8, onde, na Figura 1, podemos ver que
houve ligeiras quedas no valor das aes, mas b continua abaixo do valor dos
primeiros intervalos. Os menores valores, que so pelo menos a metade do
valor no intervalo 1, ocorrem nos intervalos 6 e 7, que so os intervalos onde
o valor das aes continua crescendo e oscilando pouco.
Disto vemos b pode estar relacionado com a volatilidade do mercado,
mostrando que a IM sensvel variao dos valores das aes, decrescendo
mais rapidamente quando h grandes oscilaes.

6 Concluso

Este trabalho de concluso de curso teve como objetivo o estudo de uma


srie temporal dos valores de alta de aes das empresas constituintes do
ndice S&P500 da bolsa de valores de Nova Iorque. Segundo o estudo feito
em [8], possvel identicar um comportamento extremo do mercado como
bubbles ou crashes a partir da entropia informacional. No estudo o autor
utilizou um modelo semelhante a spins interagentes em um modelo de campo
mdio, onde era vericado a cada dia, para cada empresa, se o valor de suas

29
aes subiam (spin up) ou desciam (spin down). Outro ponto demonstrado
em [8] que o mercado pode ser explicado atravs da interao entre pares
de empresas. A partir disso, nossa abordagem para o clculo da entropia
informacional foi diferente, se baseando diretamente no valor das aes em
cada dia e construindo uma distribuio de probabilidades para cada par
de empresas. Como as variveis da teoria da informao dependem apenas
das distribuies de probabilidade, com isto podemos calcular uma matriz
da entropia conjunta (15) para todos os pares de empresas e utilizando a
equao (18) segue diretamente o clculo de uma matriz para a informao
mtua para todos os mesmos pares.
Primeiro zemos uma comparao entre a correlao temporal e a IM
temporal, que pode ser vista como uma correlao generalizada sensvel
dependncia no-linear entre duas variveis aleatrias [18]. Desta compara-
o pudemos concluir que a IM de fato uma medida superior em comparao
com a correlao para o comportamento do mercado. Enquanto a correlao
tem uma tendncia a variar bastante com o tempo, tornando difcil identi-
car quando ocorre algum acontecimento mais importante, a IM mostra um
decrescimento mais uniforme, apresentando grandes variaes apenas quando
o mercado tambm apresenta um comportamento anmalo.
Depois, estudando mais diretamente apenas o comportamento da IM,
tentamos determinar como seu comportamento se relaciona com o compor-
tamento do mercado. Para isto calculamos os parmetros que caracterizam
uma lei de potncia para diferentes curvas da IM mdia em diferentes inter-
valos da srie temporal. Disto vimos que o parmetro referente a constante
de proporcionalidade est relacionado com a entropia mdia do intervalo,
embora sozinho no consiga explicar o comportamento da entropia. O par-
metro referente ao expoente de decaimento mostrou uma relao maior com
o comportamento do mercado, mostrando que de fato a IM decresce mais ra-
pidamente em perodos de grande volatilidade do mercado, o que faz sentido
se pensarmos principalmente na analogia usada em [8], pois em momentos
de grande volatilidade as empresas tendem a se comportar mais individual-
mente, mudando sua orientao com maior frequncia, e assim dicultando
uma visualizao da tendncia geral do mercado, enquanto que em pero-

30
dos normais ou de ps-crise, as empresas se comportem de maneira mais
uniforme.
Alguns pontos que poderiam ser usados para melhorar nossas estimativas
seriam um estudo do nmero timo de bins para a maximizao da entropia,
o uso do teorema de Bayes junto com a divergncia de Kullback-Leibler
[14, 15] para a obteno de uma distribuio de probabilidades que nos desse
um ganho de informao, e tambm o mtodo apresentado em [18] para
estimarmos os erros em nosso clculos da entropia e IM.
O uso da teoria da informao em estudos do mercado de capitais re-
cente, mas j bastante difundido no estudo de redes neurais [16, 17]. Futu-
ramente poderamos trocar nossa anlise temporal por uma anlise estrutural
(espacial), utilizando a IM para estabelecer uma matriz de conexes entre as
empresas e ento aplicar mtodos j conhecidos do estudo de redes neurais,
redes complexas e fsica estatstica.

31
Referncias
[1] BM&FBovespa, Introduo ao Mercado de Capitais,
http://www.bmfbovespa.com.br/pt-br/a-bmfbovespa/download/merccap.pdf

[2] T. Dal'Maso Peron, F. Rodrigues, Collective behavior in nancial mar-


kets, EPL (Europhysics Letters) 96 (2011) 48004.

[3] J.-P. Onnela, A. Chakraborti, K. Kaski, J. Kertsz, A. Kanto, Dynamics


of market correlations: taxonomy and portfolio analysis, Physical Review
E 68 (2003) 056110.

[4] T.K.D. Peron, L. da Fontoura Costa, F.A. Rodrigues, The structure and
resilience of nancial market networks, Chaos: An Interdisciplinary Jour-
nal of Nonlinear Science 22 (2012) 013117.

[5] H. Stanley, X. Gabaix, P. Gopikrishnan, V. Plerou, Economic uctuations


and statistical physics: quantifying extremely rare and less rare events in
nance, Physica A 382 (2007) 286-301.

[6] H. Stanley, V. Plerou, X. Gabaix, A statistical physics view of nancial


uctuations: evidence for scaling and universality, Physica A 387 (2008)
3967-3981.

[7] P. Vrtes, R. Nicol, S. Chapman, N. Watkins, E. Bullmore, Frontiers:


topological isomorphisms of human brain and nancial market networks,
Frontiers in Systems Neuroscience (2011).

[8] Thomas Bury, Market structure explained by pairwise interactions, Phy-


sica A 392 (2013) 1375-1385.

[9] http://nance.yahoo.com/

[10] C. Scherer, Mtodos Computacionais da Fsica, Cap. 4 - Probabilidade,


Varivel Aleatria e Processo Estocstico, Editora Livraria da Fsica
(2010).

32
[11] David MacKay, Information Theory, Inference and Learning Algo-
rithms, Cambridge University Press (2003).

[12] Luiz Henrique Alvez Monteiro, Sistemas Dinmicos, Seo 10.5 - Entro-
pia Informacional de Shannon, Editora Livraria da Fsica (2011).

[13] C. E. Shannon, A Mathematical Method of Communication, Bell System


Technical Journal, v. 27, (1948).

[14] S. Kullback; R. A. Leibler; On Information and Suciency, Annals of


Mathematical Statistics 22, (1951).

[15] Adom Gin, From Physics to Economics: An Econometric Example


Using Maximum Relative Entropy, Physica A, v.388, 1610-1620 (2009).

[16] David R. Carreta Dominguez, Elka Korutcheva, Three-state neural


network: From mutual information to the Hamiltonian, Phys. Rev. E
62, 2620-2628 (2000).

[17] D. R. C. Dominguez and D. Boll, Self-Control in Sparsely Coded


Networks, Phys. Rev. Lett. 80, 2961-2964 (1998).

[18] Mark S. Roulston, Estimating the erros on measured entropy and mutual
information, Physica D, 125, 285-294 (1999).

33

Você também pode gostar