Você está na página 1de 52

Estatstica Bsica

Prof. Daniela Kubudi


dkubudi@gmail.com

Aula 2

Contedo da Aula
Variveis aleatrias
Estimao da volatilidade
Estimao da covarincia

Aula 2

Variveis aleatrias
Embora os preos dos ativos financeiros possam ser observados
no presente e no passado, no possvel observar o que eles
sero no futuro. Os preos dos ativos so variveis aleatrias e
no determinsticas.
Uma varivel aleatria uma funo que associa a cada
resultado de um experimento um nmero real. O conjunto de
todos os resultados possveis de um experimento chamado de
espao amostral. Logo, uma v.a. uma funo do espao
amostral no conjunto dos nmeros reais.
Exemplo: Seja o experimento lanar uma moeda duas vezes.
Suponha que estejamos interessados no nmero de caras.

Aula 2

Variveis aleatrias
Ento podemos definir X(w) da seguinte forma:
X(w) = nmero de caras observadas nos dois lanamentos.
O espao amostral S {CC, CK, KC, KK} onde C = cara e
K = coroa. Assim, X(CC) = 2, X(CK) = X(KC) = 1 e X(KK)
= 0.

Aula 2

Variveis aleatrias
A v.a. X discreta se toma um nmero finito ou numervel de
valores, isto , se existe um conjunto finito ou enumervel de
valores {x1, x2, ... } tal que X(w) {x1, x2, ... } w S. A funo
pX(xi) definida por pX(xi) = P(X = xi), i = 1, 2, ..., chamada
funo de probabilidade de X. A funo de probabilidade
caracteriza a distribuio de X.
Exemplo: Seja o experimento lanar o dado uma nica vez.
Suponha que o dado perfeitamente equilibrado. Defina X(w) =
resultado da face superior, ento temos que P(X = 1) = P(X =
2) = P(X = 3) = P(X = 4) = P(X = 5) = P(X = 6) = 1/6.
Aula 2

Variveis aleatrias
0,20
0,15
0,10
0,05
0,00
1

Aula 2

f(x)d1P(aXb)f(x)d

X
baX

Variveis aleatrias

A varivel aleatria X contnua se existe uma funo fX, ou


simplesmente f, denominada funo densidade de probabilidade
(fdp) de X que satisfaa s seguintes condies:
f (x) 0 para todo x.
X

Para quaisquer a, b, com - < a < b < + , teremos

Aula 2

Variveis aleatrias
No estaremos mais interessados em saber a probabilidade de
um determinado resultado, mas sim em conhecer a probabilidade
do resultado estar em determinado intervalo. Tentaremos
responder questes do tipo:
Qual a chance da altura de um brasileiro, sorteado ao acaso,
ser maior que 1,50m e menor que 1,70m ?
Qual a chance do preo de uma ao de Petrobras no
fechamento de amanh ser maior que R$ 52,00 ?
Para responder a tais perguntas devemos, primeiramente,
conhecer a fdp da altura dos brasileiros e do preo da ao de
Petrobrs no fechamento de amanh.
Aula 2

P
(1,50H
1,70)h(x)d
1,570

Variveis aleatrias

Suponha que a fdp da altura dos brasileiros seja dada por h(x),
ento, a resposta da segunda pergunta

Aula 2

Distribuio Normal
Retornos S&P 2005-2015

Aula 2

10

E
(X
)
xfp(dx)

ii
X
i

1
X

Variveis aleatrias

Seja X uma v.a. discreta assumindo os valores x1, x2, ..., xn,...,
chamamos de valor esperado ou esperana matemtica ou mdia de
X ao valor

Se X for contnua com fdp fX(x), o valor esperado de X definido


como

Qual o valor esperado do resultado do lanamento de um dado


honesto?

Aula 2

11

Variveis aleatrias
Podemos tambm calcular o valor esperado condicionado a um
conjunto de informaes.
Notao: E(X|F).
Exemplo: Qual o valor esperado do resultado do lanamento de
um dado, sabendo que ele par? E se for mpar?
Obs.: O valor esperado linear, isto , E[aX + b] = aE[X] + b.
Vale tambm que E[X + Y] = E[X] + E[Y].

Aula 2

12

X2E
[X
X
E
()]2
Variveis aleatrias

A varincia de uma v.a. X, denotada por var(X) ou X2, definida


por

A raiz quadrada positiva de X2 chamada de desvio padro de


X, e denotada por X. Em finanas, comum usar o termo
volatilidade do retorno de um ativo ao invs de desvio padro.
A volatilidade uma medida de disperso da funo de
densidade de probabilidade.
Obs.: var(aX + b) = a2var(X).
Aula 2

13

XYXE(XX)YYE(Y)
E
Variveis aleatrias

O coeficiente de correlao entre duas variveis X e Y, denotado


por XY, definido por

O coeficiente de correlao mede o grau de dependncia linear


entre duas v.a. O numerador dessa equao a covarincia.
A correlao uma medida limitada de dependncia.
Primeiramente, a correlao mede apenas a dependncia linear.
Isso significa que duas v.a. podem ter correlao baixa mais terem
outros tipos de dependncia. Ou seja, variveis descorrelatadas no
so necessariamente independentes.

Aula 2

14

Variveis aleatrias

Aula 2

15

Variveis aleatrias
Alm disso, no mercado financeiro as estimativas de correlao
freqentemente apresentam falta de robustez.
Assim outros mtodos tm surgido com o intuito de capturar a
dependncia. Um dos mais famosos remete ao conceito de
cpulas.
Uma cpula uma maneira geral de se representar uma
distribuio multivariada de tal maneira que vrios tipos de
dependncia possam ser capturados.

Aula 2

16

Variveis aleatrias

cov(aX+c,bY+d) = abcov(X,Y)
cov(X, X) = var(X)
cov(X, Y) = cov(Y, X)
var(X + Y) = var(X) + var(Y) + 2cov(X,Y)
Cov(X, Y) = E[XY] - E[X]E[Y]
Var(X) = E[X2] - E[X]2

Aula 2

rnln Sn1 ernSnn1


Estimao da volatilidade

O retorno rn de um ativo durante o dia n (isto , entre o final do


dia n 1 e o fim do dia n) pode ser definido de duas maneiras
diferentes:

Se o retorno pequeno (prximo de zero, como so em geral os


retornos
dirios)
essas
duas
definies
conduzem
aproximadamente
ao
mesmo
valor.
Vamos
usar
preferencialmente a definio logartmica.
Aula 2

18

1
m
r,ondem.

m
n

i
m
2
2nin
i

1
i
Estimao da volatilidade

Seja n|n 1 a volatilidade do retorno rn com as informaes


disponveis no fim do dia n 1. Quando no houver dvidas,
vamos simplificar a notao n|n 1 = n. Em outras palavras, seja
Fn 1 o conjunto de informao disponvel ao final do dia n 1.
Ento n2 = var(rn| Fn 1).
Um estimador comumente usado para a varincia n2 a
varincia amostral das m observaes mais recentes:

Aula 2

19

Estimao da volatilidade
Esse estimador no viesado (isto , acerta na mdia) se os
retornos dirios forem iid. Como veremos mais adiante, a
equao acima tambm representa o estimador de mxima
verossimilhana da varincia, apenas substituindo m 1 por
m no denominador, o que faz pouca diferena se m grande
(maior que 30).
Se os retornos fossem realmente iid, o valor de m deveria ser o
maior possvel a fim de minimizar o erro de estimao. No
mercado financeiro a hiptese de retornos iid nem sempre
verdadeira. Assim, ao tomar m muito grande estaramos
introduzindo dados muito antigos cuja realidade no
corresponde mais a atual.
Aula 2

20

volrn
rnt1|F

n1
nt.
Estimao da volatilidade

Uma regra de dedo consiste em tomar m entre 90 e 180. No


mercado brasileiro, valores ainda menores como 20 e 30 dias
so usados.
No caso de retornos iid a estimativa da volatilidade h dias (h
1) a frente tambm dada pela equao anterior, i.e., n + h 1|n 1
= n. Logo a estrutura a termo da volatilidade plana. Algo
pouco realista. Vale tambm a regra da raiz, isto , a volatilidade
para um retorno de perodo t dias a frente, condicionado a
informao disponvel em n 1 dada por:

Aula 2

21

Estimao da volatilidade
No caso de retornos dirios, a estimativa do retorno mdio no
significativamente diferente de zero. Como estamos interessados em
estudar a varincia, vamos considerar de agora em diante que os
retornos dirios tem mdia zero. Pouco esforo necessrio para
generalizar os resultados sem essa hiptese. Alm disso, tomar
desvios em relao ao zero, produz estimativas mais acuradas da
volatilidade (Figlewski, 1997).
A equao anterior pondera igualmente todos os retornos. Uma
forma muito comum de levar em conta o fato de que os retornos
mais recentes deveriam ter uma importncia maior na determinao
da volatilidade futura consiste em considerar um processo ARCH
para a volatilidade (Engle, 1982), dando mais pesos as observaes
mais recentes.

Aula 2

22

w
r

V
w
r,
m
2
2
n
i
n

in2
1im
2
i
n

Estimao da volatilidade

onde w1 > ... > wm > 0.


Ou levando-se em conta a existncia de uma mdia de longo prazo
para a varincia:

onde V a mdia de longo prazo.


Um caso particular bem interessante o modelo EWMA
(Exponentially Weighted Moving Average).

Aula 2

23

m
i

1
2
2
in
1ni

Estimao da volatilidade

Nesse caso V = 0 e os pesos seguem um padro exponencial:

O parmetro denominado fator de decaimento. Quanto


menor , maior o peso das observaes mais recentes.Valores
tpicos para entre 0,75 e 0,98. RiskMetrics sugere 0,94 (dados
dirios) e 0,97 (dados mensais).
Aula 2

24

Estimao da volatilidade
O documento tcnico do RiskMetrics avaliou que entre
diferentes mercados o valor de 0,94 fornecia o menor erro de
previso em relao a varincia realizada. A varincia realizada
em um dia foi calculada como a mdia dos quadrados dos
retornos nos 25 dias subseqentes.
Quando = 1 EWMA = Mtodo Histrico Simples.
Outro mtodo de estimao consiste no uso de mxima
verossimilhana, de modo semelhante ao procedimento usado
nos modelos GARCH.
Quando V 0 temos o modelo IGARCH.
Aula 2

25

(1)
r(1)
2n2nn21i
i11n2n2i1

Estimao da volatilidade

Se m grande, o denominador da frmula EWMA para a


volatilidade aproximadamente igual a 1/(1 ). Desse modo:

Recursivamente, temos

O primeiro termo da equao acima representa a persistncia da


volatilidade. O segundo termo estabelece a reao da volatilidade
aos eventos do mercado.

Aula 2

26

Estimao da volatilidade
Vantagens da metodologia EWMA de estimao da volatilidade:
A volatilidade reage mais rapidamente a choques no
mercado.
Aps
um movimento extremo a volatilidade declina
exponencialmente a medida que o peso da observao do
choque diminui. Em contraste, o uso de mdia mvel simples
leva a mudanas relativamente abruptas no desvio padro,
uma vez que os movimentos extremos saem da amostra
considerada de forma no suavizada.

Aula 2

27

Estimao da volatilidade
0,180%
0,160%

Plat
Assimilao rpida do
movimento
extremo

Volatilidade diria

0,140%

Queda gradual da
volatilidade

0,120%

Queda brusca da
volatilidade

0,100%
0,080%
0,060%
0,040%

23/08/98

24/07/98

24/06/98

25/05/98

25/04/98

26/03/98

24/02/98

25/01/98

26/12/97

26/11/97

27/10/97

27/09/97

28/08/97

29/07/97

29/06/97

30/05/97

30/04/97

31/03/97

30/01/97

0,000%

01/03/97

0,020%

Tempo
Simples - 60 dias

Aula 2

EWMA - Lambda 0,94

28

Estimao da volatilidade
Uma das deficincias do modelo EWMA refere-se ao fato de que
a estrutura a termo da volatilidade plana, i.e, n + h 1|n 1 = n.
Modelos EWMA no so capazes de capturar clusters
(agrupamento) de volatilidades. De acordo como Mandelbrolt:
Large changes tend to be followed by large changes, of either
sign, and small changes tend to be followed by small changes.
Empiricamente, existe uma correlao positiva entre os
quadrados dos retornos. O termo tcnico desse fenmeno
heterocedasticidade condicional auto-regressiva.
A volatilidade tende a reverter para alguma mdia ao invs de
permanecer constante ou se mover monotonicamente ao longo
do tempo.

Aula 2

29

Estimao da volatilidade
Variao percentual diria do S&P500 2005 - 2015

Aula 2

30

2
2
2

n
n

1
n

1
r
(2
F
,1
~
N
)
0

Estimao da volatilidade

No modelo GARCH(1,1) a soma dos parmetros que


representam a influncia da volatilidade passada e do retorno
atual na volatilidade do dia seguinte no somam necessariamente
1, como no EWMA:

onde V, , > 0. A varincia incondicional dada por:


O processo estacionrio se + < 1.

Aula 2

31

Estimao da volatilidade
Exemplo: Suponha = 0,01, = 0,95 e = 0,000001.
Tempo (n 1) Retorno (n 1)

Aula 2

Varincia n

Volatilidade n

0,00011

1,05%

15%

0,0003305

1,82%

0,0003150

1,77%

-10%

0,0004002

2,00%

32

2nh1|n
2n,o

(1
h2)h1
nde
.
Estimao da volatilidade

O processo GARCH pode ser extrapolado para h dias a frente.

No vale a regra da raiz

Aula 2

33

[
,
]
Estimao da volatilidade

A estimao dos parmetros do modelo GARCH feita via o


mtodo de mxima verossimilhana. Ou seja, escolher os
parmetros que maximizam as chances de ocorrncia dos dados
observados.
Parmetros:

Exemplo: Estimar a varincia v de uma varivel R com


distribuio normal e mdia nula, a partir de uma amostra
independente de R de tamanho m (r1, r2, ..., rm).

Aula 2

34

L
()
1

r
1l2n
2v1ln2
e
x
p

v2r

2
m
i
im

1i2i2
i
1
Estimao da volatilidade

A verossimilhana (considerando a distribuio normal):

Para o modelo GARCH, basta usar a regra de atualizao da


volatilidade e fazer vi = i2. Assim o log da verossimilhana :

Aula 2

35

2
2
m

L
1
r
1

i4
i1
i2 i
()2
Estimao da volatilidade

Basta ento encontrar os parmetros do modelo que maximizam


a expresso anterior.

Outra alternativa de estimao consiste em considerar que a


distribuio dos retornos uma t-student. Isso complica um
pouco mais o processo de otimizao uma vez que a funo
densidade dessa distribuio menos tratvel que a da normal.
Aula 2

36

|
r
ln

ln

2nn1n1n1n21
Estimao da volatilidade

Variantes do modelo GARCH:


GARCH assimtrico O modelo GARCH padro especifica
a resposta da volatilidade como simtrica em relao a
notcias ruins e boas do mercado. Para acomodar uma
resposta assimtrica existem diversas possibilidades. O
modelo mais comum o E-GARCH:

Se > 0 e < 0 ento choques negativos no retorno induzem


respostas maiores na varincia do que choques positivos.
Aula 2

37

2n
rn2

Estimao da volatilidade

GARCH (p,q) considera p lags na volatilidade e q lags nos


quadrados dos retornos.
N-GARCH, T-GARCH, GARCH-M, Q-GARCH, ...
Em geral, efeitos heterocedsticos esto presentes em dados de
alta freqncia (dirios, intraday) e no so comuns em dados
mensais. Para detectar a presena de heterocedasticidade
existem diversos testes. Os principais deles procuram pela
presena de autocorrelao nos quadrados dos retornos.
Se um modelo GARCH capturou bem os efeitos de clusters,
ento a razo
deve apresentar baixa autocorrelao.
Teste usual para detectar autocorrelao Ljung-Box.

Aula 2

38

m
1
1
2
covnnm
r

.
ic
n

1
n

i
2
i
ovn1(1)n121
Estimando covarincias

Supondo que o dispomos de sries iid de tamanho m dos


retornos de dois ativos (r1 e r2), um estimador para a covarincia
entre eles :

Usando EWMA temos:

Para o GARCH(1,1):

cov n r1.n 1r2,n 1 cov n 1

Aula 2

39

Estimando covarincias
A especificao do modelo GARCH anterior para a covarincia
a forma mais simples de incorporar os efeitos heterocedsticos.
Essa verso conhecida como vech diagonal. O modelo
bastante restritivo uma vez que as volatilidades passadas no
entram na equao da covarincia atual. Ou seja, o modelo no
captura o aumento da correlao que freqentemente acompanha
o aumento de volatilidades.
A especificao completa de um modelo GARCH multivariado
envolve uma quantidade enorme de parmetros. Isto pode tornar
impossvel a estimao. Por exemplo, a matriz de covarincia de
um modelo GARCH bivariado completo
Aula 2

40

2
2
c
o1v,nn
1,nr12,n2,n1
B
ovn1

123A
,c
1
n

Estimando covarincias

onde A e B so matrizes de dimenso 3. Logo temos 21 parmetros


a serem estimados!
Na verso vech diagonal, as matrizes A e B so diagonais e o
nmero de parmetros a serem estimados se reduz para nove.
Outra verso bastante usada dos modelos GARCH multivariados
a BEKK (Baba, Engle, Kraft e Kroner).

Aula 2

41

H
D
t
tC
Estimando covarincias

Mesmo usando simplificaes na especificao de modelos


GARCH multivariados a estimao em geral problemtica,
uma vez que o nmero de parmetros cresce rapidamente. Duas
solues so em geral empregadas.
Bollerslev (1990) prope que a matriz de covarincia H seja
t
estimada da seguinte forma:

onde Dt matriz diagonal das volatilidades GARCH e C


uma matriz de covarincia calculada com as covarincias
histricas ou via um esquema EWMA com pesos constantes.
Aula 2

42

rcov(nj,nj

jkj
R
n2.Rcjov(nj,k)

jk)
M
Estimando covarincias

Outra soluo usar um modelo de fatores (como o CAPM):

Admitindo que no haja correlao condicional entre o


mercado e os riscos especficos, temos:

As covarincias entre os riscos especficos podem ser


determinadas com as covarincias histricas ou tomadas
iguais a zero.

Aula 2

43

Leitura
Alexander, C. Modelos de Mercados, 2005.
Captulos 1, 2, 3, 4 e 5.
Hull, J. Options, Futures and Other Derivatives, sixth edition,
2006.
Captulo 17.
Tsay, R. Analysis of Financial Time Series, 2005.
Captulos 1, 2 e 3.
Bollerslev, T. e outros ARCH Modelling in Finance. Journal of
Econometrics, 1992.
Bollerslev, T. Modelling the coherence in short-run nominal
exchange rates. Review of Economics and Statistics, 1990.

Aula 2

44

Leitura
Engle, R. Autoregressive conditional heteroscedasticity with
estimates of the variance of UK inflation. Econometrica, 1982.
Figlewski, S. (1997) Forecasting volatility, Financial Markets,
Institutions and Instruments (New York University Salomon
Center), 6, 1, 188.
Jorion, (2007) Value-at-Risk
Captulo 9.

Aula 2

45

Apndice A - Distribuio Normal


A distribuio normal ou Gaussiana uma das mais importantes
distribuies de probabilidade.
Ela serve como uma excelente aproximao para uma grande
classe de distribuies que tm enorme importncia prtica.
Notao: N(,2) significa distribuio normal com mdia e
varincia 2. J Z = N(0,1) significa distribuio normal padro,
isto , com mdia zero e a varincia unitria.

Aula 2

46

Apndice A - Distribuio Normal

68,27%

>
95,46%
99,73%

Aula 2


47

2
f(x)21
2
1
x

exp
.

Apndice A - Distribuio Normal

A maior parte dos dados se encontram em torno da mdia. A


medida que nos afastamos dela, tanto para mais como para
menos, a probabilidade de ocorrncia de um resultado diminui
de uma forma simtrica, isto , a distribuio uma curva
simtrica em relao a .
O espalhamento do grfico determinado pelo desvio padro .
A equao da curva

Aula 2

48

Apndice A - Distribuio Normal


Propriedade: Se X tem distribuio normal N(,2) ento (X
)/ tem distribuio normal padro.
Tabela da distribuio normal padro.

Aula 2

= P[Z z]

-3

0,00135

-2

0,02275

-1

0,158655

0,5

49

Apndice A - Distribuio Normal


Exemplo: Suponha que a altura H de um brasileiro adulto seja
distribuda normalmente com mdia 170 cm e varincia 100
cm2. Calcule a probabilidade da altura de um brasileiro sorteado
ao acaso ser maior que 2,0 m.
P[H > 200] = P[H 170 > 30] =
= P[(H 170)/10 > 3] =
= P[Z > 3] = (simetria) =
= P[Z < 3] = (tabela) = 0,00135.

Aula 2

50

1
f(x)
2

1
x
2 2

Apndice B - Distribuio t-student

Distribuio em forma de sino e simtrica em torno de zero.


Seus valores extremos se afastam mais de zero em comparao
normal padro.
Quanto mais graus de liberdade, maior a proximidade em
relao normal padro.
Sua fdp :

Aula 2

51

Apndice B - Distribuio t-student


Normal
Padro
Formato de sino

t (df = 13)

Simtrica
Caudas gordas

t (df = 5)

0
Aula 2

Z
t
52