Você está na página 1de 51

Estatstica Bsica

Prof. Jos Valentim Machado Vicente, D.Sc.


jose.valentim@gmail.com

Aula 2

Contedo da Aula
Variveis aleatrias
Estimao da volatilidade
Estimao da covarincia

Aula 2

Variveis aleatrias
Embora os preos dos ativos financeiros possam ser observados
no presente e no passado, no possvel observar o que eles
sero no futuro. Os preos dos ativos so variveis aleatrias e
no determinsticas.
Uma varivel aleatria uma funo que associa a cada
resultado de um experimento um nmero real. O conjunto de
todos os resultados possveis de um experimento chamado de
espao amostral. Logo, uma v.a. uma funo do espao
amostral no conjunto dos nmeros reais.
Exemplo: Seja o experimento lanar uma moeda duas vezes.
Suponha que estejamos interessados no nmero de caras.

Aula 2

Variveis aleatrias
Ento podemos definir X(w) da seguinte forma:
X(w) = nmero de caras observadas nos dois lanamentos.
O espao amostral S {CC, CK, KC, KK} onde C = cara e
K = coroa. Assim, X(CC) = 2, X(CK) = X(KC) = 1 e X(KK)
= 0.

Aula 2

Variveis aleatrias
A v.a. X discreta se toma um nmero finito ou numervel de
valores, isto , se existe um conjunto finito ou enumervel de
valores {x1, x2, ... } tal que X(w) {x1, x2, ... } w S. A funo
pX(xi) definida por pX(xi) = P(X = xi), i = 1, 2, ..., chamada
funo de probabilidade de X. A funo de probabilidade
caracteriza a distribuio de X.
Exemplo: Seja o experimento lanar o dado uma nica vez.
Suponha que o dado perfeitamente equilibrado. Defina X(w) =
resultado da face superior, ento temos que P(X = 1) = P(X =
2) = P(X = 3) = P(X = 4) = P(X = 5) = P(X = 6) = 1/6.
Aula 2

Variveis aleatrias
0,20
0,15
0,10
0,05
0,00
1

Aula 2

Variveis aleatrias
A varivel aleatria X contnua se existe uma funo fX, ou
simplesmente f, denominada funo densidade de probabilidade
(fdp) de X que satisfaa s seguintes condies:
f (x) 0 para todo x.
X

( x)dx 1 .

Para quaisquer a, b, com - < a < b < + , teremos


b

P(a X b) f X ( x)dx
a

Aula 2

Variveis aleatrias
No estaremos mais interessados em saber a probabilidade de
um determinado resultado, mas sim em conhecer a probabilidade
do resultado estar em determinado intervalo. Tentaremos
responder questes do tipo:
Qual a chance da altura de um brasileiro, sorteado ao acaso,
ser maior que 1,50m e menor que 1,70m ?
Qual a chance do preo de uma ao de Petrobras no
fechamento de amanh ser maior que R$ 52,00 ?
Para responder a tais perguntas devemos, primeiramente,
conhecer a fdp da altura dos brasileiros e do preo da ao de
Petrobrs no fechamento de amanh.
Aula 2

Variveis aleatrias
Suponha que a fdp da altura dos brasileiros seja dada por h(x),
ento, a resposta da segunda pergunta
1, 70

P (1,50 H 1,70)

h( x)dx

1, 50

Aula 2

Variveis aleatrias
Seja X uma v.a. discreta assumindo os valores x1, x2, ..., xn,...,
chamamos de valor esperado ou esperana matemtica ou mdia
de X ao valor

E ( X ) xi p ( xi )
i 1

Se X for contnua com fdp f(x), o valor esperado de X definido

como

E( X )

xf ( x)dx

Qual o valor esperado do resultado do lanamento de um dado


honesto?

Aula 2

10

Variveis aleatrias
Podemos tambm calcular o valor esperado condicionado a um
conjunto de informaes.
Notao: E(X|F).
Exemplo: Qual o valor esperado do resultado do lanamento de
um dado, sabendo que ele par? E se for mpar?
Se F e G so dois conjuntos de informaes tais que F G
ento E[E(X|F)|G] = E[E(X|G)|F] = E(X|F).
Obs.: O valor esperado linear, isto , E[aX + b] = aE[X] + b.

Aula 2

11

Variveis aleatrias
A varincia de uma v.a. X, denotada por V(X) ou X2, definida
por

X2 E[ X E ( X )]2

A raiz quadrada positiva de X2 chamada de desvio padro de


X, e denotada por X. Em finanas, comum usar o termo
volatilidade do retorno de um ativo ao invs de desvio padro.
A volatilidade uma medida de disperso da funo de
densidade de probabilidade.
Obs.: var(aX + b) = a2var(X).
Aula 2

12

Variveis aleatrias
O coeficiente de correlao entre duas variveis X e Y, denotado
por XY, definido por

XY

E X E ( X ) Y E (Y )

XY

O coeficiente de correlao mede o grau de dependncia linear


entre duas v.a. O numerador dessa equao a covarincia.
A correlao uma medida limitada de dependncia.
Primeiramente, a correlao mede apenas a dependncia linear.
Isso significa que duas v.a. podem ter correlao baixa mais terem
outros tipos de dependncia. Ou seja, variveis descorrelatadas no
so necessariamente independentes.

Aula 2

13

Variveis aleatrias

Aula 2

14

Variveis aleatrias

Aula 2

Propriedade

Valor

Mdia de x

9,0

Varincia de x

10,0

Mdia de y

7,5

Varincia de y

3,75

Correlao

0,816

Regresso Linear

y = 3 + 0,5x
15

Variveis aleatrias
Alm disso, no mercado financeiro as estimativas de correlao
freqentemente apresentam falta de robustez.
Assim outros mtodos tm surgido com o intuito de capturar a
dependncia. Um dos mais famosos remete ao conceito de
cpulas.
Uma cpula uma maneira geral de se representar uma
distribuio multivariada de tal maneira que vrios tipos de
dependncia possam ser capturados.
Obs.: cov(aX+c,bY+d) = abcov(X,Y) e var(X + Y) = var(X) +
var(Y) + 2cov(X,Y).
Aula 2

16

Estimao da volatilidade
O retorno ri de um ativo durante o dia i (isto , entre o final do
dia i 1 e o fim do dia i) pode ser definido de duas maneiras
diferentes:

Si

ri ln
Si 1

Si Si 1
e ri
Si 1

Se o retorno pequeno (prximo de zero, como so em geral os


retornos
dirios)
essas
duas
definies
conduzem
aproximadamente
ao
mesmo
valor.
Vamos
usar
preferencialmente a definio logartmica.
Aula 2

17

Estimao da volatilidade
Seja n|n 1 a volatilidade do retorno rn com as informaes
disponveis no fim do dia n 1. Quando no houver dvidas,
vamos simplificar a notao n|n 1 = n. Em outras palavras, seja
Fn 1 o conjunto de informao disponvel ao final do dia n 1.
Ento n2 = var(rn| Fn 1).
Um estimador comumente usado para a varincia n2 usando as
m observaes mais recentes :
m
m

1
2
2

n
r

, onde

n i
m 1 i i
Aula 2

r
i 1

n i

18

Estimao da volatilidade
Esse estimador no viesado (isto , acerta na mdia) se os
retornos dirios forem iid. Como veremos mais adiante, a
equao acima tambm representa o estimador de mxima
verossimilhana da varincia, apenas substituindo m 1 por
m no denominador, o que faz pouca diferena se m grande
(maior que 30).
Se os retornos fossem realmente iid, o valor de m deveria ser o
maior possvel a fim de minimizar o erro de estimao. No
mercado financeiro a hiptese de retornos iid nem sempre
verdadeira. Assim, ao tomar m muito grande estaramos
introduzindo dados muito antigos cuja realidade no
corresponde mais a atual.
Aula 2

19

Estimao da volatilidade
Uma regra de dedo consiste em tomar m entre 90 e 180. No
mercado brasileiro, valores ainda menores como 20 e 30 dias
so usados.
No caso de retornos iid a estimativa da volatilidade h dias (h
1) a frente tambm dada pela equao anterior, i.e., n + h 1|n 1
= n. Logo a estrutura a termo da volatilidade plana. Algo
pouco realista. Vale tambm a regra da raiz, isto , a volatilidade
para um retorno de perodo t dias a frente, condicionado a
informao disponvel em n 1 dada por:

vol rn rn t 1 | Fn 1 n t .
Aula 2

20

Estimao da volatilidade
No caso de retornos dirios, a estimativa do retorno mdio no
significativamente diferente de zero. Como estamos interessados em
estudar a varincia, vamos considerar de agora em diante que os
retornos dirios tem mdia zero. Pouco esforo necessrio para
generalizar os resultados sem essa hiptese. Alm disso, tomar
desvios em relao ao zero, produz estimativas mais acuradas da
volatilidade (Figlewski, 1997).
A equao anterior pondera igualmente todos os retornos. Uma
forma muito comum de levar em conta o fato de que os retornos
mais recentes deveriam ter uma importncia maior na determinao
da volatilidade futura consiste em considerar um processo ARCH
para a volatilidade (Engle, 1982), dando mais pesos as observaes
mais recentes.

Aula 2

21

Estimao da volatilidade
m

n2 wi rn2i ,
i 1

onde w1 > ... > wm > 0.


Ou levando-se em conta a existncia de uma mdia de longo prazo
para a varincia:
m

n2 w0V wi rn2i ,
i 1

onde V a mdia de longo prazo.


Um caso particular bem interessante o modelo EWMA
(Exponentially Weighted Moving Average).

Aula 2

22

Estimao da volatilidade
Nesse caso V = 0 e os pesos seguem um padro exponencial:
m

n2

i 1 2

rni
i 1
m

i 1

i 1

O parmetro denominado fator de decaimento. Quanto


menor , maior o peso das observaes mais recentes.Valores
tpicos para entre 0,75 e 0,98. RiskMetrics sugere 0,94 (dados
dirios) e 0,97 (dados mensais).
Aula 2

23

Estimao da volatilidade
O documento tcnico do RiskMetrics avaliou que entre
diferentes mercados o valor de 0,94 fornecia o menor erro de
previso em relao a varincia realizada. A varincia realizada
em um dia foi calculada como a mdia dos quadrados dos
retornos nos 25 dias subseqentes.
Quando = 1 EWMA = Mtodo Histrico Simples.
Outro mtodo de estimao consiste no uso de mxima
verossimilhana, de modo semelhante ao procedimento usado
nos modelos GARCH.
Quando V 0 temos o modelo IGARCH.
Aula 2

24

Estimao da volatilidade
Se m grande, o denominador da frmula EWMA para a
volatilidade aproximadamente igual a 1/(1 ). Desse modo:

(1 ) i 1rn2i
2
n

Recursivamente, temos

i 1

n2 n21 (1 )rn21
O primeiro termo da equao acima representa a persistncia da
volatilidade. O segundo termo estabelece a reao da volatilidade
aos eventos do mercado.

Aula 2

25

Estimao da volatilidade
Vantagens da metodologia EWMA de estimao da volatilidade:
A volatilidade reage mais rapidamente a choques no
mercado.
Aps
um movimento extremo a volatilidade declina
exponencialmente a medida que o peso da observao do
choque diminui. Em contraste, o uso de mdia mvel simples
leva a mudanas relativamente abruptas no desvio padro,
uma vez que os movimentos extremos saem da amostra
considerada de forma no suavizada.

Aula 2

26

Estimao da volatilidade
0,180%
0,160%

Plat
Assimilao rpida do
movimento
extremo

Volatilidade diria

0,140%

Queda gradual da
volatilidade

0,120%

Queda brusca da
volatilidade

0,100%
0,080%
0,060%
0,040%

23/08/98

24/07/98

24/06/98

25/05/98

25/04/98

26/03/98

24/02/98

25/01/98

26/12/97

26/11/97

27/10/97

27/09/97

28/08/97

29/07/97

29/06/97

30/05/97

30/04/97

31/03/97

30/01/97

0,000%

01/03/97

0,020%

Tempo
Simples - 60 dias

Aula 2

EWMA - Lambda 0,94

27

Estimao da volatilidade
Uma das deficincias do modelo EWMA refere-se ao fato de que
a estrutura a termo da volatilidade plana, i.e, n + h 1|n 1 = n.
Modelos EWMA no so capazes de capturar clusters
(agrupamento) de volatilidades. De acordo como Mandelbrolt:
Large changes tend to be followed by large changes, of either
sign, and small changes tend to be followed by small changes.
Empiricamente, existe uma correlao positiva entre os
quadrados dos retornos. O termo tcnico desse fenmeno
heterocedasticidade condicional auto-regressiva.
A volatilidade tende a reverter para alguma mdia ao invs de
permanecer constante ou se mover monotonicamente ao longo
do tempo.

Aula 2

28

Estimao da volatilidade
Variao percentual diria do S&P500 1988 - 2006

Aula 2

29

Estimao da volatilidade
No modelo GARCH(1,1) a soma dos parmetros que
representam a influncia da volatilidade e do retorno atuais na
volatilidade do dia seguinte no somam necessariamente 1, como
no EWMA:

n2 V n21 rn21
rn Fn 1 ~ N (0, n2 )

onde V, , > 0. A varincia incondicional dada por:

V

1
2

O processo estacionrio se + < 1.

Aula 2

30

Estimao da volatilidade
Exemplo: Suponha V = 0,01, = 0,03, = 0,95 e 02 = 1,1%.
Tempo (n 1)

Retorno

Varincia

Volatilidade

0,0

1,10%

1,05

3,0

1,32%

1,15

0,0

1,27%

1,13

0,0

1,22%

1,10

Aula 2

31

Estimao da volatilidade
O processo GARCH pode ser extrapolado para h dias a frente.

n2 h 1|n 1 V (1 h 2 ) h 1 n2 , onde .

No vale a regra da raiz

Aula 2

32

Estimao da volatilidade
A estimao dos parmetros do modelo GARCH feita via o
mtodo de mxima verossimilhana. Ou seja, escolher os
parmetros que maximizam as chances de ocorrncia dos dados
observados.
Exemplo: Uma urna contm bolas pretas e branca. Dez bolas so
sorteadas ao acaso e observam-se duas pretas e oito brancas.
Qual a estimativa MV da proporo de bolas pretas na urna?
Exemplo: Estimar a varincia v de uma varivel R com
distribuio normal e mdia nula, a partir de uma amostra
independente de R de tamanho m (r1, r2, ..., rm).
Aula 2

33

Estimao da volatilidade
A verossimilhana
m

i 1

ri 2
1

exp
2 v
2v

Tomando logaritmos e derivando temos que o estimador MV de v


:
m

1
2
r
i
m i 1

Para o modelo GARCH, basta usar a regra de atualizao da


volatilidade e fazer vi = i2. Assim o log da verossimilhana :

Aula 2

34

Estimao da volatilidade

ln
m

i 1

2
i

ri 2 i2

Basta ento encontrar os parmetros do modelo que maximizam


a expresso acima.
Outra alternativa de estimao consiste em considerar que a
distribuio dos retornos uma t-student. Isso complica um
pouco mais o processo de otimizao uma vez que a funo
densidade dessa distribuio menos tratvel que a da normal.

Aula 2

35

Estimao da volatilidade
Variantes do modelo GARCH:
GARCH assimtrico O modelo GARCH padro especifica
a resposta da volatilidade como simtrica em relao a
notcias ruins e boas do mercado. Para acomodar uma
resposta assimtrica existem diversas possibilidades. O
modelo mais comum o E-GARCH:

rt 1 | rt 1 |
ln V
ln n21
t 1
2
n

Se > 0 e < 0 ento choques negativos no retorno induzem


respostas maiores na varincia do que choques positivos.
Aula 2

36

Estimao da volatilidade
GARCH (p,q) considera p lags na volatilidade e q lags nos
quadrados dos retornos.
N-GARCH, T-GARCH, GARCH-M, Q-GARCH, ...
Em geral, efeitos heterocedsticos esto presentes em dados de
alta freqncia (dirios, intraday) e no so comuns em dados
mensais. Para detectar a presena de heterocedasticidade
existem diversos testes. Os principais deles procuram pela
presena de autocorrelao nos quadrados dos retornos.
Se um modelo2 GARCH
capturou bem os efeitos de clusters,
2
ento a razo ri i deve apresentar baixa autocorrelao.
Teste usual para detectar autocorrelao Ljung-Box.

Aula 2

37

Estimando covarincias
Supondo que o dispomos de sries iid de tamanho m dos
retornos de dois ativos (r1 e r2), um estimador para a covarincia
entre eles :
m

1
cov n rn1i 1 rn2i 2 .
m i 1

Usando EWMA temos:

cov n cov n 1 (1 )rn11rn21


Para o GARCH(1,1):

cov n V cov n 1 rn11rn21


Aula 2

38

Estimando covarincias
A especificao do modelo GARCH anterior para a covarincia
a forma mais simples de incorporar os efeitos heterocedsticos.
Essa verso conhecida como vech diagonal. O modelo
bastante restritivo uma vez que as volatilidades passadas no
entram na equao da covarincia atual. Ou seja, o modelo no
captura o aumento da correlao que freqentemente acompanha
o aumento de volatilidades.
A especificao completa de um modelo GARCH multivariado
envolve uma quantidade enorme de parmetros que se torna
impossvel a estimao. Por exemplo, a matriz de covarincia de
um modelo GARCH bivariado completo
Aula 2

39

Estimando covarincias
12,n
2
2,n

cov n

r12,n 1
12,n 1
V1

2
V2 A r2,n 1 B 2,n 1
r1,n 1r2,n 1
cov n 1
V3

onde A e B so matrizes de dimenso 3. Logo temos 21 parmetros


a serem estimados!
Na verso vech diagonal, as matrizes A e B so diagonais e o
nmero de parmetros a serem estimados se reduz para nove.
Outra verso bastante usada dos modelos GARCH multivariados
a BEKK (Baba, Engle, Kraft e Kroner).

Aula 2

40

Estimando covarincias
Mesmo usando simplificaes na especificao de modelos
GARCH multivariados a estimao em geral problemtica,
uma vez que o nmero de parmetros cresce rapidamente. Duas
solues so em geral empregadas.
Bollerslev (1990) prope que a matriz de covarincia H seja
t
estimada da seguinte forma:

H t Dt CDt
onde Dt matriz diagonal das volatilidades GARCH e C
uma matriz de covarincia calculada com as covarincias
histricas ou via um esquema EWMA com pesos constantes.
Aula 2

41

Estimando covarincias

Outra soluo usar um modelo de fatores (como o CAPM):

rnj j j RM j

Admitindo que no haja correlao condicional entre o


mercado e os riscos especficos, temos:

cov(rnj , rnk ) j k n2.R cov( nj , nk )

As covarincias entre os riscos especficos podem ser


determinadas com as covarincias histricas ou tomadas
iguais a zero.

Aula 2

42

Leitura
Alexander, C. Modelos de Mercados, 2005.
Captulos 1, 2, 3, 4 e 5.
Hull, J. Options, Futures and Other Derivatives, sixth edition,
2006.
Captulo 17.
Tsay, R. Analysis of Financial Time Series, 2005.
Captulos 1, 2 e 3.
Bollerslev, T. e outros ARCH Modelling in Finance. Journal of
Econometrics, 1992.
Bollerslev, T. Modelling the coherence in short-run nominal
exchange rates. Review of Economics and Statistics, 1990.

Aula 2

43

Leitura
Engle, R. Autoregressive conditional heteroscedasticity with
estimates of the variance of UK inflation. Econometrica, 1982.
Figlewski, S. (1997) Forecasting volatility, Financial Markets,
Institutions and Instruments (New York University Salomon
Center), 6, 1, 188.
Jorion, (2007) Value-at-Risk
Captulo 9.

Aula 2

44

Apndice A - Distribuio Normal


A distribuio normal ou Gaussiana uma das mais importantes
distribuies de probabilidade.
Ela serve como uma excelente aproximao para uma grande
classe de distribuies que tm enorme importncia prtica.
Notao: N(,2) significa distribuio normal com mdia e
varincia 2. J Z = N(0,1) significa distribuio normal padro,
isto , com mdia zero e a varincia unitria.

Aula 2

45

Apndice A - Distribuio Normal

68,27%

>
95,46%
99,73%

Aula 2


46

Apndice A - Distribuio Normal


A maior parte dos dados se encontram em torno da mdia. A
medida que nos afastamos dela, tanto para mais como para
menos, a probabilidade de ocorrncia de um resultado diminui
de uma forma simtrica, isto , a distribuio uma curva
simtrica em relao a .
O espalhamento do grfico determinado pelo desvio padro .
A equao da curva

1 x
1
f ( x)
exp

2
2

Aula 2

47

Apndice A - Distribuio Normal


Propriedade: Se X tem distribuio normal N(,2) ento (X
)/ tem distribuio normal padro.
Tabela da distribuio normal padro.

Aula 2

= P[Z z]

-3

0,00135

-2

0,02275

-1

0,158655

0,5

48

Apndice A - Distribuio Normal


Exemplo: Suponha que a altura H de um brasileiro adulto seja
distribuda normalmente com mdia 170 cm e varincia 100
cm2. Calcule a probabilidade da altura de um brasileiro sorteado
ao acaso ser maior que 2,0 m.
P[H > 200] = P[H 170 > 30] =
= P[(H 170)/10 > 3] =
= P[Z > 3] = (simetria) =
= P[Z < 3] = (tabela) = 0,00135.

Aula 2

49

Apndice B - Distribuio t-student


Distribuio em forma de sino e simtrica em torno de zero.
Seus valores extremos se afastam mais de zero em comparao
normal padro.
Quanto mais graus de liberdade, maior a proximidade em
relao normal padro.
Sua fdp :

2
f ( x)


2

Aula 2

x2
1

50

Apndice B - Distribuio t-student


Normal
Padro
Formato de sino

t (df = 13)

Simtrica
Caudas gordas

t (df = 5)

0
Aula 2

Z
t
51