2015 S

Estatstica Bsica
Prof. Daniela Kubudi

dkubudi@gmail.com
Aula 2
Contedo da Aula
Variveis aleatrias
Estimao da volatilidade
Estimao da covarincia
Aula 2
Variveis aleatrias
Embora os preos dos ativos financeiros possam ser observados
no presente e no passado, no possvel observar o que eles
sero no futuro. Os preos dos ativos so variveis aleatrias e
no determinsticas.
Uma varivel aleatria uma funo que associa a cada
resultado de um experimento um nmero real. O conjunto de
todos os resultados possveis de um experimento chamado de
espao amostral. Logo, uma v.a. uma funo do espao
amostral no conjunto dos nmeros reais.
Exemplo: Seja o experimento lanar uma moeda duas vezes.
Suponha que estejamos interessados no nmero de caras.
Aula 2
Variveis aleatrias
Ento podemos definir X(w) da seguinte forma:
X(w) = nmero de caras observadas nos dois lanamentos.
O espao amostral S {CC, CK, KC, KK} onde C = cara e
K = coroa. Assim, X(CC) = 2, X(CK) = X(KC) = 1 e X(KK)
= 0.
Aula 2
Variveis aleatrias
A v.a. X discreta se toma um nmero finito ou numervel de
valores, isto , se existe um conjunto finito ou enumervel de
valores {x1, x2, ... } tal que X(w) {x1, x2, ... } w S. A funo
pX(xi) definida por pX(xi) = P(X = xi), i = 1, 2, ..., chamada
funo de probabilidade de X. A funo de probabilidade
caracteriza a distribuio de X.
Exemplo: Seja o experimento lanar o dado uma nica vez.
Suponha que o dado perfeitamente equilibrado. Defina X(w) =
resultado da face superior, ento temos que P(X = 1) = P(X =
2) = P(X = 3) = P(X = 4) = P(X = 5) = P(X = 6) = 1/6.
Aula 2
Variveis aleatrias
0,20
0,15
0,10
0,05
0,00
1
Aula 2
f(x)d1P(aXb)f(x)d
X
baX
Variveis aleatrias
A varivel aleatria X contnua se existe uma funo fX, ou

simplesmente f, denominada funo densidade de probabilidade
(fdp) de X que satisfaa s seguintes condies:
f (x) 0 para todo x.
X
Para quaisquer a, b, com - < a < b < + , teremos
Aula 2
Variveis aleatrias
No estaremos mais interessados em saber a probabilidade de
um determinado resultado, mas sim em conhecer a probabilidade
do resultado estar em determinado intervalo. Tentaremos
responder questes do tipo:
Qual a chance da altura de um brasileiro, sorteado ao acaso,
ser maior que 1,50m e menor que 1,70m ?
Qual a chance do preo de uma ao de Petrobras no
fechamento de amanh ser maior que R$ 52,00 ?
Para responder a tais perguntas devemos, primeiramente,
conhecer a fdp da altura dos brasileiros e do preo da ao de
Petrobrs no fechamento de amanh.
Aula 2
P
(1,50H
1,70)h(x)d
1,570
Variveis aleatrias
Suponha que a fdp da altura dos brasileiros seja dada por h(x),
ento, a resposta da segunda pergunta
Aula 2
Distribuio Normal
Retornos S&P 2005-2015
Aula 2
10
E
(X
)
xfp(dx)
ii
X
i
1
X
Variveis aleatrias
Seja X uma v.a. discreta assumindo os valores x1, x2, ..., xn,...,
chamamos de valor esperado ou esperana matemtica ou mdia de
X ao valor
Se X for contnua com fdp fX(x), o valor esperado de X definido

como
Qual o valor esperado do resultado do lanamento de um dado

honesto?
Aula 2
11
Variveis aleatrias
Podemos tambm calcular o valor esperado condicionado a um
conjunto de informaes.
Notao: E(X|F).
Exemplo: Qual o valor esperado do resultado do lanamento de
um dado, sabendo que ele par? E se for mpar?
Obs.: O valor esperado linear, isto , E[aX + b] = aE[X] + b.
Vale tambm que E[X + Y] = E[X] + E[Y].
Aula 2
12
X2E
[X
X
E
()]2
Variveis aleatrias
A varincia de uma v.a. X, denotada por var(X) ou X2, definida

por
A raiz quadrada positiva de X2 chamada de desvio padro de

X, e denotada por X. Em finanas, comum usar o termo
volatilidade do retorno de um ativo ao invs de desvio padro.
A volatilidade uma medida de disperso da funo de
densidade de probabilidade.
Obs.: var(aX + b) = a2var(X).
Aula 2
13
XYXE(XX)YYE(Y)
E
Variveis aleatrias
O coeficiente de correlao entre duas variveis X e Y, denotado

por XY, definido por
O coeficiente de correlao mede o grau de dependncia linear

entre duas v.a. O numerador dessa equao a covarincia.
A correlao uma medida limitada de dependncia.
Primeiramente, a correlao mede apenas a dependncia linear.
Isso significa que duas v.a. podem ter correlao baixa mais terem
outros tipos de dependncia. Ou seja, variveis descorrelatadas no
so necessariamente independentes.
Aula 2
14
Variveis aleatrias
Aula 2
15
Variveis aleatrias
Alm disso, no mercado financeiro as estimativas de correlao
freqentemente apresentam falta de robustez.
Assim outros mtodos tm surgido com o intuito de capturar a
dependncia. Um dos mais famosos remete ao conceito de
cpulas.
Uma cpula uma maneira geral de se representar uma
distribuio multivariada de tal maneira que vrios tipos de
dependncia possam ser capturados.
Aula 2
16
Variveis aleatrias
cov(aX+c,bY+d) = abcov(X,Y)
cov(X, X) = var(X)
cov(X, Y) = cov(Y, X)
var(X + Y) = var(X) + var(Y) + 2cov(X,Y)
Cov(X, Y) = E[XY] - E[X]E[Y]
Var(X) = E[X2] - E[X]2
Aula 2
rnln Sn1 ernSnn1

O retorno rn de um ativo durante o dia n (isto , entre o final do

dia n 1 e o fim do dia n) pode ser definido de duas maneiras
diferentes:
Se o retorno pequeno (prximo de zero, como so em geral os

retornos
dirios)
essas
duas
definies
conduzem
aproximadamente
ao
mesmo
valor.
Vamos
usar
preferencialmente a definio logartmica.
Aula 2
18
1
m
r,ondem.
m
n
i
m
2
2nin
i
1
i
Seja n|n 1 a volatilidade do retorno rn com as informaes

disponveis no fim do dia n 1. Quando no houver dvidas,
vamos simplificar a notao n|n 1 = n. Em outras palavras, seja
Fn 1 o conjunto de informao disponvel ao final do dia n 1.
Ento n2 = var(rn| Fn 1).
Um estimador comumente usado para a varincia n2 a
varincia amostral das m observaes mais recentes:
Aula 2
19
Esse estimador no viesado (isto , acerta na mdia) se os
retornos dirios forem iid. Como veremos mais adiante, a
equao acima tambm representa o estimador de mxima
verossimilhana da varincia, apenas substituindo m 1 por
m no denominador, o que faz pouca diferena se m grande
(maior que 30).
Se os retornos fossem realmente iid, o valor de m deveria ser o
maior possvel a fim de minimizar o erro de estimao. No
mercado financeiro a hiptese de retornos iid nem sempre
verdadeira. Assim, ao tomar m muito grande estaramos
introduzindo dados muito antigos cuja realidade no
corresponde mais a atual.
Aula 2
20
volrn
rnt1|F
n1
nt.
Uma regra de dedo consiste em tomar m entre 90 e 180. No

mercado brasileiro, valores ainda menores como 20 e 30 dias
so usados.
No caso de retornos iid a estimativa da volatilidade h dias (h
1) a frente tambm dada pela equao anterior, i.e., n + h 1|n 1
= n. Logo a estrutura a termo da volatilidade plana. Algo
pouco realista. Vale tambm a regra da raiz, isto , a volatilidade
para um retorno de perodo t dias a frente, condicionado a
informao disponvel em n 1 dada por:
Aula 2
21
No caso de retornos dirios, a estimativa do retorno mdio no
significativamente diferente de zero. Como estamos interessados em
estudar a varincia, vamos considerar de agora em diante que os
retornos dirios tem mdia zero. Pouco esforo necessrio para
generalizar os resultados sem essa hiptese. Alm disso, tomar
desvios em relao ao zero, produz estimativas mais acuradas da
volatilidade (Figlewski, 1997).
A equao anterior pondera igualmente todos os retornos. Uma
forma muito comum de levar em conta o fato de que os retornos
mais recentes deveriam ter uma importncia maior na determinao
da volatilidade futura consiste em considerar um processo ARCH
para a volatilidade (Engle, 1982), dando mais pesos as observaes
mais recentes.
Aula 2
22
w
r
V
w
r,
m
2
2
n
i
n
in2
1im
2
i
n
onde w1 > ... > wm > 0.

Ou levando-se em conta a existncia de uma mdia de longo prazo
para a varincia:
onde V a mdia de longo prazo.

Um caso particular bem interessante o modelo EWMA
(Exponentially Weighted Moving Average).
Aula 2
23
m
i
1
2
2
in
1ni
Nesse caso V = 0 e os pesos seguem um padro exponencial:
O parmetro denominado fator de decaimento. Quanto

menor , maior o peso das observaes mais recentes.Valores
tpicos para entre 0,75 e 0,98. RiskMetrics sugere 0,94 (dados
dirios) e 0,97 (dados mensais).
Aula 2
24
O documento tcnico do RiskMetrics avaliou que entre
diferentes mercados o valor de 0,94 fornecia o menor erro de
previso em relao a varincia realizada. A varincia realizada
em um dia foi calculada como a mdia dos quadrados dos
retornos nos 25 dias subseqentes.
Quando = 1 EWMA = Mtodo Histrico Simples.
Outro mtodo de estimao consiste no uso de mxima
verossimilhana, de modo semelhante ao procedimento usado
nos modelos GARCH.
Quando V 0 temos o modelo IGARCH.
Aula 2
25
(1)
r(1)
2n2nn21i
i11n2n2i1
Se m grande, o denominador da frmula EWMA para a

volatilidade aproximadamente igual a 1/(1 ). Desse modo:
Recursivamente, temos
O primeiro termo da equao acima representa a persistncia da

volatilidade. O segundo termo estabelece a reao da volatilidade
aos eventos do mercado.
Aula 2
26
Vantagens da metodologia EWMA de estimao da volatilidade:
A volatilidade reage mais rapidamente a choques no
mercado.
Aps
um movimento extremo a volatilidade declina
exponencialmente a medida que o peso da observao do
choque diminui. Em contraste, o uso de mdia mvel simples
leva a mudanas relativamente abruptas no desvio padro,
uma vez que os movimentos extremos saem da amostra
considerada de forma no suavizada.
Aula 2
27
0,180%
0,160%
Plat
Assimilao rpida do
movimento
extremo
Volatilidade diria
0,140%
Queda gradual da
volatilidade
0,120%
Queda brusca da
volatilidade
0,100%
0,080%
0,060%
0,040%
23/08/98
24/07/98
24/06/98
25/05/98
25/04/98
26/03/98
24/02/98
25/01/98
26/12/97
26/11/97
27/10/97
27/09/97
28/08/97
29/07/97
29/06/97
30/05/97
30/04/97
31/03/97
30/01/97
0,000%
01/03/97
0,020%
Tempo
Simples - 60 dias
Aula 2
EWMA - Lambda 0,94
28
Uma das deficincias do modelo EWMA refere-se ao fato de que
a estrutura a termo da volatilidade plana, i.e, n + h 1|n 1 = n.
Modelos EWMA no so capazes de capturar clusters
(agrupamento) de volatilidades. De acordo como Mandelbrolt:
Large changes tend to be followed by large changes, of either
sign, and small changes tend to be followed by small changes.
Empiricamente, existe uma correlao positiva entre os
quadrados dos retornos. O termo tcnico desse fenmeno
heterocedasticidade condicional auto-regressiva.
A volatilidade tende a reverter para alguma mdia ao invs de
permanecer constante ou se mover monotonicamente ao longo
do tempo.
Aula 2
29
Variao percentual diria do S&P500 2005 - 2015
Aula 2
30
2
2
2
n
n
1
n
1
r
(2
F
,1
~
N
)
0
No modelo GARCH(1,1) a soma dos parmetros que

representam a influncia da volatilidade passada e do retorno
atual na volatilidade do dia seguinte no somam necessariamente
1, como no EWMA:
onde V, , > 0. A varincia incondicional dada por:

O processo estacionrio se + < 1.
Aula 2
31
Exemplo: Suponha = 0,01, = 0,95 e = 0,000001.
Tempo (n 1) Retorno (n 1)
Aula 2
Varincia n
Volatilidade n
0,00011
1,05%
15%
0,0003305
1,82%
0,0003150
1,77%
-10%
0,0004002
2,00%
32
2nh1|n
2n,o
(1
h2)h1
nde
.
O processo GARCH pode ser extrapolado para h dias a frente.
No vale a regra da raiz
Aula 2
33
[
,
]
A estimao dos parmetros do modelo GARCH feita via o

mtodo de mxima verossimilhana. Ou seja, escolher os
parmetros que maximizam as chances de ocorrncia dos dados
observados.
Parmetros:
Exemplo: Estimar a varincia v de uma varivel R com

distribuio normal e mdia nula, a partir de uma amostra
independente de R de tamanho m (r1, r2, ..., rm).
Aula 2
34
L
()
1
r
1l2n
2v1ln2
e
x
p
v2r
2
m
i
im
1i2i2
i
1
A verossimilhana (considerando a distribuio normal):
Para o modelo GARCH, basta usar a regra de atualizao da

volatilidade e fazer vi = i2. Assim o log da verossimilhana :
Aula 2
35
2
2
m
L
1
r
1
i4
i1
i2 i
()2
Basta ento encontrar os parmetros do modelo que maximizam

a expresso anterior.
Outra alternativa de estimao consiste em considerar que a

distribuio dos retornos uma t-student. Isso complica um
pouco mais o processo de otimizao uma vez que a funo
densidade dessa distribuio menos tratvel que a da normal.
Aula 2
36
|
r
ln
ln
2nn1n1n1n21
Variantes do modelo GARCH:

GARCH assimtrico O modelo GARCH padro especifica
a resposta da volatilidade como simtrica em relao a
notcias ruins e boas do mercado. Para acomodar uma
resposta assimtrica existem diversas possibilidades. O
modelo mais comum o E-GARCH:
Se > 0 e < 0 ento choques negativos no retorno induzem

respostas maiores na varincia do que choques positivos.
Aula 2
37
2n
rn2
GARCH (p,q) considera p lags na volatilidade e q lags nos

quadrados dos retornos.
N-GARCH, T-GARCH, GARCH-M, Q-GARCH, ...
Em geral, efeitos heterocedsticos esto presentes em dados de
alta freqncia (dirios, intraday) e no so comuns em dados
mensais. Para detectar a presena de heterocedasticidade
existem diversos testes. Os principais deles procuram pela
presena de autocorrelao nos quadrados dos retornos.
Se um modelo GARCH capturou bem os efeitos de clusters,
ento a razo
deve apresentar baixa autocorrelao.
Teste usual para detectar autocorrelao Ljung-Box.
Aula 2
38
m
1
1
2
covnnm
r
.
ic
n
1
n
i
2
i
ovn1(1)n121
Estimando covarincias
Supondo que o dispomos de sries iid de tamanho m dos

retornos de dois ativos (r1 e r2), um estimador para a covarincia
entre eles :
Usando EWMA temos:
Para o GARCH(1,1):
cov n r1.n 1r2,n 1 cov n 1
Aula 2
39
A especificao do modelo GARCH anterior para a covarincia
a forma mais simples de incorporar os efeitos heterocedsticos.
Essa verso conhecida como vech diagonal. O modelo
bastante restritivo uma vez que as volatilidades passadas no
entram na equao da covarincia atual. Ou seja, o modelo no
captura o aumento da correlao que freqentemente acompanha
o aumento de volatilidades.
A especificao completa de um modelo GARCH multivariado
envolve uma quantidade enorme de parmetros. Isto pode tornar
impossvel a estimao. Por exemplo, a matriz de covarincia de
um modelo GARCH bivariado completo
Aula 2
40
2
2
c
o1v,nn
1,nr12,n2,n1
B
ovn1
123A
,c
1
n
onde A e B so matrizes de dimenso 3. Logo temos 21 parmetros

a serem estimados!
Na verso vech diagonal, as matrizes A e B so diagonais e o
nmero de parmetros a serem estimados se reduz para nove.
Outra verso bastante usada dos modelos GARCH multivariados
a BEKK (Baba, Engle, Kraft e Kroner).
Aula 2
41
H
D
t
tC
Mesmo usando simplificaes na especificao de modelos

GARCH multivariados a estimao em geral problemtica,
uma vez que o nmero de parmetros cresce rapidamente. Duas
solues so em geral empregadas.
Bollerslev (1990) prope que a matriz de covarincia H seja
t
estimada da seguinte forma:
onde Dt matriz diagonal das volatilidades GARCH e C

uma matriz de covarincia calculada com as covarincias
histricas ou via um esquema EWMA com pesos constantes.
Aula 2
42
rcov(nj,nj
jkj
R
n2.Rcjov(nj,k)
jk)
M
Outra soluo usar um modelo de fatores (como o CAPM):
Admitindo que no haja correlao condicional entre o

mercado e os riscos especficos, temos:
As covarincias entre os riscos especficos podem ser

determinadas com as covarincias histricas ou tomadas
iguais a zero.
Aula 2
43
Leitura
Alexander, C. Modelos de Mercados, 2005.
Captulos 1, 2, 3, 4 e 5.
Hull, J. Options, Futures and Other Derivatives, sixth edition,
2006.
Captulo 17.
Tsay, R. Analysis of Financial Time Series, 2005.
Captulos 1, 2 e 3.
Bollerslev, T. e outros ARCH Modelling in Finance. Journal of
Econometrics, 1992.
Bollerslev, T. Modelling the coherence in short-run nominal
exchange rates. Review of Economics and Statistics, 1990.
Aula 2
44
Leitura
Engle, R. Autoregressive conditional heteroscedasticity with
estimates of the variance of UK inflation. Econometrica, 1982.
Figlewski, S. (1997) Forecasting volatility, Financial Markets,
Institutions and Instruments (New York University Salomon
Center), 6, 1, 188.
Jorion, (2007) Value-at-Risk
Captulo 9.
Aula 2
45
Apndice A - Distribuio Normal

A distribuio normal ou Gaussiana uma das mais importantes
distribuies de probabilidade.
Ela serve como uma excelente aproximao para uma grande
classe de distribuies que tm enorme importncia prtica.
Notao: N(,2) significa distribuio normal com mdia e
varincia 2. J Z = N(0,1) significa distribuio normal padro,
isto , com mdia zero e a varincia unitria.
Aula 2
46
68,27%
>
95,46%
99,73%

Aula 2

47
2
f(x)21
2
1
x
exp
.
A maior parte dos dados se encontram em torno da mdia. A

medida que nos afastamos dela, tanto para mais como para
menos, a probabilidade de ocorrncia de um resultado diminui
de uma forma simtrica, isto , a distribuio uma curva
simtrica em relao a .
O espalhamento do grfico determinado pelo desvio padro .
A equao da curva
Aula 2
48

Propriedade: Se X tem distribuio normal N(,2) ento (X
)/ tem distribuio normal padro.
Tabela da distribuio normal padro.
Aula 2
= P[Z z]
-3
0,00135
-2
0,02275
-1
0,158655
0,5
49

Exemplo: Suponha que a altura H de um brasileiro adulto seja
distribuda normalmente com mdia 170 cm e varincia 100
cm2. Calcule a probabilidade da altura de um brasileiro sorteado
ao acaso ser maior que 2,0 m.
P[H > 200] = P[H 170 > 30] =
= P[(H 170)/10 > 3] =
= P[Z > 3] = (simetria) =
= P[Z < 3] = (tabela) = 0,00135.
Aula 2
50
1
f(x)
2
1
x
2 2
Apndice B - Distribuio t-student
Distribuio em forma de sino e simtrica em torno de zero.

Seus valores extremos se afastam mais de zero em comparao
normal padro.
Quanto mais graus de liberdade, maior a proximidade em
relao normal padro.
Sua fdp :
Aula 2
51
Apndice B - Distribuio t-student

Normal
Padro
Formato de sino
t (df = 13)
Simtrica
Caudas gordas
t (df = 5)
0
Aula 2
Z
t
52

2015 S

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

2015 S

Enviado por

Direitos autorais:

Formatos disponíveis

Estatstica Bsica

Prof. Daniela Kubudi

A varivel aleatria X contnua se existe uma funo fX, ou

Para quaisquer a, b, com - < a < b < + , teremos

Se X for contnua com fdp fX(x), o valor esperado de X definido

Qual o valor esperado do resultado do lanamento de um dado

A varincia de uma v.a. X, denotada por var(X) ou X2, definida

A raiz quadrada positiva de X2 chamada de desvio padro de

O coeficiente de correlao entre duas variveis X e Y, denotado

O coeficiente de correlao mede o grau de dependncia linear

rnln Sn1 ernSnn1

O retorno rn de um ativo durante o dia n (isto , entre o final do

Se o retorno pequeno (prximo de zero, como so em geral os

Seja n|n 1 a volatilidade do retorno rn com as informaes

Uma regra de dedo consiste em tomar m entre 90 e 180. No

onde w1 > ... > wm > 0.

onde V a mdia de longo prazo.

Nesse caso V = 0 e os pesos seguem um padro exponencial:

O parmetro denominado fator de decaimento. Quanto

Se m grande, o denominador da frmula EWMA para a

O primeiro termo da equao acima representa a persistncia da

EWMA - Lambda 0,94

No modelo GARCH(1,1) a soma dos parmetros que

onde V, , > 0. A varincia incondicional dada por:

O processo GARCH pode ser extrapolado para h dias a frente.

No vale a regra da raiz

A estimao dos parmetros do modelo GARCH feita via o

Exemplo: Estimar a varincia v de uma varivel R com

A verossimilhana (considerando a distribuio normal):

Para o modelo GARCH, basta usar a regra de atualizao da

Basta ento encontrar os parmetros do modelo que maximizam

Outra alternativa de estimao consiste em considerar que a

Variantes do modelo GARCH:

Se > 0 e < 0 ento choques negativos no retorno induzem

GARCH (p,q) considera p lags na volatilidade e q lags nos

Supondo que o dispomos de sries iid de tamanho m dos

Usando EWMA temos:

cov n r1.n 1r2,n 1 cov n 1

onde A e B so matrizes de dimenso 3. Logo temos 21 parmetros

Mesmo usando simplificaes na especificao de modelos

onde Dt matriz diagonal das volatilidades GARCH e C

Outra soluo usar um modelo de fatores (como o CAPM):

Admitindo que no haja correlao condicional entre o

As covarincias entre os riscos especficos podem ser

Apndice A - Distribuio Normal

Apndice A - Distribuio Normal

Apndice A - Distribuio Normal

A maior parte dos dados se encontram em torno da mdia. A

Apndice A - Distribuio Normal

Apndice A - Distribuio Normal

Apndice B - Distribuio t-student

Distribuio em forma de sino e simtrica em torno de zero.

Apndice B - Distribuio t-student

Você também pode gostar