Você está na página 1de 6

O método do Valor Extremo

Quando se está interessado no cálculo do VaRe, mais ainda, do valor em risco


associado às grandes perdas potenciais, o interesse recai principalmente sobre as caudas
da distribuição dos retornos da carteira.
Os métodos estatísticos e econométricos tradicionais, sejam paramétricos ou
não-paramétricos, para cálculo do VaR apresentam o inconveniente de se basearem na
estimação de densidades inteiras. Tradicionalmente se observa boa aderência nas
regiões onde a maioria dos dados se concentra, isto é, no interior da distribuição.
Contudo, a maioria desses métodos é mal comportada no que diz respeito ao bom ajuste
das caudas das distribuições, onde poucas observações se concentram, o interesse
central no cálculo do VaR. Mesmo métodos não paramétricos de estimação
reconhecidamente desempenham mal nas caudas da distribuição, onde as observações
extremas se concentram.
Entre os avanços recentes de métodos de cálculo de Value-at-Risk está o uso da
Teoria de Valores Extremos (Extremal-Value Theory, doravante EVT). Seu uso nos
permite estimar probabilidades e quantis com razoável precisão nos limites dos valores
encontrados dentro da amostra, e mesmo além deles. Apesar de seu uso ser recente em
Finanças, não se trata de novidade dentro do corpo da estatística. Em geral a EVT é
bastante útil no estudo e dimensionamento de infra-estrutura de apóia a catástrofes
naturais. Um caso bastante citado é o dimensionamento dos diques construídos nos
Países Baixo para controlar o avanço do mar. O último grande transbordamento
registrado teve conseqüências desastrosas, matando mais de 1800 pessoas em 1953. O
trabalho do matemáticos holandês como Van Dantzig foi decisivo para o avanço tanto
da EVT como para o dimensionamento da altura dos diques. O problema nesse caso é:
dadas as observações do nível máximo anual observado (o maior deles antes de 1953,
quando o nível atingiu 3.85 m acima do normal, tinha sido na enchente de 1570, de 4m)
qual a maior altura que o nível do mar atingirá nos próximo 10000 anos (quantil
associado à probabilidade de 1  10 4 )? Van Dantzig estimou como sendo 5.14m acima
do nível de referência. Trata-se de um exemplo típico onde é necessário se fazer
inferência para eventos de fora do conjunto amostral. É exatamente esse o problema
incorrido no cálculo da estimação das grandes perdas observadas em momentos de
crise, ou de stress, no mercado financeiro.

Não há mágica nem pactos esotéricos na estimação de tais quantis. Trata-se


apenas do reconhecimento de que existem características e propriedades específicas
tipicamente encontradas nos valores extremos amostrais, e que nem sempre estão
relacionadas ao comportamento “normal” dos dados observados no interior da
distribuição. A explícitas modelagem desses valores extremos, corresponde a um ajuste
apenas da cauda da distribuição dos dados originais, ressaltando o caráter pouco
informativo que pode ter o interior da distribuição para ocorrência de baixíssima
freqüência.

Teoria de Valores Extremos


Teorema de Fisher-Tippett: Lei de Limite para o Máximo

Suponha ( X n ) uma seqüência de variáveis aleatórias i.i.d. Se existem constantes


de padronização cn  0 e d n  , e alguma distribuição não-degenerada H tal que:
M n  dn
 H,
cn
então h pertence a um dos três seguintes tipos de distribuição:

0, se x  0
Fréchet : ( x)   
 0
exp(  x ), se x  0

exp( x ), se x  0
Weibull :   0
1, se x  0

Gumbel :  ( x)  exp(e x ), x 

Trata-se de um teorema bastante forte, central na EVT, com papel semelhante às


diversas versões do Teorema Central do Limite. Em outras palavras diz que se existir
uma transformação estabilizadora para a variável aleatória definida como o máximo de
uma dada amostra, sua distribuição limite será necessariamente uma das três acima
definidas acima.

Domínio de Atração do Máximo

Outro conceito bastante importante na EVT, é basicamente a forma


reversa de se olhar o teorema anterior. Diz que uma variável aleatória X ( ou
distribuição de X) pertence ao domínio de atração do máximo (maximum domain of
attraction) de H se existirem as constantes cn  0 e d n  que produzam
d
cn1 ( M n  d n )  H .

Essa idéia é importante pois permite o relaxamento de algumas hipóteses


necessárias para que os resultados da EVT sejam válidas em aplicações empíricas.

Distribuição Generalizada do Valor Extremo (GEV)


A pergunta relevante neste ponto deve ser como identificar a correta
distribuição do extremo de uma dada amostra, entre as três possíveis. É possível
introduzir uma família paramétrica que englobe as três distribuições, e o problema recai
simplesmente na estimação do parâmetro de interesse que dará o formato da
distribuição:

 1 , se   0
 
Definindo a família: H    , se   0
 , se   0
 1

Tem-se que, para qualquer F pertencente ao domínio de atração do máximo de


H  , vale a aproximação: F n (cn x  d n )  H  para a distribuição do extremo.

precisamente, conforme embrechts et alli. (1997), pode-se definir H como:

1
 
H ( x)  exp{(1   x) }, se   0 onde 1   x  0
exp{ exp( x)} , se   0

Além disso, é possível substituir-se x na expressão acima pela transformação de


1
  x     
escala e locação H ;  ,  exp   1    denominada de GEV (General
    

Extreme Value distribution). Todos os casos anteriores estão encaixados dentre da GEV
com a escolha dos parâmetros  ,  adequados. Uma Gumbel pode ser obtida como o
caso limite H 0;  , em que   0 .

Estimação no Domínio de Atração do Máximo

Ao invés de se assumir que os máximos provém de uma H ; , , pode-se relaxar


essa hipótese para que os X j  max( X 1( j ) ,..., X s( j ) ) observados sejam i.i.d., mas agora
provenientes de uma distribuição F que pertença ao domínio de atração do máximo de
H .

Estimador de Hill para   1/   0


Suponha uma amostra X 1 ,..., X n de variáveis aleatória i.i.d. cuja distribuição F
pertence ao domínio de atração do máximo de Fréchet. Nesse caso, é possível mostrar
que F tem a forma F ( x)  x  L( x), x  0 se L(x) é uma função de baixa variação.

O parâmetro  é conhecido como índice de caudas (tail index), ou índice de


variação regular (regular variation index.
O estimador de Hill pode ser obtido como o estimador de máxima
verossimilhaça, bastando para isso supor a função L(x)=C (constante), e a função
distribuição F(x) válida para um domínio onde x  u  0 , com u  X k ,n . Os estimadores
MLE para  e C, condicionais a um valor de k, e para uma amostra de tamanho n, são
dados por:
1
^ 1 k  ^ k 
^

 k ,n    ln X j ,n  ln X k ,n  eC ( X k , n ) k ,n
 k j 1  n

Além disso, o estimador das caudas da distribuição segue naturalmente como:


^
  k ,n 1
^ k x  ^
n  ^
 k ,n
F (u )    e para os quantis, x p   (1  p )  X k ,n
n  X k ,n  k 

É possível obter consistência fraca no caso de ( X n ) ser uma seqüência de


^
variáveis aleatórias i.i.d.: para k   e k / n  0, n   obtém-se  k ,n   . Sob
restrições adicionais, também é possível obter consistência forte (convergência quase-
certa), e ainda normalidade assintótica.

Escolha do número de estatística de ordem k

O estimador de Hill depende do valor de k, a última estatística de ordem


utilizada. Nesse caso, k determina o ponto de corte ótimo onde deveria iniciar a cauda
da distribuição e ,portanto, a partir onde a EVT se torna válida para descrever a cauda
da distribuição.
Não existe consenso na literatura sobre a forma mais adequada de se escolher o
valor de k. Mais ainda, a estimativa do índice de caudas é altamente sensível à escolha
de k, principalmente em amostras consideradas pequenas. Isso se deve ao fato de que
existe um trade-off entre viés e variância do estimador devida à escolha de k. A
variância do estimador cai com o aumento do tamanho da amostra, e o conseqüente
aumento de k. Contudo também é possível mostrar a existência de um viés, crescente
com a escolha de k. Isso implica que, ao aumentar-se o valor de k, simultaneamente,
aumenta-se o viés e reduz-se a variância do estimador de Hill, sugerindo que deve haver
um ponto ótimo de k * entre viés e variância.
Para resolver o problema de encontrar o k * ótimo, duas alternativas são mais
utilizadas. A primeira consiste num método gráfico, como sugerido em Embrechts et
alii (1997), e a segunda, sugerida por Hall(1990), lança mão de um procedimento
bootstrap interativo.
O método gráfico consiste em se traçar o gráfico conhecido como Hill-plot e
procurar a região próxima das caudas onde o valor do índice de caudas estimado se
^ (H )
estabiliza. O gráfico é constituído dos pares {(k ,  k ,n ) : k  1,..., n} . A intuição é que à
mediada que um k maior é escolhido, avança-se em direção ao interior da distribuição e
menos peso é dados às observações da cauda, o real interesse da modelagem. Contudo,
um valor pequeno de k incorpora muito poucas observações extremas e produz um
estimador com elevada variância. No meio desse caminho, deve haver algum valor de k
que aproxima a taxa à que o viés aumenta da taxa à que a variância decresce refletindo-
se em um patamar no gráfico. Nem sempre isso é facilmente identificável.

Estimação de Value-at-Risk através da EVT


A teoria de valores extremos vista até aqui parece bastante indicada para a
estimação de quantis e probabilidades, e portanto de VaR, para as caudas da distribuição
dos retornos. Duas questões surgem de imediato: a) o que é cauda e o que é interior da
distribuição; b) o que fazer no caso de medidas de VaR com níveis de significância
mais altos (e portanto níveis de confiança mais baixos) que avancem no interior da
distribuição, onde a EVT, em princípio, não desempenha tão bem como outros métodos
tradicionais.
A resposta de (a) está na escolha ótima de k que, como visto acima, não é uma
tarefa livre de controvérsias. A partir de um k , a EVT é capaz de dizer a partir de que
nível de probabilidade a aproximação das caudas passa a valer.
Com relação a (b) a resposta foi dada por um dos artigos da série de Danielson e
De Vries (1997c), em que propõem uma solução semi-paramétrica. A idéia é utilizar a
simulação histórica no interior da distribuição e a estimação paramétrica, dada pela
EVT, nas caudas da distribuição.

Você também pode gostar