Econometria 008

Processo Estocástico Para Preços De Commodities:
Abordagem Através Do Filtro De Partículas
Fernando Antonio Lucena Aiube Tara Keshar Nanda Baidya

Engenheiro Da Petrobras, Doutorando Departamento De Engenharia
De Engenharia De Produção - Puc - RJ Industrial - Puc - RJ
aiube@petrobras.com.br;aiube@ind.puc- baidya@ind.puc-rio.br
rio.br
Edison Americo Huarsaya Tito

Engenharia Elétrica - Puc - RJ
edison@ele.puc-rio.br
PROCESSO ESTOCÁSTICO PARA PREÇOS DE COMMODITIES:
ABORDAGEM ATRAVÉS DO FILTRO DE PARTÍCULAS
Resumo
Uma dos principais objetivos da Teoria de Finanças é encontrar o valor de ativos sejam financeiros ou reais.
O estudo do comportamento dos preços das commodities destaca-se como um relevante tema pois tem papel
fundamental dentro da economia. A base destes estudos são modelos que se apóiam em processos
estocásticos, ou mais genericamente modelos em tempo contínuo. Geralmente os dados de preços mais
abundantes nos mercados de commodities são os preços futuros. Por vezes o preço à vista não é observável e
necessita ser estimado usando os mercados futuros. O filtro de Kalman é a metodologia que tem sido usada
para estimar o preço à vista a partir do preço futuro. O filtro de Kalman na forma clássica presume que o
modelo seja linear seguindo um processo de evolução Gaussiano. Nem sempre estas condições são
adequadas para modelar os preços das commodities. Este trabalho analisa o uso de outra metodologia, o
Filtro de Partículas, que prescinde destas condições. Foi utilizado o modelo de dois fatores de Schwartz e
Smith (2000). Os resultados mostram que esta metodologia é viável abrindo novas possibilidades de análises
para modelos não lineares e/ou não Gaussianos.
Abstract
One of the central tasks of Finance Theory is achieving the value of both financial and real assets. In general,
these problems are approached through continuous time. In this context, the analysis and definition of
stochastic processes play a central role. One of the most important is commodity prices process, usually
employed for pricing futures contracts and valuation of projects. In general, commodities are traded in
futures markets and spot prices can not be observed. These are estimated on the basis of futures prices. The
literature on the topic employs the Kalman filter as a methodology to this end. Kalman filter requires
linearity and Gaussian conditions. This is limiting because many financial models do not have these
properties. The present article uses the particle filter, which does not require the conditions above. We
analyze the filtering process of both methodologies. We use Schwartz and Smith (2000) two factor model to
carry on the analysis. Results show that this methodology is promising for pricing models which are non
linear and/or non Gaussian.
Palavras Chave: Processos Estocásticos, Filtro de Kalman, Filtro de Partículas.

1 - Introdução
Atualmente a valoração de ativos reais e o apreçamento de derivativos financeiros

constituem um dos ramos mais importantes de estudo em Finanças. Basta observar o
enorme número de publicações tanto em livros como em periódicos. Este ramo de estudo
em Finanças constitui uma de suas maiores vertentes. O rápido desenvolvimento de
métodos de apreçamento de derivativos e a sua aplicabilidade cotidiana nas empresas e no
mercado financeiro propiciaram o surgimento e o crescimento vertiginoso de bolsas de
valores e mercadorias onde são negociados títulos à vista e derivativos por todo o mundo.
Por outro lado, a existência de vigorosos mercados com grandes volumes negociados
impulsionou a pesquisa na busca de novos produtos financeiros. Nestes mercados os
investidores, as empresas e as instituições financeiras buscam, além de ganhos de capital,
proteção para as suas decisões de investimento evitando perdas econômicas e garantindo
aos investidores e credores a maximização de suas riquezas.
O derivativo é um título cujo preço é função do preço de outro ativo denominado objeto ou
subjacente. A partir do conhecimento do tipo da evolução do ativo subjacente, é possível
chegar a modelos que fornecem o preço do derivativo. As cifras negociadas nos mercados
de derivativos no mundo são enormes. Inúmeras operações e diversos mecanismos estão
hoje à disposição de todos os investidores.
Este imenso desenvolvimento teve início a partir de artigos publicados por Black, Merton e
Scholes em 1973. Estes trabalhos apreçam uma opção de compra do tipo européia através
de uma famosa fórmula que é a solução de uma equação diferencial parcial de segunda
ordem. Esta solução analítica fechada trouxe elegância à formulação proposta e favoreceu
a proliferação de trabalhos adicionais extensivos e complementares. Estes pesquisadores
propuseram um processo estocástico para a evolução dos preços dos ativos subjacentes. A
origem desta suposição remonta ao início do século passado. Em 1900, Bachelier em sua
“Théorie de la Spéculation” proveu as bases dos processos de difusão Markovianos. Suas
idéias floresceram com Kolmogorov em 1933 e foram usadas por Black, Merton e Scholes.
O processo estocástico por eles adotado é conhecido como movimento geométrico
Browniano e constitui a suposição inicial para o apreçamento de uma opção de compra
européia. A grande novidade apresentada por Black, Merton e Scholes foi a idéia de criar
um portfólio e eliminar o risco do mesmo, fazendo com que a sua remuneração fosse
idêntica à taxa livre de risco. Desta forma, criou-se a condição de não arbitragem e esta
condição é o fundamento do Teorema Fundamental de Finanças.
Posteriormente em 1979 Harrison e Kreps e em 1981 Harrison e Pliska, trouxeram uma

abordagem nova para todas estas idéias. Apresentaram o conceito da Medida Martingal
Equivalente como metodologia alternativa no apreçamento de derivativos. As idéias
iniciais básicas são as mesmas daquela do modelo de Black, Merton e Scholes, ou seja, o
mesmo processo estocástico para descrever o ativo subjacente. Enquanto Black, Merton e
Scholes chegaram ao resultado através da solução de uma equação diferencial, Harrison e
Kreps usaram uma medida de probabilidade alternativa e calcularam o valor esperado da
opção segundo esta nova medida. Esta medida de probabilidade foi denominada Medida
Martingal Equivalente (MME) ou medida neutra ao risco.
O derivativo, calculado por uma metodologia ou outra, depende fundamentalmente do

processo estocástico do ativo subjacente. Por esta razão o conhecimento preciso deste
processo é tão relevante e muitos artigos e estudos têm sido dedicados à sua estimação
acurada. Quando este ativo é uma commodity surgem complicações adicionais. Em geral,
as commodities não são negociadas no mercado à vista. Portanto, o preço à vista, S, não é
uma variável observável. Em geral são negociadas em mercados futuros e o preço futuro,
F, é uma variável observável. Logo, o preço à vista S deve ser estimado a partir do preço
futuro F. Não é por outra razão que normalmente o contrato futuro mais próximo é
considerado uma “proxy” para o preço à vista. O exemplo mais trivial é o caso do petróleo.
Dada a sua relevância no mundo, o petróleo é a commodity de maior negociação nas bolsas
de futuros. Os preços que normalmente são veiculados pela imprensa diariamente referem-
se exatamente aos preços do primeiro contrato futuro, aquele que tem vencimento no
período de um mês à frente. Em geral são divulgados os preços do petróleo do tipo Brent
negociado na bolsa de Londres e do tipo WTI (West Texas Intermidiate) negociado em
Nova Iorque. Estes preços futuros são as referências para o preço à vista do petróleo.
Existe uma relação muito conhecida entre os preços nos mercado à vista (S) e mercado
futuro (F): F = S exp((r − δ)(T − t )) . A variável que faz a ligação entre F e S é δ,
denominada retorno de conveniência. As demais variáveis são a taxa livre de risco r, a data
do vencimento do contrato T e a data atual t. O retorno de conveniência é o prêmio que faz
jus o proprietário do ativo físico, ao contrário daquele que detém apenas um contrato
futuro sobre a commodity. Quando o retorno de conveniência é considerado constante, um
simples ajuste no processo estocástico (drift) permite que os modelos de apreçamento
sejam meras extensões do modelo de Black, Merton e Scholes. Entretanto se δ é
considerado constante, a volatilidade dos contratos futuros torna-se idêntica à volatilidade
do mercado à vista. Evidências empíricas mostram que a volatilidade dos contratos futuros
é decrescente com a maturidade dos contratos. Além disso, sabe-se que o retorno de
conveniência varia inversamente com o nível dos estoques. Portanto, considerá-lo
constante é apenas uma aproximação. Os primeiros trabalhos em Opções Reais adotaram
esta hipótese simplificadora (em Dixit e Pindyck (1994) encontram-se os fundamentos da
Teoria das Opções Reais). O mais correto é considerá-lo uma variável estocástica. Assim,
para descrever adequadamente o preço futuro de uma commodity são necessárias, pelo
menos, duas variáveis estocásticas: S e δ. Estas variáveis não são observáveis e devem ser
estimadas. A variável observável F, preço futuro, permite esta estimação. A importância de
definir o preço à vista está relacionada à necessidade de seu uso em modelos de valoração
de ativos reais (Opções Reais), planejamento de curto e longo prazo, decisão de proteção
ou hedging e decisões de investimento de empresas e/ou instituições financeiras.
Este artigo apresenta uma revisão dos processos estocásticos para preços de commodities
existentes na literatura. O artigo analisa em detalhe o modelo de Schwartz e Smith (2000)
que tem sido o modelo mais utilizado recentemente. Ainda aponta algumas extensões deste
modelo e suas conseqüências. A questão fundamental aqui tratada está relacionada ao
processo de estimação das variáveis de estado. Via de regra a literatura adota o filtro de
Kalman como metodologia desta estimação. O filtro de Kalman pressupõe linearidade e
Gaussianidade dos modelos. Nem sempre estas condições são atendidas na prática.
Alternativamente a literatura usa o filtro de Kalman estendido (veja em Cortazar, Schwartz
e Naranjo (2003)). Este trabalho propõe uma metodologia alternativa. Trata-se do filtro de
Partículas que flexibiliza as suposições de linearidade e Gaussianidade dos modelos. Foi
realizada uma comparação entre as duas metodologias primeiramente com dados artificiais
e posteriormente com dados de mercado. Pode-se observar que o desempenho do filtro de
Partículas é igual ou superior ao do filtro de Kalman. Além disso, a sua maior flexibilidade
permite que modelos mais complexos para os preços de commodities sejam empregados.
O artigo foi organizado da seguinte maneira: a seção 2 resume os artigos mais relevantes
que tratam diretamente de processos estocásticos para commodities; a seção 3 apresenta o
modelo de Schwartz e Smith (2000) e possíveis extensões; a seção 4 resume o filtro de
Kalman, a seção 5 apresenta o filtro de partículas, a seção 6 relata os procedimentos
empíricos utilizados para a comparação entre o filtro de Kalman e o filtro de partículas e a
seção 7 apresenta as conclusões.
2 - Trabalhos relevantes sobre o tema
Pode-se dizer que o artigo de Gibson e Schwartz no início da década de 90 foi o primeiro
passo na direção de modelos guiados por mais de um fator para preços de commodities. O
segundo autor prosseguiu com pesquisas nesta área e produziu modelos que se
incorporaram definitivamente à literatura sobre o tema.
Gibson e Schwartz (1990) desenvolveram um modelo de dois fatores para os preços do

petróleo. Os fatores que carregam as incertezas (ou variáveis estocásticas) são o preço à
vista e o retorno de conveniência. O processo estocástico do preço à vista é o movimento
geométrico Browniano. Para o retorno de conveniência foi adotado o processo de reversão
à média. Estas duas variáveis são denominadas variáveis de estado. Usando o lema de Itô
foi derivada uma equação diferencial parcial (EDP) de segunda ordem para o valor do
ativo contingente em função destes dois fatores. O mesmo procedimento resultou na EDP
para o preço futuro do petróleo. Na época não se conhecia as soluções analíticas destas
EDPs. Então, foi implementada uma solução numérica. Os resultados mostraram que o
modelo é aderente aos contratos de curto prazo. O modelo também foi capaz de mostrar a
diferença entre a volatilidade dos preços à vista e aquela dos contratos futuros,
evidenciando que quanto maior a maturidade menor a volatilidade.
Schwartz (1997) apresentou um relevante artigo em que analisa o comportamento

estocástico dos preços das commodities. O autor investiga o desempenho de três modelos
distintos. O modelo de um fator (uma variável incerta) considera que o logaritmo do preço
à vista segue um processo de reversão à média. O segundo modelo considera dois fatores.
O primeiro fator estocástico é o preço à vista e segue um movimento geométrico
Browniano. O segundo fator estocástico é o retorno de conveniência que evolui segundo
um processo de reversão à média. Neste modelo estas variáveis de estado são
correlacionadas. O terceiro modelo agrega ao segundo a taxa de juros como variável
estocástica, e esta segue um processo de reversão à média tal qual o modelo de Vasicek.
Para os três modelos são derivadas as equações diferenciais parciais para os preços futuros.
Estas equações diferenciais possuem soluções analíticas. O modelo de dois fatores é
similar ao modelo de Gibson e Schwartz (1990) o qual foi tratado numericamente pelo
desconhecimento das soluções analíticas. Nos três casos, na solução analítica, o logaritmo
do preço futuro é uma função linear das variáveis de estado. O modelo foi então colocado
na forma espaço-estado. E aproveitando a sua propriedade linear, o autor usou o filtro de
Kalman para estimar os parâmetros do modelo e definir a cada intervalo de tempo (o
intervalo considerado foi de uma semana) o valor das variáveis de estado. O modelo foi
analisado para os dados empíricos de duas commodities comerciais, o petróleo e o cobre, e
uma commodity preciosa, o ouro. Os principais resultados destes modelos foram: i) os
processos estocásticos das commodities comerciais mostraram forte reversão à média
(parâmetros altamente significantes), porém o ouro não apresentou reversão à média; ii) os
modelos de dois e três fatores mostraram-se aderentes à estrutura à termo dos preços, já o
modelo de um fator mostrou pouca aderência; iii) os modelos de dois e três fatores
mostraram-se aderentes à estrutura a termo da volatilidade, sendo decrescente para curtas
maturidades e estabilizando-se para longas maturidades; já o modelo de um fator
apresentou pouca aderência; iv) em todos os modelos analisados os coeficientes de
correlação entre as variáveis de estado mostraram-se altamente significantes.
Pindyck (1999) apresenta um estudo sobre o comportamento de longo prazo dos preços da
energia. Usou séries de preços do petróleo, carvão e gás natural. Primeiramente analisa a
possibilidade de reversão à média para séries de preços de até um século. Os testes da raiz
unitária não são conclusivos. Entretanto estes testes, em conjunto com o teste da razão da
variância, sugerem que os preços possuem reversão, mas com um coeficiente de reversão
pequeno. Além disso, a média para a qual os preços revertem também flutua ao longo do
tempo. O autor mostra que mesmo para os modelos mais simples de recursos minerais
depletáveis como o de Hotelling, o preço e a taxa de variação do preço com o tempo (level
and slope) flutuam com o decorrer do tempo. O modelo proposto pelo autor possui duas
características fundamentais: i) reversão para uma variável não observável – o custo
marginal de longo prazo segue uma tendência; e ii) flutuação aleatória do nível e
inclinação da tendência. O modelo é colocado na forma espaço-estado e então é usado o
filtro de Kalman para estimação das variáveis de estado. Os resultados mostram que o
modelo produz boas previsões para o petróleo, mas não tão boas para o carvão e gás
natural. O autor argumenta, que para estas duas commodities, podem ter ocorrido
problemas de inicialização e sensibilidade dos parâmetros aos pontos iniciais.
Schwartz e Smith (2000) propuseram um modelo de dois fatores à semelhança de trabalhos

anteriores do primeiro autor. Neste modelo o logaritmo do preço à vista é decomposto
como a soma de duas parcelas que são as variações de curto prazo e o preço de equilíbrio.
Ou seja, ln(S t ) = χ t + ξ t onde χ t representa as variações de curto prazo e ξ t os preços de
equilíbrio. Estas duas variáveis de estado são os dois fatores incertos. A primeira é
modelada por um processo de reversão à média do tipo Ornstein-Uhlenbeck e a segunda é
modelada por um processo geométrico Browniano. As duas variáveis de estado são
correlacionadas. Em seguida, os autores definem estes processos segundo a MME e então
derivam os preços futuros. A linearidade possibilita a estimação do modelo usando o filtro
de Kalman. Os autores usaram na análise empírica, dados de contratos futuros de petróleo
(a mesma base de dados de Schwartz (1997)). Os resultados mostraram aderência para os
dados empíricos de curto prazo. Além destes dados de mercado, os autores dispunham de
dados de longo prazo cedidos pela Enron. Com isto foi possível verificar que a aderência
aos contratos de longo prazo é grande. Este modelo é formalmente equivalente ao modelo
de Gibson e Schwartz (1990) e a variável χ t é linearmente relacionada ao retorno de
conveniência. O modelo pode ser adaptado para outras situações e pode ser estendido de
maneira a considerar mais variáveis estocásticas. Os autores apresentaram, em um adendo
a este artigo, uma das extensões sugeridas nas conclusões.
Manoliu e Tompaidis (2000) apresentam o modelo de multifatores para descrever os

preços futuros de commodities incluindo aspectos relativos a sazonalidade através de uma
função determinística. Os processos estocásticos são colocados sob a MME e são
calculados os dois momentos da distribuição das variáveis de estado. A seguir é derivada a
expressão para os preços futuros e para a volatilidade dos mesmos. O modelo é colocado
na forma espaço-estado para aplicação do filtro de Kalman (estimação das variáveis de
estado) e simultaneamente para estimação dos parâmetros usando a verossimilhança. A
implementação do modelo é feita para um e dois fatores e são utilizados dados históricos
dos preços futuros de gás natural. Os parâmetros de reversão encontrados são significantes
e a volatilidade para a variável de curto prazo (reversão à média) é muito superior a
volatilidade da variável de longo prazo. A sazonalidade com parâmetros mensais é
semelhante para os dois modelos. Os resultados mostram que o modelo de dois fatores
permite melhor ajuste que o modelo de um fator.
Lucia e Schwartz (2001) apresentaram um estudo sobre os derivativos de energia elétrica.

Fizeram uso dos modelos de um e dois fatores. A derivação dos modelos é similar àquela
em Schwartz e Smith (2000). No modelo de um fator é usado o processo de Ornstein-
Uhlenbeck. Para o modelo de dois fatores são usados os modelos de reversão à média e
geométrico Browniano. Em ambos foi incluída uma componente sazonal. Para o modelo
de um fator a estimação dos parâmetros é realizada por mínimos quadrados não lineares.
No modelo de dois fatores, para a implementação numérica, foi usado um procedimento
iterativo em que se minimizou o erro quadrático entre o valor do modelo e o dado de
mercado, primeiro determinando as variáveis de estado, posteriormente as volatilidades e
correlações entre as variáveis de estado e finalmente os parâmetros do modelo. Os
resultados mostraram que os parâmetros de sazonalidade são significantes componentes
dos preços de energia elétrica na região de onde foi extraída a amostra. Esta sazonalidade
tem um papel fundamental na definição de como os preços dos derivativos de energia são
formados. O estudo conclui que outros modelos também poderiam ser especificados tais
como um processo de reversão para a volatilidade. Outra especificação relevante seria a
inclusão de saltos. Finalmente, os autores ressaltam que à medida que as séries de preços
dos mercados de energia crescem, é possível aplicar modelos desta natureza em tais
mercados. Entretanto, enfatizam os autores, esperam-se diferenças substanciais no
comportamento dos preços da energia para diferentes regiões. Estas diferenças seriam
introduzidas pelas diferenças climáticas, hábitos dos consumidores, que definem picos de
consumo durante um dia, e padrões de consumo dentro de um ciclo anual.
Sørensen (2002) apresentou um estudo sobre a modelagem da sazonalidade para os preços

futuros de commodities agrícolas. Usou um modelo similar ao de Schwartz e Smith (2000)
considerando dois fatores e introduzindo uma componente determinística para modelar a
sazonalidade. A sazonalidade foi modelada por uma combinação linear de funções
trigonométricas com freqüências sazonais. Os modelos derivados guardam a condição de
que o logaritmo do preço futuro é uma função afim das variáveis de estado. Foi usado o
filtro de Kalman para estimar as variáveis de estado. O modelo foi implementado usando
dados empíricos para as commodities milho, soja e trigo. O autor usa os dados na forma de
um painel incompleto como entrada para o filtro de Kalman. Como resultado observou-se
que as componentes sazonais acarretam um pico de preços dois a três meses antes do
período de colheita. Os resultados estão coerentes já que em períodos de baixa oferta são
os momentos de alta de preços das commodities e ao contrário, em períodos de grandes
ofertas os preços estão baixos. Outra verificação, que foi possível fazer a partir dos
resultados, está relacionada ao fato de que em períodos de elevados estoques o retorno de
conveniência é baixo, e vice-versa.
Cortazar e Naranjo (2003) propõem um modelo de multi-fatores para estimar o preço à

vista da commodity baseado nas informações dos preços futuros. Basicamente este artigo
expande os modelos de dois e três fatores para N fatores, ou seja, N variáveis não
observáveis. O logaritmo do preço à vista é a soma destes N fatores mais um termo de
tendência ou crescimento. Cada um dos fatores evolui segundo um movimento do tipo
Ornstein-Uhlenbeck. O filtro de Kalman é usado com um painel de dados incompletos.
Para ilustrar a utilização do modelo, os autores fazem uma aplicação para o caso de quatro
fatores usando dados de preços diários de contratos futuros de petróleo. Os resultados
evidenciaram que todos os parâmetros de reversão são altamente significantes. O mesmo
pode-se dizer das correlações. As volatilidades também são significantes e estáveis nos
diferentes painéis. O parâmetro de crescimento e os preços de risco de mercado das
variáveis de estado não são significantes. A estrutura a termo da volatilidade tem um bom
ajuste aos dados empíricos.
O modelo de dois fatores de Schwartz e Smith (2000) foi usado em trabalhos subsequentes
para a commodity gás natural em Manoliu e Tompaidis (2000), para commodities agrícolas
em Sørensen (2002). Além disso, permitiu extensões como em Cortazar e Naranjo (2003)
que analisa os preços do petróleo e Lucia e Schwartz (2001) que analisa os preços da
energia elétrica. Na seção seguinte apresentaremos o modelo de Schwartz e Smith (2000).
Em síntese, podemos dizer que a grande parte dos trabalhos faz uso do filtro de Kalman
para a estimação da variável não observável (o preço à vista). Além disso, a estimação dos
parâmetros dos modelos é feita pela maximização da verossimilhança do erro de predição
(veja Harvey (1989) capítulo 3). A literatura usa o fato de que os modelos são lineares e
agrega aos mesmos um erro Gaussiano, tal qual é o requisito do filtro de Kalman. Há que
se notar entretanto, que um fato estilizado das séries de retornos financeiros é o excesso de
curtose destas distribuições. Somente este fato, se rigorosamente observado, é capaz de
inviabilizar o uso do filtro de Kalman clássico. Este trabalho apresenta os resultados do uso
do filtro de Patículas como metodologia alternativa para lidar com as perdas de linearidade
e Gaussianidade dos modelos.
3 - O modelo de Schwartz e Smith e possíveis extensões
Esta seção descreve a derivação do modelo de Schwartz e Smith (2000) no que se refere
aos aspectos mais relevantes. Trata-se de um modelo de dois fatores em que o logaritmo do
preço à vista é decomposto em duas parcelas: a primeira modela as variações de curto
prazo e a segunda os preços de equilíbrio de longo prazo. As duas variáveis de estado serão
estimadas já que não são observáveis. Inicialmente será feita a derivação sob a medida de
probabilidade verdadeira ou empírica. Posteriormente usaremos a MME para o
apreçamento do contrato futuro. Então, pode-se escrever:
ln(S t ) = χ t + ξ t (1)
onde St é o preço à vista da commodity, χt representa as variações de curto prazo e ξt os

preços de equilíbrio de longo prazo. A parcela χt , variações de curto prazo, segue um
processo de Ornstein-Uhlenbeck:
dχ t = − kχ t dt + σ χ dZ χ (2)
onde k é a velocidade de reversão, σχ é o parâmetro de difusão do processo de χt e dZχ é o

incremento do processo padrão de Wiener. A parcela ξt , preço de equilíbrio, segue um
processo geométrico Browniano, dado por:
dξ t = µ ξ dt + σ ξ dZ ξ (3)
onde µξ é a tendência (drift) do processo de ξt, σξ é o parâmetro de difusão de ξt e dZξ é o

incremento do processo padrão de Wiener. Ainda temos que dZ χ dZ ξ = ρdt , onde ρ
representa a correlação entre as variáveis de estado.
A equação diferencial estocástica de Ornstein-Uhlenbeck tem solução dada por:
t
χ t = χ 0 e − kt + σ χ ∫ exp(k (s − t ))dZ s (4)
0
Veja em Øksendal, (2000) os detalhes das soluções de equações diferenciais estocásticas

para processos de reversão à média. A média e a variância de χt são:
E (χ t ) = e − kt χ 0 (5)
σ χ2
Var (χ t ) =
2k
(1 − e )− 2 kt
(6)
A solução da equação diferencial estocástica em (2) é dada por:
ξ t = ξ0 + µ ξ t + σξ Zξ (7)
É fácil verificar a média e a variância de ξt . Então χt e ξt possuem distribuição normal

conjunta com média e variância dadas por:
E (χ t , ξ t ) = (e − kt χ 0 , ξ 0 + µt ) (8)
 − 2 kt
σ χ2 ρσ χ σ ξ 
 (1 − e ) (1 − e − kt ) 
Cov(χ t , ξ t ) =  2k k  (9)
(1 − e − kt ) χ σ ξ
ρσ
σ χ2 t 
 k 
A demonstração da equação (9) pode ser vista com detalhes no Apêndice de Schwartz e
Smith (2000). Logo ln(S t ) é normalmente distribuída com média dada por:
E(ln(S t ) ) = e − kt χ 0 + ξ 0 + µt (10)
A variância de ln(S t ) é dada por:
σ χ2
Var (ln(S t ) ) = (1 − e − 2 kt
)
2k
(
+ σ χ2 t + 2 1 − e − kt ) ρσkσ
χ ξ
(11)
Também pode-se afirmar que S t é log-normalmente distribuída tal que:
( )
E(S t ) = E e ln St = exp[E(ln S t ) + 1 2 Var(ln S t )]
ou ainda pode-se escrever
ln[E(S t )] = E (ln S t ) + 1 2 Var (ln S t ) (12)
Usando as equações (10) e (11) em (12), temos que:

 2 σ χ2 ρσ χ σ ξ 
ln[E(S t )] = e χ 0 + ξ 0 + µ ξ t + 2 σ ξ t + (1 − e )
− kt 1 − 2 kt
+ 2(1 − e − kt )  (13)
 2k k 
Sob a Medida Martingal Equivalente (MME) os processos descritos em (2) e (3) podem ser
escritos por:
dχ t = (− kχ t − λ χ )dt + σ χ dZ Qχ (14)
dξ t = (µ ξ − λ ξ )dt + σ ξ dZ Qξ (15)
onde dZ Qχ e dZ Qξ são os incrementos dos processos padrões de Wiener sob a MME; λ χ e

λ ξ representam os preços de risco de mercado de χt e ξt , respectivamente. Ainda tem-se
que dZ Qχ dZ Qξ = ρdt . Seguindo as mesmas etapas feitas para o processo na medida
verdadeira, chega-se às equações que descrevem a média e a variância de χt e ξt sob a
MME, ou seja:
 λχ 
E Q [χ t , ξ t ] = e − kt χ 0 − (1 − e − kt ) , ξ 0 + µ *ξ t  (16)
 k 
Cov Q [χ t , ξ t ] = Cov[χ t , ξ t ] (17)
onde µ *ξ = µ ξ − λ ξ . Como a mudança de medida envolve somente alteração nas médias dos
processos a variância não se altera conforme descrito na equação (17). Ainda, ln S t é
normal e S t é lognormal. Então, E Q (ln S t ) = E Q (χ t ) + E Q (ξ t ) ou ainda temos que:
λχ
E Q [ln S t ] = e − kt χ 0 − (1 − e − kt ) + ξ 0 + µ *ξ t (18)
k
Var Q [ln S t ] = Var[ln S t ] (19)
Seja FT ,0 o valor corrente de um contrato futuro com vencimento em T. Sob a MME, o

preço do contrato futuro com vencimento em T é igual ao valor esperado do preço à vista
em T. Isto é FT ,0 = E Q [S T ] , ou ainda ln[FT ,0 ] = ln(E Q (S t ) ). Da equação (12) sabemos que:
( )
ln E Q (S t ) = E Q (ln S t ) + 1 2 Var Q (ln S t ) (20)
Então usando as equações (18) e (19) em (20) temos que:

λχ
ln(FT , 0 ) = e − kT χ 0 − (1 − e − kT ) + µ *ξ t + ξ 0 +
k
 − 2 kT
σ χ2 ρσ χ σ ξ 
1
2 (1 − e ) + σ ξ2 T + 2(1 − e −kT )  (21)
 2k k 
Podemos ainda reescrever a equação (21) considerando que o tempo corrente é t. Então
seja FT , t o preço futuro em t de um contrato que vence na data T:
ln(FT ,t ) = e − k ( T − t ) χ t + ξ t + A(T − t ) (22)
onde:
 ρσ χ σ ξ 
(
A(T − t ) = µ *ξ (T − t ) − 1 − e − k ( T − t ) ) λk
χ
( )
+ 1 2  1 − e −2k (T−t )
σ χ2
2k
( )
+ σ ξ2 (T − t ) + 2 1 − e − k ( T − t )
k 


O artigo de Schwartz e Smith (2000) prossegue derivando a estrutura a termo da

volatilidade e o apreçamento de uma opção européia sobre o contrato futuro. Por questão
de brevidade omitiremos estas etapas sem perda de conteúdo para este estudo. Outrossim,
vale ressaltar que este modelo é formalmente idêntico ao de Gibson e Schwartz (1990). A
variável de estado de curto prazo χt é relacionada linearmente ao retorno de conveniência
daquele artigo.
Uma das grandes dificuldades da análise do processo estocástico de commodities é que as

variáveis de observação, os preços dos contratos futuros, têm maturação relativamente
curta. Até bem recentemente os contratos de petróleo com grande liquidez no NYMEX
apresentam maturação inferior a vinte e quatro meses. Isto é um limitador na capacidade de
predição dos modelos. Por outro lado, o modelo de Schwartz e Smith (2000) é bastante
flexível e permite várias extensões. À medida que surgem contratos de maior maturidade é
possível usar modelos que tenham mais habilidade em capturar tais prazos. Assim é que
apresentamos a seguir algumas extensões do modelo acima, onde o objetivo principal é a
análise do comportamento da variável de longo prazo ξ.
a) Primeira extensão do modelo de Schwartz e Smith
A parcela ξt , preço de equilíbrio, segue um processo de reversão, com média de longo

prazo ξ tal que dξ t = k ξ ( ξ − ξ t )dt + σ ξ dZ ξ onde k ξ é a velocidade de reversão, σξ é o
parâmetro de difusão e dZξ o incremento do processo padrão de Wiener. Ainda temos que
dZ χ dZ ξ = ρdt , onde ρ representa a correlação entre as variáveis de estado.
b) Segunda extensão do modelo de Schwartz e Smith

Esta extensão é um modelo de três fatores em que ln(S t ) = χ t + ξ t . A parcela χt , variações
de curto prazo, segue um processo de reversão à média de longo prazo (zero) ou um
processo de Ornstein-Uhlenbeck. A parcela ξt , preço de equilíbrio, segue um processo
geométrico Browniano, dξ t = µ t dt + σ ξ dZ ξ onde σξ é parâmetro de difusão do processo ξt,
µt é taxa instantânea de crescimento dos preços de equilíbrio tal que µt é um processo
estocástico do tipo reversão à média dµ t = k µ (µ − µ t )dt + σ µ dZ µ onde kµ é a velocidade
de reversão, µ é taxa de crescimento média de longo prazo, σµ é o parâmetro de difusão e
dZµ é o incremento do processo padrão de Wiener. Ainda, as variáveis χt, ξt e µt estão
correlacionadas por dZ χ dZ ξ = ρ χξ dt , dZ χ dZ µ = ρ χµ dt e dZ ξ dZ µ = ρ µξ dt . Este modelo
está descrito em um adendo do artigo original de Schwartz e Smith (2000).
c) Terceira extensão do Modelo de Schwartz e Smith
A seguir estão descritos dois modelos que levam em consideração a existência de saltos na
variável de curto prazo χt (veja em Deng (1998) e em Duffie, Pan e Singleton (2000) o uso
de modelos afins com saltos). A parcela χt , variações de curto prazo, segue um processo de
Ornstein-Uhlenbeck adicionado a um salto, ou processo de Poisson
dχ t = − k χ χ t dt + σ χ dZ χ + ν(µ ν , σ ν2 )dπ(ϖ t ) onde kχ é a velocidade de reversão; σχ é o
parâmetro de difusão; dπ(ϖ t ) representa um processo de Poisson em que ϖ t é a
intensidade dos saltos; ν(.,.) é a distribuição de probabilidade do tamanho do salto (dado
que ocorre o salto), que é Gaussiana ou exponencial.
d) Quarta extensão do modelo de Schwartz e Smith
Esta extensão é idêntica a anterior no que se refere à parcela de curto prazo. Porém a
parcela de longo prazo é dada por dξ t = k ξ ( ξ − ξ t )dt + σ ξ dZ ξ onde os parâmetros têm a
mesma descrição que em a).
As duas últimas extensões diferem substancialmente das anteriores. Em tais modelos há

um processo de saltos descrito por uma distribuição de Poisson. Este fato faz com que as
variáveis de estado deixem de possuir a condição de Gaussianidade. Esta situação torna a
estimação dos estados usando o filtro de Kalman em sua forma clássica inapropriada.
O modelo de Schwartz e Smith é muito flexível. Os autores oferecem muitas outras

possíveis extensões. Por exemplo, para levar em consideração o excesso de curtose pode-
se usar no processo de curto prazo volatilidade do tipo GARCH ou ainda volatilidade
estocástica. Além disso, o coeficiente de reversão pode ser considerado estocástico.
4 - O filtro de Kalman
O filtro de Kalman é um conjunto de equações matemáticas recursivas constituindo um
processo eficiente de estimação uma vez que o erro quadrático médio é minimizado.
Através da observação da variável denominada “variável de observação”, outra variável
não observável, denominada variável de estado, pode ser eficientemente estimada. Os
estados passados, presentes e futuros podem ser estimados. Primeiramente o modelo é
escrito na forma espaço-estado e então o filtro de Kalman pode ser usado. Além disso, o
filtro de Kalman permite a estimação dos parâmetros desconhecidos do modelo através da
maximização da verossimilhança através do erro de previsão. Considere a variável de
observação y t , e a equação de observação:
y t = Ztxt + dt + εt (24)
onde Z t é uma matriz N × m , d t é um vetor N × 1 , ε t é um vetor serialmente

descorrelatado com média zero e matriz de covariância H t e x t é um vetor m × 1 que
contém as variáveis de estado. As variáveis de estado são geradas por um processo
Markoviano de primeira ordem e sua equação é denominada equação de transição:
x t = Tt x t -1 + c t + R t η t t = 1, 2, ...., T (25)
onde Tt é uma matriz m × m , c t é um vetor m × 1 , R t é uma matriz m × g e η t é um

vetor g × 1 serialmente descorrelatado com média zero e matriz de covariância Q t . Além
do mais o vetor de estado inicial x 0 tem média x̂ 0 e matriz de covariância P0 . Os ruídos
ε t e η t são descorrelatados entre si e ambos descorrelatados do vetor de estado inicial.
No processo de estimação das variáveis de estado a rotina de filtração é dividida em dois

grupos de equações: equações de atualização do tempo (ou equações de predição) e
equações de atualização das medições (ou equações de correção). Para cada observação y t
as equações de medição incorporam esta esta informação usando uma estimação a priori
para obter uma nova estimação a posteriori. Este novo estado, assim estimado, é projetado
à frente no tempo, usando as equações de atualização e obtendo-se uma estimativa a priori
para o novo instante de tempo. As equações de atualização no tempo são:
xˆ −t = Tt xˆ t −1 + c t (26)
Pt− = Tt Pt −1Tt′ + R t Q t R ′t (27)
onde o sinal superior indica e o valor da variável a priori (antes que nova observação seja
conhecida). As equações de atualização das medições são:
K t = Pt− Z ′t (Z t Pt− Z ′t + H t ) −1 (28)

xˆ t = xˆ −t + K t (y t − Z t xˆ −t − d t ) (29)
Pt = (I − K t Z t )Pt− (30)
Note que as equações (24) e (25) são funções lineares. As equações (26)-(30) foram
derivadas sob a hipótese de que os ruídos e o vetor inicial de estado são normalmente
distribuídos. Pode-se calcular a distribuição condicional dos estados que é normal dada a
informação até o tempo t. Conseqüentemente a distribuição dos estados ficam
completamente definidas com a média e a matriz de covariância. E isto é o que é feito em
cada instante de tempo através do algoritmo acima. Note também que o algoritmo envolve
a inversão de matriz. Um tratamento detalhado do filtro de Kalman pode ser encontrado
em Harvey (1989) ou em Durbin e Koopman (2002).
5 - O filtro de partículas
O filtro de Partículas é um procedimento recursivo para integração, dentro da classe dos

métodos seqüenciais de Monte-Carlo. Os métodos seqüenciais de Monte-Carlo são
particularmente interessantes para o cálculo de distribuições a posteriori, isto é, das
distribuições das variáveis de estado dadas a ocorrência da observação y t . Os métodos
seqüenciais de Monte-Carlo dispensam as condições de Gaussianidade e linearidade do
modelo e ainda possuem adequadas condições de convergência. Eles abrangem os métodos
que apareceram na literatura sob as denominações de filtros bootstrap, filtro de partículas,
filtro de Monte-Carlo, dentre outros.
Considere inicialmente que {x t , t ∈ Ν} é a variável de estado desconhecida, p(x 0 ) é a

distribuição inicial da variável de estado, p(x t x t −1 ) é a equação de transição e p(y t x t ) é
a distribuição marginal da variável de observação. Usamos a notação p(x 0 : t y 1: t ) para
descrever p( x 0 , x t , K , x t y1 , y 2 K y t ) . Em muitas aplicações de engenharia pode-se estar
interessado em conhecer p(x 0 : t y 1: t ) e a distribuição marginal p(x t y 1 : t ) . Além do mais,
pode-se desejar conhecer o valor esperado dado por I(f t ) = ∫f t ( x 0 : t )p( x 0 : t y1 : t )dx 0 : t .
Este é um problema de filtragem Bayesiano. Em qualquer instante de tempo pode-se obter
a resposta através do teorema de Bayes:
p(y 1: t x 0 : t )p(x 0 : t )
p(x 0 : t y 1: t ) = (31)
∫ p ( y 1 : t x 0 : t ) p ( x 0 : t ) dx 0 : t
A distribuição marginal que procuramos, também pode ser obtida de formulas recursivas:
p(x t y 1 : t ) = ∫ p(x t x t −1 )p(x t −1 y 1 : t −1 )dx t −1 (32)
p(y t x t )p(x t y 1 : t −1 )
p( x t y 1 : t ) = (33)
∫ p(y t x t )p(x t y 1 : t −1 )dx t
onde a equação (32) é a equação de predição e a equação (16) é a equação de atualização.
Quando as equações de transição e observação são lineares e as distribuições são
Gaussianas, as equações (32) e (33) têm uma solução fechada que é exatamente o filtro de
Kalman.
Para calcular I(f t ) deve-se conhecer a distribuição posterior. Quando o ambiente não é
Gaussianao, os cálculos para estimar a distribuição posterior são muito compelxos. O filtro
de partículas adota uma técnica denominada amostragem por importância. O objetivo é
estimar a densidade posterior baseado em uma distribuição por importância. Seja uma
distribuição representada por partículas ou pontos desta última. Considere π( x 0 : t y1 : t ) a
distribuição por importância. Então a integral I(f t ) é calculada por:
I(f t ) = ∫f t ( x 0 : t )p( x 0 : t y1 : t )dx 0 : t
∫f t (x 0 : t )p(x 0 : t y 1 : t )dx 0 : t
Pode-se usar a identidade I(f t ) = . Multiplicando e dividindo
∫p(x 0 : t y 1 : t )dx 0 : t
numerador e denominador por π( x 0 : t y1 : t ) , temos:
∫f t (x 0 : t )ω(x 0 : t )π(x 0 : t y 1 : t )dx 0 : t

I(f t ) =
∫ω(x 0 : t )π(x 0 : t y 1 : t )dx 0 : t
p(x 0 : t y 1 : t )
onde ω(x 0 : t ) = é denominado peso por importância. Um estimador da
π( x 0 : t y 1 : t )
integral acima é dado por:
∑
N
1
f (x (0i:) t )ω(x (0i:) t )
= ∑i =1 f t (x (0i:) t )ω*t
N i =1 t N (i )
Î(f t ) =
∑
N
1
N j=1
ω(x (0j:) t )
* (i )
ω(x (0i:) t )
onde ω =
∑
t N
j=1
ω(x (0j:) t )
Mas que distribuição deveria ser escolhida para representar a distribuição por importância?
Esta questão é essencial, pois ela define a eficiência e a complexidade do filtro de
partículas. A melhor escolha seria a distribuição posterior pois os pesos por importância
são minimizados. Mas, conforme mencionado acima, os cálculos seriam demasiadamente
complexos. Se escolhermos a distribuição a priori seria mais fácil implementar. Quando a
distribuição por importância é a distribuição a priori temos a denominação de amostragem
por importância seqüencial. Neste tem-se uma fórmula recursiva para os pesos por
importância:
p(y t x (t i ) )p(x (ti ) x (t i-1) )

* (i )
ω t =ω *( i )
t -1
π (x (ti ) x (0i:) t -1 , y 1 : t )
A desvantagem da amostragem seqüencial por importância é que ela não carrega

informações das observações. À medida que o tempo t cresce a distribuição dos pesos por
importância torna-se mais assimétrica. O sistema degenera-se rapidamente e não se pode
representar a distribuição posterior. Para evitar este problema um passo adicional é
introduzido, trata-se da seleção. Seleciona-se da distribuição por importância de acordo
com o peso da partícula. As partículas que não representativas são removidas do processo e
as partículas sobreviventes constituem a distribuição que é utilizada para a continuidade do
processo a cada instante de tempo. O procedimento é denominado filtro bootstrap. Note
que o algoritmo não requer nenhuma inversão de matriz. Os fundamentos do filtro de
partículas podem ser encontrados em Doucet, de Freitas e Gordon (2000) e em Tito (2003).
6 - Procedimentos Empíricos
Esta seção descreverá os procedimentos empíricos que foram seguidos para estimação das
variáveis de estado. As duas metodologias usadas para tal finalidade foram os filtros de
Kalman e o de Partículas. O filtro de Kalman possui limitações quanto à linearidade e
Gaussianidade do modelo. Uma alternativa ao filtro de Kalman clássico é o filtro de
Kalman quando perde-se a condição de Gaussianidade conforme descrito em Harvey
(1989) no Capítulo 3, seção 3.7.3. Contudo, não há solução analítica e a solução numérica
é a opção para avaliar as várias funções densidades. Outrossim os cálculos são
computacionalmente muito intensos. Outra alternativa para a perda de Gaussianidade é o
filtro de Partículas. Este é o enfoque deste estudo e esta seção dedica-se à comparação das
duas metodologias.
O modelo de Schwartz e Smith (2000) e os modelos de dois e três fatores sem saltos estão
dentro destas condições, já que a equação das observações (preços futuros - FT , t ) é linear
em relação às variáveis de estado χ t e ξ t . Também é imediato que o logaritmo de dos
preços futuros é uma distribuição condicionalmente normal. Isto é, dado que se conhece os
valores das variáveis de estado em t-1, então χ t e ξ t são condicionalmente Gaussianas e
por conseguinte a equação de observações define que o ln (FT , t ) é também Gaussiana.
Já os modelos que possuem saltos tornam as equações de observações não Gaussianas.

Decorre daí que o Filtro de Kalman clássico torna-se pouco apropriado. A não
Gaussianidade implica que uma solução analítica fechada não pode ser obtida decorrendo
então soluções numéricas computacionalmente intensas. A solução mais adequada para o
problema é tratá-lo por metodologias que dispensem a linearidade e a Gaussianidade. É o
caso do filtro de Partículas.
6.1 - Comparação entre o filtro de Kalman e o filtro de Partículas
A comparação entre as duas metodologias foi realizada em dois estágios distintos. O

primeiro estágio tratou o problema como um caso ideal. A variável de observação foi
criada artificialmente. Foi então atendido o requisito da Gaussianidade do modelo para uso
do filtro de Kalman. No segundo estágio de comparação os dados de observação são os
preços do mercado futuro do petróleo.
6.1.1 - A comparação com dados artificiais
O modelo usado para fazer a comparação entre o filtro de Kalman e o filtro de partículas
foi o modelo de Schwartz e Smith (2000) dado pelas equações (1)-(3) e com preços futuros
dado na equação (22). Considerando os parâmetros do modelo como aqueles em Schwartz
e Smith (2000), os preços futuros (variável de observação) serão gerados artificialmente.
Primeiramente as equações (2) e (3) são discretizadas abaixo:
χ t = (1 − k∆t )χ t −1 + ε t (38)
ξ t = µ ξ ∆t + ξ t −1 + ν t (39)
onde ε t ~ N(0, σ ε2 ) e ν t ~ N(0, σ ν2 ) sendo ρ∆t a correlação entre as duas distribuições

padronizadas e ∆t o intervalo de tempo usado na discretização (uma semana ou 1/52
anos). As distribuições de χ t e ξ t são condicionalmente normais. Ou seja, dados χ t −1 e
ξ t −1 , as variâncias condicionais são dadas por:
σ χ2
(
Var (χ t | χ t −1 ) = 1 − e − 2 k∆t
) 2k = σ 2
ε e Var (ξ t | ξ t −1 ) = σ ξ2 ∆t = σ ν2
A equação das observações é dada por:

ln(FT , t ) = e − k ( T − t ) χ t + ξ t + A (T − t ) + u t (40)
onde u t ~ N(0, σ 2u ) representa os erros nas observações que são descorrelacionados dos
erros das equações de transição (38) e (39).
Foram gerados simultaneamente T ( T = 2000 ) ruídos Gaussianos para ε t , para ν t e ainda

para u t de tal modo que os dois primeiros ruídos são correlacionados, conforme
mencionado acima, e ainda descorrelacionados do terceiro ruído.
Em cada uma das três séries geradas foram realizados os testes estatísticos para verificação
da adequabilidade dos dados. Foram realizados os testes de normalidade de Jarque-Bera e
Anderson-Darling, aceitando-se a hipótese nula de normalidade dos dados. O correlograma
com a FAC (Função de Auto-Correlação), FACP (Função de Auto-Correlação Parcial) e
com a estatística Ljung-Box (estatística Q) indicam que os dados são descorrelatados. O
teste de independência BDS (Brock, Dechert e Scheikman), realizado em espaço de
dimensão oito, indica aceitação da hipótese nula de independência dos termos da série.
Além disso, as séries dos resíduos das variáveis de estado estão correlacionadas, enquanto
a correlação destas mesmas séries com a série dos ruídos da variável de observação é
baixíssima. Foram realizados os testes de igualdade da média com o valor zero para as três
séries, e em todos os casos foi aceita a hipótese nula de igualdade. Portanto, os valores
gerados artificialmente para os ruídos estão adequados às premissas requeridas.
A etapa seguinte foi calcular para cada intervalo de tempo as variáveis de estado a partir de
valores inicias de χ0 e ξ0 . Para tal, foram usadas as equações discretizadas (38) e (39), bem
como os ruídos gerados acima. Foi calculado o termo A(T − t ) da equação (37). Então, de
posse dos valores calculados para as variáveis de estado e do ruído das observações, foi
calculado, em cada instante de tempo, o valor da variável de observação para o primeiro
contrato futuro (equação (40)). Os dados artificiais, assim gerados, serão os dados de
entrada para o processo de filtragem. Eles serão utilizados no filtro de Kalman e no filtro
de Partículas. Faremos somente a filtragem dos dados pelas duas metodologias. Por
enquanto não haverá estimação de parâmetros por nenhum critério. O objetivo, até o
momento, é tão somente de comparar os dois processos de filtragem dos dados observados
para estimação das variáveis de estado.
O preço futuro, artificialmente gerado, será o dado de entrada para os dois filtros. Esta é a
variável de observação que será filtrada. A filtragem estimará a duas variáveis de estados
χ t e ξ t por cada metodologia. Também será obtido o sinal de observação filtrado. Serão
avaliados os erros entre o sinal observado e aquele gerado em cada metodologia de
filtragem. Ambos os filtros foram implementados usando o MATLAB.
A variável de observação foi introduzida no filtro de Kalman e, juntamente com os

mesmos parâmetros utilizados na sua geração, foi rodado o filtro. A saída fornece as
variáveis de estado estimadas juntamente com a variável de observação filtrada. A
correlação medida entre as duas variáveis é 0,9915. É sutil a distinção entre as duas curvas,
pois elas sobrepõem-se. Qualitativamente o resultado é bastante satisfatório, pois a variável
resultante do filtro está bem aderente aos movimentos da variável observada. Antes de
passarmos ao filtro de Partículas, foram realizados testes estatísticos nas saídas produzidas
pelo filtro de Kalman.
O resíduo da variável de observação foi analisado para a verificação das propriedades de

sua distribuição. Foram realizados os testes de normalidade Jarque-Bera e Anderson-
Darling e em ambos aceita-se a hipótese nula de normalidade. A FAC e a FACP, junto
com a estatística Q, mostram que os dados são descorrelatados. O teste BDS, realizado em
espaço de dimensão seis, mostra fortemente a aceitação da hipótese nula de independência.
O mesmo procedimento foi realizado em relação ao filtro de Partículas. Ou seja, usando a

mesma variável de observação anterior e os mesmos parâmetros, fizemos a filtragem com
o filtro de Partículas e obtivemos a resposta que está na Figura 3. Novamente nota-se que é
sutil a diferença entre as duas curvas. A correlação medida entre as duas séries é de 0,9909.
Os dois procedimentos de filtragem foram comparados em termos quantitativos usando-se

três diferentes medidas de erro. Foi verificado o erro entre a variável observada e a
variável filtrada por cada uma das metodologias (filtro de Kalman e de Partículas), usando
as medidas abaixo:
∑ (y ot − y ft ) 2 T y ot − y ft 1 T y ot − y ft
RMSE = t =1
MAE = ∑ MAPE = ∑ y
T t =1 T T t =1 ot
onde yot significa o valor da variável de observação no instante t e yft o valor da variável de
observação filtrada no mesmo instante. A primeira medida RMSE é a raiz do erro
quadrático médio, a segunda medida, MAE, é o erro absoluto médio e a terceira medida,
MAPE, é o erro absoluto percentual médio.
Os erros foram calculados para a variável de observação e a variável filtrada. Os valores

iniciais para as médias das distribuições iniciais dos estados foram os mesmos para as duas
metodologias e iguais a χ 0 = 0,2 e ξ 0 = 3,2 (para fazer estas estimativas dos valores
iniciais foi rodada uma regressão da equação (22) sendo as variáveis χ e ξ os parâmetros).
As variâncias também foram idênticas para os dois filtros. Na simulação do filtro de
partículas foram consideradas diferentes amostras para representar a distribuição a priori
das variáveis de estado. Cada amostra selecionada foi denominada um experimento. Foram
rodados dois casos para o filtro de partículas um com 100 experimentos e outro com 500
experimentos. Os resultados obtidos estão mostrados na Tabela 1. No caso do filtro de
partículas os números referem-se à média de cada caso.
RMSE MAE MAPE
(US$/bbl) (US$/bbl) (%)
Filtro de Kalman 0.9954 0.7639 2.5849
Filtro de partículas (100) 1.0406 0.7917 2.6803
Tabela 1 - Comparação entre erros para a variável de observação
Pode-se observar que o filtro de partículas apresentou um erro próximo àquele do filtro de
Kalman. Isto era esperado já que o filtro de Kalman representa a resposta exata em um
ambiente Guassiano.
Como todas as variáveis foram construídas, pode-se inferir um erro entre a variável de
estado S (preço à vista) e àquela oriunda da estimação. A Tabela 2 apresenta os resultados.
Os números do filtro de partículas referem-se às médias de cada caso (com 100 e 500
experimentos).
RMSE MAE MAPE

Filtro de Kalman 1.2262 0.9507 3.1735
Tabela 2 - Comparação entre os erros para a variável de estado S
Pode-se notar que a diferença entre os erros empregando as duas metodologias é bem
pequeno. O número de partículas usado foi de 200 (veja em Fox (2001) um procedimento
para determinação do número de partículas). Não existe uma definição precisa do número
ideal de partículas a ser utilizado. Um procedimento empírico é conduzir experimentos e
observar o instante em que os resultados estabilizam-se. Quando o número de partículas é
aumentado o erro cometido reduz-se. O custo é o tempo computacional despendido quando
o número de partículas é incrementado. Em média o tempo despendido em cada
experimento foi de 25 segundos.
6.1.2 - Comparação com dados reais de mercado
Nesta seção será mostrada a comparação realizada entre as metodologias dos filtros de
Kalman e de Partículas considerando os dados reais de mercado. Foi considerada como
variável de observação os dados do primeiro contrato futuro de petróleo. Desta forma o
modelo é univariado em relação ao número de variáveis de observação, porém permanece
multivariado em relação ao número de variáveis de estado. Os dados abrangem o período
de janeiro de 1985 a abril de 2004, tomados com freqüência semanal. O tamanho da
amostra é de 1007 dados. O modelo analisado é o de Schwartz e Smith (2000), o mesmo da
seção anterior. Os parâmetros foram mantidos os mesmos e a análise dar-se-á tão somente
sob o aspecto da filtragem. Adotou-se o mesmo procedimento anterior, ou seja, foram
calculados os erros da mesma forma. A Tabela 3 mostra os resultados. De forma similar os
erros do filtro de partículas referem-se às médias dos experimentos em cada caso.
RMSE MAE MAPE

Filtro de Kalman 0.5242 0.3675 1.6970
Tabela 3 - Comparação para a variável de observação com dados de mercado
Da mesma forma que com dados artificiais, a diferença entre a variável observada (preço
de mercado) e a variável filtrada é muito sutil. As curvas praticamente sobrepõem-se. As
correlações entre estas variáveis são 0,9960 e 0,9953 para os filtros de Kalman e de
partículas respectivamente. Os resíduos do modelo foram analisados. Os testes de
normalidade Jarque-Bera e Anderson-Darling rejeitam a hipótese nula de normalidade. A
distribuição é leptocúrtica. Era um fato esperado já um fato estilizado das séries de
retornos financeiras é o excesso de curtose. Em suma usando dados de mercado foram
encontrados resíduos não Gaussianos.
O estudo prossegue fazendo a comparação com dados reais de mercado, mas considerando
uma análise multivariada em relação à variável de observação. Ou seja, foram usados
quatro contratos futuros. Agora os filtros são multivariados em relação aos estados e
observações. Os resultados obtidos são idênticos ao caso univariado.
7 - Conclusões
Este estudo tem como objetivo analisar o comportamento estocástico dos preços de
commodities através do uso do filtro de Partículas. O modelo de Schwartz e Smith (2000) é
o de maior uso nos estudos mais recentes. Este modelo é flexível, permitindo várias
extensões que capturaram detalhes específicos dos dados empíricos. O artigo apresenta
algumas possíveis extensões do modelo. Embora o objetivo central deste estudo não seja a
análise dos modelos propriamente, entendemos que estudos nesta direção possibilitem
aumentar o poder de predição dos mesmos. Notadamente a extensão do modelo de
Schwartz e Smith (2000) em que foi inserido um termo de Poisson no processo de
Ornstein-Uhlenbeck traz complicações adicionais para a estimação das variáveis de estado.
Os saltos são utilizados para modelar o excesso de curtose exibido em séries de retornos
financeiros.
A literatura usa naturalmente o filtro de Kalman como metodologia de estimação das
variáveis de estado. Entretanto, limitado às condições de Gaussianidade e linearidade,
muitos modelos são descartados em face da natureza complexa da estimação, como é o
caso do modelo não Gaussiano apresentado. Já o filtro de partículas é uma metodologia
viável e apresenta resultados coerentes conforme mostramos. Pode-se concluir, pelos
resultados alcançados, que as duas metodologias são equivalentes. O filtro de partículas
consome maior tempo computacional. Por outro lado seu algoritmo não requer nenhuma
inversão de matriz. Além disso, permite que sejam realizadas análises em modelos mais
complexos que não aderem às condições do filtro de Kalman. Nós mantivemos a análise
somente sob o âmbito do processo de filtragem. Poderíamos ter considerado o processo de
estimação dos parâmetros do modelo. Mas esta é uma etapa que pode ser tratada
separadamente. Preferimos nos ater ao processo de filtragem isolando os efeitos do
processo de otimização. A estimação dos parâmetros é uma etapa fundamental em
Finanças, mas para os propósitos desta pesquisa preferimos tratá-la separadamente em
outro artigo. Em suma, o filtro de partículas é uma metodologia promissora em Finanças.
Abre-se um campo vasto de pesquisa dentro do ramo da econometria em Finanças.
8 - Bibliografia
Black, F., Scholes, M. (1973). The pricing of options and corporate liabilities. Journal of
Political Economy, 81, 637-654.
Cortazar, G., Naranjo, L. (2003). A multi-factor stochastic model for estimation procedure
for the valuation and hedging of commodity contingent claims. Working paper,
Pontificia Universidade Catolica de Chile.
Cortazar G., Schwartz, E. S., Naranjo, L. (2003). Term structure estimation in low-
frequency transaction markets: A Kalman filter approach with incomplete panel-data.
Working paper, The Anderson School, University of California Los Angeles.
Deng, S. (1998). Stochastic models of energy commodity prices and their applications:
mean-reversion with jumps and spikes. Working paper, University of California at
Berkeley.
Dixit, A. K., Pindyck, R. S. (1994). Investment under Uncertainty. Princeton, New Jersey:
Princeton University Press.
Doucet A., De Freitas, N., Gordon, N., (2001). Sequential Monte-Carlo methods in
practice. Springer-Verlag, New York.
Duffie, D., Pan, J., Singleton, K. J. (2000). Transformation analysis and asset pricing for
affine jump-diffusions, Econometrica, 68(6), 1343-1376.
Durbin J., Koopman, S. J. Time series analysis by state space methods. Oxford statistical
science series, 25, Oxford University Press.
Fox, D. (2001). KLD-Sampling- Adaptive Particle Filters, in Proceedings NIPS 2001.
Gibson, R., Schwartz, E. S. (1990). Stochastic convenience yield and the pricing of oil
contingent claims. The Journal of Finance, 45(3), 959-976.
Harrison, M., Kreps, D. (1979). Martingales and multiperiod securities markets. Journal of
Economic Theory
Harrison, M., Pliska S. (1981). Martingales and stochastic integrals in theory of continuous
trading. Stochastic Processes and their Applications, 11, 313-316.
Harvey, A. C. (1989). Forecasting, structural time series models and the Kalman filter.
Cambridge University Press, Cambridge.
Lucia, J. J., Schwartz, E. S. (2001). Electricity prices and power derivatives: evidence from
the Nordic Power Exchange. Review of Derivatives Research, 5(1), 5-50.
Manoliu, M., Tompaidis, S. (2000). Energy futures prices: Term structure models with
Kalman filter estimation. Working paper, University of Texas, Austin.
Merton, R. C. (1973). Theory of rational option pricing. Bell Journal of Economics and
Management Science,4,141-183.
Øksendal, B. (2000). Stochastic differential equations: an introduction with applications,

5th Edn. Springer, Berlin, New York.
Pindyck, R. S. (1999). The long-run evolution of energy prices. The Energy Journal, 20(2),
1-27.
Schwartz, E. S., (1997). The stochastic behavior of commodity prices: Implications for
valuation and hedging. The Journal of Finance, 52(3), 923-973.
Schwartz, E. S., Smith, J. E. (2000). Short term-variations and long-term dynamics in

commodity prices. Management Science, 46, 893-911. Adendo: Short-term variations
and long-term dynamics in commodity prices: Incorporating a stochastic growth rate.
Sørensen, C. (2002). Modeling seasonality in agricultural commodity futures. Journal of

Futures Markets, 22, 393-426.
Tito, E. A. H. (2003). Abordagens de inferência evolucionária em modelos adaptativos.

Tese de Doutorado, Departamento de Engenharia Elétrica, Pontifícia Universidade
Católica do Rio de Janeiro.

Econometria 008

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Econometria 008

Enviado por

Direitos autorais:

Formatos disponíveis

Processo Estocástico Para Preços De Commodities:

Abordagem Através Do Filtro De Partículas

Fernando Antonio Lucena Aiube Tara Keshar Nanda Baidya

Edison Americo Huarsaya Tito

Palavras Chave: Processos Estocásticos, Filtro de Kalman, Filtro de Partículas.

Atualmente a valoração de ativos reais e o apreçamento de derivativos financeiros

Posteriormente em 1979 Harrison e Kreps e em 1981 Harrison e Pliska, trouxeram uma

O derivativo, calculado por uma metodologia ou outra, depende fundamentalmente do

2 - Trabalhos relevantes sobre o tema

Gibson e Schwartz (1990) desenvolveram um modelo de dois fatores para os preços do

Schwartz (1997) apresentou um relevante artigo em que analisa o comportamento

Schwartz e Smith (2000) propuseram um modelo de dois fatores à semelhança de trabalhos

Manoliu e Tompaidis (2000) apresentam o modelo de multifatores para descrever os

Lucia e Schwartz (2001) apresentaram um estudo sobre os derivativos de energia elétrica.

Sørensen (2002) apresentou um estudo sobre a modelagem da sazonalidade para os preços

Cortazar e Naranjo (2003) propõem um modelo de multi-fatores para estimar o preço à

3 - O modelo de Schwartz e Smith e possíveis extensões

onde St é o preço à vista da commodity, χt representa as variações de curto prazo e ξt os

onde k é a velocidade de reversão, σχ é o parâmetro de difusão do processo de χt e dZχ é o

onde µξ é a tendência (drift) do processo de ξt, σξ é o parâmetro de difusão de ξt e dZξ é o

A equação diferencial estocástica de Ornstein-Uhlenbeck tem solução dada por:

Veja em Øksendal, (2000) os detalhes das soluções de equações diferenciais estocásticas

A solução da equação diferencial estocástica em (2) é dada por:

É fácil verificar a média e a variância de ξt . Então χt e ξt possuem distribuição normal

A variância de ln(S t ) é dada por:

Também pode-se afirmar que S t é log-normalmente distribuída tal que:

ou ainda pode-se escrever

ln[E(S t )] = E (ln S t ) + 1 2 Var (ln S t ) (12)

Usando as equações (10) e (11) em (12), temos que:

onde dZ Qχ e dZ Qξ são os incrementos dos processos padrões de Wiener sob a MME; λ χ e

Cov Q [χ t , ξ t ] = Cov[χ t , ξ t ] (17)

Var Q [ln S t ] = Var[ln S t ] (19)

Seja FT ,0 o valor corrente de um contrato futuro com vencimento em T. Sob a MME, o

Então usando as equações (18) e (19) em (20) temos que:

ln(FT ,t ) = e − k ( T − t ) χ t + ξ t + A(T − t ) (22)

O artigo de Schwartz e Smith (2000) prossegue derivando a estrutura a termo da

Uma das grandes dificuldades da análise do processo estocástico de commodities é que as

a) Primeira extensão do modelo de Schwartz e Smith

A parcela ξt , preço de equilíbrio, segue um processo de reversão, com média de longo

b) Segunda extensão do modelo de Schwartz e Smith

c) Terceira extensão do Modelo de Schwartz e Smith

d) Quarta extensão do modelo de Schwartz e Smith

As duas últimas extensões diferem substancialmente das anteriores. Em tais modelos há

O modelo de Schwartz e Smith é muito flexível. Os autores oferecem muitas outras

onde Z t é uma matriz N × m , d t é um vetor N × 1 , ε t é um vetor serialmente

onde Tt é uma matriz m × m , c t é um vetor m × 1 , R t é uma matriz m × g e η t é um

No processo de estimação das variáveis de estado a rotina de filtração é dividida em dois

Pt− = Tt Pt −1Tt′ + R t Q t R ′t (27)

K t = Pt− Z ′t (Z t Pt− Z ′t + H t ) −1 (28)

O filtro de Partículas é um procedimento recursivo para integração, dentro da classe dos

Considere inicialmente que {x t , t ∈ Ν} é a variável de estado desconhecida, p(x 0 ) é a

I(f t ) = ∫f t ( x 0 : t )p( x 0 : t y1 : t )dx 0 : t

∫f t (x 0 : t )ω(x 0 : t )π(x 0 : t y 1 : t )dx 0 : t

p(y t x (t i ) )p(x (ti ) x (t i-1) )

A desvantagem da amostragem seqüencial por importância é que ela não carrega

Já os modelos que possuem saltos tornam as equações de observações não Gaussianas.

6.1 - Comparação entre o filtro de Kalman e o filtro de Partículas

A comparação entre as duas metodologias foi realizada em dois estágios distintos. O

6.1.1 - A comparação com dados artificiais

onde ε t ~ N(0, σ ε2 ) e ν t ~ N(0, σ ν2 ) sendo ρ∆t a correlação entre as duas distribuições

A equação das observações é dada por:

Foram gerados simultaneamente T ( T = 2000 ) ruídos Gaussianos para ε t , para ν t e ainda

A variável de observação foi introduzida no filtro de Kalman e, juntamente com os