Notbayesianos

Texto Didático
Notas introdutórias sobre modelos bayesianos para

previsão de séries temporais
Rogério Silva de Mattos

Universidade Federal de Juiz de Fora
Departamento de Economia
rogerio.mattos@ufjf.edu.br
Junho, 1993
ÍNDICE
1. Introdução ........................................................................................................................... 3
2. Visão Geral de Modelos Estruturais e Abordagem Bayesiana de Previsão ................... 5
2.1. Abordagem Bayesiana ................................................................................................. 6
2.2. Possibilidades de Intervenção ..................................................................................... 6
2.3. Testes de Diagnóstico ................................................................................................... 8
2.4. Programa BATS ........................................................................................................... 9
3. Os Detalhes da Abordagem Bayesiana de Previsão ....................................................... 10
3.1. Modelo Estrutural ...................................................................................................... 10
3.2. Modelo Linear Dinâmico ........................................................................................... 12
3.3. Operacionalização do Modelo Estrutural ................................................................ 15
3.4. Hiperparâmetros ........................................................................................................ 17
3.5. Intervenções ................................................................................................................ 19
3.6. Avaliação dos Modelos .................................................................................................. 20
3.6.1. Medidas de Aderência............................................................................................. 20
3.6.2. Medidas e Testes de Previsão ................................................................................. 20
Referências ............................................................................................................................ 22
2
1. Introdução
O período compreendido pela década de 80 e início dos anos 90 teve reflexos

marcantes para a economia brasileira. Desde seu início, com a deflagração da crise da
dívida externa e as consequentes respostas de política econômica recessiva, e,
posteriormente, com o recrudescimento do processo inflacionário e os sucessivos
planos de estabilização, o sistema econômico vem sofrendo abalos e transformações.
Notadamente, a manifestação direta destas mudanças tem sido o desenvolvimento de
uma crescente instabilidade no comportamento dinâmico do sistema.
Ao longo de todo esse período, as condições de funcionamento da economia,

sobretudo de seu aparato produtivo/industrial, foram progressivamente se
deteriorando. Tal movimento produziu implicações não apenas para o agravamento
dos problemas estruturais, mas também para a dinâmica conjuntural das principais
variáveis econômicas. Dentre os fatores que, provavelmente, mais contribuíram para
isso, poderíamos listar:
a) o processo recessivo, que, de um lado, aumentou a concentração industrial

ao levar diversas firmas à falência, e, de outro, intensificou a obsolescência do
parque produtivo ao desestimular novos investimentos;
b) o recrudescimento do processo inflacionário e o aumento de volatilidade

das taxas de juros, que forçaram os agentes econômicos a buscar outras formas
de administração da produção, calcadas em novos padrões de gerência
financeira e administração de estoques;
c) a desarticulação do sistema de incentivos governamentais, que não só

contribuiu para reduzir a oferta agregada de bens e serviços como também fez
alterar sua composição;
d) a progressiva liberalização comercial da economia, que vem trazendo - e

trará ainda mais - novos padrões de competição em diversos mercados e
e) as frequentes mudanças das regras econômicas, introduzidas dentro e fora

dos diversos planos de estabilização macroeconômica.
Diversos são os estudos que enfocam os problemas estruturais da economia, em

especial de seu segmento industrial. Porém, são poucos os que investigam o s efeitos
que as mudanças estruturais da última década tiveram para o padrão de
comportamento das variáveis econômicas. Este fato vem tornando cada vez mais
complexa a tarefa de prever o futuro destas variáveis, mesmo no curto prazo. Em
consequência, ficam dificultadas as atividades de curto prazo. Em consequência,
ficam dificultadas as atividades de acompanhamento de conjuntura econômica.
Lembre-se que o principal objetivo destas atividades para o gestor de políticas é o de
identificar movimentos indesejáveis daquelas variáveis a fim de poder revertê-los em
tempo via estímulos de política econômica.
Esse quadro sugere ser de interesse o desenvolvimento de estudos sobre alterações no

padrão dinâmico das variáveis econômica. ocorridas ao longo da década de 80 e início
3
dos anos 90. Tais estudos seriam úteis, de um lado, para aprofundar o conhecimento
sobre o comportamento de curto prazo das variáveis e, de outro, para fornecer a base
de um sistema para sua previsão. Uma forma interessante de se fazer isto é através do
uso de técnicas estatísticas de análise e previsão de séries temporais.
Diversas dessas técnicas são amplamente utilizadas, internacionalmente, para dar

suporte a atividades de acompanhamento da conjuntura econômica. Por exemplo, na
maioria dos países, as agências oficiais da estatística adotam o procedimento X-11 ou
X-11-ARIMA para dessazonalizar as séries econômicas e permitir a análise de suas
tendências1. Também, diversos departamentos de planejamento em organizações
públicas e privadas utilizam modelos de alisamento exponencial ou métodos Box-
Jenkins para previsão das variáveis de interesse2.
Muitas das técnicas utilizadas, porém, não se adequam a contextos de elevada

instabilidade, como é o caso brasileiro e de muitos países latino-americanos, em que
as séries apresentam comportamento errático e com quebras estruturais. Além disso,
muitas também não são versáteis o suficiente para incorporar, tanto na análise como
na previsão, todo o conjunto de informações (quantitativas ou qualitativas), disponível
ao analistas.
Essas limitações são superadas no âmbito da metodologia de modelos estruturais de

séries temporais, proposta por Harrison e Stevens (1976), na escola bayesiana de
estatística, e Harvey(1981), na escola clássica. Embora tenha sido introduzida em
meados da década de 70, o uso desta metodologia só passou a se difundir a partir da
segunda metade da década de 80, devido à inexistência, até então, de pacotes
estatísticos que permitissem a sua utilização em larga escala.
Grosso modo, o que esta metodologia faz é permitir estimar os componentes de

tendência e sazonalidade das series de forma sequencial e dinâmica, através de um
mecanismo que atualiza as estimativas a cada período de tempo. Isto confere à ela
vantagens preditivas, além de permitir a análise do padrão dinâmico das séries através
do estudo das variações dos componentes estimados3. No contexto bayesiano proposto
por Harrison e Stevens (e sistematizado em West e Harrison (1989)), existem ainda
amplas possibilidades de se combinar informações externas aos dados na análise e na
previsão das variáveis.
A metodologia de modelos estruturais vem sendo aplicada ao estudo de séries

econômicas brasileiras desde meados da década de 80. Destacam-se os trabalhos de
Migon et alii (1986) para as séries de produção industrial e índice de preços, Migon e
Pereira (1987) para o hiato do produto e Markwald et alii (1989) para a produção
industrial, todos a nível de Brasil. Atualmente, a abordagem bayesiana vem sendo
adotada em uma base permanente pelo IPEA, no âmbito de seu Grupo de
Acompanhamento Conjuntural (GAC), para previsão e acompanhamento de
conjuntura das séries de produção industrial mensal e PIB trimestral do Brasil 4.
1
Estes procedimentos são utilizados no Brasil pelo IBGE para a obtenção das séries dessazonalizadas
da produção industrial. Ver IBGE (1990).
2
Ver Souza (1989), para uma resenha da utilização destes métodos.
3
Apresentaremos maiores detalhes mais adiante na seção 2.
4
Ver Moreira et alii (1992). As previsões com os modelos são publicadas mensalmente pelo IPEA em
seu Boletim Conjuntural e Carta de Conjuntura.
4
2. Visão Geral de Modelos Estruturais e Abordagem Bayesiana de Previsão
Nesta seção, procuraremos apenas introduzir as principais características dos modelos

estruturais, dando ênfase ao método bayesiano, a fim de tornar clara as versatilidades
dessa metodologia para a pesquisa empírica em economia. Serão evitados agora os
detalhes matemáticos da metodologia, o que deixamos para outras seções mais
adiante.
A moderna abordagem de modelos estruturais para análise e previsão de séries

temporais foi proposta inicialmente na literatura por Harrisson e Stevens (1976), na
escola bayesiana, e por Harvey (1981), na escola clássica5. A principal diferença entre
ambas as escolas reside no tratamento dado à informações disponíveis para se
elaborar os modelos. Ao passo que a escola clássica baseia-se apenas nos dados
amostrais, a escola bayesiana permite também incorporar informações subjetivas,
externas à amostra.
A abordagem de modelos estruturais se baseia em um conceito antigo da análise de

séries temporais, qual seja, o de que toda série é constituída de componentes não
observáveis6 de tendência (t), ciclo (t), sazonalidade (t) e irregular (t), tal como:
Yt = t + t +t + t
Tradicionalmente, à excessão do componente irregular, os componentes acima eram

tratados como funções determinísticas do tempo, o que trazia pouca flexibilidade no
tratamento de suas alterações dinâmicas. Posteriormente, com o surgimento dos
chamados modelos de alisamento exponencial, tais componentes passaram a ser
tratados de forma adaptativa, mas dentro de um aparato estatístico pouco consistente,
onde se recorria a procedimentos ad-hoc7 para sua estimação.
Com o surgimento dos modelos estruturais, estas e outras limitações foram superadas,
na medida em que a descrição em (1) passou a ser feita através de um instrumental,
originário da engenharia de controle, conhecido como representação de sistemas em
espaço de estados. Por esta formulação, é possível a utilização de um algoritmo
conhecido como Filtro de Kalman, através do qual estimativas dos componentes são
produzidas sequencialmente com uma série de propriedades ótimas.
A vantagem dos modelos estruturais em termos de previsão é bem conhecida, mas

eles podem ser úteis também para se desenvolver uma melhor compreensão do
mecanismo gerador das séries estudadas. Eles servem, por exemplo, para se analisar
padrões sazonais mutáveis, mudanças estruturais ou transientes 8 e pontos de reversão
cíclica, assim permitindo explorar todo um conjunto de hipóteses sobre alterações no
comportamento dinâmico das séries.
5
Ver também os livros de West e Harisson (1989) e Harvey (1989a).
6
Modelos baseados neste conceito são conhecidos na literatura como modelos de componentes não
observáveis.
7
Ver Harvey (1989a)
8
Devidas a valores atípicos (outliers).
5
2.1. Abordagem Bayesiana
As observações acima valem tanto para a visão clássica quanto para a visão bayesiana
de modelos estruturais. Esta última, porém, se mostra mais versátil no tratamento das
informações disponíveis ao analista no processo de desenvolvimento dos modelos.
Isto porque permite combinar informações contidas na amostra com informações
externas à amostra, através de vasta gama de procedimentos.
Harisson e Stevens (1976) salientam que as vantagens inerentes à abordagem

bayesiana, em relação a outras metodologias de análise de séries temporais, residem
nos seguintes fatores:
a) Representação Paramétrica: as séries são representadas através de

componentes que são diretamente interpretáveis, em contraposição à
representação funcional usada pelos modelos ARIMA de Box e Jenkins
(1976);
b) Descrição Probabilística: a abordagem bayesiana explicita não apenas as

estimativas dos componentes a cada instante de tempo, mas também indica
automaticamente uma medida de incerteza associada a tais estimativas;
c) Descrição Sequencial: refere-se à capacidade do modelo de se alterar ou se

adaptar ao longo da amostra com base em um mecanismo de transição de um
período para outro e gerando uma representação específica para cada instante
de tempo.
A característica a) é importante para evitar ambiguidades na análise das séries,

aumentando a compreensão de seus mecanismos geradores. Sobretudo, quando existe
a preocupação de descrever e não apenas prever o comportamento das séries.
O item b) decorre da descrição sequencial em termos de distribuições a priori e a

posteriori, onde se explicita não apenas a média das distribuições9 mas também sua
variância. Isto vale tanto para as estimativas históricas como para o usuário tomador
de decisão, que pode usar as informações geradas pelo modelo tendo noção de seu
grau de confiabilidade.
Finalmente, o item c) determina a natureza dinâmica da metodologia e fornece a base

para as intervenções subjetivas do usuário no modelo. Estas possibilidades de
intervenção conferem especial destaque a metodologia bayesiana, conforme falaremos
na próxima subseção.
2.2. Possibilidades de Intervenção
A filosofia que suporta a idéia de intervenção baseia-se no fato de que, a todo

momento, está disponível ao analista ou usuário do modelo um conjunto de
informações mais amplo do que aquele composto pelos dados observados da série.
9
Correspondentes à estimativas dos componentes.
6
Por exemplo, é comum o usuário ter conhecimento de eventos passados que explicam
certos movimentos atípicos apresentados pelo histórico da série, ou de eventos futuros
que irão alterar o comportamento da série previsto pelo modelo. Tais informações não
estão presentes nos dados, mas devem ser incorporadas no sistema de análise e
previsão. A abordagem bayesiana permite que estas informações sejam formalmente
incorporadas no processo de estimação e previsão dos modelos estruturais.
As intervenções consideradas pela metodologia bayesiana são de duas naturezas:
a) "Feed-forward": quando a intervenção é feita para se antecipar os efeitos

de eventos excepcionais relevantes. Por exemplo, quando se sabe, a priori,
que em determinado mês houve sensível queda na produção industrial devido
à ocorrência de greves, produzindo um vale atípico no comportamento da
série; ou ainda, quando a introdução de uma nova legislação trabalhista
referente à carga horária de trabalho produz mudanças para baixo no nível da
série. Nestes casos, a intervenção é feita de maneira a forçar o modelo a captar
com rapidez as alterações no mecanismo gerador das séries.
b) "Feed-back": quando não se sabe a priori da necessidade de intervir, mas,

através de um sistema de monitoração que detecta automaticamente
deteriorações na capacidade preditiva dos modelos, obtém-se uma sinalização
para se pesquisar a ocorrência de eventos importantes não considerados e que
potencialmente estariam afetando o comportamento da série.
Ambas as forma de intervenção são úteis tanto para descrição como para previsão. A
intervenção feed-back, em especial, permite usar a metodologia de modo
exploratório, para se detectar eventos relevantes, não contemplados a priori, o que
contribui para melhor compreensão do mecanismo gerador das séries. A relação entre
as formas de intervenção e a aquisição de conhecimento sobre o fenômeno
investigado estão ilustradas na Figura 2.3.1.
7
Figura 2.2.1
Intervenção Feed-forward
Conhecimento Conhecimento
a Priori a posteriori
Intervenção
Estimação
Sequencial
Intervenção Feed-back
Monitoração Detecção Conhecimento

Sequencial a posteriori
Estimação Intervenção
Sequencial
2.3. Testes de Diagnóstico
O processo de construção de modelos é constituído de uma série de passos,

começando com a especificação inicial do modelo, seguida de sua estimação com ou
sem intervenções, a realização dos testes de diagnóstico e o término com a escolha de
um modelo. A fase de testes de diagnóstico pode levar a uma nova especificação e
definição de intervenções, caso o modelo inicialmente definido não passe nestes
testes.
Os testes de diagnóstico são, portanto, muito importantes para todo o processo, e vale
fazer aqui uma breve menção aos que se costuma usar para avaliar os modelos. Na
realidade, existe uma ampla bateria de testes de diagnóstico que podem ser aplicados,
desde inspeção visual dos resíduos até testes para heterocedasticidade, não-linearidade
e normalidade10.
Nem todos os testes estão disponíveis no software comercial disponível para

implementar a abordagem bayesiana de previsão, sobre o qual falaremos na próxima
sub-seção. Em uma aplicação com a metodologia bayesiana, devem ser usadas
10
Ver Harvey, op. cit.
8
algumas medidas de aderência e testes de previsão, a maior parte dos quais estão
implantados no referido software. Abaixo, apenas listamos os principais testes que são
normalmente utilizados, deixando para a Seção ...., adiante, a descrição formal de
cada um deles.
a) medidas de aderência:
- erro quadrático médio
- desvio absoluto médio
- logaritmo da verosimilhança preditiva
b) medidas e testes de previsão:

- erro quadrático médio de previsão
- desvio absoluto médio
- teste de previsão após a amostra
2.4. Programa BATS
A aplicação da metodologia bayesiana apresentada nas seções anteriores é viabilizada

pela existência do programa BATS - Bayesian Analysis of Time Series, desenvolvido
por West, Harrison e Pole (1988). Este programa é um sistema menu-driven, que
permite a estimação on-line dos componentes, as facilidades de intervenção, o
sistema de monitoração e a previsão L passos à frente com intervalos de
probabilidade.
Além disso, o sistema provê um série de facilidades, dentre as quais vale citar: a)
importação e exportação de dados; b) estatísticas descritivas para análise exploratória
dos dados e c) amplo sistema gráfico passível de ser usado em todas as etapas da
análise.
9
3. Os Detalhes da Abordagem Bayesiana de Previsão
Nesta Seção, é apresentada a formalização de metodologia de modelos estruturais

para previsão e análise de séries temporais. O que será mostrado aqui se baseia no
enfoque bayesiano implementado no programa BATS. A única excessão diz respeito à
componente cíclica, cuja estimação não está disponível no BATS, mas cuja forma de
modelagem será aqui apresentada para uma melhor ilustração dos modelos
estruturais11.
A sequência de exposição adotada se iniciará com a forma de modelagem proposta

para os componentes do modelo estrutural; em seguida, será apresentado o problema
de estimação de modelos em espaços de estados, com base no conceito bayesiano de
Modelo Linear Dinâmico, e de sua solução via Filtro de Kalman; nas seções
seguintes, serão apresentadas a operacionalização do modelo estrutural em termos do
MLD, a solução bayesiana para tratamento dos hiperparâmetros e as possibilidades de
intervenção, por parte do usuário, disponíveis na metodologia bayesiana e
implementadas no BATS; finalmente, na última seção, serão apresentadas as medidas
de aderência e os testes de previsão a serem usados para avaliar os modelos.
3.1. Modelo Estrutural
O conceito de modelo estrutural segue o antigo princípio de que toda série temporal
pode ser representada por um modelo estatístico de componentes não observáveis de
tendência, ciclo, sazonalidade e irregular. Formalmente, o modelo de componentes
não observáveis se escreve:
Yt = t + t + t + t (modelo aditivo) (1)
ou
Yt = t . t . t . t (modelo multiplicativo)12 (1')
onde:
t = nível da série (componente de tendência)
t = componente cíclica
t = componente sazonal
t = componente irregular
11
A rigor, a componente cíclica tem maior relevância quando se está analisando um período de dados
bastante longo, que não será o caso da pesquisa que só cobre pouco mais de uma década.
12
A metodologia apresentada aqui refere-se ao modelo aditivo, podendo o modelo multiplicativo ser
convertido em aditivo via tranformação logarítimica. O modelo multiplicativo é mais adequado para a
maior parte das séries econômicas, pois segue a idéia de que a amplitude dos movimentos cíclicos e
sazonais se relaciona dieretamente com o nível das séries.
10
A abordagem de modelos estruturais assume, em primeiro lugar, que cada
componente evolui estocasticamente, e não deterministicamente, ao longo do
tempo. Em segundo lugar, a modelagem matemática proposta para caracterizar a
evolução temporal de cada componente é feita por intermédio de sistemas de
equações recursivas, da seguinte forma:
a) tendência:
t = t-1 + t-1 + vt
t = t-1 + vt

b) ciclo:

t = .t-1.cos *t1 sen + wt
 *t t-1.sen +  *t1 .cos + w *t
c) sazonalidade:
s/ 2
 t    j,t
j1
 j,t   j,t 1.cos( j )   *j,t 1.cos( j )  w j,t

 *j,t   j,t 1.sen( j )   *j,t 1.cos( j )  w*j,t
t representa o crescimento do nível,  o fator de amortecimento do ciclo e  a

frequência da harmônica do ciclo;  *t e  *t são as componentes associadas a t e t,
respectivamente; vt, vt, wt, w *t , wj,t e w *j,t (j=1,...s/2) são as perturbações
estocásticas de cada componente.
O sistema composto por (4) e (5) representa a forma de evolução dinâmica para a
componente cíclica, o que é feito através de uma única harmônica na frequência . O
termo de amortecimento  é incluído para impedir um comportamento explosivo deste
componente.
A equação (6) descreve o componente sazonal como sendo a soma de s/2 fatores,
onde s é o período sazonal. Na fórmula acima, assume-se que cada fator é uma
harmônica e, portanto, que a sazonalidade t é uma média de s/2 harmônicas13. As
frequências respectivas de cada harmônica são determinadas por:
2. . j
j  j = 1, ...,s/2
s
13
Outra forma, proposta na literatura, para modelar o componente sazonal é via fatores sazonais. Ver
Harrison & Stevens (1976).
11
3.2. Modelo Linear Dinâmico
A cada instante de tempo t, a estimação dos componentes não observáveis em (1) tem
de ser feita a partir do vetor de observações y' = [y1, y2,..., yt]. A proposta da
metodologia de modelos estruturais é tratar esta questão como um problema de
modelos estruturais é tratar esta questão como um problema de estimação de modelos
em espaço de estados, o qual apresenta uma solução pronta, dada pela utilização de
um algoritmo conhecido como Filtro de Kalman. Assim, para se estimar os
componentes não observáveis, é preciso colocar (1) em termos da representação de
modelos em espaço de estados. No contexto bayesiano, isto é feito com base no
conceito de Modelo Linear Dinâmico (MLD), que pode ser entendido como uma
forma particular de se representar modelos em espaço de estados14.
O MLD é descrito pelas seguintes equações:
Yt = Ft't + vt vt ~ (0,Vt) (9)


t = Gtt-1 + wt wt ~ (0,Wt) (10)
onde:
Yt = vetor (1x1) de observações da variável Y em t.
Ft = vetor (mx1) conhecido em t
t = vetor (mx1) de estado do sistema em t
Gt = matriz (mxm) de transição em t
vt = vetor (1x1) de perturbação estocástica em t
wt = vetor (mx1) de perturbações estocásticas em t
Vt = variância de vt
Wt = matriz de variância-covariância de wt
A equação (9) descreve a forma como cada observação é gerada para um dado estado
do sistema no instante t. É chamada equação das observações. A equação (10), por
sua vez, descreve a transição, entre o instante t-1 e o instante t, do sistema de geração
das observações, é chamada equação do sistema e t vetor de estado do sistema.
O problema de estimação do MLD refere-se a encontrar estimativas para o vetor de

estados, a cada instante t, com base nas observações disponíveis até aquele instante,
inclusive. Ou seja, a partir do vetor yt' = [y1, y2, ..., yt].
14
Para uma representação mais geral, ver Harvey (1989).
12
Agora, assumindo-se gaussianidade (normalidade) para os vetores de perturbações vt
e wt e que eles não são auto-correlacionados e nem correlacionados entre si, isto é:
vt ~ N(0,Vt)
wt ~ N(0,Wt)
E(v t , v t k )  0 
  k  1,2,
E(w t , w t k )  0
E(v t , w t k )  0 k  0,1,2,
a solução do problema de estimação fica determinada pelo seguinte sistema de

equações recursivas:
at = Gt . mt-1 (11)
Rt = Gt . Ct-1 . G' + Wt (12)
mt = at + Rt . Ft . (yt - Ft . at) / Qt (13)
Ct = Rt - Rt.Ft.Ft'.Rt / Qt (14)
Qt = Ft'.Rt.Ft + Vt (15)
onde
at = E(t/t-1)
Rt = Var(t/t-1)
mt = E(t/t)
Ct = Var(t/t).
O sistema formado pelas equações (11) a (15) constitui o Filtro de Kalman.
As equações (11) e (12) são denominadas equações de predição do Filtro. Através

delas, obtém-se estimativas para o vetor de estado t e para sua matriz de variância-
covariância - isto é, at e Rt, respectivamente -, usando-se apenas as informações
disponíveis até o instante t-1.
As equações (13), (14) e (15), são chamadas equações de atualização, pois atualizam
as estimativas at e Rt (obtendo mt e Ct) usando a última observação disponível para Yt
13
(isto é, yt). Assim, produzem-se estimativas de t usando-se as informações
disponíveis até o instante t, inclusive. Note-se, por exemplo, que mt é a soma de at
mais uma correção do erro de previsão do sistema em t, dado por yt - Ft'.at. Portanto,
a estimativa at, (que usa a informação disponível até t-1, apenas) é corrigida ou
atualizada quando fica disponível a última observação yt. O fator de correção, dado
por Rt.Ft / t, é chamado Ganho do Filtro.
O estimador gerado pelo Filtro de Kalman possui a propriedade de ser aquele que
minimiza o erro quadrático médio de previsão dentre todos os estimadores
lineares. Na hipótese de normalidade dos resíduos das observações, ele estende esta
propriedade para todos os estimadores, lineares ou não15.
Na formulação bayesiana, as recurssões do filtro de Kalman são representadas em

termos de distribuições a priori e a posteriori para o vetor de estado em t, da
seguinte maneira:
a) Posteriori em t-1: (t-1/t-1) ~ N(mt-1, Ct-1)
b) Priori em t: (t/t-1) ~ N(at, Rt)
c) Posteriori em t: (t/t) ~ N(mt, Ct)
A aplicação prática do Filtro de Kalman apresenta um problema de inicialização. Na

hora de se começar as recussões com o Filtro no instante t = 1, é preciso conhecer-se
os valores iniciai m0 e c0. Para a solução deste problema, existem, basicamente, duas
propostas:
a) usar as primeiras k observações para se achar estimativas iniciais de m 0 e

C0, começando-se as recussões em t = k+1, onde k é o número de componentes
a serem estimados, ou;
b) assumir uma priori difusa16, isto é, supor m0 = 0 e C0 = cI, onde I é uma

matriz identidade de ordem mxm e c é um número grande;
As estimativas obtidas com m t e Ct apresentadas acima não usam toda a informação

contida na amostra, excessão feita ao instante t = T, onde T é o último período da
amostra para o qual existe observação disponível. Isto ocorre porque mt e Ct usam a
informação disponível do instante 1 até o instante t, somente. Se queremos obter
estimativas mais eficientes, o procedimento adequado é usarmos, para cada instante t,
toda a amostra de dados (de 1 a T). Este procedimento denomina-se amortecimento
ou suavizamento e operacionalmente envolve aplicar o Filtro de Kalman no sentido
inverso, isto é, de traz para frente17.
15
Ver Harvey (1981).
16
Assumir uma priori difusa é sinônimo de supor ignorância total a priori com relação aos valores
que pode assumir o vetor de estado.
17
Ver Harvey (1981).
14
As previsões com o Filtro de Kalman envolvem dois passos:
a) no primeiro, prevê-se o vetor de estado e sua matriz de variância-

covariância;
b) no segundo, as observações futuras para Yt e sua variância de previsão.
Assim, supondo j passos à frente de previsão, a partir de um instante genérico t,

escreve-se:
a) Vetor de Estado:
at+j/t = Gt+j.at+j-1/t
Rt+j/t = Gt+j.Rt+j-1/t.G't+j + Wt
b) Observações Futuras:
 t+j/t = F't+j.at+j/t
Y
 t+j/t = F't+j . Rt+j/t . Ft+J + Vt
onde:
at+j/t = E(t+j/t) Rt+j/t = Var(t+j/t)
 t j/t  E(Yt j/t )

Y  t j/t  Var(Yt j/t )

3.3. Operacionalização do Modelo Estrutural
Uma vez introduzidos o conceito de MLD e o Filtro de Kalman, o problema de se

estimar os componentes não observáveis do modelo estrutural envolve escrever as
equações (2) a (5), (7) e (8) em termo do MLD. Isto é feito escrevendo-se os vetores
Ft, t , vt e wt, e as matrizes Gt, Vt e Wt, da seguinte maneira:
a) vetor Ft
F’ = [ 1 0 ¦ 1 0 ¦ 1 0 ... 1 0 1 ]
b) vetor de estado t:
 t = [  t  t ¦ t *t ¦  1,t  1*,t   s/2,t  *s/2,t ]
c) matriz de transição Gt:
15
1 1 
0 1 0
(22)
0
(22s )
0 
(21)
 
 0 .cos  .sen 
 (22) .sen  .cos  0 0 
(22s ) (21) 
G  D1 
(52s2s )  
 0 0  0 
(2s2) (2s2)
D
(2s1) 
 s 
 (102) 0 0 Ds1 
 (12) (12s ) 
onde:
 cosi sen i 
Di    i = 1, ..., s’
 sen i cosi 
Ds1  coss1 s’ = s/2-1
d) resíduo observacional vt:
vt = t
e) vetor de resíduos do sistema w t:

wt  vt vt wt w*t w1,t w1*,t  ws1,t 
f) variância observacional Vt:
V = 
16
g) variância dos resíduos do sistema W t:
 
  
 
0
( 22s1) 
 
 
  wc 
W  0 
( 2s12s1)
 ( 2s12) *wc 
 
 Q1 
  
 
 Qs1 
onde:
 0
Qi   wi * 
 0 wi 
Qs1  w,s/2
3.4. Hiperparâmetros
A solução do problema de estimação do vetor de estados t fica perfeitamente

determinada se, além do vetor de observações Yt, a todo instante, for conhecida,
também, a seguinte quádrupla:
Mt = [Ft, Gt, Vt, Wt]
O vetor Mt é conhecido como vetor de caracterização do sistema.
No caso dos modelos estruturais, o vetor Ft é sempre conhecido a priori. Se o modelo

especificado não tiver a componente cíclica, então Gt também será conhecida. Caso a
especificação adotada inclua a componente cíclica, G conterá dois componentes
desconhecidos, e , que terão de ser identificados (estimados) antes de se começar
as recurssões com o Filtro. Os elementos de V e W são todos desconhecidos e terão de
ser, também, especificados a priori.
Os elementos desconhecidos que precisam ser especificados são denominados

hiperparâmetros do modelo estrutural podem ser relacionados através do seguinte
vetor H:
H
(1(6s1))

     wc *wc w1 *w1  ws1 
17
A abordagem bayesiana implementada no BATS não admite a componente cíclica no
modelo. No contexto clássico, que admite a especificação desta componente, a
estimação dos hiperparâmetros e  a ela associados, juntamente com os demais, é
feita via maximização da função de verosimilhança escrita para os erros de previsão
do sistema, sobre o que não falaremos aqui18.
Na abordagem bayesiana, a determinação dos hiperparâmetros é feita via lei de

variância, para Vt, e via fatores de desconto, para Wt.
a) Lei de Variância para Vt: a hipótese de que V é uma constante conhecida

é pouco realista na prática, porque muitas séries econômicas apresentam
heterocedasticidade; assim, a abordagem bayesiana assume que esta segue
uma determinada regra de formação, sendo expressa por uma lei de potência,
como:
Vt = t.bt
onde b é o expoente da lei, que é designado subjetivamente pelo usuário (um

valor considerado adequado para a grande maioria dos casos é b = 1.5) e t é o
coeficiente denominado fator de escala, cuja estimação é feita
sequencialmente19.
b) Fatores de Desconto para Wt: o uso de fatores de desconto baseia-se na

idéia de descontar a informação contida nas observações mais antigas; quanto
maior o desconto, mais adaptativo é o sistema e vice-versa. Na abordagem
bayesiana, o procedimento consiste em reescrever a equação (12) da seguinte
forma:
Rt = B.G.Ct-1.G'.B (12’)
Em (12'), B é a matriz de descontos, dada por:
B  Diag.[(1/ 1 ).I1 ,(1/ 2 ).I2 ,...,(1/ k ).Ik ]
onde:

i = fator de desconto associado à componente i (i = 1,...,k)
Ii = matriz identidade de ordem ni x ni
Os fatores de desconto assumem valores no intervalo (0,1]. O uso de B acima está

associado à possibilidade de se escrever a matriz de transição G estruturada em
blocos, um para cada componente do sistema, como abaixo:
18
Para tanto, ver Harvey (1989a).
19
Para uma descrição do procedimento de estimação sequencial deste fator de escala, ver Souza (1989),
Apêndice III.
18
G = Diag.(G1, G2, ..., Gk)
onde Gi = bloco matricial, de ordem ni x ni correspondente ao i-ésimo componente.
Note-se que, no procedimento acima, elimina-se Wt fazendo-se com que o elemento

de incerteza associado fique implícito na relação (12') através da matriz de descontos
B.
3.5. Intervenções
Recapitulando, os seguintes elementos têm de ser especificados pelo usuário, antes de

se utilizar a metodologia bayesiana para se estimar os componentes do modelo
estrutural:
a) Componentes do Modelo20
b) Priori Inicial m0 e c0
c) Expoente da Lei de Variância: b
d) Fatores de Desconto:  i i = 1,... , k.
A metodologia bayesiana fornece amplas possibilidades de intervenção, por parte do

usuário, para se incorporar efeitos externos à informações contidas na amostra.
Estritamente falando, o processo de intervenção consiste na interrupção do processo
de estimação do vetor de estados (isto é, das recurssões do Filtro de Kalman), para
fazer-se alterações associadas aos elementos acima.
Formalmente, a intervenção no período t se dá quando o Filtro de Kalman já

operacionalizou a estimativa da priori em t, isto é, quando já encontrou:
(t/t-1) ~ (at, Rt)
As modalidades para intervenção do tipo feed-forward, neste momento, e que são as

permitidas no BATS, consiste em:
a) alterar a priori em t, ou seja, assumir novos valores para a t e Rt (para a

média e a variância dos componentes estimados);
b) alterar o expoente da lei de variância;
c) alterar os fatores de desconto i (i = 1,...,k);
20
O modelo especificado pode conter os três componentes ou apenas dois deles. O BATS, por
exemplo, só permite que se especifique o modelo estrutural básico, isto é, com tendência e
sazonalidade apenas, sem o ciclo. O número de harmônicas também pode ser especificado a priori,
omitindo-se aquelas que são irrelevantes para descrever o padrão sazonal.
19
Além das modalidades acima, existe também a possibilidade de se alterar o fator de
desconto de excessão, no âmbito das intervenções automáticas do tipo feed-back.
Este fator é usado no processo de monitoração sequencial embutido no BATS 21
3.6. Avaliação dos Modelos
Diversas especificações alternativas são tentadas no processo de desenvolvimento dos

modelos estruturais. A fim de se poder compará-las, necessita-se de critérios de
avaliação dos modelos estimados, o que pode ser feito através dos seguintes testes e
medidas de aderência e previsão.
3.6.1. Medidas de Aderência
a) Erro Quadrático Médio (EQM)
T
  2t / t 1
j1k
EQM
T K
b) Desvio Absoluto Médio (DAM):

T
  t / t 1
j1 k
DAM 
T K
c) Logaritmo da Verossimilhança Preditiva (LVP):
T 1T 1T
LVP   ln(2)   ln ft    2t / t 1 / ft
2 2 t 1 2 t 1
3.6.2. Medidas e Testes de Previsão
a) Erro Quadrático Médio de Previsão (EQMP):
L
  2T j/T
j1
EQMP 
L
b) Desvio Absoluto Médio de Previsão (DAM):

T
  t / t 1
j1 k
DAM 
T K
c) Teste de Previsão Após a Amostra:
21
Ver West (1988) e Harisson (1989).
20
L
  2T j/T
j1
TPAA( L)  L
T
  2
t / t 1
j1k
(T  K)
onde:
 t / t1 = erro de previsão um passo à frente em t-1
T = número total de observações
k = número de componentes e parâmetros dos modelos estimados
L = número de passos de previsão após a amostra
ft = variância do erro de previsão  t / t1
21
Referências
Boletim de Conjuntura Industrial - vários números, IEI/FEA/UFRJ, Rio de Janeiro.
IBGE (1990) - Indicadores Conjunturais da Indústria - Série Relatórios

Metodológicos, v. 11, IBGE, Rio de Janeiro.
Indicadores de Conjuntura, Minas Gerais. Vários números, SEI/SEPLAN, Belo

Horizonte.
Harrisson, P. J. & Stevens, C. F. (1976) - Bayesian Forecasting (with discussion) -

Journal of The Royal Statistical Society, Series B, 38, 3, 205-267.
Harvey, A. C. (1981) - Time Series Models - Phillip Allan, U. K.
Harvey, A. C. (1989a) - Forecasting, Structural Time Series Models and the Kalman
Filter - Cambridge University Press, Cambridge, U.K.
Harvey, A. C. (1989b) - The Econometric Analysis of Time Series - 2nd Edition,

Handbooks in Economics, London School of Economics, Londres.
Markwald, R. A., Moreira, A. R. B. e Pereira, P. L. V. (1989) - Previsão da

Produção Industrial: Indicadores Antecedentes e Modelos de Série Temporal -
Pesquisa e Planejamento Econômico. 19(2), agosto.
Migon et alii (1986) - Modelos de Previsão para Séries de Produção e Preços:

Metodologia Bayesiana e de Box-Jenkins para Séries Temporais - IPEA, Texto para
Discussão nº 92, Rio de Janeiro.
Migon, H. S. e Pereira, P. L. V. (1987) - Procedimentos Bayesiano e Clássico em

Modelos Estruturais - Relatório Interno nº 4, IPEA, Rio de Janeiro.
Moreira, A. R. B., Migon, H. S. e Monteiro, A. B. (1992) - Previsões de Séries

Econômicas com Modelos Bayesianos Univariados - Texto para Discussão nº 250,
IPEA, Rio de Janeiro.
Souza, R. C. (1989) - Modelos Estruturais para Previsão de Séries Temporais:

Abordagens Clássica e Bayesiana - 17º Colóquio Brasileiro de Matemática, IMPA,
Rio de Janeiro.
West, M. (1986) - Bayesian Model Monitoring - Journal of The Royal Statistical

Society, B, 48, 1.
West, M. e Harrisson, J. - Subjective Intervention in Formal Models - Warwick

Research Report nº 120, Department of Statistics, University of Warwick, Coventry,
U. K.
22
West, M. e Harrisson, J. (1989) - Bayesian Forecasting and Dynamic Models -
Springer Verlag.
West, M., Harrison, J. e Pole, A. (1988) - BATS: A User Guide - Warwick Research
Report nº 114, Departmento of Statistics, University of Warwick, Coventry, U. K.
23

Notbayesianos

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Notbayesianos

Enviado por

Direitos autorais:

Formatos disponíveis

Texto Didático

Notas introdutórias sobre modelos bayesianos para

Rogério Silva de Mattos

O período compreendido pela década de 80 e início dos anos 90 teve reflexos

Ao longo de todo esse período, as condições de funcionamento da economia,

a) o processo recessivo, que, de um lado, aumentou a concentração industrial

b) o recrudescimento do processo inflacionário e o aumento de volatilidade

c) a desarticulação do sistema de incentivos governamentais, que não só

d) a progressiva liberalização comercial da economia, que vem trazendo - e

e) as frequentes mudanças das regras econômicas, introduzidas dentro e fora

Diversos são os estudos que enfocam os problemas estruturais da economia, em

Esse quadro sugere ser de interesse o desenvolvimento de estudos sobre alterações no

Diversas dessas técnicas são amplamente utilizadas, internacionalmente, para dar

Muitas das técnicas utilizadas, porém, não se adequam a contextos de elevada

Essas limitações são superadas no âmbito da metodologia de modelos estruturais de

Grosso modo, o que esta metodologia faz é permitir estimar os componentes de

A metodologia de modelos estruturais vem sendo aplicada ao estudo de séries

Nesta seção, procuraremos apenas introduzir as principais características dos modelos

A moderna abordagem de modelos estruturais para análise e previsão de séries

A abordagem de modelos estruturais se baseia em um conceito antigo da análise de

Tradicionalmente, à excessão do componente irregular, os componentes acima eram

A vantagem dos modelos estruturais em termos de previsão é bem conhecida, mas

Harisson e Stevens (1976) salientam que as vantagens inerentes à abordagem

a) Representação Paramétrica: as séries são representadas através de

b) Descrição Probabilística: a abordagem bayesiana explicita não apenas as

c) Descrição Sequencial: refere-se à capacidade do modelo de se alterar ou se

A característica a) é importante para evitar ambiguidades na análise das séries,

O item b) decorre da descrição sequencial em termos de distribuições a priori e a

Finalmente, o item c) determina a natureza dinâmica da metodologia e fornece a base

2.2. Possibilidades de Intervenção

A filosofia que suporta a idéia de intervenção baseia-se no fato de que, a todo

As intervenções consideradas pela metodologia bayesiana são de duas naturezas:

a) "Feed-forward": quando a intervenção é feita para se antecipar os efeitos

b) "Feed-back": quando não se sabe a priori da necessidade de intervir, mas,

Monitoração Detecção Conhecimento

2.3. Testes de Diagnóstico

O processo de construção de modelos é constituído de uma série de passos,

Nem todos os testes estão disponíveis no software comercial disponível para

b) medidas e testes de previsão:

2.4. Programa BATS

A aplicação da metodologia bayesiana apresentada nas seções anteriores é viabilizada

Nesta Seção, é apresentada a formalização de metodologia de modelos estruturais

A sequência de exposição adotada se iniciará com a forma de modelagem proposta

3.1. Modelo Estrutural

Yt = t + t + t + t (modelo aditivo) (1)

Yt = t . t . t . t (modelo multiplicativo)12 (1')

t = nível da série (componente de tendência)

t = t-1 + t-1 + vt

 *t t-1.sen +  *t1 .cos + w *t

 j,t   j,t 1.cos( j )   *j,t 1.cos( j )  w j,t

t representa o crescimento do nível,  o fator de amortecimento do ciclo e  a

O MLD é descrito pelas seguintes equações:

Yt = Ft't + vt vt ~ (0,Vt) (9)

Yt = vetor (1x1) de observações da variável Y em t.

Ft = vetor (mx1) conhecido em t

t = vetor (mx1) de estado do sistema em t

Gt = matriz (mxm) de transição em t

vt = vetor (1x1) de perturbação estocástica em t

wt = vetor (mx1) de perturbações estocásticas em t

O problema de estimação do MLD refere-se a encontrar estimativas para o vetor de

a solução do problema de estimação fica determinada pelo seguinte sistema de

Rt = Gt . Ct-1 . G' + Wt (12)

mt = at + Rt . Ft . (yt - Ft . at) / Qt (13)

 t t-1.sen +  t1 .cos + w *t

 t = [  t  t ¦ t t ¦  1,t  1,t   s/2,t  *s/2,t ]