Você está na página 1de 41

Nota Técnica

Métodos de ajuste sazonal para séries


de Business Tendency: um estudo de
caso para a Sondagem da Indústria
utilizando o método X13-ARIMA-
SEATS

NMEC/SUEP | IBRE
(nmec.ibre@fgv.br)

Prof. Pedro Costa Ferreira


José Lisboa Gondin
Daiane Marcolino de Mattos

Fevereiro de 2015

Núcleo de Métodos Estatísticos e Computacionais 4


Sumário

1. Introdução .........................................................................................................5
2. Possibilidades de Ajuste Sazonal ......................................................................6
2.1 Dummies Sazonais ...................................................................................6
2.2 Holt-Winters ..............................................................................................6
2.3 Modelos Estruturais ..................................................................................6
2.4 TRAMO/SEATS ........................................................................................7
2.5 X11 / X12-ARIMA......................................................................................7
3. Metodologia do X13-ARIMA-SEATS .................................................................8
3.1 Verificação de sazonalidade .....................................................................8
3.2 Pré-ajuste ............................................................................................... 10
3.3 Ajuste Sazonal ........................................................................................ 15
3.4 Diagnósticos ........................................................................................... 16
4. Métodos de ajuste para séries agregadas ....................................................... 17
5. Métodos de Agregação ................................................................................... 18
6. Políticas de Revisão ........................................................................................ 20
7. Estudo de Caso .............................................................................................. 21
7.1 Análise exploratória ................................................................................ 22
7.2 Ajuste Sazonal ........................................................................................ 25
8. Análise fora da amostra para estabilidade dos fatores sazonais ..................... 37
9. Conclusões e trabalhos futuros ....................................................................... 40
10. Referências ..................................................................................................... 40
11. Núcleo de Métodos Estatísticos e Computacionais ......................................... 42

Núcleo de Métodos Estatísticos e Computacionais 4


1. Introdução1
Uma série temporal, segundo a decomposição clássica, pode ser decomposta em quatro
componentes não observáveis: tendência, sazonalidade, ciclo e erro. A sazonalidade, principal objeto
de estudo desta nota, é causada por movimentos oscilatórios de mesma periodicidade que ocorrem
em período intra-anual, como variações climáticas, férias, feriados, entre outros. A ocorrência desses
eventos pode levar a conclusões inadequadas a respeito da série temporal em estudo. Por exemplo,
a oferta de emprego costuma aumentar, no final do ano, devido às festas natalinas, isto é, há uma
demanda maior por bens e serviços, elevando o nível de contratações de pessoas. Porém, como a
maioria das vagas é temporária, geralmente, há diminuição no nível de pessoal ocupado no período
seguinte. Para a análise econômica, o importante é detectar a diferença entre o que periodicamente
ocorre e o que de fato ocorre de diferente naquele período específico, possibilitando observar a
tendência e o ciclo da variável.

Dessa forma, precisa-se de uma ferramenta adequada que consiga remover essa
componente (a sazonalidade). A remoção da sazonalidade de uma série temporal é chamada de
ajuste sazonal ou dessazonalização. Diversos órgãos de estatística relevantes, como IBGE, Eurostat,
NIER e BLS, aplicam métodos sofisticados que permitem um ajuste sazonal de qualidade. É o caso
do software X12-ARIMA com sua nova versão já disponível, o X13-ARIMA-SEATS.

Esta nota técnica tem como objetivo principal o estudo de metodologias de ajuste sazonal
bem como sua aplicação. Com essa finalidade, esta fica dividida em mais seis seções. Na seção 2,
relata-se as principais possibilidades de ajuste sazonal encontradas internacionalmente. Dentre todas
as possibilidades, foi escolhido o software X13-ARIMA-SEATS. Na seção 3, há uma descrição do
software o X13-ARIMA-SEATS como, por exemplo, quando foi criado e como funciona teoricamente.
Na seção 4, são discutidos os métodos de ajuste direto e indireto, utilizados quando se ajusta uma
série temporal que tem origem ao agregarem-se outras séries. Na seção 5, são apresentados os
métodos utilizados para a agregação das séries temporais já ajustadas. A seção 6 trata das políticas
de revisões das séries temporais, que se referem ao que deve ser feito quando novas informações
estão disponíveis, e discute as vantagens e desvantagens de cada uma. E por fim, nas seções 7 e 8,
há um estudo de caso aplicado à Sondagem da Indústria de Transformação (FGV/ IBRE), no qual é
feito o ajuste sazonal e suas análises de adequação e, também, uma análise fora da amostra para a
estabilidade dos fatores sazonais.

1A equipe NMEC agradece a todas as pessoas que contribuíram para execução desta nota técnica,
em especial a Paulo Picchetti, Aloisio Campelo, Tabi Thuler, Sarah Piassi e Juliana Carneiro.

Núcleo de Métodos Estatísticos e Computacionais 5


2. Possibilidades de Ajuste Sazonal
É possível encontrar diversas metodologias que permitem a remoção da sazonalidade de
uma série temporal. Algumas são: (i) Dummies Sazonais; (ii) Holt-Winters; (iii) Modelos Estruturais;
(iv) Dainties; (v) TRAMO-SEATS e (vi) X11/X12-ARIMA. Abaixo, faz-se um breve comentário sobre as
mesmas.

2.1 Dummies Sazonais

Um dos métodos de ajustamento sazonal é dado pela inserção de variáveis dummies em um


modelo de regressão. Em casos em que a variável dependente, Y, tem um comportamento sazonal e
este não é totalmente captado pelo comportamento da variável independente, X, um modelo de
regressão com dummies sazonais pode ser uma boa alternativa de solução, porém, este só é
adequado quando o fator sazonal da variável explicada Y é constante (determinístico), o que não
ocorre em grande parte das séries econômicas. Um exemplo da aplicação de dummies sazonais
pode ser encontrado em Zellner (1979).

2.2 Holt-Winters

O método de suavização de Holt-Winters (HW) pode ser utilizado em séries temporais que
apresentam um padrão de comportamento com componentes de tendência e de sazonalidade, muito
encontradas nas séries históricas econômicas. HW é muito utilizado pela facilidade de entendimento
e aplicação não dispendiosa. As desvantagens da aplicação do método são as dificuldades em
determinar os valores apropriados de alguns parâmetros do modelo (as constantes de suavização) e
a impossibilidade e/ou dificuldade de estudar algumas estatísticas como, por exemplo, a média e a
variância da previsão, o que implica na construção de intervalos de confiança para a previsão
(Morettin & Toloi, 2006). Um exemplo de aplicação do método de suavização de Holt-Winters pode
ser encontrado em Rasmussen (2004).

2.3 Modelos Estruturais

A natureza determinística das componentes não observáveis do modelo de decomposição


clássico é inapropriada do ponto de vista prático. Uma maneira natural de contornar esse problema é
permitir uma variabilidade nessas componentes, considerando-se os modelos estruturais ou modelos
de espaço de estados (Morettin & Toloi, 2006). Um modelo estrutural nada mais é do que um modelo
de regressão em que as variáveis exploratórias são função do tempo e seus parâmetros variam ao
longo do tempo (Harvey & Shephard, 1993). Um exemplo de aplicação de modelos estruturais para a
correção de fatores sazonais pode ser encontrado em (Plosser, 1979). Como exemplo, pode-se citar
o software STAMP (Koopman et al., 2009) que utiliza métodos de espaço de estados com
componentes não observáveis.

Núcleo de Métodos Estatísticos e Computacionais 6


2.4 Dainties

No método Dainties, o ajuste é obtido através de uma regressão por janela móvel. Para dados
trimestrais os componentes da regressão são: constante, tendência temporal, a tendência temporal
ao quadrado, tendência temporal ao cubo e três dummies sazonais. Os parâmetros estimados que
correspondem às dummies sazonais são usados para remover os padrões sazonais da série
temporal. O método Danties tem uma boa execução para séries que possuem sazonalidade
determinística, que não são as séries de estudo desta nota (Fok, Franses, & Paap, 2005).

2.5 TRAMO/SEATS

TRAMO (Time Series Regression with ARIMA Noise, Missing Observations and Outliers) e
SEATS (Signal Extraction in ARIMA Time Series) são programas desenvolvidos por Victor Gomez e
Agustin Maravall do Bank of Spain (Gómez & Maravall, 1997). Ambos os programas foram
estruturados para serem desenvolvidos juntos. O TRAMO pré-ajusta a série removendo diversos
efeitos determinísticos a partir de um modelo de regressão com processo ARIMA. O SEATS executa
o ajuste sazonal. Os dois programas são utilizados intensivamente por agências econômicas,
incluindo o European Central Bank e a Eurostat (European Commission Grant, 2007).

2.6 X11 / X12-ARIMA

O programa de ajuste sazonal X11 foi desenvolvido pelo U.S. Bureau of the Census em 1965
2
(Shiskin, Young and Musgrave, 1967). Utiliza, basicamente, filtros de médias móveis para estimar as
componentes de tendência e sazonalidade, porém acarreta problemas com o início e o fim da série
temporal pela baixa qualidade de filtros assimétricos, além de requerer um grande número de
revisões. Em 1980, Estella Dagum do Statistics Canada desenvolveu o X11-ARIMA que permitia a
extensão do início e do final das séries temporais através de um modelo ARIMA (Dagum, 1980). O
método reduziu o número de revisões. Em meados de 1990, o X12-ARIMA foi implementado pelo
U.S. Bureau of the Census possibilitando grandes melhorias ao X11-ARIMA (Findley & Hood, 1998).
A principal foi a inserção de variáveis regressoras (regARIMA) que podem afetar o comportamento da
série temporal como, por exemplo, quantidade de dias úteis e feriados, e o tratamento de outliers. O
X12-ARIMA era e ainda é utilizado em diversos órgãos internacionais além do U.S. Bureau of the
Census, como, por exemplo, o IBGE no Brasil (2010), Eurostat na Europa (2009), The Office for
National Statistics no Reino Unido (2007), Statistics Canada (2014).

Atualmente, já está disponível a nova versão do programa, o X13-ARIMA-SEATS, que une o


X12-ARIMA com o TRAMO/SEATS, desenvolvida pelo U.S. Bureau of the Census com o apoio do
Bank of Spain. Esta metodologia é exposta a seguir.

2
Existem outras metodologias que também utilizam filtros de médias móveis, como, por exemplo, STL (Cleveland et al, 1990).

Núcleo de Métodos Estatísticos e Computacionais 7


3. Metodologia do X13-ARIMA-SEATS
O X13-ARIMA-SEATS, criado em julho de 2012, é um programa de ajuste sazonal
desenvolvido por U.S Census Bureau com o apoio do Bank of Spain. Conforme observado na seção
2.6, é uma versão aprimorada do X11 (Shiskin, Young and Musgrave, 1967). O programa é a junção
dos softwares X12-ARIMA e TRAMO/SEATS com melhorias.
As melhorias incluem uma variedade de novos diagnósticos que ajudam o usuário a detectar e
corrigir inadequações no ajuste. O programa também inclui diversas ferramentas que superaram
problemas de ajuste e permitiram um aumento na quantidade de séries temporais econômicas que
podem ser ajustadas de maneira adequada (U.S. Bureau of the Census, 2013), além da possibilidade
de realizar um pré-ajuste na série temporal, isto é, uma correção antes de ser feito, de fato, o ajuste
sazonal.

3.1 Verificação de sazonalidade

Nas seções 3.2 e 3.3, explica-se como pode ser feito o pré-ajuste e o ajuste sazonal,
respectivamente, no entanto, é importante destacar que antes de dar início a essas etapas, sugere-se
que sejam executados alguns testes para verificar a presença de sazonalidade na série temporal,
uma vez que não se deve ajustar sazonalmente uma série que não apresenta sazonalidade
identificável. O ajuste inapropriado ou de baixa qualidade pode implicar em resultados errôneos e,
possivelmente, afetar a credibilidade do indicador (ESS Guidelines on Seasonal Adjustment, 2009).
A Eurostat sugere aplicação de testes estatísticos, que estão implementados no X13-ARIMA-
SEATS, para verificar a presença de sazonalidade em uma série temporal, como, por exemplo, o
Teste de Friedman, indicado por Fs na figura 1 e descrito a seguir. A partir da combinação dos
diversos testes é possível concluir se existe ou não sazonalidade na série.

Núcleo de Métodos Estatísticos e Computacionais 8


Figura 1: Combinação de testes de sazonalidade

Fonte: (Eurostat, 2014)

Teste de Friedman

O teste de Friedman (Friedman, 1937) é um teste não paramétrico que busca identificar
diferenças entre blocos para diversos tratamentos de uma amostra. É um teste alternativo à Análise
de Variância quando não é possível assumir que os dados vêm de uma população normalmente
distribuída. No contexto de uma série temporal mensal, os meses são considerados “tratamentos”, e
os anos são considerados “blocos”. Se houver sazonalidade, espera-se que as médias de, pelo
menos, dois meses tenham diferença significativa, isto é, ao longo dos anos é verificado que pelo
menos dois meses possuem comportamentos diferentes. A estatística de teste FD, formulada a
seguir, é calculada fazendo-se uma ordenação por rank (postos) dentro de cada bloco (mês).

k
12
FD  
bk (k  1) j 1
R.2j - 3b(k  1 )

Onde:
b é o número de blocos (anos);
k é o número de tratamentos (meses);
R é a soma dos postos do j-ésimo tratamento (mês).
.j

Núcleo de Métodos Estatísticos e Computacionais 9


FD pode ser aproximada por uma variável 𝜒 2 com 𝑘 − 1 graus de liberdade. Assim, o p-valor
2
é dado por 𝑃(𝑋 ≥ 𝐹𝐷), em que 𝑋 segue distribuição 𝜒𝑘−1 .
É conveniente destacar que o teste pode ser influenciado pela componente de tendência na
série temporal, sendo, portanto necessária a verificação e remoção da componente (Morettin & Toloi,
2006). Para verificar a componente de tendência, pode-se utilizar o teste Augmented Dickey-Fuller
(Dickey & Fuller, 1979), que testa a existência de raiz unitária (tendência estocástica) e de tendência
determinística.

Ao concluir que existe sazonalidade na série temporal de interesse, inicia-se a etapa de pré-
ajuste.

3.2 Pré-ajuste

Alguns eventos atípicos e/ou não sazonais como, por exemplo, efeitos do calendário, greves,
catástrofes, entre outros, podem afetar o padrão sazonal da série temporal e, consequentemente,
gerar um ajuste de qualidade inferior. O tratamento desses eventos deve ser feito, se necessário. A
esse tratamento dá-se o nome de pré-ajuste (Eurostat, 2014).
O tratamento de variáveis de calendário pode ser feito a partir do modelo regARIMA,
implementado no software X12-ARIMA. Este é uma combinação de um modelo de regressão linear
com um modelo ARIMA (modelo autorregressivo integrado de médias móveis). Se variáveis
regressoras não são usadas, o modelo se reduz a um modelo ARIMA apenas. Na parte da regressão
linear, são incluídas variáveis que podem afetar a sazonalidade presente na série temporal, por
exemplo: trading days, working days, holidays, outliers, entre outros. Tais variáveis são explicadas a
seguir. O tratamento adequado dessas variáveis pode melhorar a qualidade do ajuste final caso seja
verificado que as mesmas afetam o comportamento da sazonalidade presente na série temporal. Um
exemplo da aplicação de ajuste sazonal a partir do X13-ARIMA-SEATS com a utilização de trading
days pode ser encontrado em Livsey, Pang, & McElroy (2014). A definição das variáveis de
calendário é dada a seguir.

a) Trading Days (TD): Refere-se à quantidade de cada dia da semana em um mês qualquer (ou
trimestre) a cada ano. Por exemplo, suponha a tabela a seguir com a distribuição de dias da semana
para o mês de janeiro em quatro anos.

Núcleo de Métodos Estatísticos e Computacionais 10


Tabela 1: Trading Days (TD) – janeiro

Dias da Semana 2011 2012 2013 2014


Segunda-feira 5 5 4 4
Terça-feira 4 5 5 4
Quarta-feira 4 4 5 5
Quinta-feira 4 4 5 5
Sexta-feira 4 4 4 5
Sábado 5 4 4 4
Domingo 5 5 4 4
Fonte: NMEC.

Geralmente, cada dia da semana ocorre quatro vezes em um mês. Às vezes, um dia extra,
dependendo do dia da semana, pode ter um efeito significativo, principalmente para as séries
temporais em que a atividade diária depende do dia da semana, como produção industrial,
construção, Produto Interno Bruto, comércio e etc.
Trading days são afetados por feriados. Em caso de um feriado cair em um dia da semana, ele
é contabilizado como domingo, pois espera-se que a atividade de um feriado seja similar a de
domingo.

b) Working Days (WD): Pode ser considerado como uma versão mais simples do Trading Days.
Distingue entre dias úteis e finais de semana. Esse efeito pode ser significativo se a série temporal
em questão tem níveis de comportamento diferentes quando se comparam os dias úteis e os fins de
semana. A tabela a seguir ilustra a distribuição dos dias para quatro anos no mês de janeiro.

Tabela 2: Working Days (WD) – janeiro


Dias 2011 2012 2013 2014
Seg. à Sex 21 22 23 23
Finais de Semana 10 9 8 8
Fonte: NMEC.

c) Leap Year: O ano bissexto refere-se ao ano que possui um dia adicional no mês de fevereiro.

d) Moving Holidays: Moving Holidays são feriados móveis, isto é, feriados que caem em diferentes
dias ou meses de ano em ano. Por exemplo: Páscoa, Carnaval e Corpus Christi. Os feriados móveis
podem afetar uma atividade econômica não somente na data em que ele cai, mas também antes e
depois dela.

e) Outliers: Além dos efeitos de calendário, é possível o tratamento de eventos inesperados que
afetam o comportamento da série temporal, conforme dito no início da seção. Exemplos desses
eventos são: greves, desastres naturais, crises econômicas e manifestações, entre outros eventos
sociais, econômicos ou ambientais. Esses eventos são tratados como outliers (valores atípicos ou
extremos) e afetam o ajuste negativamente, influenciando na qualidade da previsão e na estimação

Núcleo de Métodos Estatísticos e Computacionais 11


das componentes de decomposição. Tanto X12-ARIMA, a partir do regARIMA, quanto o
TRAMO/SEATS detectam e corrigem outliers. É permitido que o usuário informe os outliers em vez
3
de o programa detectá-los automaticamente. Alguns dos principais tipos de outliers identificados pelo
X13 são enunciados a seguir.

i. Additive Outlier (AO): O outlier aditivo afeta apenas uma observação. É modelado por:

1, para t  t 0
AOtt0   (1)
0, para t  t 0
A Figura 2 ilustra um outlier do tipo AO.

Figura 2: Additive Outlier (AO)

Fonte: NMEC; (Eurostat, 2014)

ii. Level Shift (LS): O outlier do tipo LS provoca uma mudança no nível da série temporal. É
modelado por:

 1, para t  t0
LStt0   (2)
0, para t  t0

A Figura 3 ilustra um outlier do tipo LS.

3
Outros tipos de outliers podem ser encotrados na seção 4 de X13-ARIMA-SEATS Reference Manual Accessible HTML
Output Version, 2013.

Núcleo de Métodos Estatísticos e Computacionais 12


Figura 3: Level Shift (LS)

Fonte: NMEC; (Eurostat, 2014)

iii. Temporary Change (TC): O outlier do tipo TC provoca uma mudança temporária no nível da
série temporal. É modelado por:

0, para t  t0

TCtt0   t  t (3)
 , para t  t0
 0

Onde 𝛼 é a taxa de decaimento de volta para o nível anterior, 0 < 𝛼 < 1.

A Figura 4 ilustra um outlier do tipo TC.

Figura 4: Temporary Change (TC)

Fonte: NMEC; (Eurostat, 2014)

Núcleo de Métodos Estatísticos e Computacionais 13


f) Outras Variáveis: O usuário pode definir e informar outras variáveis que de alguma forma podem
explicar o comportamento da série temporal. As variáveis de regressão mais utilizadas são condições
climáticas e variáveis socioeconômicas (taxas e indicadores). Por exemplo, vendas de ar
condicionado são influenciadas pela temperatura.

Depois da identificação das variáveis, é feito o teste de significância das mesmas. Variáveis
não significantes devem ser excluídas do modelo.

Modelo ARIMA

Em relação à parte ARIMA do modelo, é possível o usuário determinar a ordem do ARIMA


desejado ou então o modelo será ajustado de acordo com os critérios do programa (AIC, BIC,
Hannan-Quinn, entre outros).
Assim, tem-se o seguinte modelo:

Yt  X t   Z t (4)

Onde:
𝑌𝑡 é a série temporal;
𝑋𝑡 é a matriz de variáveis de regressão (trading days, working days, holidays, etc);
𝛽 é um vetor coluna de parâmetros para cada variável de regressão;
𝑍𝑡 é o processo ARIMA.

Adequação do Modelo

Uma vez escolhido o modelo, é necessário verificar se o mesmo é adequado


estatisticamente. Isso pode ser verificado por meio dos diagnósticos fornecidos pelo programa. Deve-
se observar os parâmetros estimados e o comportamento dos resíduos. Para que o modelo seja
considerado adequado, algumas necessidades precisam ser validadas. Caso contrário, o modelo
pode estar mal especificado, e isso implicará na má estimação dos parâmetros do modelo e em
previsões ruins.

a) Significância dos parâmetros: Os parâmetros das variáveis inseridas no modelo precisam ter
significância estatística; usualmente considera-se o nível de 5% de significância. Caso um parâmetro
de alguma variável de regressão não seja significativo no modelo, esta deve ser tirada e o modelo
deve ser reestimado.

b) Normalidade: Os resíduos devem seguir distribuição normal com média zero e variância
constante. Esta propriedade pode ser verificada através de testes estatísticos: Teste de Jarque-Bera
(Jarque-Bera Test, 1980), Teste de Doornik-Hansen (Doornik & Hansen, 1994) ou Teste de Shapiro
Wilk (Shapiro Wilk Test, 1965).

c) Independência: Os valores dos resíduos no tempo presente não devem ter alguma relação com
seus valores passados. Esta propriedade pode ser testada pelos testes de autocorrelação de Box-
Pierce (Box-Pierce Test, 1970) ou de Ljung-Box (Ljung & Box, 1978).

Núcleo de Métodos Estatísticos e Computacionais 14


d) Aleatoriedade: É esperado que os resíduos se comportem de forma aleatória, ou seja, não há
períodos em que o resíduo seja significativamente maior (ou menor) que em outros períodos. Espera-
se que os resíduos estejam bem distribuídos em torno de zero, isto é, que possuam média e variância
constantes ao longo do tempo. Teste estatístico: Teste de Wald-Wolfowitz (Wald & Wolfowitz, 1943).

3.3 Ajuste Sazonal

Uma vez identificada a componente sazonal e feito o pré-ajuste, é possível ajustar a série
sazonalmente. O programa X13-ARIMA-SEATS pode realizar o ajuste de duas formas: através do
X11 ou através do SEATS. Ambas as formas podem ser escolhidas pelo usuário.

3.3.1 Método X11

O método X11 (Shiskin, Young and Musgrave, 1967) utiliza médias móveis para decompor a
série temporal em três componentes: tendência-ciclo (doravante tendência), sazonalidade e irregular.
A decomposição pode ser aditiva ou multiplicativa; sendo que a multiplicativa se torna aditiva a partir
da transformação logarítmica. O programa usa dois tipos diferentes de médias móveis com o
propósito de estimar a tendência e a componente sazonal. Primeiro, a componente de tendência é
removida e, em seguida, a sazonalidade.
O critério de escolha para os filtros de tendência, estimada a partir dos filtros de Henderson
(Findley et al., 1998) é baseado no tamanho relativo entre as variações das componentes irregular e
de tendência. Para os filtros sazonais, no tamanho médio relativo entre os movimentos das
componentes irregular e sazonal de todos os meses ou trimestres (European Commission Grant,
2007). Ambos os critérios para o tamanho dos filtros são feitos de forma automática pelo programa,
no entanto, é permitido ao usuário especificá-los.
Feita a decomposição da série temporal a partir do método X11, a série dessazonalizada é
estimada. No caso de um modelo aditivo, a série sem sazonalidade é obtida subtraindo-se a
componente sazonal da série original. Já no caso de um modelo multiplicativo, a série com ajuste
sazonal é obtida dividindo-se a série original pela componente sazonal estimada.

3.3.2 TRAMO/SEATS4

Como visto na seção 2.4, TRAMO/SEATS foram desenvolvidos por Victor Gomez e Agustin
Maravall do Bank of Spain (Gómez & Maravall, 1997). Ambos foram estruturados para serem
desenvolvidos juntos. O TRAMO pré-ajusta a série removendo diversos efeitos determinísticos a
partir de um modelo de regressão com ARIMA erros. É similar ao regARIMA visto anteriormente. O
SEATS executa o ajuste sazonal.

4
A metodologia básica é descrita em Gómez e Maravall (1992, 1994, 1996, e 2001a) e Gómez, Maravall e Peña (1999).

Núcleo de Métodos Estatísticos e Computacionais 15


O TRAMO funciona para dados de frequências trimestrais e mensais. O tamanho mínimo
necessário de observações é de 36 para dados mensais e 16 para dados trimestrais. O programa é
utilizado para a estimação e previsão de modelos de regressão e processo ARIMA com observações
faltantes (missing values) e vários tipos de outliers. As variáveis de regressão que geralmente ajudam
a melhorar o pré-ajuste, como, por exemplo, trading days e variáveis dummies, podem ser inseridas
pelo usuário. O modelo ARIMA é identificado automaticamente, porém, também é permitido ao
usuário informar ao programa. O modelo ajustado final é o mesmo descrito em (4). Por default, o
programa estima os parâmetros pelo método da máxima verossimilhança exata (deixando como
opção mínimos quadrados condicionais/não condicionais). Além disso, o programa detecta e corrige
diferentes tipos de outliers; calcula previsões ideais para a série, juntamente com o seu erro
quadrático médio; produz interpolações ótimas para os valores faltantes e o seu erro quadrático
médio associado; contém as opções para identificação automática do modelo e tratamento
automático de outliers (European Commission Grant, 2007)
O SEATS, assim como o TRAMO, funciona para dados trimestrais e mensais. O programa
decompõe a série temporal em suas componentes não observáveis utilizando filtros derivados do
modelo ARIMA passados pelo TRAMO. A decomposição pode ser aditiva ou multiplicativa, sendo que
a multiplicativa se torna aditiva a partir de log. Caso outliers e efeitos determinísticos não tenham sido
inclusos no modelo e não existam observações faltantes, o SEATS pode ser executado sozinho, uma
vez que há implementado nele a mesma rotina do TRAMO para a obtenção do modelo ARIMA.
(European Commission Grant, 2007).

3.4 Diagnósticos

É indicado avaliar a qualidade do ajuste sazonal regularmente. O X13-ARIMA-SEATS


disponibiliza o teste estatístico QS e o gráfico SI ratio para essa finalidade.

Diagnóstico QS: O teste estatístico QS tem o objetivo de detectar sazonalidade nos dados. É
aplicado aos dados originais, aos dados corrigidos por valores extremos, aos dados
dessazonalizados, aos resíduos do modelo ARIMA na fase do pré-ajuste e à componente irregular.
Em séries temporais longas (pelo menos 7 anos), também é aplicado aos três últimos anos. A
hipótese nula do teste é que não existe sazonalidade na série temporal.

Diagnóstico SI ratio: O SI ratio é a série temporal apenas com as componentes de sazonalidade (S)
e irregular (I), em outras palavras, é a série original sem a tendência-ciclo. O gráfico SI ratio é uma
ferramenta útil para analisar o comportamento dos fatores sazonais periodicamente (mensal ou
trimestral). Se foi feito um ajuste sazonal de qualidade, espera-se que os SI ratios acompanhem os
fatores sazonais, caso contrário há indícios que a componente irregular domina a série temporal, e
esta não foi decomposta apropriadamente. Neste caso, sugere-se o uso de um filtro de médias
móveis mais curto do que o escolhido automaticamente, se a opção utilizada foi o X11. A seguir, um

Núcleo de Métodos Estatísticos e Computacionais 16


exemplo de gráfico SI, em que os fatores sazonais acompanham e não acompanham (mês de
dezembro) os SI ratios.

Figura 5: SI ratio e fatores sazonais

Fonte: (Eurostat, 2014)

4. Métodos de ajuste para séries agregadas


Comumente, uma série temporal pode surgir a partir da agregação de outras séries temporais.
Nesses casos, é necessário discutir sobre a forma mais adequada de dessazonalização. Há dois
métodos de ajuste sazonal para uma série agregada: (i) direto e (ii) indireto, ambos definidos a seguir.

a) Método Direto: o ajuste é feito apenas sobre a série já agregada, ou seja, primeiro ocorre a
agregação das séries temporais e, em seguida, a dessazonalização da série resultante.

b) Método Indireto: o ajuste é feito, individualmente, em cada série temporal que compõe a série
final de interesse e, em seguida, é feita a agregação das séries dessazonalizadas.

Os principais trabalhos sobre sazonalidade não apresentam evidência teórica ou empírica que
indique uma preferência clara de um método em detrimento do outro em um contexto geral. Contudo,
questões subjetivas devem ser consideradas em cada caso. Estudos empíricos mostram que não há
grande diferença entre os dois métodos (Eurostat, 2014), principalmente, quando todas as séries que
compõem a série final, ou pelo menos as séries com maior importância (peso) na agregação,
possuem sazonalidade identificável.
O método direto pode proporcionar maior transparência e precisão, por exemplo, no caso em
que o indicador é mais bem conhecido e compreendido do que suas componentes. Já o método
indireto é indicado quando as séries temporais que compõem a série agregada têm padrões muito
distintos, pois assim é possível uma atenção mais específica para cada série resultando em um pré-
ajuste mais eficaz. Isso ocorre, uma vez que cada série temporal pode ser influenciada por efeitos

Núcleo de Métodos Estatísticos e Computacionais 17


determinísticos diferentes ou até mesmo apresentar um resultado diferente com relação ao mesmo
evento determinístico, por exemplo, o impacto da crise de 2008 surge nos indicadores Sondagem da
Indústria da Transformação em períodos distintos com impactos significativamente diferentes. Assim,
o método indireto pode proporcionar um melhor diagnóstico, e consequentemente, uma melhor
estimativa dos fatores sazonais.

5. Métodos de Agregação
Diversas séries temporais têm sua origem a partir da agregação de outras séries temporais.
Nesse caso, é importante analisar o impacto da volatilidade e nível de um dos indicadores na série
agregada. Nesta seção, serão apresentados três principais métodos de agregação que são,
largamente, utilizados. São eles: (i) Média Aritmética Simples; (ii) Inverso da Volatilidade, e (iii)
Padronização. Todavia, apenas o método de Padronização será utilizado no estudo de caso deste
documento.

Considere Z t a série agregada pelas componentes X t1 , X t2 , , X tn e t é o período de tempo.

i. Média Aritmética Simples: Nesse método, em cada tempo t, é feita a média aritmética simples
de todas as séries temporais, no entanto, caso alguma série temporal possua alguma
importância maior na formação da série agregada, é mais indicada uma média ponderada.

X t
i
(5)
Zt  i 1
n

ii. Inverso da Volatilidade: Nesse método, é aplicada uma média ponderada. Cada série temporal
tem o peso inversamente proporcional à sua volatilidade. Assim, quanto mais volátil é a série,
menos peso a mesma recebe.

Primeiro, as séries são padronizadas para terem média zero e desvio padrão um:

X ti  X
Yt 
i
(6)
SD i

Onde:


T
Xi
t 1 t
X
T

T
( X ti  X ) 2
SD i  t 1
T 1

𝑡 = 1, 2, . . . , 𝑇.

Núcleo de Métodos Estatísticos e Computacionais 18


Em seguida, os Fatores (F) e os Pesos(P) são calculados para cada série 𝑖 em todo o tempo 𝑡:

Yt i Ft j
Ft i  Pj  (7)
X ti 
n
Fi
i 1 t

Finalmente, a série agregada é dada por:

Zt  i 1 P i X ti
n
(8)

Onde:


T
Pi
t 1 t
P i

T

iii. Padronização: Nesse método, a série agregada surge como reparametrização para os
parâmetros da média e do desvio-padrão. A nova média passa a ser 100 e o desvio-padrão, 10.

Primeiro, as séries são padronizadas para terem média zero e desvio padrão um:

X ti  X
Yt i  (9)
SD i

Onde:

t 1 X ti
T

X
T


T
( X ti  X ) 2
SD i  t 1
T 1

𝑡 = 1, 2, . . . , 𝑇.

Em seguida, a série Z t agregada é obtida a partir da média ponderada com o respectivo peso

wi de cada série temporal padronizada anteriormente:


n
wYi
i 1 i t
Zt  (10)
i 1 wi
n

Por fim, a série Z t padronizada novamente para ter média 100 e desvio-padrão 10.

Z Z 
Z t'   t  10  100 (11)
 SZ 

Núcleo de Métodos Estatísticos e Computacionais 19


Onde:

 Z ti
T

Z  t 1
T

t 1 (Z ti 
T
Z )2
SZ 
T 1
𝑡 = 1, 2, . . . , 𝑇.

É importante ressaltar que método (i) está sujeito à influência causada por nível e flutuações de
alguma série específica, uma vez que pondera todas as séries com o mesmo peso. Por outro lado, o
método (iii) apresenta vantagem em relação ao método (ii), pois corrige possíveis distorções entre
flutuações e nível de forma menos invasiva e mais inteligível, além disso, o método (iii) permite que
as séries sejam ponderadas com relação ao sua importância no agregado final.

6. Políticas de Revisão5
Quando novas informações se tornam disponíveis, o ajuste sazonal dos dados deve ser refeito,
no entanto, um dado novo pode alterar todos os valores da série temporal ajustada se comparada
com o ajuste anterior sem essa nova informação. Dessa forma, nesta seção, discutem-se os quatro
métodos de revisão de uma série temporal. Segundo Glossary of Statistical Terms (OECD), revisão
refere-se a qualquer mudança no valor de uma estatística já publicada por algum instituto oficial de
estatística. Existem quatro tipos de revisão (ESS Guidelines on Seasonal Adjustment, 2009):

i. Corrente: modelo ARIMA, filtros, outliers, variáveis de regressão são reidentificados, e os


seus respectivos parâmetros e fatores são reestimados para certo período de tempo pré-
estabelecido, por exemplo, 12 meses.
ii. Concomitante: modelo ARIMA, filtros, outliers, variáveis de regressão são reidentificados, e
os seus respectivos parâmetros e fatores são reestimados sempre que um novo dado se
torna disponível.
iii. Concomitante parcial: o modelo ARIMA, filtros, outliers, variáveis de regressão são
reidentificados anualmente, e seus respectivos parâmetros e fatores são reestimados. Assim,
sempre que um novo dado estiver disponível, é feito o ajuste sazonal na série temporal inteira
mantendo as configurações do modelo daquele ano.
iv. Concomitante controlado: sempre que um novo dado estiver disponível, é feito o ajuste
Corrente e o ajuste Concomitante parcial. Em seguida, comparam-se os resultados.

5 Mais informações em Fok, Franses & Paap (2005).

Núcleo de Métodos Estatísticos e Computacionais 20


7. Estudo de Caso
6
A Sondagem da Indústria fornece indicações sobre o momento atual e as tendências de curto
prazo do setor industrial brasileiro. Devido à sua importância no cenário econômico, por fornecer
informações para a tomada de decisões empresariais, para a formulação de políticas econômicas
pelo Governo, entre outras utilidades, é relevante uma análise de dados rigorosa em relação aos
dados dessazonalizados divulgados pela instituição. A série histórica teve seu início em 1966, sendo
divulgada trimestralmente. A partir de outubro de 2005, passou a ter periodicidade mensal.
O Índice de Confiança da Indústria (ICI) é o indicador-síntese da pesquisa. É calculado a partir
7
da média ponderada das seguintes variáveis (figura 1): (i) Nível de Demanda Global (NDG); (ii) Nível
de Estoques (NdE); (iii) Situação Atual dos Negócios (SAN); (iv) Produção Prevista (PrP); (v)
Emprego Previsto (EmP); (vi) Tendência dos Negócios (TdN). Ressalte-se que NDG é obtida
agregando-se as variáveis Nível de Demanda Interna e Externa (NDI e NDE, respectivamente). Por
último, há ainda a série NUCI (Nível de Utilização da Capacidade Instalada), contudo, este não é
contabilizado no cálculo de ICI.

Figura 6: Composição do Índice de Confiança da Indústria.

Fonte: Elaborado por NMEC a partir da FGV/IBRE.

O valor do ICI em cada período permite avaliar o grau de aquecimento da atividade industrial:
se o índice se encontra acima de 100, está acima da média histórica do período 1996-2005,
refletindo, portanto, satisfação do setor industrial com o estado dos negócios e/ou otimismo em
relação ao futuro. Analogamente, para valores abaixo dessa referência, configura-se uma situação de
insatisfação/pessimismo (FGV/IBRE, 2014).
Para obter o ICI com ajuste sazonal, serão utilizados os métodos direto e indireto. No método
direto, todas as séries que compõem o ICI serão agregadas e por fim, a série resultante será
ajustada. No método indireto, cada uma das séries que compõem o ICI serão ajustadas pelo método
direto, com exceção da série NDG (método indireto), nesta as séries NDE e NDI serão ajustadas e
agregadas para formar a série NDG com ajuste sazonal. Por fim, obtidas as séries com ajuste
sazonal, estas serão agregadas e resultarão no ICI com ajuste sazonal.
Esse estudo de caso está dividido da seguinte forma: primeiro, será feita uma análise
exploratória das séries temporais, pela qual se revelam indícios de existência de sazonalidade e

6
Para informações mais detalhadas sobre a Sondagem da Indústria, acesse o Portal IBRE da FGV (http://portalibre.fgv.br).
7 Inverso da volatilidade, ver seção 5.

Núcleo de Métodos Estatísticos e Computacionais 21


outros comportamentos da série temporal; em seguida, há a seção de ajuste sazonal, em que é feito
o teste de confirmação de sazonalidade e, consequentemente, a dessazonalização das séries
temporais que compõem o ICI pelo software X13-ARIMA-SEATS. Nessa seção, também, é abordado
o método direto e indireto, e, ao final, é feita a comparação entre os dois. Por último, perfaz-se a
análise fora da amostra para estabilidade dos fatores sazonais, com o intuito de comparar a série
ajustada final com a série obtida a partir dos fatores previstos.
Os dados utilizados para o estudo compreendem o período de outubro de 2005 a novembro de
2014, contabilizando 110 observações.

7.1 Análise exploratória

Nesta seção, são visualizadas medidas estatísticas que buscam descrever o comportamento
dos dados para as séries temporais de interesse relatadas anteriormente.
Cada série temporal que compõe o ICI possui média e desvio-padrão consideravelmente
diferentes, vide tabela 4, sendo Nível de Demanda Externa e Nível de Estoques as únicas com
8
médias inferiores a 100 (pessimismo).

Tabela 4: Média e Desvio-padrão das séries históricas da Sondagem da Indústria -


out/2005 a nov/2014.

ICI NDG NDI NDE NdE SAN PrP EmP TdN NUCI
Média 103,12 103,9 106,6 92,71 95,45 110,80 124,76 110,83 138,08 83,82
Desvio-
Padrão 10,87 13,96 15,21 11,43 4,94 15,77 16,87 12,30 18,87 1,96

Fonte: NMEC.

No gráfico 1, com exceção da Produção Prevista (PrP), todas as séries que compõem o ICI
sugerem uma quebra estrutural, em outras palavras, apresentam variações no nível e flutuações
irregulares ao longo do tempo. É notável, também, que, no período que antecede a crise econômica,
no final de 2009, há um crescimento na expectativa da atividade industrial, entretanto, ao longo do
tempo, percebe-se um decrescimento em grande parte das séries.

8
NUCI é uma série mensurada, então sua interpretação não é a mesma para as demais séries no estudo.

Núcleo de Métodos Estatísticos e Computacionais 22


Gráfico 1: Séries históricas da Sondagem da Indústria – out/2005 a jun/2014.

Fonte: NMEC.

No gráfico 2, pode-se analisar o nível de cada série histórica ao longo dos meses do ano. O
Nível de Estoque (NdE), por exemplo, apresenta, relativamente, a mesma média (linha vermelha) em
todos os meses, com os níveis de janeiro e dezembro apresentando maior variação (linha preta). De
forma oposta, a Produção Prevista (PrP) possui magnitudes de variações semelhantes em todos os
meses, porém os meses de abril a setembro possuem níveis de expectativas maiores do que os
meses restantes.

Gráfico 2: Séries históricas da Sondagem da Indústria por mês – out/2005 a nov/2014.

Núcleo de Métodos Estatísticos e Computacionais 23


Fonte: NMEC.

Núcleo de Métodos Estatísticos e Computacionais 24


Uma vez que os comportamentos das séries temporais e dos padrões sazonais são distintos,
espera-se que o ajuste sazonal pelo método indireto dê resultados mais adequados do que os
resultados obtidos pelo método direto.

7.2 Ajuste Sazonal

Conforme a análise exploratória (seção 7.1), acredita-se que o método indireto pode fornecer
um ajuste sazonal mais adequado, uma vez que as séries temporais possuem comportamentos
diferentes. Para efeito de comparações, serão executados os métodos direto e indireto. Este exemplo
inicia-se pelo método direto, no qual o ICI sem ajuste sazonal foi obtido agregando-se as séries
temporais que o compõem (mencionadas no início da seção 7) por meio do método de padronização,
detalhado na seção 5. Em seguida, realiza-se o método indireto. Após a finalização do ajuste sazonal
em cada uma das séries, estas são agregadas também, pelo do método de padronização.
Como primeiro passo, é necessária a confirmação de que a série temporal possui
sazonalidade detectável. Inicialmente, foi aplicado o teste de raiz unitária Augmented Dickey-Fuller,
ADF (Dickey & Fuller, 1979) para confirmar se as séries são estacionárias ou não devido a
tendências determinísticas ou estocásticas (raiz unitária). Os resultados podem ser vistos na tabela 5.

Tabela 5: Teste de raiz unitária Augmented Dickey-Fuller.


Estatística Valor
Tipo de Equação Lag Conclusão
de teste 𝝉 crítico
Com raiz unitária
ICI constante 23 -2,0402 -2,88
+ constante
Sem raiz unitária
NDG constante + tendência 12 -3,8689 -3,43 + tendência
determinística
Com raiz unitária
NDE constante 12 -2,4525 -2,88
+ constante
Sem raiz unitária
NDI constante + tendência 12 -3,7371 -3,43 + tendência
determinística
Sem raiz unitária
NdE constante 12 -3,8933 -2,88
+ constante
Com raiz unitária
SAN constante 18 -2,6898 -2,88
+ constante
Sem raiz unitária
PrP constante 12 -3,3701 -2,88
+ constante
Com raiz unitária
sem constante e sem
EmP 23 -0,744 -1,95 s/ constante e s/
tendência
tendência
Com raiz unitária
TdN constante 23 -2,8717 -2,88
+ constante
Sem raiz unitária
NUCI constante 24 -2,1216 -2,88
+ constante
Fonte: NMEC utilizando o software R.

Como foram encontradas raízes unitárias em grande parte das séries, tomou-se a primeira
diferença, e foi recalculado o teste ADF, não tendo sido, então, encontrada raiz unitária. Para a série
NDG e NDI, ambas com tendência determinística, o teste ADF foi feito sobre os resíduos obtidos a
partir da série original subtraída da tendência encontrada. Para tanto foi usado um modelo de
regressão linear simples cuja variável explicativa foi o tempo. Note-se, também, que a estatística de

Núcleo de Métodos Estatísticos e Computacionais 25


teste 𝝉 e o valor crítico para a série TdN são quase os mesmos, podendo não ser adequada a
conclusão de que a série possua raiz unitária.
Na tabela 6, a seguir, mostra-se o teste de Friedman para as séries sem tendência
estocástica ou determinística.

Tabela 6: Teste de Friedman para a verificação de sazonalidade.

Original Diferenciada

Estatística de Teste p-valor Estatística de Teste p-valor

ICI 28,4615 0,0002 59,8269 0,0000


9
NDG 25,5095 0,0077 28,5961 0,0026

NDE 14,1449 0,2251 25,4102 0,0079


10
NDI 27,8761 0,0034 29,0576 0,0022

NdE 12,2021 0,3486 --- ---

SAN 16,4463 0,1253 39,5970 0,0000

PrP 69,3533 0,0000 --- ---

EmP 58,0860 0,0000 70,0400 0,0000

TdN 14,9140 0,1865 31,5975 0,0008

NUCI 70,1347 0,0000 --- ---

Fonte: NMEC.

Importante ressaltar que algumas conclusões a respeito do teste de Friedman são diferentes
quando se comparam os resultados para as séries originais e diferenciadas, como, por exemplo, para
a série NDE. Considerando nível de significância de 0,1%, o mesmo assumido pela Eurostat - sendo
este mais rigoroso no que concerne a séries temporais que não deveriam ser ajustadas-, apenas as
séries NDI, SAN, PrP, EmP, TdN e ICI poderiam ser dessazonalizadas. Ocorre que, ao considerar
5% de significância, além das séries anteriores, a série NDG, também, poderia ajustada. Neste
documento, é considerado o nível de 5% de significância.
Em uma análise mais profunda do teste ADF, foi visto que nem todos os resíduos dos modelos
ajustados possuem variância constante. Nesse caso o teste pode fornecer conclusões inadequadas.
Dessa forma, aplicou-se também o teste de Phillips-Perron (Phillips & Perron, 1988). A conclusão do
teste foi diferente para as séries NDG e NDI, nas quais foram encontradas raízes unitárias em vez de
tendência determinística, como no teste ADF; porém o teste de Friedman confirmou a existência de
sazonalidade nas séries temporais. Também houve diferença de conclusão para a série NdE, na qual
o teste de Phillips-Perron encontrou raiz unitária, contrariamente ao teste ADF. Assim, o teste de
Friedman executado na série NdE diferenciada forneceu p-valor de 0,019, concluindo-se que a série
apresenta sazonalidade ao nível de significância de 5%.

9
A série NDG sem tendência determinística foi obtida a partir dos resíduos do modelo de regressão linear simples.
10
A série NDI sem tendência determinística foi obtida a partir dos resíduos do modelo de regressão linear simples.

Núcleo de Métodos Estatísticos e Computacionais 26


Método Direto

Por meio do teste de Friedman visto na tabela 6, foi detectada sazonalidade identificável na série
histórica do ICI ao nível de confiança de 95%, concluindo-se que o ajuste sazonal pode ser realizado.
O ICI utilizado nesse primeiro exemplo foi obtido através da agregação das seis séries que o
compõem pelo método de padronização. Os resultados estão a seguir.
11
Foi modelado um ARIMA(0 1 0)(1 0 1)12 pelo programa NMEC_AS . Este segue as
especificações vistas na tabela 7. Três outliers foram detectados pelo programa. Todos são
explicados pela crise econômica nos meses finais de 2008 e têm significância estatística.

Tabela 7: Pré-ajuste X13-ARIMA-SEATS

Coeficientes Estimativas P-valor


-07
LS2008.Oct -9,6185 2,69e
-16
LS2008.Nov -16,5798 < 2e
-05
LS2008.Dec -7,50529 5,28e
MA Não Sazonal-1 -0,23152 0,0132
-05
MA Não Sazonal-2 -0,3656 8,16e
-16
MA-Sazonal-1 0,6810 < 2e
Fonte: NMEC.

De acordo com o teste de Ljung-Box, os resíduos não são autocorrelacionados. Além disso, o
teste fornecido pelo X13 pela estatística QS indica que não foi encontrada sazonalidade na série
ajustada, nas séries dos resíduos do modelo e no componente irregular. Conclui-se, dessa forma,
que o modelo segue os pressupostos necessários vistos na seção 3.1. O gráfico do ICI com ajuste
sazonal pode ser visto a seguir.

Gráfico 3: Índice de Confiança da Indústria (ICI) com ajuste sazonal


out/2005 a nov/2014.

Fonte: NMEC.

11
Programa de ajuste sazonal desenvolvido pelo NMEC que utiliza o X13-ARIMA-SEATS implementado no software R.

Núcleo de Métodos Estatísticos e Computacionais 27


O gráfico 4 mostra o comportamento dos fatores sazonais ao longo dos meses. Percebe-se
que a média dos fatores sazonais (FS) possui níveis diferentes em cada mês, mas os fatores
sazonais aparentam um comportamento estável, contribuindo para uma previsão menos errática.

Gráfico 4: Fatores Sazonais (FS) para o ICI


out/2005 a nov/2014.

Fonte: NMEC.

Método Indireto
12
A seguir, considera-se o ajuste individual para cada uma das séries que compõem o ICI, a
começar pelo Nível de Demanda Global.

a) Nível de Demanda Global (NDG):

Foi modelado um ARIMA(0 1 0)(1 0 1)12 pelo programa. Este segue as especificações vistas na
tabela 8. Três outliers foram detectados pelo programa. Embora não tenha sido encontrada
justificativa teórica para inserção do outlier Level Shift em maio de 2006, preferiu-se deixá-lo, por ter
influenciado, positivamente, a qualidade do ajuste.

Tabela 8: Pré-ajuste X13-ARIMA-SEATS

Coeficientes Estimativas P-valor


-05
LS2006.May -14,7128 4,10e
-05
LS2008.Oct -13,5699 3,42e
-16
LS2008.Nov -27,8208 < 2e
-16
AR-Sazonal-1 0,8837 < 2e
-07
MA-Sazonal-1 0,4813 1,29e
Fonte: NMEC.

12 Em nenhuma das séries foram inseridos efeitos de calendário devido à falta de justificativa teórica e/ou estatística.

Núcleo de Métodos Estatísticos e Computacionais 28


Todos os parâmetros do modelo são significativos, os resíduos não são autocorrelacionados de
acordo com o teste de Ljung-Box, bem como seguem distribuição normal. Assim, apresentam-se o
ajuste sazonal e o gráfico dos fatores sazonais (FS), respectivamente, nos gráficos 5 e 6.

Gráfico 5: Nível de Demanda Global (NDG) com ajuste sazonal


out/2005 a nov/2014.

Fonte: NMEC.

Gráfico 6: Fatores Sazonais (FS) para NDG – out/2005 a nov/2014.

Fonte: NMEC.

Pelo gráfico 6, pode-se ver que os fatores sazonais se alteram de um mês para outro,
confirmando-se a sazonalidade na série temporal. Além disso, esses fatores sazonais acompanham
bem os SI ratios, concluindo que não há sazonalidade no componente irregular.
Foi aplicado o teste de Friedman na série com ajuste sazonal, não tendo indicado sazonalidade
(p-valor = 0,9976). Por meio do teste da estatística QS, fornecida pelo X13, conclui-se, ademais, que
a sazonalidade foi removida da série temporal e que não há resquícios nos resíduos do modelo,

Núcleo de Métodos Estatísticos e Computacionais 29


tampouco no componente irregular. Dessa maneira, considera-se esse ajuste sazonal para a série de
Nível de Demanda Global (NDG) adequado.

b) Nível de Demanda Externa (NDE):

Mesmo concluindo, pelo emprego do teste de Friedman, que a série NDE poderia ser ajustada,
o X13-ARIMA-SEATS não considerou a série com componente de sazonalidade. Logo, a série não foi
ajustada.

c) Nível de Demanda Interna (NDI):

Foi modelado um ARIMA(0 1 2)(1 0 1)12 pelo programa NMEC-AS. Este segue as
especificações vistas na tabela 9. Assim como em NDG, um outlier, em maio de 2006, foi detectado e
mantido, por melhorar a qualidade do ajuste.

Tabela 9: Pré-ajuste X13-ARIMA-SEATS

Coeficientes Estimativas P-valor


-06
LS2006.May -15,3835 9,88e
-16
LS2008.Nov -30,1277 < 2e
-16
AR-Sazonal-1 0,9468 < 2e
MA Não Sazonal-1 -0,0504 0,502
-09
MA Não Sazonal-2 -0,4391 6,58e
-15
MA Sazonal-2 0,6502 1,65e
Fonte: NMEC.

Com exceção do primeiro MA não sazonal, os parâmetros restantes do modelo são


significativos, os resíduos não são autocorrelacionados de acordo com o teste de Ljung-Box e
seguem distribuição normal. A seguir, o ajuste sazonal e o gráfico dos fatores sazonais (FS) vistos,
respectivamente, nos gráficos 7 e 8.

Núcleo de Métodos Estatísticos e Computacionais 30


Gráfico 7: Nível de Demanda Interna (NDI) com ajuste sazonal
out/2005 a nov/2014.

Fonte: NMEC.

Gráfico 8: Fatores Sazonais (FS) para NDI – out/2005 a nov/2014.

Fonte: NMEC.

Pelo gráfico 8, pode-se ver que os fatores sazonais se alteram de um mês para o outro,
confirmando a sazonalidade na série temporal. Além disso, esses fatores sazonais acompanham bem
os SI ratios, concluindo-se que não há sazonalidade no componente irregular.
Foi aplicado o teste de Friedman na série com ajuste sazonal, não tendo indicado sazonalidade
(p-valor = 0,9963). Por intermédio do teste da estatística QS, fornecida pelo X13, conclui-se, também,
que a sazonalidade foi removida da série temporal e que não há resquícios nem nos resíduos do
modelo, nem no componente irregular. Assim, considera-se esse ajuste sazonal para a série de Nível
de Demanda Interna (NDI) adequado.

Núcleo de Métodos Estatísticos e Computacionais 31


d) Nível de Estoques (NdE):

Mesmo concluindo, pelo emprego do teste de Friedman, que a série NdE poderia ser ajustada,
o X13-ARIMA-SEATS não considerou a série com componente de sazonalidade. Logo, a série não foi
ajustada.

e) Situação Atual dos Negócios (SAN):

Mesmo concluindo, pelo emprego do teste de Friedman, que a série SAN poderia ser ajustada,
o X13-ARIMA-SEATS não considerou a série com componente de sazonalidade. Logo, a série não foi
ajustada.

f) Produção Prevista (PrP):

Foi modelado um ARIMA(2 0 0)(0 1 1)12 pelo programa NMEC-AS. Este segue as
especificações vistas na tabela 10. Apenas um outlier foi detectado pelo programa; refere-se ao mês
de dezembro de 2005. Apesar de não ter sido encontrada justificativa teórica para inserção desse
Additive outlier, preferiu-se deixá-lo, por ter influenciado, positivamente, a qualidade do ajuste.

Tabela 10: Pré-ajuste X13-ARIMA-SEATS

Coeficientes Estimativas P-valor


AO2005.Dec 9,7249 0,0001
-16
AR Não Sazonal-1 1,2610 < 2e
-07
AR Não Sazonal-2 -0,3968 9,64e
-16
MA-Sazonal-1 0,9988 < 2e
Fonte: NMEC.

Todos os parâmetros do modelo são significativos, os resíduos não são autocorrelacionados de


acordo com o teste de Ljung-Box e seguem distribuição normal. A seguir, o ajuste sazonal e o gráfico
dos fatores sazonais (FS) vistos, respectivamente, nos gráficos 9 e 10.

Núcleo de Métodos Estatísticos e Computacionais 32


Gráfico 9: Produção Prevista (PrP) com ajuste sazonal
out/2005 a nov/2014.

Fonte: NMEC.

Gráfico 10: Fatores Sazonais (FS) para PrP – out/2005 a nov/2014.

Fonte: NMEC.

Pelo gráfico 10, pode-se ver que os fatores sazonais se alteram de um mês para outro, sendo
todos bastante estáveis, com uma exceção: o outlier encontrado em dezembro de 2005.
Foi aplicado o teste de Friedman na série com ajuste sazonal, que não indicou sazonalidade
(p-valor = 0,9998). Pelo teste da estatística QS, fornecida pelo X13, conclui-se, também, que a
sazonalidade foi removida da série temporal e que não há resquícios nos resíduos do modelo,
tampouco no componente irregular. Assim, considera-se esse ajuste sazonal para a série de
Produção Prevista (PrP) adequado.

Núcleo de Métodos Estatísticos e Computacionais 33


g) Emprego Previsto (EmP):

Foi modelado um ARIMA(2 1 0)(0 1 1)12 pelo programa. Este segue as especificações vistas na
tabela 11. Nenhum outlier foi detectado. Como, ao final, o ajuste revelou-se de boa qualidade, não
houve necessidade de inserir algum outro com referência à crise de 2008.

Tabela 11: Pré-ajuste X13-ARIMA-SEATS

Coeficientes Estimativas P-valor


AR Não Sazonal-1 0,1691 0,0518
AR Não Sazonal-2 0,2375 0,0072
-16
MA-Sazonal-1 0,9712 < 2e
Fonte: NMEC.

Com exceção do primeiro AR não sazonal, todos os parâmetros do modelo são significativos,
os resíduos não são autocorrelacionados de acordo com o teste de Ljung-Box e seguem distribuição
normal. A seguir, o ajuste sazonal e o gráfico dos fatores sazonais (FS) vistos, respectivamente, nos
gráficos 11 e 12.

Gráfico 11: Emprego Previsto (EmP) com ajuste sazonal


out/2005 a nov/2014.

Fonte: NMEC.

Núcleo de Métodos Estatísticos e Computacionais 34


Gráfico 12: Fatores Sazonais (FS) para EmP
out/2005 a nov/2014.

Fonte: NMEC.

Da análise do gráfico 12, pode-se perceber que os fatores sazonais se alteram de um mês para
outro e todos são bastante estáveis, assim como ocorreu em Produção Prevista.
Foi aplicado o teste de Friedman na série com ajuste sazonal, não tendo apontado
sazonalidade (p-valor = 0,96). O teste da estatística QS, fornecida pelo X13, permitiu a conclusão de
que a sazonalidade foi removida da série temporal e de que não há resquícios nem nos resíduos do
modelo, nem na componente irregular. Assim, considera-se esse ajuste sazonal para a série de
Emprego Previsto (EmP) adequado.

h) Tendência dos Negócios (TdN):

Mesmo concluindo, pelo emprego do teste de Friedman, que a série TdN poderia ser ajustada,
o X13-ARIMA-SEATS não considerou a série com componente de sazonalidade. Logo, a série não foi
ajustada.

Feito o ajuste nas séries que possuíam sazonalidade e agregando-as, obtém-se o Índice de
Confiança da Indústria (ICI) dessazonalizado pelo método indireto. A agregação foi feita pelo método
da padronização. Foram cooptadas as séries com e sem ajuste sazonal.

Núcleo de Métodos Estatísticos e Computacionais 35


Gráfico 13: Índice de Confiança da Indústria (ICI) com ajuste sazonal
out/2005 a nov/2014.

Fonte: NMEC.

Com a série do ICI ajustada sazonalmente, é possível concluir, por exemplo, que, no início de
2014, houve um leve decrescimento da expectativa enquanto que a série original indicava um
crescimento.
No gráfico a seguir, encontra-se a comparação entre os métodos de ajuste direto e indireto
para o Índice de Confiança da Indústria.

Gráfico 14: Comparação entre Índice de Confiança da Indústria (ICI) com ajuste
sazonal direto e indireto – out/2005 a nov/2014.

Fonte: NMEC.

Nota-se a diferença sútil entre os métodos, havendo mudança de interpretação entre alguns
meses em que o método direto indica crescimento, e o indireto, decrescimento, contudo em pequena
escala. O MAPE para a diferença entre essas séries é de 0,0088; considerado pequeno.

Núcleo de Métodos Estatísticos e Computacionais 36


8. Análise fora da amostra para estabilidade dos fatores sazonais

Nesta seção, propõe-se o ajuste das séries temporais até dezembro de 2010 e, em seguida, a
previsão dos fatores sazonais para os 12 meses seguintes, com o intuito de comparar a diferença
entre a série ajustada final com os dados previstos até dezembro de 2011 (cor amarela) e a série
ajustada final com os dados originais (série revisada). Isso será feito para os anos de 2010, 2011,
2012, 2013 e 2014.

Gráfico 15: Comparação entre a série prevista e a série revisada para o Nível
de Demanda Global (NDG) – out/2005 a nov/2014.

Fonte: NMEC.

Gráfico 16: Comparação entre a série prevista e a série revisada para o Nível de
Demanda Interna (NDI) – out/2005 a nov/2014.

Fonte: NMEC.

Núcleo de Métodos Estatísticos e Computacionais 37


Considerando-se os dados até dezembro de 2011, não foi encontrada sazonalidade na série de
NDG, sendo assim a série não foi ajustada naquele ano, acarretando considerável diferença entre a
série prevista e revisada. Isto ocorreu devido à série NDI também não ter sido ajustada nesse ano.
No gráfico 17 a seguir, nota-se, até dezembro de 2011, a nítida a diferença entre as séries
obtidas por fatores previstos e ajustada totalmente (revisada). Já no início de 2013, quase não há
diferença notável entre as duas séries.

Gráfico 17: Comparação entre a série prevista e a série revisada para Produção
Prevista (PrP) – out/2005 a nov/2014.

Fonte: NMEC.

Gráfico 18: Comparação entre a série prevista e a série revisada para Emprego
Previsto (EmP) – out/2005 a nov/2014.

Fonte: NMEC.

Núcleo de Métodos Estatísticos e Computacionais 38


Assim como em Produção Prevista (no gráfico anterior), há, também, uma diferença
considerável no ajuste de EmP até dezembro de 2011 e maior estabilidade a partir de janeiro de
2013.
Por fim, há o ICI agregado pelo método da padronização. Na série agregada final, também são
encontradas diferenças, porém em pequenas escalas, confirmadas na tabela 12 a partir do MAPE.

Gráfico 19: Comparação entre a série prevista e a série revisada para o Índice de
Confiança da Indústria (ICI) – out/2005 a nov/2014.

Fonte: NMEC.

Tabela 12: MAPE para as séries previstas e revisadas da Sondagem da


Indústria com ajuste sazonal - out/2005 a nov/2014.

ICI NDG NDI NDE NdE SAN PrP EmP TdN


0,0126 0,0160 0,0268 --- --- --- 0,0114 0,0124 ---
Fonte: NMEC.

Núcleo de Métodos Estatísticos e Computacionais 39


9. Conclusões e trabalhos futuros
A partir dos resultados vistos nas duas seções anteriores, pode-se concluir, para as séries de
dados da Sondagem da Indústria do IBRE/FGV, que não há grandes diferenças entre os métodos
direto e indireto. Em relação à estabilidade dos fatores sazonais, percebe-se que não são estáveis
para a série NDI, influenciando no ajuste para a série NDG - composta, também, pela série NDE que
não foi ajustada. Assim, ao agregarem-se as séries ajustadas por fatores previstos uma vez ao ano e
ao agregarem-se as séries ajustadas com todos os dados disponíveis até novembro de 2014 (série
revisada), o ICI revela duas interpretações diferentes para o ano de 2012: otimismo (acima de 100) e
pessimismo (abaixo de 100) para as duas formas de revisão (gráfico 19), embora não exista grande
diferença em valor absoluto. Dessa forma, ressalta-se a importância da discussão de políticas de
revisão.
Vale ressaltar, também, que as variáveis de calendário não foram utilizadas no modelo de pré-
ajuste, mas sabe-se que estas podem ter justificativa econômica e influenciar, positivamente, na
qualidade do ajuste. Logo, pretende-se melhorar o ajuste desses modelos futuramente.

10. Referências
Box-Pierce Test. (1970). "Distribution of Residual Autocorrelations in Autoregressive-Integrated Moving Average
Time Series Models", Journal of the American Statistical Association.
Canada, S. (2014). Statistics Canada Quality Guidelines. Fonte: Statistics Canada:
http://www.statcan.gc.ca/pub/12-539-x/2009001/seasonal-saisonnal-eng.htm
Cleveland, R. B., Cleveland, W. S., McRae, J. E., & Terpenning, I. (1990). STL: A Seasonal-Trend Decomposition
Procedures Based on Loess. Journal of Official Statistics.
Dagum, E. B. (1980). The X11-ARIMA Seasonal Adjustment Method. Statistics Canada, Ottawa.
Dickey, D. A., & Fuller, W. A. (1979). Distribution of the Estimators for Autoregressive Time Series With a Unit
Root. Journal of the American Statistical Association, 74.
Doornik, J. A., & Hansen, H. (1994). An Omnibus Test for Univariate and Multivariate Normality.
European Commission Grant. (2007). Seasonal Adjustment Methods and Pratices.
Eurostat. (2009). ESS Guidelines on Seasonal Adjustment. Methodologies and working papers, Eurostat -
European Comission.
Eurostat. (2014). Calendar effects. Acesso em 08 de 2014, disponível em Seasonal Adjusment: http://www.sa-
elearning.eu/calendar-effects-0
Eurostat. (2014). Pre-treatament. Fonte: Seasonal Adjustment: http://www.sa-elearning.eu/pre-treatment-0
Eurostat. (2014). Seasonal Adjustment. Fonte: E-learning Courses: http://www.sa-elearning.eu/
Eurostat. (2014). Seasonality tests. Fonte: Seasonal Adjustment: http://www.sa-elearning.eu/seasonality-tests
FGV/IBRE. (2014). Sondagens e Índices de Confiança. Fonte: Portal IBRE: http://portalibre.fgv.br/
Findley, & Hood. (1998). New Capabilities and Methods of the X-12-ARIMA Seasonal Adjustment Program.
Journal of Business and Economic Statistics, 16.
Findley, Monsell, Bell, Otto, & Chen. (1998). New Capabilities and Methods of the X-12-ARIMA Seasonal
Adjustment Program. Journal of Business and Economic.
Fok, D., Franses, P. H., & Paap, R. (2005). Performance of Seasonal Adjustment Procedures: Simulation and
Empirical Results. Econometric Institute Report.
Friedman, M. (1937). The Use of Ranks to Avoid the Assumption of Normality Implicit in the Analysis of Variance.
Journal of the American Statistical Association, 32.
Gómez, V., & Maravall, A. (1997). Programs TRAMO and SEATS; Instructions for the User. Working.
Harvey, A., & Shephard, N. (1993). Structural Time Series Models. In: Handbook of Statistics (Vol. 11). Elsevier
Science Publishers B.V.
IBGE. (Novembro de 2010). Nota Técnica - Aperfeiçoamento do Ajuste Sazonal. IBGE.
Jarque-Bera Test. (1980). Efficient tests for normality, homoscedasticity and serial independence of regression
residuals. Economic Letters.
Koopman, S. J., Harvey, A., Doornik, J., & Shephard, N. (2009). Structuural Time Series Analyser, Modeler, and
Predictor. Timberlake Consultants.
Livsey, J., Pang, O., & McElroy, T. (2014). Effect of Trading Day Regressors on Seasonal Adjustment of Growth
Rates . CSRM Research Report.

Núcleo de Métodos Estatísticos e Computacionais 40


Ljung, G. M., & Box, G. (1978). On a Measure of a Lack of Fit in Time Series Models. Biometrika.
Morettin, P. A., & Toloi, C. M. (2006). Análise de Séries Temporais (2ª ed.). São Paulo: Egard Blucher.
OECD. (s.d.). Data Revisions. Acesso em novembro de 2014, disponível em OECD Glossary of Statistical
Terms,: http://stats.oecd.org/glossary/detail.asp?ID=6704
ONS. (2007). Guide to Seasonal Adjustment with X-12-ARIMA.
Phillips, P. C., & Perron, P. (1988). Testing for a unit root in time series regression. Biomètrika.
Plosser, C. I. (1979). A Time Series Analysis of Seasonality in Econometric Models, Seasonal Analysis of
Economic Time Series.
Portal IBRE - FGV. (s.d.). Sondagens e Índices de Confiança. Acesso em 10 de 2014, disponível em Portal IBRE:
http://portalibre.fgv.br/
Rasmussen, R. (2004). On time series data and optimal parameters. The International Journal of Management
Science.
Shapiro Wilk Test. (1965). "An analysis of variance test for normality (complete samples)".
Shiskin, Young and Musgrave. (1967). The X-11 variant of the Census Method II seasonal adjustment program.
Technical Paper No. 15, U.S. Department of Commerce, U. S. Census Bureau.
U.S. Bureau of the Census. (2013). X13-ARIMA-SEATS Reference Manual Accessible HTML Output Version.
Wald, A., & Wolfowitz, J. (1943). An exact test for randomness in the non-parametric case based on serial
correlation. The Annals of Mathematical Statistics.
Zellner, A. (1979). Front matter to "Seasonal Analysis of Economic Time Series", Seasonal Analysis of Economic
Time Series.

Núcleo de Métodos Estatísticos e Computacionais 41


11. Núcleo de Métodos Estatísticos e Computacionais

Atividades:

 Desenvolver e atualizar métodos estatísticos e de Séries Temporais para as pesquisas


produzidas pela SUEP;
 Gerenciar bases de dados externas e Textos para Discussão - SUEP;
 Estudos e Pesquisas em parceria com a SACE e a SAINF;
 Treinamentos estatísticos e de Séries Temporais;
 Produzir Artigos e Notas Técnicas;

Equipe responsável pela NT (Métodos de ajuste sazonal para séries de Business Tendency:
um estudo de caso para a Sondagem da Indústria utilizando o método X13-ARIMA-SEATS):

Pedro Costa Ferreira


Mestre em Economia (UFJF-MG) e doutor em Engenharia Elétrica - Métodos de Apoio à
Decisão - (PUC-Rio). Atualmente é professor de Econometria de Séries Temporais e Estatística e
coordenador do Núcleo de Métodos Estatísticos e Computacionais (NMEC/IBRE | FGV). Principais
estudos são em Estatística e modelos de Séries Temporais aplicados ao Setor Elétrico, Inflação e
Business Cycle.
Contato: pedro.guilherme@fgv.br

José Lisboa Gondin


Mestre em Matemática (PUC-Rio) e Licenciado em Matemática (Unimontes). Ministrou
disciplinas em nível de graduação na UFRJ, UERJ e PUC-Rio. Técnico em Análises Econômicas
(NMEC/IBRE | FGV). Áreas de interesse: Geometria e Topologia, Estatística e Computacional.
Contato: jose.gondin@fgv.br

Daiane Marcolino de Mattos


Graduanda em Ciências Estatísticas (ENCE-RJ). Atualmente é Pesquisadora do Núcleo de
Métodos Estatísticos e Computacionais (NMEC/IBRE | FGV).
Contato: daiane.mattos@fgv.br

Núcleo de Métodos Estatísticos e Computacionais 42


Núcleo de Métodos Estatísticos e Computacionais 43

Você também pode gostar