Apostila ARIMA SEFAZ Gretl PDF

FACE – Faculdade de Administração, Ciências CURSO DE ANÁLISE DE SÉRIES
Contábeis e Ciências Econômicas

Curso de Ciências Econômicas TEMPORAIS – MODELO ARIMA
Direção FACE
Prof. Moisés Ferreira da Cunha MATERIAL DE APOIO
Vice-Direção FACE
Prof. Mauro Caetano de Souza
Coordenação do Curso de Ciências Econômicas Professor:
Prof.ª Priscila Casari Sandro Eduardo Monsueto
NEPEC – Núcleo de Estudos e Pesquisas
Econômicas
Coordenação
Sérgio Fornazier Meyrelles Filho
NEPEC/FACE/UFG
Goiânia – Setembro/Outubro 2014
Versão 1.0
Endereço
Campus Samambaia, Prédio da FACE – Rodovia
Goiânia/Nova Veneza, km. 0 – Caixa Postal 131,
CEP 74001-970, Goiânia – GO.
Tel. (62) 3521 – 1390
URL
http://www.face.ufg.br/economia
1
1. Introdução e conceitos básicos
Esta apostila serve de material de apoio para a realização do curso. Longe de ser
abrangente, tem como objetivo servir de guia ou de lembrete para a execução de
tarefas. Outros materiais, melhores e mais completos, podem ser facilmente
encontrados de forma gratuita na internet e em livros especializados no assunto. Para
realizar as estimações, iremos utilizar o pacote estatístico Gretl, disponível para baixar
gratuitamente no site gretl.sourceforge.net.
A primeira definição necessária para nossa análise é o conceito de série
temporal. Uma série temporal é uma sequência de dados no tempo com uma
determinada periodicidade. Alguns exemplos:
- PIB brasileiro trimestral.
- taxa de juros mensal.
- índice pluviométrico semanal.
- valor das ações da Petrobras minuto a minuto.
Ou seja, é o conjunto de informações sobre uma mesma variável ao longo de
vários períodos sequenciais. Ao longo deste curso, usaremos a seguinte notação
algébrica para representar os dados no tempo:
Yt: a observação no tempo t da variável Y.
Yt-1: a observação um período atrás, ou com uma defasagem (lag) temporal.
Yt+1: a observação um período a frente.
Generalizando:
Yt±j: a observação no período t±j
Exemplo:
Mês Período Yt Yt-1 Yt+1

1991.01 Y1 3,6 3,9
1991.02 Y2 3,9 3,6 2,5
1991.03 Y3 2,5 3,9 1,9
1991.04 Y4 1,9 2,5 2,7
1991.05 Y5 2,7 1,9 2,4
1991.06 Y6 2,4 2,7 1,6
1991.07 Y7 1,6 2,4 1,6
1991.08 Y8 1,6 1,6 1,7
1991.09 Y9 1,7 1,6 2,5
1991.10 Y10 2,5 1,7 -
O restante do material está constituído de uma série de exemplos estimados com

dados reais ou fictícios e telas explicativas das funções do programa Gretl. Ao longo do
curso serão acrescentados novos exemplos.
2
2. Exemplos de Modelos Autoregressivos – AR(p)
AR(1)
Modelo 1: ARMA, usando as observações 1995:01-2010:03 (T = 183)
Variável dependente: ipca
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,571725 0,11237 5,0879 <0,00001 ***
phi_1 0,788617 0,0471062 16,7413 <0,00001 ***
Média var. dependente 0,538361 D.P. var. dependente 0,519166
Média de inovações -0,006069 D.P. das inovações 0,326753
Log da verossimilhança -55,45739 Critério de Akaike 116,9148
Critério de Schwarz 126,5432 Critério Hannan-Quinn 120,8177
Real Imaginária Módulo Frequência

AR
Raiz 1 1,2680 0,0000 1,2680 0,0000
AR(2)
const 0,569602 0,108703 5,2400 <0,00001 ***
phi_1 0,815008 0,0755062 10,7939 <0,00001 ***
phi_2 -0,0338969 0,0758055 -0,4472 0,65476

AR
Raiz 1 1,2969 0,0000 1,2969 0,0000
Raiz 2 22,7468 0,0000 22,7468 0,0000
AR(3)
const 0,574432 0,115983 4,9527 <0,00001 ***
phi_1 0,819322 0,0755966 10,8381 <0,00001 ***
phi_2 -0,0819083 0,0988616 -0,8285 0,40738
phi_3 0,0579267 0,0767865 0,7544 0,45062

AR
Raiz 1 1,2395 0,0000 1,2395 0,0000
Raiz 2 0,0873 -3,7310 3,7320 -0,2463
Raiz 3 0,0873 3,7310 3,7320 0,2463
3
Exemplos de modelos AR(p) usando dados da Sefaz/GO:
ICMS – Taxa de crescimento
Variável dependente: d_l_ICMS
const 0,00567966 0,00816623 0,6955 0,48674
phi_1 -0,400336 0,0797424 -5,0204 <0,00001 ***

Média de inovações 0,000328 D.P. das inovações 0,130597
Log da verossimilhança 80,70000 Critério de Akaike -155,4000
Critério de Schwarz -146,7744 Critério Hannan-Quinn -151,8950

AR
Raiz 1 -2,4979 0,0000 2,4979 0,5000

const 0,00586463 0,00564463 1,0390 0,29882
phi_1 -0,542985 0,0815173 -6,6610 <0,00001 ***
phi_2 -0,354886 0,0815606 -4,3512 0,00001 ***


AR
Raiz 1 -0,7650 -1,4942 1,6786 -0,3253
Raiz 2 -0,7650 1,4942 1,6786 0,3253
4
3. Exemplos de Modelos de Média Móvel – MA(q)
MA(1)
const 0,543279 0,0464909 11,6857 <0,00001 ***
theta_1 0,611094 0,0422925 14,4492 <0,00001 ***

MA
Raiz 1 -1,6364 0,0000 1,6364 0,5000
MA(2)
const 0,546989 0,0585125 9,3482 <0,00001 ***
theta_1 0,881548 0,0774425 11,3833 <0,00001 ***
theta_2 0,387895 0,0583002 6,6534 <0,00001 ***


MA
Raiz 1 -1,1363 -1,1344 1,6056 -0,3751
Raiz 2 -1,1363 1,1344 1,6056 0,3751
MA(3)
const 0,550957 0,0646414 8,5233 <0,00001 ***
theta_1 0,782521 0,0735914 10,6333 <0,00001 ***
theta_2 0,5313 0,0810619 6,5542 <0,00001 ***
theta_3 0,251944 0,0703504 3,5813 0,00034 ***
MA
Raiz 1 -1,6714 0,0000 1,6714 0,5000
Raiz 2 -0,2187 -1,5254 1,5410 -0,2727
Raiz 3 -0,2187 1,5254 1,5410 0,2727
5
Exemplos de modelos MA(q) usando dados da Sefaz/GO:
const 0,00560753 0,00080953 6,9269 <0,00001 ***
theta_1 -0,924674 0,0416968 -22,1761 <0,00001 ***


MA
Raiz 1 1,0815 0,0000 1,0815 0,0000

const 0,00570155 0,000691485 8,2454 <0,00001 ***
theta_1 -0,824861 0,0936196 -8,8108 <0,00001 ***
theta_2 -0,115467 0,0992711 -1,1632 0,24477


MA
Raiz 1 1,0562 0,0000 1,0562 0,0000
Raiz 2 -8,1999 0,0000 8,1999 0,5000
6
4. Exemplos de Modelos ARMA (1,1)
Os modelos ARMA (p,q) combinam memória de longo prazo com memória de curto
prazo:
const 0,00569386 0,000702447 8,1057 <0,00001 ***
phi_1 0,102099 0,0982049 1,0397 0,29850
theta_1 -0,945348 0,046179 -20,4714 <0,00001 ***


AR
Raiz 1 9,7944 0,0000 9,7944 0,0000
MA
Raiz 1 1,0578 0,0000 1,0578 0,0000

Variável dependente: d_l_agropecuaria
const 0,00140343 0,00101435 1,3836 0,16649
phi_1 0,681096 0,0674072 10,1042 <0,00001 ***
theta_1 -1 0,0236957 -42,2017 <0,00001 ***
Média var. dependente -0,000077 D.P. var. dependente 0,162097


AR
Raiz 1 1,4682 0,0000 1,4682 0,0000
MA
Raiz 1 1,0000 0,0000 1,0000 0,0000
7
5. Estimar modelos ARMA/ARIMA no Gretl
Para estimar um modelo da classe ARMA/ARIMA, siga até o menu Modelo, clique
na opção Série Temporal e em seguida na opção ARIMA, como mostra a Figura abaixo:
Após esses passos, a tela abaixo irá aparecer. Selecione a variável que será
utilizada para previsão e delimite as ordens AR(p) e MA(q). Lembre-se que o modelo
ARMA tradicional não possui regressores extras.
Selecione a variável e
clique no botão lilás
Define a ordem AR(p)

- longo prazo
Define a ordem MA(q)

- curto prazo
8
6. O método Box-Jenkins de previsão
O objetivo do método é gerar um modelo com as seguintes características:
i. Estabilidade (módulo das raízes fora do círculo unitário)
ii. Resíduos na forma de Ruído Branco
a. Sem memória
b. Normalmente distribuído
c. Homocedástico
O MÉTODO BOX-JENKINS DE ESTIMAÇÃO DO MODELO ARIMA
9
7. O correlograma
Para gerar o correlograma de uma série temporal, clique sobre uma variável com
o botão direito do mouse e selecione a opção Correlograma:
O Resultado é exemplificado na Figura abaixo. Todas as autocorrelações que

ultrapassam o intervalo de confiança são estatisticamente diferente de zero, indicando
presença de algum tipo de memória na série.
Função de
Autocorrelação
Simples (FAC)
Função de
Autocorrelação
Parcial (FACP)
A interpretação do correlograma segue o esperado para cada tipo de modelo

teórico. Seguindo Bueno (2011), temos:
Fonte: Bueno (2011)
10
Correlograma esperado para um AR(1)
FAC – decaimento exponencial FACP – truncada na primeira defasagem
Correlograma esperado para um AR(2)

FAC – decaimento exponencial FACP – truncada na segunda defasagem
Correlograma esperado para um MA(2)

FAC – truncada na segunda defasagem FACP – decaimento exponencial
Correlograma esperado para um ARMA(2,1)

FAC – truncada na primeira e decaimento exponencial a partir FACP – truncada na segunda e decaimento exponencial a partir
da segunda defasagem da terceira defasagem
Contudo, lembre-se que na prática a identificação visual do modelo é

complicada, devendo o pesquisador utilizar o processo de tentativa e erro do
fluxograma apresentado anteriormente. Ou seja, a próxima etapa é verificar se o
modelo é estável para, em seguida, realizar o diagnóstico dos resíduos.
11
8. Estabilidade do modelo
Para verificar a estabilidade, basta observar se os módulos das raízes do modelo
são maiores do que 1, ou seja, se estão fora do círculo unitário. Se o modelo for não-
estável, volte à fase de identificação (correlograma) e escolha outra especificação. Se
obtiver estabilidade, prossiga para fase de diagnóstico dos resíduos.
Exemplo de modelo não-estável (raízes no círculo unitário).
O módulo da raiz
MA(1) não está
fora do círculo
unitário
Exemplo de modelo estável (raízes fora do círculo unitário).
O módulo de cada
raiz está fora do
círculo unitário
12
9. Diagnóstico de resíduos
Este diagnóstico tem como objetivo verificar se os resíduos são ruído branco, ou
seja, sem memória, normalmente distribuídos e homocedásticos (variância constante).
Para testar a presença de memória, são usados dois testes: o Correlograma dos
Resíduos e a estatística Ljung-Box. Ambas são acessadas na tela de resultados do
modelo, no menu Gráficos, opção Correlograma dos resíduos, como mostra a figura:
Teste da memória dos resíduos (correlograma e Ljung-Box)
Basta clicar em OK para o Gretl gerar

o correlograma dos resíduos e o
teste de Ljung-Box.
Neste resultado, vemos que o

correlograma dos resíduos
apresenta correlações
(memórias) significativamente
diferente de zero (barras
rompendo o intervalo de
confiança)
É um indício de que o modelo

não está bem estimado.
13
Da mesma forma, o Ljung-Box
confirma a presença de memória
nos resíduos, como mostram os
baixo [p-valores] obtidos após a 5ª
defasagem.
Um bom modelo exibe um [p-

valor] alto para todas as
defasagens, evidenciando a não
rejeição da hipótese nula de
correlação igual a zero.
Abaixo, vemos um exemplo do que seria um resíduo de um bom modelo

estimado, sem memória tanto pelo correlograma como pelo teste Ljung-Box:
Teste de normalidade dos resíduos

Para testar a
normalidade dos
resíduos, na tela do
modelo estimado,
clique no menu Testes
e na opção
Normalidade dos
resíduos.
14
O GRETL exibe um histograma dos
resíduos e o resultado do teste de
Doornik-Hansen na parte superior
esquerda da tela. Um p-valor (entre
colchetes) alto revela a não rejeição da
hipótese nula de normalidade dos
resíduos.
Um p-valor muito baixo mostra a
necessidade de se estimar um novo
modelo.
Teste ARCH para heterocedasticidade

O teste ARCH tem como
objetivo verificar se os resíduos
do modelo apresentam
variância constante
(homocedasticidade).
Menu Testes, opção ARCH.
Um p-valor muito alto revela a

não rejeição da hipótese nula de
homocedasticidade.
Um p-valor muito baixo mostra
que os resíduos são
heterocedásticos e um novo
modelo deve ser estimado
10. Comparação entre modelos

Na prática, mais de um modelo pode ser usado para representar a evolução da
série analisada. O pesquisador deve selecionar ao menos dois “modelos candidatos”
para compará-los e escolher qual deles será usado para a previsão. Um modelo
15
candidato é um modelo que passou por todos os diagnósticos anteriores. A escolha está,
em geral, baseada no equilíbrio entre parcimônia (economia de coeficientes) e nível de
ajustamento. Desta forma, três critérios gerais são comumente empregados:
1. Critérios de Informação: o GRETL fornece três critérios de informação. Estão
disponíveis automaticamente sempre que um modelo é estimado.
Deve-se buscar privilegiar o
modelo que gerar os menores
critérios de informação
2. Erro Médio e Erro Quadrado Médio: disponíveis no menu Análise, opção

Mostrar efetivo, ajustado, resíduos.
Quanto menores os erros médios, melhor é o nível de

ajustamento do modelo e melhor tende a ser a qualidade da
previsão
3. Significância dos coeficientes: em geral, busca-se eliminar os coeficientes de

memória que são não significativos, principalmente os últimos de cada
ordem (AR ou MA).
Coeficiente significativo a 10%
Coeficiente não significativo (p-valor

muito alto)
16
11. Previsão
Escolhido o modelo de análise, deve-se partir para a etapa de previsão. No GRETL
a previsão é bem simples. Suponha que desejamos prever o resultado de uma variável
k períodos a frente:
A previsão k períodos a
frente pode ser feita por
meio do menu Análise,
opção Previsões....
• Período para realizar a previsão
• Método de previsão (o mais usado

é a previsão automática)
• Opções para exibir o intervalo de

confiança da previsão
17
12. Séries não estacionárias
Até aqui, estávamos supondo que as séries eram estacionárias, ou seja, que
mantinham constante suas características fundamentais. Contudo, a maior parte das
séries econômicas apresentam algum tipo de tendência, fazendo com que sua média se
altere ao longo do tempo.
De maneira geral, trabalhamos com dois tipos de tendência:
• Tendência Determinística: gira em torno de um eixo aproximadamente fixo no

tempo. Também conhecidas como séries TSP (Trend Stationary Process -
Processo de Tendência Estacionária).
• Tendência Estocástica: não gira em torno a um eixo fixo, mas sim um eixo que se
altera com o passar do tempo. É também denominada de DSP (Difference
Stationary Process – Processo Estacionário por Diferença) ou ainda processo com
Raiz Unitária.
Antes de realizar a estimação do modelo ARMA, é necessário eliminar ou tratar
a tendência da séria. Cada tipo de tendência tem um tratamento diferente. No caso de
uma série do tipo DSP (raiz unitária), o caminho natural é a diferenciação, ou seja,
transformando a variável em sua primeira diferença. Em geral, a primeira diferença de
uma série é estacionaria.
Taxa de desemprego (em nível) Taxa de desemprego em primeira diferença
10 2,5
2
9
1,5
8
1
d_desemprego
7
desemprego
0,5
-0,5
4
-1
3
-1,5
1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
Logarítmo da Arrecadação na Agropecuária (em Primeira difeença do logaritmo da arrecadação

nível) na agropecuária
17,2 0,4
0,3
17
0,2
16,8 0,1
l_agropecuaria
0
d_l_agropecuaria
16,6
-0,1
16,4 -0,2
-0,3
16,2
-0,4
16 -0,5
2004 2006 2008 2010 2012 2014
-0,6
2004 2006 2008 2010 2012 2014
18
Para a situação de tendência determinística (TSP) deve-se primeiro extrair o
componente determinístico por meio de um modelo de M.Q.O. e utilizar os resíduos
estimados para modelar um ARMA. Uma alternativa seria estimar um modelo ARMAX,
onde X representa um conjunto de variáveis explicativas exógenas. No nosso caso, X
seria a tendência temporal determinística. As próximas seções mostram como
operacionalizar estas três situações (DSP, TSP e ARIMAX) no Gretl.
13. Modelo ARIMA (p,d,q)

O modelo ARIMA (p,d,q) é o indicado quando a série apresenta uma raiz unitária
ou tendência estocástica. Neste caso, podem ser tomados dois caminhos pelo Gretl. A
primeira opção é gerar a primeira diferença da variável e estimar um modelo ARMA (p,q)
sobre esta nova série estacionária.
Para gerar a primeira diferença de

uma série, selecione a variável e siga
até o menu Acrescentar, e depois na
opção Primeiras diferenças das
variáveis selecionadas.
Alternativamente, o pesquisador pode estimar diretamente um modelo ARIMA

(p,d,q) onde d é a quantidade de vezes que é preciso diferenciar a série original para se
obter algo estacionário. A estimação de um modelo ARIMA no Gretl segue os mesmos
passos de um modelo ARMA, com o adicional de que agora precisamos definir a ordem
de integração da série:
Após entrar pelo menu Modelos, opção Séries

Temporais, ARIMA, selecione as ordem p,d,q
Define a ordem de
integração da série
19
Note que, em termos de modelo, é a mesma coisa estimar um modelo
ARIMA(p,d,q) diretamente sobre a série original e estimar um ARMA (p,q) sobre a
primeira diferença das séries. Vemos estas duas alternativas nos modelos 1 e 2
respectivamente:
Estimando um ARIMA (1,1,1) para a série de L_energia original
Modelo 1: ARIMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: (1-L) l_ENERGIA
const 0,00468105 0,00806734 0,5802 0,56175
phi_1 -0,22456 0,112379 -1,9982 0,04569 **
theta_1 -0,746504 0,0918233 -8,1298 <0,00001 ***


AR
Raiz 1 -4,4532 0,0000 4,4532 0,5000
MA
Raiz 1 1,3396 0,0000 1,3396 0,0000
Estimando um ARMA(1,1) para a primeira diferença da série de L_energia

Variável dependente: d_l_ENERGIA
const 0,00468105 0,00806734 0,5802 0,56175
phi_1 -0,22456 0,112379 -1,9982 0,04569 **
theta_1 -0,746504 0,0918233 -8,1298 <0,00001 ***


AR
Raiz 1 -4,4532 0,0000 4,4532 0,5000
MA
Raiz 1 1,3396 0,0000 1,3396 0,0000
A diferença entre eles está no resultado da previsão. Enquanto o Modelo 1 faz a

previsão da série original, o Modelo 2 tem como previsão a primeira diferença da série.
Desta forma, na maior parte dos casos, é mais interessante estimar diretamente um
modelo ARIMA.
20
Observações importantes:
i. O correlograma para identificação inicial das ordens AR(p) e MA(q)
devem ser feitas em cima da primeira diferença da série.
ii. Deve-se sempre verificar se a primeira diferença é de fato estacionária.
14. Séries com tendência determinística

Para se estimar um modelo com tenência determinística, devemos primeiro
extrair o componente determinístico por meio de um modelo de Mínimos Quadrados
Ordinários. As etapas são:
1. Rodar um modelo de M.Q.O. com a tendência temporal como variável
dependente.
2. Extrair os resíduos deste modelo estimado.
3. Estimar um modelo ARMA(p,q) sobre os resíduos.
Para acrescentar uma tendência

temporal, clique no menu
Acrescentar e depois na opção
Tendência Temporal.
No menu Modelo, selecione a

opção Mínimos Quadrados
Ordinários. Acrescente a variável
time na lista de Regressores e
estime o modelo.
21
Depois de estimado o
modelo, salve os
resíduos por meio do
menu Salvar, opção
Resíduos. Isso irá
gerar uma nova
variável na base de
dados.
Abaixo, seguem os resultados para o tratamento da tendência determinística da

arrecadação do setor de Energia (em logaritmos).
Extração da tendência determinística
Modelo 12: MQO, usando as observações 2003:01-2013:12 (T = 132)
Variável dependente: l_ENERGIA
Coeficiente Erro Padrão razão-t p-valor

const 17,7131 0,0773861 228,8933 <0,00001 ***
time 0,0050459 0,00100969 4,9975 <0,00001 ***

Soma resíd. quadrados 25,40026 E.P. da regressão 0,442026
R-quadrado 0,161153 R-quadrado ajustado 0,154700
F(1, 130) 24,97460 P-valor(F) 1,84e-06
rô 0,021395 Durbin-Watson 1,956131
Arrecadação do setor de energia Resíduos do modelo de M.Q.O.

20
Resíduos da regressão (= observados - ajustados l_ENERGIA)
1,5
19,5
1
19
0,5
18,5
l_ENERGIA
0
18
resíduo
17,5 -0,5
17 -1
16,5
-1,5
16
2004 2006 2008 2010 2012 2014 -2
2004 2006 2008 2010 2012 2014
22
Modelo ARMA (1,1) sobre os resíduos de M.Q.O. – após extrair a tendência
determinística
Variável dependente: uhat12
const 0,00370065 0,0635819 0,0582 0,95359
phi_1 0,852921 0,0951371 8,9652 <0,00001 ***
theta_1 -0,744821 0,112997 -6,5915 <0,00001 ***
Média var. dependente -1,16e-15 D.P. var. dependente 0,440335


AR
Raiz 1 1,1724 0,0000 1,1724 0,0000
MA
Raiz 1 1,3426 0,0000 1,3426 0,0000
15. Modelo ARMAX para a tendência determinística

Alternativamente, a tendência determinística pode ser modelada junto com o
modelo ARMA (p,q), utilizando a tendência temporal como variável exógena. Neste
contexto, o modelo ARMA passa a ser conhecido como ARMAX, onde o X representa o
conjunto de variáveis extra.
Modelo ARMAX (1,1) para L_energia – compare com o modelo 13 da seção anterior.
Modelo 14: ARMAX, usando as observações 2003:01-2013:12 (T = 132)
Variável dependente: l_ENERGIA
const 17,7187 0,123729 143,2058 <0,00001 ***
phi_1 0,852917 0,0951118 8,9675 <0,00001 ***
theta_1 -0,744809 0,112962 -6,5935 <0,00001 ***
time 0,00501748 0,00159592 3,1439 0,00167 ***


AR
Raiz 1 1,1724 0,0000 1,1724 0,0000
MA
Raiz 1 1,3426 0,0000 1,3426 0,0000
23
Para estimar um modelo ARMAX, basta
acrescentar variáveis extra na lista de
Regressores. No nosso caso,
acrescentamos a variável time, que é a
tendência temporal.
16. Teste de Dickey-Fuller Aumentado (ADF)

O teste ADF foi originalmente desenhado para captar a presença de raiz unitária
na série (DSP). Contudo, também pode ser empregado para detectar a ocorrência de
tendência determinística (TSP). O teste possui a seguinte hipótese nula:
Ho: Presença de Raiz Unitária
Ha: Sem Raiz Unitária
Pode-se comparar o valor da estatística calculada com a tabela de valores críticos

de Dickey-fuller ou utilizar diretamente o p-valor. Um p-valor elevado (geralmente
acima de 0,10) aponta para a não rejeição de Ho e evidencia a presença de raiz unitária
na série. Por exemplo, o quadro abaixo mostra as três versões do teste para a taxa de
desemprego no Brasil. A esquerda, os p-valores elevados mostram que a série original
apresenta uma raiz unitária, enquanto sua primeira diferença aparenta ser estacionária.
Teste para Desemprego em nível Teste para a primeira diferença do
desemprego
Teste de Dickey-Fuller para desemprego Teste de Dickey-Fuller para d_desemprego
dimensão de amostragem 111 dimensão de amostragem 110
hipótese nula de raiz unitária: a = 1 hipótese nula de raiz unitária: a = 1
teste sem constante teste sem constante

modelo: (1-L)y = (a-1)*y(-1) + e modelo: (1-L)y = (a-1)*y(-1) + e
coeficiente de 1ª ordem para e: -0,029 coeficiente de 1ª ordem para e: -0,005
valor estimado de (a - 1): 0,000551086 valor estimado de (a - 1): -1,02869
estatística de teste: tau_nc(1) = 0,0669027 estatística de teste: tau_nc(1) = -10,7045
p-valor 0,702 p-valor 1,639e-068
teste com constante teste com constante

modelo: (1-L)y = b0 + (a-1)*y(-1) + e modelo: (1-L)y = b0 + (a-1)*y(-1) + e
coeficiente de 1ª ordem para e: 0,014 coeficiente de 1ª ordem para e: -0,005
valor estimado de (a - 1): -0,0750893 valor estimado de (a - 1): -1,03106
estatística de teste: tau_c(1) = -1,9269 estatística de teste: tau_c(1) = -10,6734
com constante e tendência com constante e tendência

modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + e modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + e
coeficiente de 1ª ordem para e: 0,038 coeficiente de 1ª ordem para e: -0,006
valor estimado de (a - 1): -0,153099 valor estimado de (a - 1): -1,03417
estatística de teste: tau_ct(1) = -3,01459 estatística de teste: tau_ct(1) = -10,6509
24
Contudo, a ausência de raiz unitária não implica necessariamente em uma série
estacionaria, uma vez que ainda pode estar presente a tendência determinística. Para
identificação correta, deve-se aplicar o teste ADF em sua versão mais completa
disponível no Gretl.
Para realizar o teste ADF, siga o esquema abaixo:
Selecione a variável, clique no menu Variável, e depois na opção Testes de raiz

unitária, teste de Dickey-Fuller aumentado.
• Determina a ordem máxima para o

teste. O Gretl calcula
automaticamente usando a fórmula
ܶ ଵ/ସ
‫ ݐ݊݅ = ݌‬ቈ12 ∗ ൬ ൰ ቉
100
Onde T é o número de observações da base
de dados.
• Marcar essa opção para visualizar

todo o resultado do teste.
25
O fluxograma abaixo pode ajudar a interpretar o resultado completo do teste
ADF e identificar o tipo de tendência da série.
Abaixo, seguem alguns exemplos de aplicação do teste, seguindo a interpretação

deste fluxograma:
26
Teste ADF para L_agropecuaria
Teste Aumentado de Dickey-Fuller para l_agropecuaria
incluindo 10 defasagens de (1-L)l_agropecuaria
(o máximo foi 12, critério estatística-t)
dimensão de amostragem 121
hipótese nula de raiz unitária: a = 1
teste sem constante

modelo: (1-L)y = (a-1)*y(-1) + ... + e
coeficiente de 1ª ordem para e: -0,036
diferenças defasadas: F(10, 110) = 5,480 [0,0000]
valor estimado de (a - 1): 0,000232479 Evidência de raiz
estatística de teste: tau_nc(1) = 0,31619
p-valor assintótico 0,777
unitária
Regressão aumentada de Dickey-Fuller
MQO, usando as observações 2003:12-2013:12 (T = 121)
coeficiente erro padrão razão-t p-valor
----------------------------------------------------------------
l_agropecuaria_1 0,000232479 0,000735252 0,3162 0,7770
d_l_agropecuar~_1 -0,368625 0,0945622 -3,898 0,0002 ***
d_l_agropecuar~_2 -0,411156 0,0988597 -4,159 6,36e-05 ***
d_l_agropecuar~_3 -0,191574 0,0980168 -1,955 0,0532 *
d_l_agropecuar~_4 -0,279691 0,0916272 -3,052 0,0028 ***
d_l_agropecuar~_5 -0,377815 0,0883527 -4,276 4,07e-05 ***
d_l_agropecuar~_6 -0,289086 0,0865691 -3,339 0,0011 ***
d_l_agropecuar~_7 -0,466409 0,0905514 -5,151 1,15e-06 ***
d_l_agropecuar~_8 -0,391866 0,0980797 -3,995 0,0001 ***
d_l_agropecuar~_9 -0,169873 0,100041 -1,698 0,0923 *
d_l_agropecua~_10 -0,263887 0,0928801 -2,841 0,0054 ***
AIC: -131,382 BIC: -100,629 HQC: -118,892
teste com constante

modelo: (1-L)y = b0 + (a-1)*y(-1) + ... + e
valor estimado de (a - 1): -0,127696
estatística de teste: tau_c(1) = -1,25345

coeficiente erro padrão razão-t p-valor Constante não

---------------------------------------------------------------
const 2,13351 1,69898 1,256 0,2119 significativa e p-valor
l_agropecuaria_1
d_l_agropecuar~_1
-0,127696
-0,256666
0,101876
0,129785
-1,253
-1,978
0,6533
0,0505 *
alto para o teste de
d_l_agropecuar~_2 -0,306019 0,129352 -2,366 0,0198 ** raiz unitária. Subir
d_l_agropecuar~_3 -0,100402 0,121772 -0,8245 0,4115
d_l_agropecuar~_4 -0,198588 0,111906 -1,775 0,0788 * para a versão sem
d_l_agropecuar~_5 -0,306871 0,104676 -2,932 0,0041 ***
d_l_agropecuar~_6 -0,229387 0,0985655 -2,327 0,0218 ** constante.
d_l_agropecuar~_7 -0,412725 0,0999217 -4,130 7,12e-05 ***
d_l_agropecuar~_8 -0,348893 0,103636 -3,367 0,0011 ***
d_l_agropecuar~_9 -0,138856 0,102791 -1,351 0,1795
d_l_agropecua~_10 -0,241807 0,0942914 -2,564 0,0117 **
AIC: -131,12 BIC: -97,5709 HQC: -117,495
com constante e tendência

modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e
diferenças defasadas: F(10, 108) = 3,298 [0,0009] Sem evidência de tendência
estatística de teste: tau_ct(1) = -1,69067 determinística. Mas com p-
valor auto para o teste de
raiz unitária.
coeficiente erro padrão razão-t p-valor Subir para a versão sem

---------------------------------------------------------------
const 3,37431 1,99834 1,689 0,0942 * tendência.
l_agropecuaria_1 -0,204218 0,120792 -1,691 0,7557
d_l_agropecuar~_1 -0,198983 0,138563 -1,436 0,1539
d_l_agropecuar~_2 -0,259038 0,135186 -1,916 0,0580 *
d_l_agropecuar~_3 -0,0581789 0,126769 -0,4589 0,6472
d_l_agropecuar~_4 -0,160038 0,116437 -1,374 0,1721
d_l_agropecuar~_5 -0,271180 0,108827 -2,492 0,0142 **
d_l_agropecuar~_6 -0,203823 0,100775 -2,023 0,0456 **
d_l_agropecuar~_7 -0,394122 0,100999 -3,902 0,0002 ***
d_l_agropecuar~_8 -0,338045 0,103868 -3,255 0,0015 ***
d_l_agropecuar~_9 -0,132927 0,102737 -1,294 0,1985
d_l_agropecua~_10 -0,236548 0,0942346 -2,510 0,0135 **
time 0,000492543 0,000419508 1,174 0,2429
AIC: -130,655 BIC: -94,3098 HQC: -115,894
27
Teste ADF para L_deduções
Teste Aumentado de Dickey-Fuller para l_deducoes
incluindo 9 defasagens de (1-L)l_deducoes
teste sem constante

modelo: (1-L)y = (a-1)*y(-1) + ... + e
coeficiente de 1ª ordem para e: 0,018
valor estimado de (a - 1): 0,00223531

Variável dependente: d_l_deducoes

----------------------------------------------------------------
l_deducoes_1 0,00223531 0,00115875 1,929 0,9876
d_l_deducoes_1 -0,690832 0,0933976 -7,397 2,74e-011 ***
d_l_deducoes_2 -0,490202 0,113904 -4,304 3,61e-05 ***
d_l_deducoes_3 -0,143804 0,122894 -1,170 0,2444
d_l_deducoes_4 -0,192615 0,123442 -1,560 0,1215
d_l_deducoes_5 -0,0733609 0,124632 -0,5886 0,5573
d_l_deducoes_6 -0,0598205 0,123578 -0,4841 0,6293
d_l_deducoes_7 0,0466701 0,122876 0,3798 0,7048
d_l_deducoes_8 0,0462044 0,113691 0,4064 0,6852
d_l_deducoes_9 0,153787 0,0931313 1,651 0,1015
AIC: -28,9695 BIC: -0,929251 HQC: -17,5804
teste com constante

modelo: (1-L)y = b0 + (a-1)*y(-1) + ... + e


-----------------------------------------------------------------
const 0,0595967 0,416673 0,1430 0,8865
l_deducoes_1 -0,00125760 0,0222483 -0,05653 0,9522
d_l_deducoes_1 -0,674027 0,0837187 -8,051 5,50e-013 ***
d_l_deducoes_2 -0,403558 0,0824872 -4,892 3,00e-06 ***
AIC: -42,6647 BIC: -31,2255 HQC: -38,0168

modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e
coeficiente de 1ª ordem para e: 0,017
valor estimado de (a - 1): -0,169562 Evidência de misto
estatística de teste: tau_ct(1) = -2,29238
p-valor assintótico 0,4376 TSP/DSP

---------------------------------------------------------------
const 2,92584 1,27459 2,296 0,0236 **
l_deducoes_1 -0,169562 0,0739674 -2,292 0,4376
d_l_deducoes_1 -0,573802 0,107125 -5,356 4,71e-07 ***
d_l_deducoes_2 -0,410086 0,120289 -3,409 0,0009 ***
d_l_deducoes_3 -0,0885861 0,126511 -0,7002 0,4853
d_l_deducoes_4 -0,144025 0,126401 -1,139 0,2570
d_l_deducoes_5 -0,0372025 0,126578 -0,2939 0,7694
d_l_deducoes_6 -0,0316024 0,124664 -0,2535 0,8004
d_l_deducoes_7 0,0707518 0,123450 0,5731 0,5677
d_l_deducoes_8 0,0647471 0,113449 0,5707 0,5694
d_l_deducoes_9 0,161771 0,0921629 1,755 0,0820 *
time 0,00409814 0,00164218 2,496 0,0141 **
AIC: -31,6994 BIC: 1,94888 HQC: -18,0325
28
Teste ADF para L_Folha
Teste Aumentado de Dickey-Fuller para l_Folha
incluindo 7 defasagens de (1-L)l_Folha
teste sem constante

modelo: (1-L)y = (a-1)*y(-1) + ... + e
valor estimado de (a - 1): 0,00132659

Variável dependente: d_l_Folha

-------------------------------------------------------------
l_Folha_1 0,00132659 0,00208376 0,6366 0,8538
d_l_Folha_1 -0,793613 0,0914723 -8,676 2,94e-014 ***
d_l_Folha_2 -0,625926 0,112921 -5,543 1,89e-07 ***
d_l_Folha_3 -0,488779 0,121801 -4,013 0,0001 ***
d_l_Folha_4 -0,478322 0,121962 -3,922 0,0001 ***
d_l_Folha_5 -0,398513 0,121483 -3,280 0,0014 ***
d_l_Folha_6 -0,321879 0,112567 -2,859 0,0050 ***
d_l_Folha_7 -0,173662 0,0898867 -1,932 0,0558 *
AIC: 168,31 BIC: 190,873 HQC: 177,476
teste com constante

modelo: (1-L)y = b0 + (a-1)*y(-1) + ... + e

Variável dependente: d_l_Folha

------------------------------------------------------------
const 9,82062 2,32168 4,230 4,48e-05 ***
l_Folha_1 -0,490125 0,116011 -4,225 0,0006 ***
d_l_Folha_1 -0,306429 0,110517 -2,773 0,0064 ***
d_l_Folha_2 -0,144649 0,0878458 -1,647 0,1021
AIC: 167,034 BIC: 178,473 HQC: 171,682

modelo: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e
estatística de teste: tau_ct(1) = -4,44467 Sem evidência de raiz
p-valor assintótico 0,001802 unitária e com tendência
Regressão aumentada de Dickey-Fuller determinística significativa.
Variável dependente: d_l_Folha Evidência de série TSP
-------------------------------------------------------------
const 30,9189 6,95904 4,443 2,19e-05 ***
l_Folha_1 -1,58200 0,355932 -4,445 0,0018 ***
d_l_Folha_1 0,605438 0,333554 1,815 0,0723 *
d_l_Folha_2 0,620036 0,313240 1,979 0,0504 *
d_l_Folha_3 0,611657 0,294133 2,080 0,0400 **
d_l_Folha_4 0,478752 0,275824 1,736 0,0855 *
d_l_Folha_5 0,421578 0,253303 1,664 0,0990 *
d_l_Folha_6 0,353092 0,228215 1,547 0,1248
d_l_Folha_7 0,339274 0,203769 1,665 0,0989 *
d_l_Folha_8 0,341226 0,178363 1,913 0,0584 *
d_l_Folha_9 0,277195 0,156155 1,775 0,0787 *
d_l_Folha_10 0,228383 0,129193 1,768 0,0800 *
d_l_Folha_11 0,164162 0,0929386 1,766 0,0802 *
time 0,0105217 0,00253157 4,156 6,58e-05 ***
AIC: 154,267 BIC: 193,291 HQC: 170,115
29
17. Sazonalidade
As séries econômicas, principalmente as brasileiras, podem estar sujeitos à
sazonalidade, gerada por fenômenos que tendem a ocorrer sempre na mesma época do
ano, como safras agrícolas, férias e datas comemorativas. A sazonalidade é um
componente de memória e pode ser modelada juntamente com uma estimativa
ARMA/ARIMA. Alternativamente, o pesquisador pode estar interessado em retirar a
sazonalidade da série e trabalhar com um processo livre deste componente.
Métodos para retirar a Sazonalidade Métodos para modelar a Sazonalidade

• Suavização por média móvel • ARMA degenerado
• Suavização exponencial • SARMA(p,q)(P,Q)
• X-12-ARIMA • ARMAX com dummies periódicas
17. Suavização por média móvel
Define a quantidade de
meses usada na média
móvel
Salvar a série suavizada
30
18. Suavização exponencial
Determina o valor
de α. Quanto maior
este valor, maior o
peso no presente.
Yt*=αYt-1 + (1-α)Y*t-1
19. X-12-ARIMA
Para obter uma série dessazonalizada com o método X-12-ARIMA, é necessário
instalar um pacote extra no Gretl. Para isso, siga os passos abaixo:
1. Na página principal do Gretl na internet, clique na opção “Gretl for Windows” na

parte esquerda.
31
2. Baixe o pacote X-12-ARIMA clicando na opção x12a.install.exe
3. Irá abrir uma página do sourceforge.net. Espere alguns segundos e o download será
iniciado.
4. Instale o programa baixado seguindo os passos do instalador. É necessário que o Gretl

não esteja aberto neste momento.
5. Depois de instalado o programa, o pacote X-12-ARIMA estará disponível no Gretl

sempre que o usuário abrir uma base de dados como série temporal mensal ou
trimestral.
6. O pacote X-12-ARIMA pode ser acessado no menu Variável Análise X-12-ARIMA

OBS: TEM QUE SELECIONAR A VARIÁVEL PRIMEIRO !!
32
7. Na figura abaixo, está a configuração básica para se criar uma série com ajuste
sazonal. Neste exemplo, será criada a variável ipcm_d11, que é o IPCM
dessazonalizado.
20. ARMA degenerado
• Define as ordens específicas

de defasagens
33
Exemplo de um modelo ARIMA[(1,12), 1, 1]
Variável dependente: (1-L) l_agropecuaria
const -0,000919328 0,0154457 -0,0595 0,95254
phi_1 -0,179238 0,084197 -2,1288 0,03327 **
phi_12 0,36066 0,0891847 4,0440 0,00005 ***


AR
Raiz 1 -1,0696 0,0000 1,0696 0,5000
Raiz 2 1,1052 0,0000 1,1052 0,0000
Raiz 3 -0,0176 -1,0900 1,0901 -0,2526
Raiz 4 -0,0176 1,0900 1,0901 0,2526
Raiz 5 0,9516 -0,5585 1,1034 -0,0845
Raiz 6 0,9516 0,5585 1,1034 0,0845
Raiz 7 -0,5546 -0,9276 1,0808 -0,3358
Raiz 8 -0,5546 0,9276 1,0808 0,3358
Raiz 9 -0,9341 -0,5276 1,0728 -0,4182
Raiz 10 -0,9341 0,5276 1,0728 0,4182
Raiz 11 0,5367 -0,9581 1,0982 -0,1687
Raiz 12 0,5367 0,9581 1,0982 0,1687
21. SARMA(p,q)(P,Q)
• Define as ordens sazonais
34
Exemplo de um modelo SARIMA(1,1,1)(1,0)
const 0,00126219 0,00109948 1,1480 0,25097
phi_1 0,605108 0,0757161 7,9918 <0,00001 ***
Phi_1 0,409892 0,090208 4,5439 <0,00001 ***
theta_1 -1,000000 0,0220068 -45,4405 <0,00001 ***

AR
Raiz 1 1,6526 0,0000 1,6526 0,0000
AR
(sazonal)
Raiz 1 2,4397 0,0000 2,4397 0,0000
MA
Raiz 1 1,0000 0,0000 1,0000 0,0000
22. ARMAX com dummies periódicas

Para acrescentar as binárias
de períodos, clique no menu
Acrescentar e na opção
Dummies periódicas
Com isso, são criadas binárias para

cada período. No exemplo, foram
criadas 12 dummies, uma para
cada mês do ano.
35
Para estimar o modelo, basta acrescentar
as binárias na lista de Regressores.
Lembre-se de sempre acrescentar um
número a menos que a quantidade total
de binárias.
No exemplo, são 12 meses. Logo, devem

ser incluídas no máximo 11 binárias no
modelo.
Exemplo de um modelo ARMAX com dummies periódicas

Modelo 1: ARMAX, usando as observações 2003:02-2013:12 (T = 131)
const 0,000610663 0,00324124 0,1884 0,85056
phi_1 0,345129 0,156311 2,2080 0,02725 **
theta_1 -0,79347 0,106849 -7,4261 <0,00001 ***
dm2 0,0285772 0,0379625 0,7528 0,45159
dm3 0,0176125 0,0445928 0,3950 0,69287
dm4 0,148899 0,0470598 3,1640 0,00156 ***
dm5 0,276885 0,0481692 5,7482 <0,00001 ***
dm6 0,178553 0,0486953 3,6667 0,00025 ***
dm7 0,25779 0,0488848 5,2734 <0,00001 ***
dm8 0,299158 0,0488054 6,1296 <0,00001 ***
dm9 0,265164 0,0484063 5,4779 <0,00001 ***
dm10 0,187742 0,0474609 3,9557 0,00008 ***
dm11 0,0240094 0,0452392 0,5307 0,59561
dm12 -0,123349 0,0391174 -3,1533 0,00161 ***


AR
Raiz 1 2,8975 0,0000 2,8975 0,0000
MA
Raiz 1 1,2603 0,0000 1,2603 0,0000
36

Apostila ARIMA SEFAZ Gretl PDF

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Apostila ARIMA SEFAZ Gretl PDF

Enviado por

Direitos autorais:

Formatos disponíveis

FACE – Faculdade de Administração, Ciências CURSO DE ANÁLISE DE SÉRIES

Contábeis e Ciências Econômicas

Mês Período Yt Yt-1 Yt+1

O restante do material está constituído de uma série de exemplos estimados com

Real Imaginária Módulo Frequência

Real Imaginária Módulo Frequência

Real Imaginária Módulo Frequência

Média var. dependente 0,005959 D.P. var. dependente 0,143210

Real Imaginária Módulo Frequência

Modelo 5: ARMA, usando as observações 2003:02-2013:12 (T = 131)

Média var. dependente 0,005959 D.P. var. dependente 0,143210

Real Imaginária Módulo Frequência

Real Imaginária Módulo Frequência

Média var. dependente 0,538361 D.P. var. dependente 0,519166

Real Imaginária Módulo Frequência

Média var. dependente 0,005959 D.P. var. dependente 0,143210

Real Imaginária Módulo Frequência

Modelo 5: ARMA, usando as observações 2003:02-2013:12 (T = 131)

Média var. dependente 0,005959 D.P. var. dependente 0,143210

Real Imaginária Módulo Frequência

Média var. dependente 0,005959 D.P. var. dependente 0,143210

Real Imaginária Módulo Frequência

Modelo 2: ARMA, usando as observações 2003:02-2013:12 (T = 131)

Média var. dependente -0,000077 D.P. var. dependente 0,162097

Real Imaginária Módulo Frequência

Define a ordem AR(p)

Define a ordem MA(q)

O Resultado é exemplificado na Figura abaixo. Todas as autocorrelações que

A interpretação do correlograma segue o esperado para cada tipo de modelo

Fonte: Bueno (2011)

Correlograma esperado para um AR(2)

Correlograma esperado para um MA(2)

Correlograma esperado para um ARMA(2,1)

Contudo, lembre-se que na prática a identificação visual do modelo é

Exemplo de modelo estável (raízes fora do círculo unitário).

Teste da memória dos resíduos (correlograma e Ljung-Box)

Basta clicar em OK para o Gretl gerar

Neste resultado, vemos que o

É um indício de que o modelo

Um bom modelo exibe um [p-

Abaixo, vemos um exemplo do que seria um resíduo de um bom modelo

Teste de normalidade dos resíduos

Teste ARCH para heterocedasticidade

Um p-valor muito alto revela a

10. Comparação entre modelos

2. Erro Médio e Erro Quadrado Médio: disponíveis no menu Análise, opção

Quanto menores os erros médios, melhor é o nível de

3. Significância dos coeficientes: em geral, busca-se eliminar os coeficientes de

Coeficiente significativo a 10%

Coeficiente não significativo (p-valor

• Período para realizar a previsão

• Método de previsão (o mais usado

• Opções para exibir o intervalo de

• Tendência Determinística: gira em torno de um eixo aproximadamente fixo no

Logarítmo da Arrecadação na Agropecuária (em Primeira difeença do logaritmo da arrecadação

13. Modelo ARIMA (p,d,q)

Para gerar a primeira diferença de

Alternativamente, o pesquisador pode estimar diretamente um modelo ARIMA

Após entrar pelo menu Modelos, opção Séries

Média var. dependente 0,006812 D.P. var. dependente 0,618222

Real Imaginária Módulo Frequência

Estimando um ARMA(1,1) para a primeira diferença da série de L_energia

Média var. dependente 0,006812 D.P. var. dependente 0,618222