Escolar Documentos
Profissional Documentos
Cultura Documentos
NEPEC/FACE/UFG
Goiânia – Setembro/Outubro 2014
Versão 1.0
Endereço
Campus Samambaia, Prédio da FACE – Rodovia
Goiânia/Nova Veneza, km. 0 – Caixa Postal 131,
CEP 74001-970, Goiânia – GO.
Tel. (62) 3521 – 1390
URL
http://www.face.ufg.br/economia
1
1. Introdução e conceitos básicos
Esta apostila serve de material de apoio para a realização do curso. Longe de ser
abrangente, tem como objetivo servir de guia ou de lembrete para a execução de
tarefas. Outros materiais, melhores e mais completos, podem ser facilmente
encontrados de forma gratuita na internet e em livros especializados no assunto. Para
realizar as estimações, iremos utilizar o pacote estatístico Gretl, disponível para baixar
gratuitamente no site gretl.sourceforge.net.
A primeira definição necessária para nossa análise é o conceito de série
temporal. Uma série temporal é uma sequência de dados no tempo com uma
determinada periodicidade. Alguns exemplos:
- PIB brasileiro trimestral.
- taxa de juros mensal.
- índice pluviométrico semanal.
- valor das ações da Petrobras minuto a minuto.
Ou seja, é o conjunto de informações sobre uma mesma variável ao longo de
vários períodos sequenciais. Ao longo deste curso, usaremos a seguinte notação
algébrica para representar os dados no tempo:
Yt: a observação no tempo t da variável Y.
Yt-1: a observação um período atrás, ou com uma defasagem (lag) temporal.
Yt+1: a observação um período a frente.
Generalizando:
Yt±j: a observação no período t±j
Exemplo:
2
2. Exemplos de Modelos Autoregressivos – AR(p)
AR(1)
Modelo 1: ARMA, usando as observações 1995:01-2010:03 (T = 183)
Variável dependente: ipca
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,571725 0,11237 5,0879 <0,00001 ***
phi_1 0,788617 0,0471062 16,7413 <0,00001 ***
Média var. dependente 0,538361 D.P. var. dependente 0,519166
Média de inovações -0,006069 D.P. das inovações 0,326753
Log da verossimilhança -55,45739 Critério de Akaike 116,9148
Critério de Schwarz 126,5432 Critério Hannan-Quinn 120,8177
AR(2)
Modelo 2: ARMA, usando as observações 1995:01-2010:03 (T = 183)
Variável dependente: ipca
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,569602 0,108703 5,2400 <0,00001 ***
phi_1 0,815008 0,0755062 10,7939 <0,00001 ***
phi_2 -0,0338969 0,0758055 -0,4472 0,65476
Média var. dependente 0,538361 D.P. var. dependente 0,519166
Média de inovações -0,005716 D.P. das inovações 0,326574
Log da verossimilhança -55,35740 Critério de Akaike 118,7148
Critério de Schwarz 131,5527 Critério Hannan-Quinn 123,9187
AR(3)
Modelo 3: ARMA, usando as observações 1995:01-2010:03 (T = 183)
Variável dependente: ipca
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,574432 0,115983 4,9527 <0,00001 ***
phi_1 0,819322 0,0755966 10,8381 <0,00001 ***
phi_2 -0,0819083 0,0988616 -0,8285 0,40738
phi_3 0,0579267 0,0767865 0,7544 0,45062
Média var. dependente 0,538361 D.P. var. dependente 0,519166
Média de inovações -0,006535 D.P. das inovações 0,326053
Log da verossimilhança -55,07385 Critério de Akaike 120,1477
Critério de Schwarz 136,1951 Critério Hannan-Quinn 126,6525
3
Exemplos de modelos AR(p) usando dados da Sefaz/GO:
ICMS – Taxa de crescimento
Modelo 4: ARMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: d_l_ICMS
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00567966 0,00816623 0,6955 0,48674
phi_1 -0,400336 0,0797424 -5,0204 <0,00001 ***
4
3. Exemplos de Modelos de Média Móvel – MA(q)
MA(1)
Modelo 1: ARMA, usando as observações 1995:01-2010:03 (T = 183)
Variável dependente: ipca
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,543279 0,0464909 11,6857 <0,00001 ***
theta_1 0,611094 0,0422925 14,4492 <0,00001 ***
Média var. dependente 0,538361 D.P. var. dependente 0,519166
Média de inovações -0,001839 D.P. das inovações 0,391161
Log da verossimilhança -88,12918 Critério de Akaike 182,2584
Critério de Schwarz 191,8868 Critério Hannan-Quinn 186,1612
MA(2)
Modelo 2: ARMA, usando as observações 1995:01-2010:03 (T = 183)
Variável dependente: ipca
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,546989 0,0585125 9,3482 <0,00001 ***
theta_1 0,881548 0,0774425 11,3833 <0,00001 ***
theta_2 0,387895 0,0583002 6,6534 <0,00001 ***
MA(3)
Modelo 3: ARMA, usando as observações 1995:01-2010:03 (T = 183)
Variável dependente: ipca
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,550957 0,0646414 8,5233 <0,00001 ***
theta_1 0,782521 0,0735914 10,6333 <0,00001 ***
theta_2 0,5313 0,0810619 6,5542 <0,00001 ***
theta_3 0,251944 0,0703504 3,5813 0,00034 ***
Média var. dependente 0,538361 D.P. var. dependente 0,519166
Média de inovações -0,003248 D.P. das inovações 0,342610
Log da verossimilhança -64,02861 Critério de Akaike 138,0572
Critério de Schwarz 154,1046 Critério Hannan-Quinn 144,5620
Real Imaginária Módulo Frequência
MA
Raiz 1 -1,6714 0,0000 1,6714 0,5000
Raiz 2 -0,2187 -1,5254 1,5410 -0,2727
Raiz 3 -0,2187 1,5254 1,5410 0,2727
5
Exemplos de modelos MA(q) usando dados da Sefaz/GO:
Modelo 4: ARMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: d_l_ICMS
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00560753 0,00080953 6,9269 <0,00001 ***
theta_1 -0,924674 0,0416968 -22,1761 <0,00001 ***
6
4. Exemplos de Modelos ARMA (1,1)
Os modelos ARMA (p,q) combinam memória de longo prazo com memória de curto
prazo:
Modelo 1: ARMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: d_l_ICMS
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00569386 0,000702447 8,1057 <0,00001 ***
phi_1 0,102099 0,0982049 1,0397 0,29850
theta_1 -0,945348 0,046179 -20,4714 <0,00001 ***
7
5. Estimar modelos ARMA/ARIMA no Gretl
Para estimar um modelo da classe ARMA/ARIMA, siga até o menu Modelo, clique
na opção Série Temporal e em seguida na opção ARIMA, como mostra a Figura abaixo:
Após esses passos, a tela abaixo irá aparecer. Selecione a variável que será
utilizada para previsão e delimite as ordens AR(p) e MA(q). Lembre-se que o modelo
ARMA tradicional não possui regressores extras.
Selecione a variável e
clique no botão lilás
8
6. O método Box-Jenkins de previsão
O objetivo do método é gerar um modelo com as seguintes características:
i. Estabilidade (módulo das raízes fora do círculo unitário)
ii. Resíduos na forma de Ruído Branco
a. Sem memória
b. Normalmente distribuído
c. Homocedástico
O MÉTODO BOX-JENKINS DE ESTIMAÇÃO DO MODELO ARIMA
9
7. O correlograma
Para gerar o correlograma de uma série temporal, clique sobre uma variável com
o botão direito do mouse e selecione a opção Correlograma:
Função de
Autocorrelação
Simples (FAC)
Função de
Autocorrelação
Parcial (FACP)
10
Correlograma esperado para um AR(1)
FAC – decaimento exponencial FACP – truncada na primeira defasagem
11
8. Estabilidade do modelo
Para verificar a estabilidade, basta observar se os módulos das raízes do modelo
são maiores do que 1, ou seja, se estão fora do círculo unitário. Se o modelo for não-
estável, volte à fase de identificação (correlograma) e escolha outra especificação. Se
obtiver estabilidade, prossiga para fase de diagnóstico dos resíduos.
Exemplo de modelo não-estável (raízes no círculo unitário).
O módulo da raiz
MA(1) não está
fora do círculo
unitário
O módulo de cada
raiz está fora do
círculo unitário
12
9. Diagnóstico de resíduos
Este diagnóstico tem como objetivo verificar se os resíduos são ruído branco, ou
seja, sem memória, normalmente distribuídos e homocedásticos (variância constante).
Para testar a presença de memória, são usados dois testes: o Correlograma dos
Resíduos e a estatística Ljung-Box. Ambas são acessadas na tela de resultados do
modelo, no menu Gráficos, opção Correlograma dos resíduos, como mostra a figura:
13
Da mesma forma, o Ljung-Box
confirma a presença de memória
nos resíduos, como mostram os
baixo [p-valores] obtidos após a 5ª
defasagem.
14
O GRETL exibe um histograma dos
resíduos e o resultado do teste de
Doornik-Hansen na parte superior
esquerda da tela. Um p-valor (entre
colchetes) alto revela a não rejeição da
hipótese nula de normalidade dos
resíduos.
Um p-valor muito baixo mostra a
necessidade de se estimar um novo
modelo.
15
candidato é um modelo que passou por todos os diagnósticos anteriores. A escolha está,
em geral, baseada no equilíbrio entre parcimônia (economia de coeficientes) e nível de
ajustamento. Desta forma, três critérios gerais são comumente empregados:
1. Critérios de Informação: o GRETL fornece três critérios de informação. Estão
disponíveis automaticamente sempre que um modelo é estimado.
Deve-se buscar privilegiar o
modelo que gerar os menores
critérios de informação
16
11. Previsão
Escolhido o modelo de análise, deve-se partir para a etapa de previsão. No GRETL
a previsão é bem simples. Suponha que desejamos prever o resultado de uma variável
k períodos a frente:
A previsão k períodos a
frente pode ser feita por
meio do menu Análise,
opção Previsões....
17
12. Séries não estacionárias
Até aqui, estávamos supondo que as séries eram estacionárias, ou seja, que
mantinham constante suas características fundamentais. Contudo, a maior parte das
séries econômicas apresentam algum tipo de tendência, fazendo com que sua média se
altere ao longo do tempo.
De maneira geral, trabalhamos com dois tipos de tendência:
• Tendência Estocástica: não gira em torno a um eixo fixo, mas sim um eixo que se
altera com o passar do tempo. É também denominada de DSP (Difference
Stationary Process – Processo Estacionário por Diferença) ou ainda processo com
Raiz Unitária.
Antes de realizar a estimação do modelo ARMA, é necessário eliminar ou tratar
a tendência da séria. Cada tipo de tendência tem um tratamento diferente. No caso de
uma série do tipo DSP (raiz unitária), o caminho natural é a diferenciação, ou seja,
transformando a variável em sua primeira diferença. Em geral, a primeira diferença de
uma série é estacionaria.
Taxa de desemprego (em nível) Taxa de desemprego em primeira diferença
10 2,5
2
9
1,5
8
1
d_desemprego
7
desemprego
0,5
-0,5
4
-1
3
-1,5
1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
1991 1992 1993 1994 1995 1996 1997 1998 1999 2000
0,3
17
0,2
16,8 0,1
l_agropecuaria
0
d_l_agropecuaria
16,6
-0,1
16,4 -0,2
-0,3
16,2
-0,4
16 -0,5
2004 2006 2008 2010 2012 2014
-0,6
2004 2006 2008 2010 2012 2014
18
Para a situação de tendência determinística (TSP) deve-se primeiro extrair o
componente determinístico por meio de um modelo de M.Q.O. e utilizar os resíduos
estimados para modelar um ARMA. Uma alternativa seria estimar um modelo ARMAX,
onde X representa um conjunto de variáveis explicativas exógenas. No nosso caso, X
seria a tendência temporal determinística. As próximas seções mostram como
operacionalizar estas três situações (DSP, TSP e ARIMAX) no Gretl.
Define a ordem de
integração da série
19
Note que, em termos de modelo, é a mesma coisa estimar um modelo
ARIMA(p,d,q) diretamente sobre a série original e estimar um ARMA (p,q) sobre a
primeira diferença das séries. Vemos estas duas alternativas nos modelos 1 e 2
respectivamente:
Estimando um ARIMA (1,1,1) para a série de L_energia original
Modelo 1: ARIMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: (1-L) l_ENERGIA
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00468105 0,00806734 0,5802 0,56175
phi_1 -0,22456 0,112379 -1,9982 0,04569 **
theta_1 -0,746504 0,0918233 -8,1298 <0,00001 ***
20
Observações importantes:
i. O correlograma para identificação inicial das ordens AR(p) e MA(q)
devem ser feitas em cima da primeira diferença da série.
ii. Deve-se sempre verificar se a primeira diferença é de fato estacionária.
21
Depois de estimado o
modelo, salve os
resíduos por meio do
menu Salvar, opção
Resíduos. Isso irá
gerar uma nova
variável na base de
dados.
19,5
1
19
0,5
18,5
l_ENERGIA
0
18
resíduo
17,5 -0,5
17 -1
16,5
-1,5
16
2004 2006 2008 2010 2012 2014 -2
2004 2006 2008 2010 2012 2014
22
Modelo ARMA (1,1) sobre os resíduos de M.Q.O. – após extrair a tendência
determinística
Modelo 13: ARMA, usando as observações 2003:01-2013:12 (T = 132)
Variável dependente: uhat12
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00370065 0,0635819 0,0582 0,95359
phi_1 0,852921 0,0951371 8,9652 <0,00001 ***
theta_1 -0,744821 0,112997 -6,5915 <0,00001 ***
Modelo ARMAX (1,1) para L_energia – compare com o modelo 13 da seção anterior.
Modelo 14: ARMAX, usando as observações 2003:01-2013:12 (T = 132)
Variável dependente: l_ENERGIA
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 17,7187 0,123729 143,2058 <0,00001 ***
phi_1 0,852917 0,0951118 8,9675 <0,00001 ***
theta_1 -0,744809 0,112962 -6,5935 <0,00001 ***
time 0,00501748 0,00159592 3,1439 0,00167 ***
23
Para estimar um modelo ARMAX, basta
acrescentar variáveis extra na lista de
Regressores. No nosso caso,
acrescentamos a variável time, que é a
tendência temporal.
24
Contudo, a ausência de raiz unitária não implica necessariamente em uma série
estacionaria, uma vez que ainda pode estar presente a tendência determinística. Para
identificação correta, deve-se aplicar o teste ADF em sua versão mais completa
disponível no Gretl.
ܶ ଵ/ସ
ݐ݊݅ = ቈ12 ∗ ൬ ൰
100
Onde T é o número de observações da base
de dados.
25
O fluxograma abaixo pode ajudar a interpretar o resultado completo do teste
ADF e identificar o tipo de tendência da série.
26
Teste ADF para L_agropecuaria
Teste Aumentado de Dickey-Fuller para l_agropecuaria
incluindo 10 defasagens de (1-L)l_agropecuaria
(o máximo foi 12, critério estatística-t)
dimensão de amostragem 121
hipótese nula de raiz unitária: a = 1
27
Teste ADF para L_deduções
Teste Aumentado de Dickey-Fuller para l_deducoes
incluindo 9 defasagens de (1-L)l_deducoes
(o máximo foi 12, critério estatística-t)
dimensão de amostragem 122
hipótese nula de raiz unitária: a = 1
28
Teste ADF para L_Folha
Teste Aumentado de Dickey-Fuller para l_Folha
incluindo 7 defasagens de (1-L)l_Folha
(o máximo foi 12, critério estatística-t)
dimensão de amostragem 124
hipótese nula de raiz unitária: a = 1
29
17. Sazonalidade
As séries econômicas, principalmente as brasileiras, podem estar sujeitos à
sazonalidade, gerada por fenômenos que tendem a ocorrer sempre na mesma época do
ano, como safras agrícolas, férias e datas comemorativas. A sazonalidade é um
componente de memória e pode ser modelada juntamente com uma estimativa
ARMA/ARIMA. Alternativamente, o pesquisador pode estar interessado em retirar a
sazonalidade da série e trabalhar com um processo livre deste componente.
Define a quantidade de
meses usada na média
móvel
30
18. Suavização exponencial
Determina o valor
de α. Quanto maior
este valor, maior o
peso no presente.
Yt*=αYt-1 + (1-α)Y*t-1
19. X-12-ARIMA
Para obter uma série dessazonalizada com o método X-12-ARIMA, é necessário
instalar um pacote extra no Gretl. Para isso, siga os passos abaixo:
31
2. Baixe o pacote X-12-ARIMA clicando na opção x12a.install.exe
3. Irá abrir uma página do sourceforge.net. Espere alguns segundos e o download será
iniciado.
32
7. Na figura abaixo, está a configuração básica para se criar uma série com ajuste
sazonal. Neste exemplo, será criada a variável ipcm_d11, que é o IPCM
dessazonalizado.
33
Exemplo de um modelo ARIMA[(1,12), 1, 1]
Modelo 5: ARIMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: (1-L) l_agropecuaria
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const -0,000919328 0,0154457 -0,0595 0,95254
phi_1 -0,179238 0,084197 -2,1288 0,03327 **
phi_12 0,36066 0,0891847 4,0440 0,00005 ***
21. SARMA(p,q)(P,Q)
34
Exemplo de um modelo SARIMA(1,1,1)(1,0)
Modelo 1: ARIMA, usando as observações 2003:02-2013:12 (T = 131)
Variável dependente: (1-L) l_agropecuaria
Erros padrão baseados na Hessiana
Coeficiente Erro Padrão z p-valor
const 0,00126219 0,00109948 1,1480 0,25097
phi_1 0,605108 0,0757161 7,9918 <0,00001 ***
Phi_1 0,409892 0,090208 4,5439 <0,00001 ***
theta_1 -1,000000 0,0220068 -45,4405 <0,00001 ***
35
Para estimar o modelo, basta acrescentar
as binárias na lista de Regressores.
Lembre-se de sempre acrescentar um
número a menos que a quantidade total
de binárias.
36