Você está na página 1de 9

UNIVERSIDADE ESTADUAL DE CAMPINAS

ME607-P2: Testes para Diagnóstico de Modelos Tipo


ARFIMA

Laura Thereza Zaia Ferro

CAMPINAS

Maio de 2021
RESUMO
Analisando dados obtidos no website do Banco da Reserva Federal de St. Louis (Federal Reserve
Bank of St. Louis)[1], este trabalho procura definir e exemplificar de forma prática o uso de vários
métodos de diagnóstico (testes) em modelos ARFIMA (Modelo Auto-Regressivo Fracionário
Integrado de Médias Móveis) utilizados na representação de séries temporais de memória longa. Por
meio do uso do software R-Studio, na linguagem R, foram criados gráficos de autocorrelação para
analisar e confirmar a presença ou não de comportamento característico de ruídos brancos nos
resíduos amostrais do processo modelando o preço total das ações totais dos Estados Unidos.

Palavras-chave: ARFIMA, diagnóstico, preço

2
1 - INTRODUÇÃO

1.1 Processos de Memória Longa

Estudos empíricos, principalmente aqueles das áreas de Climatologia, Economia e Hidrologia, tendem
a possuir séries temporais e espaciais que exibem dependência de longo intervalo ou, em outras
palavras, memória longa. Estas séries apresentam dependência significativa entre valores separados
por um longo intervalo de tempo, isto é, persistência nas autocorrelações amostrais, o que significa
que as autocorrelações decaem para zero hiperbólicamente (suavemente) e a soma destas não
converge. Ou seja, sua função densidade espectral não é limitada na frequência zero.[2]

Outra característica das séries de memória longa é que, se a série é diferenciada, mesmo que uma vez,
as autocorrelações que na série original indicam não-estacionariedade podem fazer parecer que a série
está ‘superdiferenciada’. Um sinal de uma série ‘superdiferenciada’ é a primeira autocorrelação
próxima de -0,5 e valores pequenos em outros pontos.

1.2 Modelo Auto-regressivo Fracionário Integrado de Médias Móveis (ARFIMA)

O modelo ARFIMA é um modelo de série temporal que generaliza o modelo ARIMA


(auto-regressivo integrado de médias móveis), que em si é uma generalização do modelo ARMA
(auto-regressivo de médias móveis).[4] Ambos são ajustados aos dados de uma série temporal com o
objetivo de melhor compreender os dados ou fazer previsões. Modelos ARFIMA são aplicados em
casos em que os dados mostram evidências de não-estacionariedade e de dependência de longo
intervalo.[4] Para eliminar essa primeira característica, um passo inicial de diferenciação pode ser
aplicado uma ou mais vezes. E, para corretamente representar a série de longa memória, o parâmetro
da diferenciação pode ser fracionário e deve ter valor absoluto menor que 0.5, o que garante que o
processo seja estacionário e invertível. Esse parâmetro deve ser escolhido com o objetivo de explicar a
estrutura de correlação das altas ordens do processo.

2 - OBJETIVOS

Foi determinado que na realização deste trabalho serão elaborados os seguintes temas:

● Definição dos resíduos do modelo ARFIMA e suas propriedades


● Apresentação e definição teórica dos testes de Autocorrelação Residual, Box-Pierce
Modificado (Ljung-Box) e Autocorrelação Cruzada
● Aplicação prática dos testes sobre um modelo ARFIMA ajustado a uma série

3
3 - METODOLOGIA

3.1 Resíduos

O trabalho do estatístico não termina apenas com a estimação do modelo. Ele deve também verificar
se o modelo é adequadamente representativo dos dados ou não. Existem diversas maneiras de
diagnosticar um modelo, mas por fim de simplificação, nos ateremos aos testes baseados nas
autocorrelações estimadas dos resíduos.

Supondo que o modelo ARFIMA(p,d,q) ajustado seja dado por

𝑑
ϕ(𝐵)(1 − 𝐵) 𝑍𝑡 = θ(𝐵)ε𝑡,

2
onde {ε𝑡} é um 𝑅𝐵(0, σ ), ϕ(𝐵) e θ(𝐵) são polinômios em B de graus p e q, B é o operador de

defasagem e d é o parâmetro de diferenciação, que assume valores em (-0.5; 0.5).[3] Estimados ϕ e θ,


os resíduos (erros) estimados são dados por

−1
𝑑
𝑎𝑡 = θ (𝐵) ϕ(𝐵)(1 − 𝐵) 𝑍𝑡

e é sobre eles que serão realizados os testes de autocorrelação residual e cruzada. O objetivo dos testes
é observar se os resíduos estimados têm um comportamento significativamente próximo de um Ruído
Branco.

3.2 Teste de Autocorrelação Residual

Se o modelo for bem condicionado, os resíduos estimados devem ter valores próximos dos 𝑎𝑡 e,
portanto, devem ser aproximadamente não-correlacionados. Sendo as autocorrelações dadas por
𝑛
∑ 𝑎𝑡𝑎𝑡−𝑘
γ𝑘 = 𝑡=𝑘+1
𝑛 , sendo k o lag, então devemos ter γ𝑘 ≃ 0. Em geral, a comparação de γ𝑘 com os
2
∑ 𝑎𝑡
𝑡=1

limites ± 2 𝑛 fornece uma indicação de possível quebra de comportamento de ruído branco em 𝑎𝑡.
Deve-se levar em consideração que, para lags pequenos, estes limites subestimam a significância de
qualquer discrepância. A verificação das autocorrelações também serve para descobrir se há a
necessidade de incluir novos termos de médias móveis no modelo. Por exemplo, se |||γ10||| > 2/ 𝑛 , então
um termo θ10𝑎𝑡−10 deve ser incluído no modelo.

4
3.3 Teste de Ljung-Box

O teste de Ljung-Box é um teste estatístico para determinar se um conjunto de autocorrelações de uma


série temporal são diferentes de zero. O teste não é capaz de detectar quebras específicas no
comportamento de ruído branco, mas corretamente identifica se os valores das autocorrelações são
excessivamente altos. Se o modelo for adequado, a estatística do teste
2
𝑘 γ𝑗
𝑄(𝑘) = 𝑛(𝑛 + 2) ∑ (𝑛−𝑗)
𝑗=1

2
terá aproximadamente uma distribuição χ com 𝑑𝑓 = 𝑘 − 𝑝 − 𝑞 graus de liberdade. Se nenhum
modelo foi ajustado e as autocorrelações são para os dados originais, 𝑑𝑓 = 𝑘 .[5] Em geral usa-se um
lag 𝑘 > 10 para calcular a estatística. A hipótese nula do teste é que os dados ou resíduos são
independentes, isto é, as autocorrelações da população são próximas de zero, e qualquer correlação
observada é produto da variação natural da amostra). Os resíduos têm um comportamento
significativamente próximo de um ruído branco se H0 não é rejeitada.

3.4 Teste da Autocorrelação Cruzada

Outro teste que pode auxiliar no procedimento de diagnóstico é o teste baseado na correlação entre os
resíduos e os valores passados da série. Se o modelo for adequado, os resíduos 𝑎𝑡 e os valores
passados 𝑍𝑡−𝑘, k o atraso, serão não correlacionados para 𝑘 ≥ 1 . Então,

𝐶𝑜𝑣{𝑎𝑡, 𝑍𝑡−𝑘} = γ𝑎𝑧(𝑘) = 0 para 𝑘 ≥ 1. Isso sugere que seja investigada a função de correlação
cruzada (fcc). Porém, como não conhecemos os verdadeiros ε𝑡, usamos a função estimada

𝑛
∑ 𝑎𝑡(𝑍𝑡−𝑘−𝑍)
𝑡=𝑘+1
𝑠𝑘 = 𝑛 𝑛 , 𝑘 = 1, 2, . . .
2 2 1/2
[ ∑ 𝑎𝑡 ∑ (𝑍𝑡−𝑍) ]
𝑡=1 𝑡=1

O critério de julgar sk significante quando |||𝑠𝑘||| > 2/ 𝑛 é razoável exceto para k pequeno. A verificação
das autocorrelações cruzadas serve para identificar a necessidade de incluir novos termos
auto-regressivos no modelo. Por exemplo, se |||𝑠14||| > 2/ 𝑛 , então devemos interpretar que precisamos
incluir no modelo o termo ϕ14𝑎𝑡−14.

5
4 - EXEMPLO PRÁTICO

4.1 Banco de Dados

Para a realização deste exemplo prático, foi selecionado o banco de dados Total Share Prices for All
Shares for the United States (1990-2010). O conjunto de dados original é composto por 252
observações e 2 variáveis: DATE (ano e mês) e SPASTT01USM661N (Preços totais das ações para
todas as ações dos Estados Unidos - dado em unidades “Index 2015=100”). A variável DATE está em
ordem crescente de anos e meses.

4.2 Testes

A Figura 1 mostra a série temporal resultante do conjunto de dados escolhido e suas autocorrelações
amostrais, onde podemos notar um decaimento hiperbólico (suave e lento). Dessa forma, há indícios
de que temos um processo de memória longa. A fim de exemplificação, foi ajustado um modelo
ARFIMA(0,d,2) à série, com θ1 =− 0. 94, θ2 =− 0. 48 e 𝑑 = 0. 49 utilizando a função de ajuste
automatizado arfima() do pacote forecast, do software R. A função utiliza o algoritmo de
Hyndman-Khandakar (2008) para estimar p e q, e utiliza o algoritmo de Haslett e Raftery (1989) para
estimar o parâmetro de diferenciação d.

Para testar a qualidade do ajuste foram extraídos os resíduos amostrais do modelo de acordo com os
métodos fornecidos em 3.1. Observando os gráficos de autocorrelação e autocorrelação parcial dos
resíduos do modelo na Figura 2, nota-se que diversos valores estão acima do limite superior 2/ 𝑛 no
primeiro, o que indica possível quebra de comportamento de ruído branco pelos resíduos. Portanto,
existem evidências de que os resíduos amostrais não são completamente não-correlacionados e que
novos termos de médias móveis devem ser adicionados ao modelo.

Aplicando sobre a série o teste de Ljung-Box descrito em 3.3 a um nível de significância de α = 5% e


com 𝑘 = 20 defasagens, obtivemos um p-valor próximo de zero e podemos rejeitar a hipótese nula.
Consequentemente, os resíduos não são independentes e suas correlações não são aproximadamente
zero como é esperado para um modelo bem ajustado.

Por fim, examinando o gráfico da Figura 3, fica claro que existe grande correlação entre os resíduos
do modelo e os valores passados da série. Se o modelo fosse adequado, ambos não seriam
correlacionados para quaisquer defasagens. O gráfico de correlação cruzada também aponta que seria
necessário adicionar ao modelo vários termos auto-regressivos.

6
Figura 1: Preços totais das ações totais dos E.U.A (em unidades index2015=100) e
função de autocorrelação da série

7
Figura 2: Função de autocorrelação e autocorrelação parcial estimadas
dos resíduos amostrais do modelo ARFIMA(0,d,2)

Figura 3: Função de autocorrelação cruzada estimada dos resíduos amostrais e valores passados da
série original, modelo ARFIMA(0,d,2)

8
5 - CONCLUSÕES

Os três testes realizados sobre o modelo ARFIMA(0,d,2) escolhido para representar os dados revelam
que o modelo é mal ajustado. Segundo o teste de autocorrelação dos resíduos amostrais, deveriam ser
adicionados 10 novos termos de médias móveis ao modelo. O teste de autocorrelações cruzadas indica
que deveriam ser adicionados ainda outros 23 termos auto-regressivos. Embora a série original tenha
indícios de dependência de longo intervalo, fica claro que o modelo ARFIMA(0,d,2) não se adequa a
eles.

Para encontrar um modelo melhor, é possível utilizar outros métodos de estimação dos parâmetros. É
também possível que a família de modelos ARFIMA(p,d,q) não sejam adequados, em geral, para o
problema. Nesse caso, é sempre possível empregar outras famílias de modelo, como ARIMA(p,d,q)
ou ARCH(q) e suas generalizações.

6 - REFERÊNCIAS

[1] Federal Reserve Bank of St. Louis (2021) Federal Reserve Economic Data. Disponível em:
https://fred.stlouisfed.org/ Acesso em: 17 de Maio de 2021.

[2] Morettin, P.A., Toloi, C.M.C. (2006). Análise de Séries Temporais. Segunda Edição, ABE - Projeto Fisher.
Editora Blucher, São Paulo.

[3] Brockwell, P. J. & Davis, R. A. (2016). Introduction to time series and forecasting. Terceira Edição.
Springer, Nova York.

[4] Hosking, J. R. M. (1981) Fractional Differencing. Revista Biometrika, v.68, n.1, p. 165-176. Disponível em:
https://www.jstor.org/stable/2335817?seq=1#metadata_info_tab_contents Acesso em: 15 de Maio de 2021.

[5] Romer, Megan. (2021) Applied Time Series Analysis. Disponível em: https://online.stat.psu.edu/stat510/
Acesso em: 22 de Abril de 2021

Você também pode gostar