Você está na página 1de 27

CAPTULO 2 REVISO DE LITERATURA

2.1.

MODELOS ESTATSTICOS

2.1.1. Conceitos Gerais


Conforme Fischer (1982), uma srie temporal um conjunto de observaes
de uma varivel dispostas seqencialmente no tempo. De acordo com o conjunto
gerado, a srie classificada com discreta, em que o conjunto de observaes no tempo
for finito ou infinito enumervel. Caso contrrio, se a srie for infinita e no numervel
classificada como contnua.
Em relao formao das sries, podemos classific-las como
determinstica, ou seja, quando os valores futuros da srie so estabelecidos atravs da
*relao funcional matemtica do tipo y

f (tempo ) (tempo) ou estocstica se seus

valores futuros so expostos em termos probabilsticos, uma vez que a srie esta
descrita por meio de uma relao funcional que envolve no s o tempo, mas tambm
uma varivel aleatria do tipo y

f (tempo , a ) (tempo, a), em que "a" o termo

aleatrio residual, necessrio quando no se consegue explicar completamente algum


movimento irregular da srie atravs unicamente da relao matemtica 1.
O objetivo da anlise dessas sries estudar suas componentes bsicas,
visando identificar um padro de comportamento que possibilite previses que, para
abordagem econmica, pode ser realizada atravs de modelos de regresso de equao
nica; regresso com equaes simultneas; modelos auto-regressivos integrados de
mdia mvel e auto-regresso vetorial (MORETTIN, 2008).
O processo estocstico estacionrio se suas mdias e varincias forem
constantes ao longo do tempo e o valor da covarincia entre dois perodos de tempo

1
Neste trabalho, somente sero consideradas sries temporais estocsticas discretas,
em que as observaes sero geradas em intervalos de tempo contnuos.

Formatado: Fonte: Itlico

depender apenas da distncia ou defasagem entre dois perodos, e no do perodo de


tempo efetivamente em que a covarincia calculada. Essa propriedade permite a
realizao de inferncias estatsticas sobre os parmetros estimados. Conforme Matos
(2000), a no-estacionariedade constitui uma violao de pressuposto, cuja
conseqncia a possibilidade de se obter resultados esprios.
Formalmente, considera-se que um processo estocstico uma famlia de
variveis aleatrias (v.a.) definidas no mesmo espao de probabilidades. Portanto, seja
T um conjunto arbitrrio, um processo estocstico definido por { y t , t T } , tal que

para cada t T , y (t ) uma varivel aleatria e t o tempo. O conjunto de valores


{ y t , t T } denominado de espao dos estados e y (t ) representam os estados. Para

cada t T , existe uma varivel aleatria, com uma funo de densidade de


probabilidades

(y)

(MORETIN, 2008).

Se as distribuies finito-dimensionais permanecerem as mesmas sob


translaes de tempo, o processo estocstico estritamente estacionrio, logo a mdia
(t ) e a varincia

sero constantes para todo t T e a covarincia igual a 0, de

forma que:
Mdia:

E{ y(t )}

Varincia: Var{ y (t )}
Covarincia:

(t )

(t1, t 2)

(t )

(t1

t 2, 0)

;
Cov{ y(t 1

t 2), y(0)} .

Na estacionariedade estrita, a forma da distribuio conjunta do processo


permanece sem variao mediante uma translao temporal. Porm, na prtica
complexa a especificao da distribuio conjunta de um processo estocstico, ento
existe a verso mais fraca, a qual denominaremos por processo fracamente estacionrio,
onde somente alguns momentos do processo permanecem inalterados no tempo, ou seja,

um processo estocstico { y t , t T } fracamente estacionrio (ou estacionrio de


segunda ordem) se e somente se:
E{ y(t )}

(t )

E{ y (t )}

(t1, t 2)

Cov{ y(t1), y(t 2)}

uma funo apenas de | t 1 t 2 | .

Conforme Bueno (2008), tambm necessrio satisfazer a propriedade de


ergocidade que permite usar a srie para calcular as mdias em cada instante de tempo
e como todas as mdias so iguais, basta uma nica realizao da srie para viabilizar o
clculo. Se as mdia temporal convergir para a mdia no condicional, h ergocidade e
a srie temporal pode ser estimada normalmente, mesmo com apenas uma realizao do
processo estocstico.
Outro processo importante o rudo branco, caracterizado por uma
seqncia do termo de erro { t}, com mdia zero, varincia constante e no
correlacionado com qualquer realizao da prpria srie, ou seja, autocorrelao igual a
zero, RB (0, ) , onde:
E( t )

0; t ;

E ( t2 )
E(

; t
t j

) 0 ; para todo j 0

At o incio da dcada de 1970, a anlise tradicional de uma srie temporal


ocorria atravs da sua decomposio nos componentes de tendncia, ciclo, sazonalidade
e variao irregular ou componente errtico. Por essa abordagem, uma srie temporal
pode resultar da combinao de todos os quatro componentes ou de um subconjunto
deles.

De acordo com Fischer (1992), a tendncia caracteriza um movimento


regular e contnuo de longo prazo. Pode ser vista como aquela componente que descreve
as variaes graduais que se mantm em um longo perodo de observao da varivel no
tempo e se caracteriza pelo fato de que a varincia se altera ao longo do tempo. Corrar e
Thephilo (2004) afirmam que a tendncia a componente mais importante da srie
temporal.
Os ciclos so variaes que se referem s oscilaes de longo prazo que
caracterizam, em geral, os ciclos econmicos. So as flutuaes de longo prazo em
torno da curva de tendncia. So mais difceis de determinar, pois tanto o perodo
considerado ou a causa do ciclo podem no ser conhecidos
A sazonalidade corresponde s oscilaes de subida e de queda que sempre
ocorrem em um determinado perodo do ano, do ms, da semana ou do dia. A diferena
entre a sazonalidade e o ciclo, que o primeiro possui movimentos previsveis,
ocorrendo em intervalos regulares de tempo, enquanto que movimentos cclicos tendem
a ser irregulares.
Para Morettin e Toli (2006), as variaes irregulares so descolamentos
espordicos das sries, decorrente de causas naturais e sociais, provocadas por eventos
imprevisveis e no peridicos denominados rudos, como as enchentes, eleies,
greves, entre outros. Variaes estas que no podem ser previstas, portanto no so
includas no modelo.
2.1.2. Mtodos de Previso
Conforme Brooks (2002), os modelos de sries univariadas de tempo
representam uma classe especfica, onde se objetiva modelar e prever variveis
utilizando apenas informaes contidas em seus prprios valores passados, valores
atuais e um termo de erro. So considerados atericos, o que implica que a sua

construo e utilizao no baseada em qualquer teoria subjacente ao comportamento


de outra varivel, ou seja, no existe qualquer independncia e causalidade com outras
sries temporais.
Esta prtica pode ser contrastada com modelos estruturais, que so de
natureza multivariada ou causal, e tentam explicar as mudanas em uma varivel
dependente atravs de referncia aos movimentos nos valores atuais ou passados de
outras variveis (explicativas). Porm, os modelos estruturais no sero abordados neste
trabalho.
2.1.2.1. Alisamento exponencial
De acordo com Gelper et al (2007), o alisamento exponencial uma tcnica
simples, usada para suavizao e previso de uma srie temporal sem a necessidade de
adaptao de um modelo paramtrico. baseado em um esquema de computao
recursiva, onde as previses so atualizadas a cada nova observao de entrada. A
suavizao exponencial , por vezes, considerada como um mtodo de previso
ingnuo, mas freqentemente aplicado, onde mostra bom desempenho.
Esses mtodos utilizam pesos exponenciais decrescentes no sentido das
observaes mais recentes em direo s observaes mais antigas, onde existem um ou
mais parmetros de suavizao a serem determinados e essa escolha definir os pesos a
serem dados a cada observao. Os principais modelos so a mdia mvel simples,
mdia mvel ponderada, suavizao exponencial simples, dupla suavizao exponencial
e Holt-Winters.
Se os dados no apresentam padres de tendncia ou sazonalidade, o
alisamento exponencial simples adequado. Para os dados que indicam tendncia
linear, o mtodo Holt apropriado. Porm, se os dados so sazonais necessrio aplicar
o modelo Holt Winters para captar a sazonalidade (Mileski Jr., 2007). Esse mtodo,

proposto por por Holt (1957) e Winters (1960), baseado em trs equaes de
suavizao: nvel, tendncia e sazonalidade. Dependendo da sazonalidade pode ser
modelado de forma multiplicativa ou aditiva, conforme equaes seguintes.
Quadro 2.1 Equaes recursivas para modelos de Holt-Winters
Holt-Winters Aditivo

Nvel

( yt st
(t

bt

Tendncia
Sazonalidade

st

Previso

Ft

)(t

) (1

(t

bt

bt 1)

)bt

) (1

( yt t ) (1

Holt-Winters Multiplicativo

yt

st

(t

bt

)st

st

Ft

m) t

yt
t
m

)(t

(1

bt 1)

(t

)bt

) (1

)St

(1
bt

m) t

Onde:

t = elemento de nvel para o perodo t ;

bt = elemento de tendncia para o perodo t ;

st = elmento de sazonalidade para o perodo t ;

Ft

= valor da previso para o perodo m;

yt = valor observado no perodo t ;

s = intervalo de tempo da sazonalidade;

m = nmero do perodo previsto;


= constante do ajuste de nvel;
= constante do ajuste de tendncia;
= constante do ajuste de sazonalidade.
O mtodo Holt-Winters adequado para anlise de sries que possuem
padro de comportamento mais geral, porm tem como desvantagens as dificuldades em
determinar os valores mais apropriados das constantes de suavizao e a

impossibilidade ou dificuldade de estudar as propriedades estatsticas como mdia e


varincia de previso e, conseqentemente, determinar um intervalo de confiana.
Pegels (1969) props uma taxonomia para os modelos de alisamento
exponencial, estendida por Gardner (1985), defendida por Makridakis, Wheelwright e
Hyndman (1998) e modificada por Hyndman et al (2002). Cada mtodo tem um
componente de tendncia e outro sazonal, conforme quadro abaixo.
Quadro 2.2 Classificao dos Modelos de Suavizao Exponencial
Componente de sazonalidade
Componente de tendncia

(nenhum)

(aditivo)

(multiplicativo)

N (nenhum)

N,N

N,A

N,M

A (aditivo)

A,N

A,A

A,M

Ad (aditivo amortecido)

Ad,N

Ad,M

Ad,M

M (multiplicativo)

M,N

M,A

M,M

Md (multiplicativo amortecido)

Md,N

Md,A

Md,M

Fonte: Hyndman et al (2002)


Cada mtodo indicado por uma ou duas letras para tendncia (linha do
ttulo) e outra escrita para sazonalidade (coluna). A nomenclatura NN descreve a
suavizao exponencial simples. AN se refere ao modelo Holt. O modelo aditivo de
Holt-Winters caracterizado por AA, enquanto o Holt-Winters multiplicativo
denotado por AM. As demais nomenclaturas representam modelos menos utilizados.
Para cada um dos quinze mtodos indicados no quadro anterior, ainda
existem duas possibilidades de modelagem no espao de estados que correspondem ao
modelo com erros aditivos e outro com erros multiplicativos. Dessa forma, existem ao

todo 30 possibilidades de modelos de suavizao exponencial que podem descrever uma


srie temporal (HYNDMAN 2002, GARDNER JR, 2006).
Conforme Brooks (2002), as desvantagens dos mtodos de suavizao
exponencial, o fato de que geralmente no so ideais para capturar qualquer
dependncia linear nos dados. Alm disso, as previses desses modelos no convergem
para a mdia de longo prazo da varivel com o aumento do horizonte de tempo. O
resultado que previses a longo prazo so extremamente afetados pelos ltimos
acontecimentos da srie investigada e ser, portanto, sub-timo.
2.1.2.2.Modelos estacionrios
2.1.2.2.1. Modelo auto-regressivo (AR)
O modelo auto-regressivo AR (p) aquele em que a varivel endgena de
um perodo explicada por seus valores passados (parte sistemtica) e um termo de
rudo branco (parte aleatria). No caso de processos estacionrios com distribuio
normal, expresso por:

yt

1 t

2 t

...

p t

(2.1)

Onde:

yt = valor observado da srie temporal no instante t ;


= i-simo parmetro auto-regressivo estimado, i

Assume-se que valor observado yt


constantes (
Se a mdia,

0)

e o termo de erro

estacionrio,

possui mdia

1, 2,..., p

0e

;
,

,...,

varincia constante

, for diferente de zero, yt deve ser substitudo por yt

so
2

na equao

(2.1) (SHUMWAY, STOFFER, 2010):

yt

( yt

yt

1 t

( yt

2 t

) ...

...

p t

p( t

(2.2)

Em que

(1

...

p)

Uma forma til para escrever a equao (2.2) atravs do operador de


defasagem B dado por:

(1

B p )yt

B 2 ...

(2.3)

Onde:

Byt

yt

B 2 yt B (Byt ) Byt

yt

Com o operador de defasagem, (2.1) pode ser reescrito de forma mais


concisa:

(B )yt

(2.4)

As propriedades de (B) so importantes para soluo de (2.4). Isso leva a


definio do operador auto-regressivo dado por:
(B ) 1

Bp

B 2 ...

(2.5)

A varincia e as autocovarincias do processo AR (p) so respectivamente:


0

1 1

1 k

...

2 2
1

2 k

...

(2.6)
p k

Para exemplificar, considere que yt depende somente de yt


de erro

, indicando um modelo auto-regressivo de ordem p

1,

e do termo

ou seja, AR (1),

especificado por:

yt

yt

(2.7)

Se | | 1 e yt seja estacionrio, pode-se representar um modelo AR (1)


como um processo linear determinado por:
j

yt

(2.8)

j 0

A condio de estacionariedade do AR(p), em que | | 1 , estabelece que


todas as p razes da equao caracterstica

(B )

caem fora do crculo unitrio e para

que a varincia de yt seja no negativa e finita. (FAVA, 2000).


A figura seguinte ilustra um exemplo de um processo aleatrio simples de
AR (1), tambm chamado de processo de Markov, com

=+ 0,9 e

Figura 2.1 - Exemplo simulado de AR (1) com

= -0,9.

= +0,9 e

=-0,9.

Fonte: SHUMWAY, STOFFER, 2010


2.1.2.2.2. Modelos de mdias mveis (MA)
No modelo de mdias mveis (MA), a srie yt resulta da combinao linear
dos choques aleatrios (rudos brancos) ocorridos no perodo corrente e perodos
passados. O modelo genrico envolve q valores defasados de

e indicado por MA(q)

(FAVA, 2000), atravs da equao:

yt

1 t

2 t

...

q t

(2.9)

10

Onde:

yt = valor observado da srie temporal no instante t ;


,

t ~

,...,

N (0,

q(

0) =

parmetros de mdia mvel estimado, i

1, 2,..., q ;

) , ou seja, rudo branco no instante t ;

q = nmero de defasagens da mdia mvel;


possvel reescrever o processo MA (q), em (2.9), na forma equivalente
atravs da equao abaixo: :

yt

(B )

(2.10)

Em que o operador de mdia mvel e dado por


(B ) 1

B p (2.11)

B 2 ...

A varincia do MA (q) demonstrada por:


2
1

(1

2
2

...

(2.12)

Apenas as autocovarincias de ordem menor ou igual a q so nulas e sua


expresso :
k

Para k > q,
da equao caracterstica

k 1

...

k 2

q k q

(2.13)

= 0. A condio de invertibilidade requer que todas as razes


(B)=0 caiam fora do crculo unitrio.

Para exemplificar, considere o modelo de mdias mveis de primeira ordem


MA (1), em que:

yt
Onde
zero e

t ~

N (0,

(2.14)

o parmetro de mdia mvel estimado, com a mdia de yt igual a


) . Portanto, sua varincia :
0

E y t2

E (

)2

11

(1

) (2.15)

As autocovarincias do MA (1) so definidas da forma seguinte:


1

E ytyt

E (

E ytyt

E (

)(

)(

(2.16)

A autocovarincia de ordem maior ou igual a dois so nulas. As expresses


da varincia e autocovarincia indicam que no necessrio impor nenhuma restrio
ao parmetro

para obter a estacionariedade fraca (FAVA, 2000).

A prxima figura apresenta um exemplo de processo aleatrio simples MA


(1) com

=+ 0,5 e

= -0,5.

12

Figura 2.2 - Exemplo simulado de MA (1) com

= +0,5 e

= -0,5

Fonte: SHUMWAY, STOFFER, 2010


2.1.2.2.3. Modelo auto-regressivo de mdias mveis (ARMA)
O processo auto-regressivo de mdias mveis a combinao dos processos
AR e MA, descrito por seus p valores passados e q rudos brancos correntes e passados
para sries temporais estacionrias, ilustrado a seguir (SHUMWAY, STOFFER, 2010):

yt

yt

...

yt

1 t

...

q t

(2.17)

Em que:
= parmetro auto-regressivo;

= parmetro de mdia mvel;


t ~

N (0,

Se
(1

...

yt

yt

) = rudo branco, com mdia zero e varincia constante.

tem mdia
p

diferente de zero, pode-se definir

que

e o modelo pode ser reescrito por:


1

yt

...

yt

1 t

...

q t

(2.18)

Como observado anteriormente, quando q = 0, o modelo chamado de autoregressivos de ordem p, AR (p), e quando p = 0, o modelo chamado de mdia mvel
de ordem q, MA (q). Para auxiliar na investigao dos modelos ARMA, util escrevlos usando o operador de defasagem do processo AR (2.5) e operador da MA (2.11).
Assim, o modelo ARMA (p,q) (2.17) pode ser descrito de forma simplificada:

(B )yt

(B )

(2.19)

Para Morettin (2008), em um processo ARMA (p,q) genrico a condio de


estacionariedade a mesma para o processo AR (p), equivale que todas as rezes de
(B )

devem estar fora do crculo unitrio e a condio de invertibilidade a mesma

13

(B )

para o processo MA (q), ou seja, as razes de

0 tambm devem estar fora do

crculo unitrio.
2.1.2.2.4. Modelo auto-regressivo integrado de mdias mvel (ARIMA)
A relao temporal

considerada por

Box-Jenkins representada

formalmente por um conjunto de processos estocsticos genericamente denominados de


ARIMA (Autoregressive Integrated Moving Average), resultantes da combinao dos
componentes auto-regressivo (AR), integrao (I) e mdias mveis (MA). Por
envolverem apenas a srie de tempo, eles so classificados como modelos univariados
(GUJARATI, 2000).
Esses modelos so usados para analisar as sries temporais no
estacionrias, transformando-as em estacionrias atravs da ordem de integrao, ou
seja, a diferenciao da varivel envolvida. A razo para necessitar que os dados sejam
estacionrios que qualquer modelo inferido a partir desses dados pode ser considerado
como estvel, fornecendo uma base vlida para previso.
Genericamente, representado por ARIMA (p, d, q), onde p o nmero de
defasagens da srie, d a ordem de integrao e q o nmero de defasagens dos erros
aleatrios. As ordens de p e q do modelo, como se trata da combinao dos processos
AR e MA, so determinadas com base em funes de autocorrelao parcial e de
autocorrelao, assim como exame de diagnsticos efetuados aps estimao (MATOS,
2000).
Para representar o modelo ARIMA (p, d, q), a varivel yt substituda por

w t que representa uma srie estacionria, conforme equao (2.20):


wt

wt

wt

...

Portanto, wt
O operador de diferena

1 t

...

q t

(2.20)

yt (1 B )d yt , ou seja, a srie estacionria de ordem d.


indica a seguinte relao com o operador de defasagem
14

1 B.

,...,

so os parmetros de mdia mvel de ordem q e

,...,

so os

parmetros auto-regressivos de ordem p (SHUMWAY, STOFFER, 2010).


Generalizando, o modelo fica definido por:

(B )(1 B )d yt
Se E (

yt )

(B )

(2.21)

, o modelo reescrito:

(B )(1 B )d yt
Em que

(1

...

(B )

(2.22)

p)

De acordo com Gujarati (2000), na metodologia Box-Jenkins necessrio


descobrir qual entre as vrias verses do modelo ARIMA descreve o comportamento da
srie. Esta etapa denominada identificao, onde se determinam os valores de p, d e q
do modelo, detalhada a seguir.
a) Fase de identificao
O primeiro parmetro a ser identificado o grau de diferenciao d atravs
do diagrama da funo de autocorrelao amostral (FAC), no qual so apresentados os
valores das autocorrelaes em relao s defasagens2 k . Se as autocorrelaes
decrescem de forma exponencial, realizam-se diferenciaes na srie at que o diagrama
apresente um corte abrupto para um valor qualquer de autocorrelao, quando a srie
ser considerada estacionria.
Considera-se d = 1 quando a srie no estacionria em relao ao
processo, ou seja, quando a mdia durante um perodo uma e depois desse perodo
ocorre mudana na mdia e d = 2 quando a srie no estacionria quanto inclinao,
isto , a srie oscila em uma direo em certo tempo e depois muda de direo. O

Defasagens ou lags indicam intervalos de tempo em que ocorrem mximas correlaes.

15

nmero de diferenciaes d, em geral, no mximo igual a 2 (MAKRIDAKIS ET AL.


1998).
Embora a FAC seja amplamente utilizada para definir a ordem de integrao
de yt , pode trazer dvidas em relao correta ordem de integrao. interessante
utilizar testes estatsticos para verificar se a diferenciao d da srie temporal foi
suficiente para torn-la estacionria atravs de testes de raiz unitria. Esses testes so
um procedimento alternativo que consiste no em determinar, mas sim testar a ordem de
integrao da srie yt e decorre do fato de que o nmero de diferenas necessrias para
tornar uma srie temporal estacionria corresponde ao nmero de razes sobre o crculo
unitrio, presentes no processo gerador de yt (FAVA, 2000). Mais informaes sobre os
testes de raiz unitria so realizadas no tpico 2.1.2.3.
Feito isto, determina-se o processo ARMA (p, q) em que as principais
ferramentas para identificao so a funo de autocorrelao (FAC) que determina a
ordem q de um processo MA e a funo de autocorrelao parcial (FACP) que indica a
ordem p do processo AR e seus correlogramas resultantes, que so representaes
grficas contra o tamanho da defasagem. O comportamento da FAC e FACP deve
imitar os respectivos comportamentos das quantidades tericas (GUJARATI, 2000;
MORETIN, 2008).
Para o modelo AR(p) a funo de autocorrelao decai exponencialmente
com o aumento de defasagens e a funo de autocorrelao parcial truncada a partir da
defasagem. Em relao ao MA(q), a funo de autocorrelao truncada na defasagem
q e a autocorrelao parcial decai exponencialmente. No caso do ARMA (p, q), ambas
as funes decaem exponencialmente a partir da defasagem de truncagem, dificultando
o reconhecimento visual (BUENO, 2008).

16

A FAC e FACP so importantes no processo de identificao, pois como os


modelos AR, MA e ARMA s se aplicam em sries originalmente estacionrias, a
identificao tem incio pela determinao da ordem de integrao na srie. Se d=0, a
srie estacionria e passa para a identificao dos filtros AR e MA. Caso contrrio,
aplicam-se quantas diferenas forem necessrias para tornar a srie estacionria e
trabalha-se com os resultados para a identificao de AR e MA (FAVA, 2000).
Porm, esses padres do modelo nem sempre so muito objetivos por serem
estocsticos. Uma mesma srie pode sugerir padres alternativos de modelagem em
razo da dificuldade em inferir qual o padro gerador daquela funo. Dependendo da
magnitude dos coeficientes dos parmetros AR e MA, o padro que emerge da FAC
diferente do verdadeiro padro do processo gerador de dados.
Visualmente, tambm pode ser difcil identificar quando se inicia o
decaimento exponencial. Outro problema ocorre para estimar os valores da varincia da
autocorrelao e autocorrelao parcial, pois ambas dependem dos verdadeiros valores
dos coeficientes, os quais so desconhecidos (BUENO, 2008).
O coeficiente de autocorrelao (FAC) ou correlao serial dado
por

(2.23)

k
0

Em que
de pares (k ,

K)

a covarincia yt, yt

a varincia de yt . A seqncia

, k =1, 2,..., denominada funo de autocorrelao. Porm, como esse

coeficiente envolve o clculo de parmetros desconhecidos, necessrio trabalhar com


o coeficiente de correlao amostral, expresso por:
n

( yt

rk

y )( yt

t k 1

y)
,k

( yt

1,2,..., (2.24)

y )

t 1

17

n = tamanho da amostra
Conhecida a distribuio de r k possvel determinar os intervalos de
confiana e os testes de hipteses usuais para verificar se cada coeficiente de
autocorrelao nulo. Tambm possvel testar se os primeiros coeficientes de
autocorrelao so conjuntamente iguais a zero, ao invs de testar as autocorrelaes
residuais individuais, atravs das estatsticas Q. Box & Jenkins (1970) sugeriram o uso
do teste de Box-Pierce:
k

rk2 (2.25)

k 1

k = nmero de defasagens do modelo;


n = nmero de observaes;

r k = coeficiente de correlao amostral;


Porm, o teste Box-Pierce no tem bom desempenho em amostras pequenas
ou moderadas no sentido de que a distribuio se afasta da

Neste caso, utiliza-se o

teste Ljung-Box, na qual a estatstica descrita por:


k

rk2

k 1

n k

Q (K ) n (n 2)

As equaes (2.25) e (2.26) tm distribuio


hiptese nula H0:

n
k 1

rk 0 contra H1:

de signicncia , se Q

n
k 1

(2.26)

com n graus de liberdade e

rk 0 . Para anlise dos testes, escolhe-se o nvel

, rejeita-se a hiptese nula de que os k primeiros

coeficientes de autocorrelao so nulos. Os testes acima so vlidos se a distribuio


normal e estacionria. Caso haja violao dessas premissas a potncia do teste
reduzida (FAVA, 2000).

18

J o coeficiente de autocorrelao parcial de ordem k representado por


mede a correlao entre yt e yt

depois que a influncia de yt

, yt

,... , yt

kk

sobre yt foi descontada.


1

1
2

...
...

(2.27)

(...)
k

...

Os coeficientes de autocorrelao amostral e autocorrelao parcial seguem


uma distribuio normal, com mdia igual a zero e varincia 1 / n e erro padro de
1 / n 1/2 ,

onde n o nmero de observaes. Para intervalos de confiana de 95%, tais

coeficientes esto entre

1, 96 / n 1/2 e

(MATOS, 2000).

1, 96 / n 1/2

Formas alternativas de identificao foram propostas atravs de critrios de


informao que so mecanismos para encontrar o nmero ideal de parmetros de um
modelo, visto que podem ocorrer vrios problemas de identificao atravs da FAC e
FACP. A cada regressor adicional, a soma dos resduos no vai aumentar e,
freqentemente, ir diminuir. A reduo ocorre em funo de mais regressores e o
critrio de informao associa uma penalidade a esse aumento (BUENO, 2008).
Se a penalidade for menor que a diminuio da soma dos resduos, o
regressor adicional deve ser incorporado ao modelo, caso contrrio, se a penalidade for
maior que a reduo da soma, o regressor adicional traz mais custos que benefcios.
Portanto, o critrio de informao busca minimizar uma funo baseada nos resduos
penalizada pelo nmero de regressores. Dentre os principais, cita-se o AIC e o BIC.
O critrio de AIC, tambm chamado de Akaike Information Criterion e dado
respectivamente por:

AIC

log

2
k

n 2k
n

(2.28)

19

Em que:

2
k

SSE
; SSE
n

( yt

y )

t 1

SSE = soma do quadrado dos resduos;


2
k

= estimador da mxima verossimilhana da varincia;

n = tamanho da amostra;
k = n de parmetros do modelo.
Formalmente, o AIC tambm pode ser representado por:

AIC

2log Lk 2k

(2.29)

Existem vrias correes para melhorar o comportamento do AIC, que pode


ser tendencioso, no sentido de diminuir a probabilidade de se selecionar uma ordem
maior que a verdadeira. Uma delas foi proposta por Hurvich e Tsai (1989) que corrige o
AIC atravs de (2.30) (SHUMWAY, STOFFER, 2010).

AICc

log

2
k

n 2k
(2.30)
n k 2

Tambm possvel derivar um termo de correo com base em argumentos


bayesianos, como em Schwarz (1978), que leva ao BIC, Bayesian Information
Criterion, representado por (2.31):

BIC

log

2
k

k log n
n

(2.31)

O critrio BIC consistente assinoticamente, tendendo a escolher um


modelo mais parcimonioso que o AIC. J o AIC funciona melhor em pequenas
amostras, no obstante seja viesado para escolher modelos parametrizados
(MORETTIN, 2008). Porm, importante observar que estas medidas individualmente,
considerando um nico modelo, no tm nenhum significado. O AIC e BIC podem
assumir quaisquer valores, inclusive negativos, j que eles dependem da funo de

20

verossimilhana. Porm, para comparar esses critrios, a estimao precisa ser feita no
mesmo perodo amostral (EHLERS, 2009).
Alguns trabalhos propuseram a abordagem de redes neurais para
identificao dos parmetros do ARIMA, como Jhee et al. (1992) que desenvolveram
duas redes neurais usadas para modelar a funo de autocorrelao (FAC) e funo de
autocorrelao parcial (FACP), sendo que as sadas dessas RNAs indicaram as ordens
de um modelo ARMA. Lee e Jhee (1994), estudaram um sistema de RNAs para
identificao automtica dos parmetros de Box-Jenkins usando a funo de
autocorrelao estendida da amostra atravs de rede MPL para filtragem dos rudos e
identificar corretamente o modelo ARMA.
Reynolds et al (1995) tambm utilizaram as RNAs para o problema de
identificao do modelo Box-Jenkins. Duas redes foram criadas, a primeira foi usada
para determinar o nmero de diferenas necessrias para que uma srie temporal se
tornasse estacionria, enquanto a segunda teve o objetivo de identificar o modelo
ARMA com base nas informaes da FAC e FACP da srie.
b) Estimao
O segundo passo da metodologia Box-Jenkins consiste na estimao dos
parmetros do modelo identificado,

se houver parmetro auto-regressivo e

se

houver o filtro de mdias mveis e a varincia do rudo branco. Para um bom ajuste do
ARIMA necessrio utilizar tcnicas em que a estrutura residual seja um rudo branco,
equivalente a uma varivel aleatria independentemente e identicamente distribuda, ou
seja,

t ~

i .i .d (0,

) (BUENO, 2008; MORETIN, 2008).

A estimativa dos parmetros pode ocorrer atravs do mtodo dos momentos,


mnimos quadrados ou a mxima verossimilhana (condicional ou exata). O mtodo dos
momentos no tem boas propriedades quando comparados com os demais. O mtodo da

21

verossimilhana

condicional

assinoticamente

equivalente

ao

da

mxima

verossimilhana exata, mas com a vantagem de especificao e estimar a funo, porm


no to eficiente quanto ao mtodo exato, principalmente para pequenas amostras.
c) Validao dos parmetros estimados
Para Fava (2000), a verificao da adequabilidade do modelo, ou seja, a
validao ocorre atravs da anlise dos resduos e da avaliao da ordem do modelo. Se
o modelo identificado for adequado, o mesmo pode ser utilizado para realizar previses,
caso contrrio, outra especificao deve ser escolhida para modelar a srie temporal.
Alm de verificar se os resduos se comportam como um rudo branco
atravs dos testes Box-Pierce e Ljung-Box, equaes (2.25) e (2.26), no qual os
coeficientes de autocorrelao amostrais dos erros

devem ser estatisticamente iguais a

zero, necessrio identificar se os mesmos apresentam distribuio normal. A


identificao da normalidade do

pode ser realizada atravs dos testes de Jarque-Bera

e Shapiro-Wilk.
O teste Jarque-Bera verifica se os momentos da srie estimada so iguais
aos da normal. Sob essa hiptese, a assimetria igual a zero e a curtose igual a trs.
H 0 : E ( ts )3

E ( ts ) 4

H 1 : E ( ts )3

0 E ( ts ) 4

Em que a estatstica do teste Jarque-Bera dada por:

JB

T
t

(
1

s
t

)3

(
1

24

s
t

)4

(2.32)

Onde:
s
t

= resduo padronizado, ts

)/

T = tamanho da amostra

22

importante notar que a rejeio da hiptese nula indica no


normalidade, porm a no rejeio no indica normalidade. De fato, a no rejeio
indica que apenas o terceiro e quarto momentos da distribuio emprica coincidem
com os da normal (BUENO, 2008, p.xx).
Teste Shapiro-Wilk proposto em 1965 baseado na estatstica W. As
hipteses propostas foram de que H0: amostra provm de uma populao normal, contra
H1: amostra no de uma populao normal. De acordo com Shapiro e Wilk (1965),
dada uma amostra aleatria y 1 , y 2 ,..., y n , de tamanho n, deve-se proceder da seguinte
forma para calcular o valor de W:
i) Ordene a amostra, tal que y 1

y2

ii) Calcule a estatstica

...

y )2

( yi
i 1

yn ;

iii) Calcule o valor de b , em que:


k

2k , ento b

Se n

an

( yn

yi )

i 1

Se n 2k 1 , ento b

an( yn y 1) ... ak 2( yk

yk )

Em que i representa a observao atual, n o tamanho da amostra, o


coeficiente an

do teste W dado pela tabela desenvolvida por Shapiro-Wilk,

demonstrada abaixo para n 10 e i

5.

Tabela 2.1 -

23

Fonte: Shapiro e Wilk (1965)


iv) Calcule W

b / S , dado em (ii) e (iii);

v) Tomar a deciso: rejeitar H0 ao nvel de significncia se Wcalculado < W


(valores crticos tabelados da estatstica W de Shapiro-Wilk).
Como exemplo, considere uma amostragem de {6, 1, -4, 8, -2, 5, 0}.
i) Para a amostra ordenada, obtm-se:

y 1 -4, y 2 -2, y 3 0, y 4
1
(142 ) S 118 ;
7

ii) S 146

iii) Da tabela 5, para n


a 7 0,6233 ,

1, y 5 5, y 6 6, y 7 8.

7,

verifica:

a 6 0,3031 , a 5 0,1401 , a 4 0,0000

0,6233(8

4) 0,3031(6 2) 0,1401(5 0)

b 10,6049

iv) W

10, 6049 2 / 118

v) Para

0,9530

0,50 , o valor crtico tabelado da estatstica W de Shapiro-Wilk

de 0,928 e Wcalculado = 0,9530. Como Wcalculado > W, no existem


evidncias para rejeitar H0 ao nvel de significncia de 50%.
2.1.2.2.5. Modelos sazonais
Vrias modificaes so feitas no modelo ARIMA para explicar o
comportamento

sazonal

no-estacionrio

das

sries

temporais,

presente

principalmente em sries econmicas. Devido a essas flutuaes sazonais apropriado


introduzir polinmios auto-regressivos e de mdia mvel com defasagens sazonais
(SHUMWAY, STOFFER, 2010).
O resultado do modelo auto-regressivo de mdia mvel sazonal, dito como
ARMA (P, Q)s, assume a seguinte forma:

24

(B s )yt

(B s )

(2.33)

Em que o operador auto-regressivo sazonal e operador de mdia mvel


sazonal de ordens P e Q, respectivamente, com perodo sazonal s, dado por:
(B s ) 1

(B s ) 1

Bs

B 2s ...

Bs

B Ps (2.34)

B 2s ...

B Qs (2.35)

Abaixo, exemplo de um modelo ARMA (P, D) sazonal de primeira ordem.

B 12 )yt (1

(1

yt

yt

12

B 12 )

12

(2.36)

Em geral, possvel combinar operadores sazonal e no-sazonal em um


modelo sazonal multiplicativo denotado por ARMA (p, q) (P, Q) atravs da equao:
P

(B s ) (B )yt

(B s ) (B )

(2.37)

Os modelos sazonais anteriores consideram as observaes consecutivas


no correlacionadas; a correlao s existe entre t e t s , t 2s ... . A incorporao da
correlao entre instantes de tempo sucessivos redunda no modelo sazonal
multiplicativo geral denominado ARIMA (p, d, q) (P, D, Q) s (FAVA, 2000).
O ARIMA (p, d, q) (P, D, Q)s demonstrado por (2.38):
P

(B s ) (B )

D
s

yt

(B s ) (B )

(2.38)

Onde:
d

(1 B )d

D
s

(1 B s )D

(B s ) = equao (2.34)

(B s ) = equao (2.35)

(B )

= equao (2.5)
25

(B )

= equao (2.11)

2.1.2.3. Raiz Unitria


Para Margarido e Anfalos (1999), quando a srie estacionria, os
resultados da estatstica tradicional so vlidos, no entanto, quando a srie apresenta raiz
unitria h estimadores viesados, comprometendo, conseqentemente, a validade dos
resultados. Por isso, a aplicao do teste de raiz unitria importante para verificar se a
integrao foi suficiente para transformar a srie no-estacionria em estacionria.
Segundo Brooks (2002), o teste Dickey-Fuller (DF) tem como objetivo
bsico examinar a hiptese nula de que = 1, contra a hiptese alternativa <1, na
equao abaixo:

yt

yt

(2.39)

Portanto, as hipteses de interesse so H0: a srie contm uma raiz unitria,


contra hiptese alternativa H1: a srie estacionria. Ento, o teste DF verifica a
existncia de uma raiz unitria em yt , quando o processo gerador da srie expresso
por um dos trs modelos apresentados abaixo:
yt = yt - 1 +
yt =
yt =

yt - 1 +
t

(2.40)

(2.41)

yt - 1 +

(2.42)

A equao (2.40) demonstra um processo estocstico com caminho aleatrio


puro. O modelo (2.41) adiciona um intercepto
tendncia linear

t. O coeficiente

e (2.42) inclui o intercepto

e uma

estimado dividido por seu erro-padro para

calcular a estatstica de DF (, e , para as equaes (2.40), (2.41) e (2.42)


respectivamente). O valor obtido comparado com o valor tabelado de DF para
veriricar se a hiptese nula

= 1 rejeitada, ou seja, se a srie estacionria. Hipteses

26

a respeito da constante
individuais (H0:

e da tendncia linear t podem ser testadas por meio de testes

= 0 e H0: t = 0) e de testes conjuntos (H0: ( , t, ) = (0, 0, 0).

Em sntese, os testes DF consistem em estimar as equaes (2.40) a (2.42)


por mnimos quadrados ordinrios e comparar as estatsticas t resultantes, aos valores
crticos gerados por Dickey-Fuller. Para as hipteses conjuntas, a estatstica do teste
construda a partir da soma dos quadrados dos resduos das equaes de regresso
(FAVA, 2000).
Para Brooks (2002), os testes acima so vlidos somente quando o termo de
erro

for um rudo branco no-correlacionado. Caso contrrio, o verdadeiro tamanho

do teste, ou seja, a proporo de vezes que a hiptese nula incorretamente rejeitada


seria maior do que o tamanho nominal utilizado, geralmente 5%. A soluo foi
aumentar o teste, usando p defasagens das variveis dependentes, resultando no teste
Dickey-Fuller Aumentado (ADF). As equaes (2.40), (2.41) e (2.42) so reescritas
abaixo:
p 1

yt = yt - 1 +

yt

(2.43)

i 1

p 1

yt =

yt - 1

yt

(2.44)

i 1

p 1

yt = +

+ yt - 1 +

yt

(2.45)

i 1

27

Você também pode gostar