Você está na página 1de 35

ECONOMETRIA II

(2001/2002)

Modelizao Univariada de Sries Temporais: uma Introduo


Artur C. B. da Silva Lopes

Instituto Superior de Economia e Gesto Universidade Tcnica de Lisboa

Nota Introdutria Estas notas foram elaboradas com o propsito de apoiar o estudo dos alunos da disciplina de Econometria II do ISEG, no ano lectivo de 2001/2002, relativamente matria do captulo 4 do programa. A principal fonte empregue foi o livro de Jonhston, J. e DiNardo, J. (1997), Econometric Methods, 4th ed. [JD], mas procurouse simplicar a abordagem a seguida. No entanto, por vezes este texto segue esse livro de perto. O leitor interessado tambm poder consultar, entre muitas outras, as seguintes obras adicionais: Franses, Philip Hans (1998), Time Series Models for Business and Economic Forecasting, Mills, Terence C. (1992), Time Series Techniques for Economics e Mills, Terence C. (1999), The Econometric Modelling of Financial Time Series, 2nd ed. . Todos estes livros so da Cambridge University Press. Tambm o texto de Cochrane, J. H. (1997), Time Series for Macroeconomics and Finance, disponvel (em formato PDF) em http://gsbwww.uchicago.edu/fac/john.cochrane.research/Papers/timeser1.pdf, embora no contendo uma abordagem estatstica, recomendado pela sua acessibilidade. Agradeo os comentrios da colega Isabel Proena. Comentrios adicionais, sugestes e crticas sero muito bem-vindos!

Lisboa, 25 de Abril de 2002 Artur C. B. da Silva Lopes

ndice
1 Introduo 2 Preliminares 2.1 O operador de desfasamento (lag operator ) 2.2 O operador de diferenciao . . . . . . . . 2.3 Polinmios em L . . . . . . . . . . . . . . 2.4 Modelizao ARMA . . . . . . . . . . . . 3 Sries Estacionrias e 3.1 O Caso do AR(1) . 3.2 Raiz Unitria . . . 3.3 Anlise Grca . . No . . . . . . . . . 4 5 5 6 6 6 7 8 9 10 13 16 19 20 20 21 22 24 (TSP) . . . . . . . . . . . . . . . . . . . . ou por . . . . . . . . . . . . . . . . . . . . diferenci. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 29 29 32 33

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

Estacionrias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4 Modelos ARMA para Sries Estacionrias 5 Previso 6 Modelos Autoregressivos 6.1 Estimao . . . . . . . 6.2 Seleco . . . . . . . . 6.3 Testes-diagnstico . . . 6.4 Exemplo . . . . . . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

7 Anlise de Estacionaridade 7.1 Sries econmicas: estacionrias em tendncia ao (DSP)? . . . . . . . . . . . . . . . . . . . 7.2 Testes de razes unitrias: Testes DF e ADF . 7.2.1 Testes DF . . . . . . . . . . . . . . . . 7.2.2 Testes ADF . . . . . . . . . . . . . . . 7.3 Exemplo . . . . . . . . . . . . . . . . . . . . .

Introduo

Neste captulo o estudo incide exclusivamente sobre a modelizao de sries temporais econmicas, isto , de variveis econmicas observadas ao longo do tempo. Mais ainda: trata-se apenas da chamada modelizao univariada ou extrapolativa. Diz-se univariada porque se despreza a possibilidade de existirem relaes entre a varivel de interesse (yt ) e outras variveis econmicas. Assim, o comportamento de yt explicado apenas com base na sua histria passada e nos valores corrente e passados de um erro estocstico, assumido evoluir segundo um processo rudo branco ({ t }): yt = f (yt1 , yt2 , . . . , t ,
t1 , . . .), t

iid(0, 2 ).

Para tornar operacional esta relao necessrio especicar: a) a sua forma funcional e b) os nmeros de desfasamentos (lags ) de yt e de t . Relativamente ao primeiro aspecto saliente-se que s consideraremos modelos lineares (mas note-se que o estudo dos modelos no-lineares est em franca expanso). Relativamente ao segundo, de acordo com a sua estrutura e o seus desfasamentos teremos vrios modelos, j apresentados no captulo 2: AR(1) : MA(1) : MA(q ) : yt =
t

yt = yt1 + t , yt = 1
t

AR(p) : yt = 1 yt1 + . . . + p ytp + t ,


t1 , tq . t1

. . . q

Como sabido, todos estes modelos podem ser vistos como casos particulares do modelo (misto) ARMA(p, q): yt = 1 yt1 + 2 yt2 + . . . + p ytp +
t

t1

. . . q

tq .

Note-se ainda que todos estes modelos podem ser aumentados atravs da introduo de variveis determinsticas: constante, tendncia, dummies sazonais, etc.. Porqu modelizao extrapolativa? Porque o principal objectivo destes modelos o de prever os valores futuros das variveis extrapolando o seu comportamento passado. Contudo, note-se que esta extrapolao algo sosticada, pois baseia-se em mtodos estatsticos. Porqu e quando utilizar este tipo de abordagem? Como se disse, este tipo de modelizao puramente estatstico e despreza a informao dada pela teoria econmica sobre a relao da varivel com outras. Isto faz algum sentido? No a modelizao multivariada, que toma em considerao essas relaes, prefervel? No necessariamente. Porqu? 4

a) Porque quando o objectivo a previso de curto prazo, estes modelos so bastante baratos" (porque dispensam a obteno de informao sobre outras variveis) e a sua relao qualidade/preo pode ser (quase) imbatvel. Na verdade, modelos simples deste tipo podem fornecer melhores previses de curto prazo do que modelos com muitas equaes e muitas variveis explicativas. b) Porque a relao com outras variveis pode no estar bem fundamentada teoricamente. Adicionalmente, como veremos mais adiante, a boa modelizao multivariada de sries temporais requer que tenha sido efectuada previamente uma anlise univariada de cada srie.

2
2.1

Preliminares
O operador de desfasamento (lag operator )
1

Aplicado a uma srie, o operador de desfasamento, L, atrasa-a perodo: L(yt ) = yt1 .

ou desfasa-a num

Assim, L2 (yt ) = L[L(yt )] = L(yt1 ) = yt2 . Mais geralmente, com s inteiro: Ls (yt ) = yts . Note-se que este operador : comutativo com a multiplicao: L(yt ) = L(yt ) = yt1 ; distributivo relativamente adio: L(yt + xt ) = yt1 + xt1 . Note-se ainda que, embora nas manipulaes algbricas o operador L possa ser tratado como um escalar, no se deve perder de vista que um operador.
Na literatura tradicional de sries temporais mais comum a utilizao de B , como operador de atraso (backward shift ).
1

2.2

O operador de diferenciao

O operador de diferenciao, , pode escrever-se como 1 L, isto , 1 L. De facto, yt = yt yt1 = (1 L)yt . Repare-se que tambm pode aparecer sob a forma de potncia: 2 yt = (yt ) = (yt yt1 ) = yt yt1 yt1 + yt2 = yt 2yt1 + yt2 .

2.3

Polinmios em L

Um polinmio simples em L , por exemplo, (1 L)L, isto , L. Assim, (1 L)Lyt = yt1 = yt1 yt2 . Um exemplo mais interessante o seguinte: yt + 0.8yt1 0.2yt2 + 0.3yt3 = (1 + 0.8L 0.2L2 + 0.3L3 )yt . Fazendo (L) = (1 + 0.8L 0.2L2 + 0.3L3 ), podemos escrever yt + 0.8yt1 0.2yt2 + 0.3yt3 = (L)yt . Uma operao importante com os polinmios em L a da inverso. O caso que se apresenta a seguir, embora simples, dos mais importantes. Seja agora (L) = 1 L. Repare-se ento que (1 L)(1 + L + 2 L2 + . . . + p Lp ) = 1 p+1 Lp+1 . E desde que || < 1, quando p p+1 Lp+1 0. Ento, o polinmio inverso de (L) 1 = 1 + L + 2 L2 + 3 L3 + . . . , 1 (L) = 1 L isto , um polinmio innito. Uma forma intuitiva de ver isto consiste em olhar para o terceiro termo da igualdade como uma srie geomtrica com primeiro termo 1 e razo L.

2.4

Modelizao ARMA

A modelizao (e previso) ARMA consiste basicamente em 3 passos:

1. Anlise de estacionaridade da srie. Muito frequentemente necessrio transformar a srie (logaritmiz-la e/ou diferenci-la) para a estacionarizar". Saliente-se que os modelos ARMA pressupem a estacionaridade da srie 2 . 2. Com base na anlise das propriedades de autocorrelao da srie (eventualmente transformada) escolhemos algum ou alguns modelos que a possam representar aproximadamente. Trata-se da chamada anlise de identicao". No caso de considerarmos vrios modelos alternativos procede-se seleco de um modelo com base em testes-diagnstico" e em estatsticas como a AIC ou a SC. Note-se que o estudo que faremos desta fase ser muito limitado pois apenas consideraremos modelos autoregressivos. Por outro lado, a escolha de um modelo bom e simples , em boa medida, uma arte, requerendo muita experincia. 3. O modelo seleccionado utilizado para efectuar previso.

Sries Estacionrias e No Estacionrias

J sabemos que para que uma srie temporal (ou melhor, um processo estocstico) seja estacionria(o) (fracamente ou em covarincia), devem ser satisfeitas as seguintes condies: 1. E (yt ) = , t = 0, 1, 2, . . ., 2. E [(yt )(ytj )] = j , t = 0, 1, . . . , j = 0, 1, 2, . . .. Mas note-se que fazendo j = 0 nesta igualdade resulta E [(yt )2 ] = 2 y = 0 , t = 0, 1, 2, . . . . Assim, uma srie temporal estacionria se a sua mdia, a sua varincia e as suas autocovarincias so independentes do tempo, isto , so constantes ao longo do tempo. Note-se que esta denio de estacionaridade se baseia apenas nos dois primeiros momentos do processo estocstico.
Os modelos para sries que no so estacionrias mas que se tornam estacionrias quando diferenciadas sero chamados de ARIMA. O I" abrevia a palavra integrated".
2

3.1

O Caso do AR(1)

A ttulo de exemplo considere-se o processo AR(1): yt = m + yt1 + t . Substituindo yt1 pela sua expresso, isto , por m + yt2 + yt = m + m + 2 yt2 +
t t1

tem-se

t1 .

Continuando a resolver recursivamente e supondo que o processo se iniciou h muito tempo atrs tem-se: yt = m(1 + + 2 + 3 + . . .) + ( t +
t1

+ 2

t2

+ . . .),

(1)

isto , o processo AR(1) escrito sob a forma de MA(). Aplicando o operador valor esperado a esta expresso: E (yt ) = m(1 + + 2 + 3 + . . .). Desta forma, o processo tem mdia (nita) sse a srie (geomtrica) dentro de parntesis for convergente. Como sabido, a condio necessria e suciente que || < 1. Nestas condies, m E (yt ) = = , (2) 1 independente de t. Para calcular a varincia do processo vai continuar a assumir-se que || < 1. Assim, note-se que yt = t + t1 + 2 t2 + . . .. Por conseguinte,
2 2 y = V ar (yt ) = 0 = E [(yt ) ] = E [ 2 t

+ 2

2 t1

+ 4

2 t2

+ . . . + 2

t t1

+ . . .],

que tambm existe nita sse || < 1. Nestas condies,


2 2 4 2 2 2 y = V ar (yt ) = 0 = + + + . . . =

2 , 1 2

e note-se que esta expresso no faria qualquer sentido se || 1. Note-se tambm que, desde que a condio || < 1 seja satisfeita, a varincia do processo no depende de t. Finalmente, pode ainda mostrar-se que, desde que || < 1, as autocovarincias so 2 2 s 2 dadas por: 1 = 2 y , 2 = y e, em geral, s = y , s = 0, 1, 2, . . ., que so 8

independentes de t (dependendo apenas da ordem de desfasamento, s). Em resumo, quando || < 1 o processo AR(1) estacionrio 3 . Rera-se ainda que como os coecientes de autocorrelao so dados por s = s / 0 , tem-se s = s , s = 0, 1, 2, . . .. Desta forma, um processo AR(1) estacionrio tem memria longa", e tanto mais longa quanto mais prximo de |1| estiver . Por exemplo, com = 0.9, 20 0.122. Isto , mesmo aps 20 perodos, a srie ainda se lembra de 12.2% do choque ocorrido.

3.2

Raiz Unitria

Considere-se de novo o processo AR(1) mas com = 1, caso em que se tem o passeio aleatrio com deriva (m 6= 0): yt = m + yt1 + t . Diz-se que este processo tem uma raiz unitria pois ele pode escrever-se como (1 L)yt = m + t e a equao caracterstica, (z ) = 0, 4 dada por 1 z = 0, com soluo z = 1. Ou seja, tem-se uma raiz de mdulo unitrio (e que mesmo igual a um). Da anlise anterior j sabemos que este processo no estacionrio. Porqu? Porque nem sequer tem mdia constante. De facto, resolvendo recursivamente e assumindo que o processo se iniciou no momento 0 tem-se yt = 2m + yt2 + ... yt = y0 + mt +
t X i=1 i. t

t1 ,

(3)

Saliente-se a presena de um termo de tendncia determinstica (mt). Rera-se ainda que ao termo de acumulao de todos os choques, desde o primeiro periodo at ao P presente ( t i=1 i ), usual chamar de tendncia estocstica. Desta forma, o valor esperado condicional, E (yt |y0 ) = y0 + mt, varia ao longo do tempo.
Recorde-se que || < 1 tambm a condio de estabilidade da equao s diferenas de primeira ordem yt = m + yt1 . Desta forma tambm se pode dizer que, desde que a condio seja satisfeita, o processo AR(1) estvel. 4 usual empregar z em vez de L na equao caracterstica pois L um operador.
3

Por outro lado, para o passeio aleatrio sem deriva (m = 0), xt = xt1 +
t

o problema reside sobretudo na varincia. De facto, resolvendo recursivamente tem-se P xt = xt2 + t + t1 , . . ., xt = x0 + t i=1 i (note-se, de novo, a presena da tendncia estocstica). Por conseguinte,
t X 2 Var(xt |x0 ) = Var( i ) = t , i=1

que claramente no constante, crescendo medida que o tempo passa. Ambos os passeios aleatrios so ditos processos integrados de primeira ordem, escrevendo-se yt I (1) e xt I (1). De facto, trata-se dos exemplos mais simples de processos integrados de primeira ordem. Porqu integrados? Porqu de primeira ordem? Porque so no estacionrios mas quando so diferenciados uma vez cam estacionrios: yt = yt yt1 = (m + t ) I (0), xt = xt xt1 =
t

I (0),

onde I(0) a notao usada para representar uma srie que no precisa ser diferenciada nenhuma vez para car estacionria (mas que pode ser no estacionria). Assim, ordem de integrao de um processo o nmero mnimo de vezes que necessrio diferenci-lo para o tornar estacionrio.

3.3

Anlise Grca

No primeiro grco da gure 1" encontra-se representada gracamente uma srie, gerada em computador com base num modelo AR(1) estacionrio, dado por xt = 0.7xt1 + t (com x0 = 0). Ou seja, neste caso a mdia nula. Atente-se nas suas principais caractersticas: o comportamento da srie pouco suave ou muito errtico; a srie tem um comportamento de reverso (ou regresso) para a mdia, cruzando frequentemente o eixo das abcissas 5 ;
Se se tivesse m 6= 0 a mdia da srie seria dada por m/(1 0.7) e a srie cruzaria frequentemente a recta y = m/(1 0.7). Note-se que um mais prximo de zero implicaria um comportamento de reverso para a mdia ainda mais acentuado.
5

10

como a srie tem varincia (nita e) constante, ela tende a utuar sempre dentro de um intervalo de amplitude constante. Por outro lado, no segundo grco da gure 1" apresenta-se um exemplo de um passeio aleatrio sem deriva, yt = yt1 + t (com y0 = 0). Repare-se nas seguintes caractersticas: tem um comportamento muito mais suave; no apresenta um comportamento de reverso para a mdia nem para nenhum valor constante (isto , a srie parece vaguear sem destino); como a varincia cresce com o tempo, a srie tende a utuar dentro de intervalos de amplitude crescente. Finalmente, no terceiro grco apresenta-se um exemplo de um processo AR(1) no estacionrio explosivo (no integrado), dado por wt = 1.05wt1 + t (isto , || > 1). Sries econmicas com grcos deste tipo so usualmente logaritmizadas na tentativa de estacionarizao. A srie assim transformada ento sujeita a uma anlise de estacionaridade. Porque no considerar tambm sries (estacionrias e no estacionrias) com coeciente autoregressivo negativo? Porque estas tm pouco interesse em economia. De facto, as sries econmicas so geralmente caracterizadas por um comportamento de inrcia: a valores elevados tendem a seguir-se valores elevados e a valores baixos tendem a suceder-se tambm valores baixos. Por exemplo, muito difcil (se no impossvel) encontrar uma srie econmica bem aproximada pelo modelo no estacionrio t = t1 + t , que tambm possui uma raiz de mdulo unitrio (z = 1). De facto, repare-se que a srie tenderia a alternar de sinal, de observao para observao. Algumas sries econmicas com sazonalidade podem apresentar este tipo de comportamento mas s depois de diferenciadas. Ou seja, o interesse recai sobretudo sobre a raiz unitria positiva. O principal problema a estudar aqui ser ento o de, por exemplo, no contexto do modelo AR(1), yt = m + yt1 + t , testar H0 : = 1 vs H1 : < 1. Aparentemente, o problema parece ter soluo simples: estima-se a equao com o OLS e emprega-se a estatsticat 1 . 11

2 0

0 15 10 5 0 500
Y

10

20

30

40

50

60

70

80

90

100

10
W

20

30

40

50

60

70

80

90

100

250

10

20

30

40

50

60

70

80

90

100

Figure 1: Exemplos de sries geradas por modelos AR(1)

12

Todavia, como sob H0 yt no estacionria, a distribuio desta estatstica no a usual t-Student nem, assimptoticamente, a normal. Mais adiante estudaremos a resoluo do problema.

Modelos ARMA para Sries Estacionrias

O estudo das propriedades dos diversos tipos de modelos ARMA importante para seleccionar um (ou alguns) modelo(s) que possam ser considerados adequados para aproximar o comportamento da srie temporal em estudo. Ou seja, o conhecimento dessas propriedades que permite fazer a chamada anlise de identicao. Como foram os estatsticos G. E. P. Box e G. M. Jenkins quem, pela primeira vez 6 , apresentaram um estudo sistemtico das referidas propriedades para inmeros modelos, usual designar este tipo de modelizao como modelizao Box-Jenkins. Como se referiu, a anlise de identicao um pouco complexa. Desta forma, o assunto ser abordado de forma muito ligeira. Os modelos autoregressivos so particularmente adequados para situaes em que os t s, chamados de choques ou inovaes, tm um efeito que se vai diluindo no tempo de forma muito lenta. Com efeito, retomando de novo o caso do AR(1) estacionrio como exemplo e a equao (1), repare-se que o efeito sobre o nvel actual da srie de um choque unitrio ocorrido h um perodo atrs dado por , o de um choque ocorrido h 2 perodos atrs de 2 e, em geral, o de um choque ocorrido h s perodos atrs de s . Assim, se for elevado (por exemplo, 0.90), pode ser necessrio que decorra muito tempo at que a srie se esquea" do que ocorreu no passado. Rera-se ainda que essa equao a chamada representao MA() do processo AR(1) e que, no caso no estacionrio com || > 1 ter-se-ia um efeito estranho de a srie se recordar melhor dos choques mais antigos do que dos mais recentes. Embora ilustrado apenas com base no caso do AR(1), o problema da estacionaridade coloca-se relativamente a todos os processos autoregressivos. Assim, no caso geral de um AR(p), yt = 1 yt1 + . . . + p ytp + t , note-se que escrevendo toda a parte autoregressiva do lado esquerdo da equao tem-se: (1 1 L . . . p Lp )yt = t . Ou seja, fazendo (L) = 1 1 L . . . p Lp , pode escrever-se (L)yt = t ,
6

No livro Time Series Analysis, Forecasting and Control, publicado em 1970.

13

que a representao mais comum de um processo autoregressivo. As condies de estacionaridade podem ento ser apresentadas da forma que se segue. Comece por se formar a equao caracterstica: (1 1 z . . . p z p ) = 0, isto , (z ) = 0. A resoluo desta equao fornece as suas razes, representadas com zi (i = 1, 2, . . . , p), e estas podem ser complexas para os casos p 2, isto , as razes so do tipo zi = a + bi, com i2 = 1 (isto , i = 1). Os mdulos das razes so dados por |zi | = a2 + b2 . As condies de estacionaridade resumem-se a: sejam reais ou complexas, (todas) as razes devem ter mdulo superior a um, isto , |zi | > 1 (i = 1, 2, . . . , p), dizendo-se que se encontram fora do crculo unitrio. Os modelos autoregressivos sero retomados mais adiante, estudando-se ento uma forma muito simples de determinao da sua ordem (isto , de escolha do p). Pelo contrrio, os processos MA tm memria curta e so sempre estacionrios. Por exemplo, para o MA(1) verica-se facilmente que a srie se esquece" dos choques ocorridos h mais que um perodo. Para um MA(2), a srie esquece-se" dos choques ocorridos h mais que dois perodos atrs e, em geral, para um MA(q ) a srie esquecese" dos choques ocorridos h mais que q perodos atrs. A estacionaridade de qualquer processo MA nito tambm de fcil vericao. O problema que pode afectar os processos MA o da invertibilidade. Para o ilustrar considere-se o caso do MA(1): xt = t t1 , isto , xt = (1L) t . Resolvendo em ordem a t : 1 t = (1 L) xt , isto , desde que || < 1,
t

= (1 + L + 2 L2 + . . .)xt , = xt + xt1 + 2 xt2 + . . . , (4)

que tambm se pode escrever como xt = xt1 2 xt2 + . . . + t , isto , como um processo AR(). Note-se que esta representao tambm s faz sentido se || < 1. No caso contrrio, xt dependeria mais fortemente dos seus valores mais antigos do que dos mais recentes (|| > 1) ou dependeria da mesma forma de todos os valores passados (|| = 1). Diz-se ento que se inverteu o processo MA(1) e a 14

condio || < 1 chamada de condio de invertibilidade do MA(1). Rera-se tambm que, se esta condio no for satisfeita, podero ocorrer problemas de estimao e de previso. Mais geralmente, considere-se o processo MA(q ), xt = t 1 t1 . . . q tq , que se pode escrever como xt = (1 1 L . . . q Lq ) t , isto , xt = (L) t , com (L) = 1 1 L . . . q Lq . Procedendo como anteriormente, (L)1 xt = t , com (L)1 um polinmio innito. Resolvendo em ordem a xt obtm-se a representao AR() do processo MA, do tipo, xt = 1 xt1 + 2 xt2 + . . . + t , que s tem sentido se todas as razes do polinmio (L), isto , se todas as solues da equao caracterstica (z ) = 0, se situarem fora do crculo unitrio. Estas so as condies de invertibilidade do processo MA. Tal como para o MA(1), se estas condies no forem satisfeitas, podem observar-se problemas de estimao e de previso. Finalmente, para o caso mais geral dos processos ARMA (estacionrios), tem-se (L)yt = (L) t , com (L) = 1 1 L . . . p Lp o polinmio autoregressivo de ordem p e (L) = 1 1 L . . . q Lq o polinmio MA de ordem q . Satisfeitas as condies de estacionaridade (razes de (L) fora do crculo unitrio), o processo pode ser escrito como um MA(), yt = (L)1 (L) t , com coecientes que tendem para zero medida que vamos recuando no tempo. Como exemplo, considere-se o processo ARMA(1,1) dado por yt = 2 + 0.8yt1 + t 0.5 t1 , isto , (1 0.8L)yt = 2 + (1 0.5L) t . Resolvendo em ordem a yt , invertendo o seu polinmio autoregressivo, yt = (1 0.8L)1 2 + (1 0.8L)1 (1 0.5L) t , isto , yt = 2/(1 0.8) + (1 0.5L)(1 + 0.8L + 0.82 L2 + . . .) t , 15

ou seja, yt = 10 + (1 + 0.8L + 0.82 L2 + 0.83 L3 + . . . 0.5L 0.4L2 0.32L3 . . .) t . Desta forma, passado um perodo, o efeito de um choque unitrio de 0.3 unidades, passados dois perodos de 0.24 unidades, passados trs perodos de 0.192, etc.. Por outro lado, satisfeitas tambm as condies de invertibilidade (razes de (L) fora do crculo unitrio), o processo tambm pode ser escrito como um AR(), (L)1 (L)yt = t , tambm com coecientes que vo tendendo para zero medida que nos afastamos do presente. Desta forma, a partir de certa ordem, os coecientes sero to pequenos que, para efeitos prticos, podero ser negligenciados. Ou seja, mesmo um processo misto ARMA poder ser aproximado por um AR nito. esta aproximao que justica que, mais adiante, apenas nos preocupemos com os processos (modelos) AR nitos.

Previso

Como se referiu inicialmente, o principal objectivo da utilizao dos modelos ARMA a projeco ou extrapolao da srie para o futuro, para alm do perodo da amostra. Obviamente, a previso est sujeita a erros. Os erros de previso tm duas fontes, ou origens: 1. o desconhecimento dos choques ou inovaes futuras; 2. o desconhecimento dos valores dos parmetros e os erros inevitveis da sua estimao. Como em JD, no que se segue s consideraremos a primeira fonte. Tambm s alguns modelos simples sero estudados a ttulo de exemplo. Assume-se que temos observaes para a varivel de interesse (y ) de 1 a n. Assim, as previses so efectuadas de forma condicional na informao disponvel no nal do perodo n, isto , o nal da amostra a origem da previso. Considerem-se as seguintes notaes: yn+s representa o valor desconhecido (a prever) no perodo n + s; assim, s representa o horizonte de previso; 16

y n+s representa a previso de yn+s feita com base na informao disponvel no nal do perodo n (mas mais adiante representar a previso ptima). Suponha-se que se pretende que as previses obedeam s seguintes condies: a) os erros de previso positivos e os negativos implicam custos idnticos; b) todavia, pretende-se evitar grandes erros de previso, penalizando-os fortemente. Nestas condies, para avaliar a qualidade das previses razovel usar o seu erro quadrtico mdio, n+s )2 ], EQM ( yn+s ) = E [(yn+s y e, naturalmente, procura-se encontrar a previso que minimize o EQM (de previso). Pode ento mostrar-se que a previso de yn+s , efectuada no nal do perodo n, que minimiza o EQM, o valor esperado de yn+s condicional em toda a informao disponvel at esse momento. Por outras palavras, a previso ptima (em EQM) dada por y n+s = En (yn+s ), onde o ndice n em E traduz o condicionamento sobre a informao disponvel at ao referido momento. 7 Como primeiro exemplo de aplicao desta regra, comecemos por considerar o caso do processo AR(1), yt = m + yt1 + t . Mesmo que s seja elevado, como a previso efectuada recursivamente, teremos que obter inicialmente a previso para s = 1, depois para s = 2, etc.. Ento, para s = 1 tem-se yn+1 = m + yn + Logo, y n+1 = En [m + yn +
n+1 ]. n+1 .

Como calcular o valor esperado condicional? Relativamente ao presente e ao passado, isto , no nal do perodo n, os valores das variveis aleatrias referentes a esses perodos foram j observados, isto , so (considerados como) conhecidos. Assim, para t n, En (yt ) = yt e En ( t ) = t .
Outra forma de representar o mesmo, muito comum na literatura, E (yn+s |In ), onde In representa toda a informao disponvel at ao nal do perodo n. Recorde-se, contudo, que a informao aqui empregue se refere apenas histria da varivel e das inovaes ou choques.
7

17

Mas relativamente aos t s futuros (t > n), o valor esperado condicional igual ao valor esperado no condicional (zero) dado que a independncia dos s implica que o conhecimento do seu passado (e presente) nada adianta sobre o futuro: para t > n, En ( t ) = E ( t ) = 0. Desta forma, a previso ptima para yn+1 y n+1 = En [m + yn +
n+1 ]

= m + yn .

Por conseguinte, o erro de previso n+1 . No admira, assim, que os s sejam designados como inovaes, ou surpresas", ou choques. Por outro lado, para s = 2, tem-se yn+2 = m + yn+1 + Por conseguinte, y n+2 = En [m + yn+1 + = m + y n+1 = m + (m + yn ) = m + m + 2 yn . Em geral, para um s (positivo) qualquer, tem-se n+s1 , y n+s = m + y que tambm se pode mostrar ser y n+s = + s (yn ), com = m/(1 ) (reveja-se a equao (2)). Esta expresso permite concluir que, medida que o horizonte de previso aumenta, como || < 1 a previso tende para a mdia do processo. Ou seja, as previses para prazos um pouco mais longos tornam-se pouco informativas. Esta uma das razes que levam a desaconselhar a utilizao destes modelos para previses de mdio e de longo prazos. Ainda a ttulo de exemplo considere-se agora o caso do processo MA(1): yt = m +
t n+2 ] n+2 .

t1 ,

18

para o qual se verica facilmente que = E (yt ) = m. Ento, para s = 1: y n+1 = En [m + Para s = 2, y n+2 = En [m +
n+2 n+1

n] = m n.
n+1 ]

= m = .

n+s = m = . E tambm se verica facilmente que, para s > 2, tambm se tem y Ou seja, as previses tornam-se pouco informativas muito rapidamente (e da que os modelos MA puros sejam pouco utilizados para as sries econmicas). Finalmente, rera-se que: 1. A incerteza de previso medida atravs da varincia do erro de previso. Ora, pode mostrar-se que: a) para processos ARMA (estacionrios), a varincia dos erros de previso limitada e tende para a varincia no condicional do processo. b) Pelo contrrio, para os processos no estacionrios a varincia dos erros de previso no limitada e vai crescendo com o horizonte de previso. Este comportamento parece muito mais plausvel para muitas das variveis econmicas: a incerteza de previso aumenta medida que nos afastamos do presente. Isto , muita ateno deve ser dada aos processos no estacionrios. 2. Em termos prticos, evidente que os parmetros no so conhecidos e necessitam ser substitudos por estimativas nas expresses anteriores. Tambm os t s, com t n, no so efectivamente observados. Assim, na prtica so substitudos pelos t s (ou et s), isto , pelos resduos ou erros de estimao.

Modelos Autoregressivos

Pelas razes j referidas e tambm porque so mais fceis de estimar, apenas os modelos autoregressivos sero objecto de ateno mais detalhada. No se pense, no entanto, que os modelos MA e ARMA no so teis para as sries econmicas. Por exemplo, um modelo que parece adequar-se bem a algumas sries econmicas yt = m +
t

t1 ,

19

com > 0, isto , um modelo MA(1) sobre a srie diferenciada (isto , um modelo ARIMA(0,1,1)) 8 .

6.1

Estimao

Considere-se o modelo AR(p): yt = m + 1 yt1 + . . . + p ytp + t . Como os erros do modelo seguem um processo rudo branco, o estimador OLS consistente. Adicionalmente, desde que a distribuio dos t s seja normal 9 , pode mostrar-se que o estimador OLS idntico ao estimador de mxima verosimilhana condicional nas primeiras p observaes. Desta forma, o estimador OLS pode tambm ser considerado como assimptoticamente eciente.

6.2

Seleco

Os resultados anteriores assumem que a ordem do processo, p, conhecida. Todavia, um dos problemas mais importantes para os modelos autoregressivos precisamente o da escolha (ou estimao) da sua ordem. Contudo, no parece existir ainda uma soluo ptima, unanimemente aceite. Assim, muitos investigadores usam a estatstica AIC, escolhendo o modelo que minimiza essa estatstica. Outros empregam, por exemplo, a estatstica SC (ou SIC ou SBIC) para o mesmo efeito. Outras estatsticas do mesmo tipo tambm so empregues. Note-se, contudo, que o R2 no deve ser empregue. De facto, por exemplo, para o processo AR(1), yt = m + yt1 + t , o R2 da populao dado por 2 . Ou seja, se, por exemplo, = 0.9, o R2 muito maior do que se = 0.2, mas esse facto no signica que o primeiro modelo seja mais adequado que o segundo. Por outro lado, tambm no se deve comparar, usando o R2 , a qualidade de um modelo em que a varivel dependente aparece diferenciada com a de outro em que aparece sem o ser (em nvel). Porqu? Nos ltimos anos, a chamada estratgia de modelizao do geral para o particular tem vindo a prevalecer no trabalho emprico. Frequentemente, esta estratgia serve-se de testes-t individuais, de signicncia sobre os coecientes autoregressivos, sendo por isso chamada tambm de t-sig".
O I" que agora aparece e o correspondente 1" referem-se ao facto de a srie ser integrada de primeira ordem. 9 Dizendo-se que { t } um processo rudo branco Gaussiano.
8

20

Em termos simples, esta estratgia parte da xao de uma ordem mxima para a autoregresso, seja pmax . Estimado o modelo autoregressivo com essa ordem, testa-se a signicncia do ltimo coeciente, isto , do coeciente pmax , utilizando um vulgar rcio-t, vlido assimptoticamente. Se a hiptese nula for rejeitada o processo pra imediatamente e seleccionado p = pmax . No caso contrrio, o modelo simplicado com a excluso do ltimo desfasamento e re-estimado. O processo de teste ento retomado: testa-se a signicncia do ltimo coeciente (pmax 1 ) e, caso a hiptese nula seja rejeitada, o processo pra. No caso contrrio, o modelo reespecicado com a excluso do ltimo desfasamento e o procedimento de estimao e de teste retomado. Ou seja, o processo sequencial s pra quando se obtm a rejeio de uma hiptese nula (ou quando se atinge a ordem zero). Daqui emergem dois novos problemas: a) que dimenso usar para os testes? b) como escolher pmax ? Ambos os problemas tm sido resolvidas de forma algo arbitrria. Relativamente ao primeiro, muitos investigadores usam o habitual = 0.05 mas outros preferem usar = 0.10. Como evidente, com alguma frequncia os ltimos tendero a seleccionar ordens mais elevadas que os primeiros. Ou seja, quanto mais elevado for o empregue nos testes sequenciais mais liberal" tender a ser a especicao escolhida. Por outro lado, para escolher pmax vrias regras determinsticas tm sido sugeridas, todas elas associando essa ordem dimenso da amostra. Uma regra algo popular a chamada l12 , que prope que pmax (n) = [12(n/100)1/4 ] onde [.] representa a parte inteira de". Por exemplo, supondo que n = 50 ter-se- pmax = 10. Todavia, outros investigadores preferem usar regras que no implicam a perda de tantas observaes (como a regra l4 "). Assim, por exemplo, frequente usar-se pmax = 6 quando n = 50 e pmax = 10 quando n = 100. 10

6.3

Testes-diagnstico

O modelo escolhido e estimado com base nos procedimentos referidos dever ainda ser submetido a testes-diagnstico" e, em particular, a testes de autocorrelao. A ideia base de que se os resduos do modelo apresentam ainda alguma autocorrelao
Note-se que a utilizao do procedimento sequencial t-sig tem dominado a prtica economtrica nos ltimos 10 anos mas que se descobriu recentemente que o mtodo funciona mal quando o modelo autoregressivo contm regressores determinsticos, e tanto pior quanto maior for o nmero destes. Assim, dentro de poucos anos, provvel que este procedimento seja abandonado.
10

21

porque a estrutura dinmica do modelo inadequada ou insuciente. De outra forma, num modelo especicado correctamente, os erros devero evoluir segundo um processo rudo branco. Assim, analisam-se os resduos de estimao, que devero reectir (aproximadamente) este comportamento ideal. Embora na anlise tradicional das sries temporais sejam empregues mais frequentemente os testes de Ljung-Box, so os testes de Breusch-Godfrey (de multiplicadores de Lagrange) que devero ser usados preferencialmente. De facto, alguns estudos tm demonstrado que os ltimos so mais potentes que os primeiros. Adicionalmente, relembre-se que convm efectuar testes para vrias ordens: o teste de primeira ordem obrigatrio mas (pelo menos) um teste de ordem superior testando a ausncia de autocorrelao at ordem 3 ou 4 , tambm deve ser efectuado. Adicionalmente, a frequncia das observaes tambm d indicaes teis. Por exemplo, para dados trimestrais praticamente obrigatrio um teste para as autocorrelaes at ordem 4 (ou at 8, se o nmero de observaes for grande); para observaes mensais devem considerar-se testes at s ordens 6 e 12, etc..

6.4

Exemplo

Para exemplo simples de modelizao e previso autoregressiva consideraram-se os dados trimestrais (do logaritmo) do consumo de cimento no mercado interno, do exerccio 40, entre 80.1 e 2001.4, cujo grco apresentado na gure 2". Da anlise grca claro que se deve incluir nos modelos um termo de tendncia determinstica bem como um conjunto de dummies" sazonais. Por outro lado, note-se que o trabalho de especicao se baseou apenas nos dados de 80.1 a 2001.2, reservando para a simulao das previses as duas ltimas observaes. Como primeiro modelo (M1) considerou-se uma autoregresso com pmax = 8, tendo = 6) pelo processo sequencial, t-sig, de eliminao dos desfasase obtido p = 6 (ou p mentos insignicantes. O modelo estimado yt = 1.032 + 0.070Q1t + 0.107Q2t + 0.084Q3t + 0.002 t + 0.549yt1 + 0.260yt2 1t , u1 = 0.052, 0.025yt3 + 0.138yt4 + 0.175yt5 0.252yt6 + u mas com os regressores yt3 , yt4 e yt5 algo longe da signicncia estatstica (os valores-p dos seus coecientes so, respectivamente, 0.857, 0.319 e 0.202). Este modelo ajusta-se bem aos dados (R2 = 0.96) e, sobretudo, passa" facilmente os testes BG de autocorrelao de primeira ordem e at ordem quatro: BG(1) = 0.74 [0.388] e BG(4) = 3.61 [0.459], com os valores dentro de parntesis a representarem os valores-p. 22

8 7.9 7.8 7.7 7.6 7.5 7.4 7.3 7.2 7.1 1980

LC

1985

1990

1995

2000

Figure 2: Logaritmo do consumo de cimento no mercado interno Como segundo modelo (M2) considerou-se uma autoregresso com pmax = 4, que produziu yt = 0.667 + 0.059Q1t + 0.120Q2t + 0.106Q3t + 0.001 t + 0.620yt1 +0.276yt2 + u 2t , u2 = 0.053, ou seja, um modelo bastante mais parcimonioso, apenas com p = 2, o que ilustra o facto bem conhecido de a ordem seleccionada do processo autoregressivo depender fortemente da ordem mxima inicialmente assumida. Este modelo tambm se ajusta bem aos dados (R2 = 0.95) e tambm passa" facilmente nos testes de autocorrelao: BG(1)=0.05[0.825] e BG(4) = 5.44[0.245]. Finalmente, como nos modelos anteriores as somas dos coecientes autoregressivos no se encontram muito longe da unidade, especicou-se e estimou-se um modelo nas primeiras diferenas (isto , impondo uma raiz unitria), iniciando o processo com trs desfasamentos. (Porque no tambm quatro desfasamentos, como no caso anterior?) O modelo a que se chegou simplesmente yt = 0.064 + 0.063Q1t + 0.127Q2t + 0.109Q3t 0.320yt1 + u 3t , u3 = 0.053, com todos os coecientes altamente" signicativos
11

11

. O R2 = 0.494 pode ser consi-

Porque no se considerou o termo de tendncia determinstica neste modelo?

23

derado como bastante elevado atendendo a que se refere a uma srie diferenciada. Por outro lado, o modelo tambm passa facilmente os testes de autocorrelao: BG(1) = 0.20[0.657] e BG(4) = 4.73 [0.316]. Os trs modelos foram empregues para efectuar previses para os dois ltimos trimestres de 2001 12 , com os resultados que se apresentam no quadro 1. RQEQM e EAM representam, respectivamente, a raiz quadrada do EQM e o erro absoluto mdio. Quadro 1 Valores observados e previstos (em milhares de toneladas) e anlise sumria das previses 2001.3 2001.4 RQEQM EAM val. obs. 3005 2840 prev. M1 2874 2717 127.1 127.1 prev. M2 2941 2757 73.8 73.1 prev. M3 2934 2752 79.7 79.3

Desta forma, como se constata facilmente, a ordenao dos modelos em termos de qualidade das previses dada por: M2, M3 e M1. Note-se ainda que possvel obter previses claramente melhores que estas mas com um custo (de obteno de informao adicional) superior. Alis, mesmo empregando apenas uma anlise univariada um pouco mais sosticada, tambm possvel obter previses de melhor qualidade. Em particular, basta incorporar no modelo a quebra na tendncia da srie ocorrida ainda na primeira metade da dcada de 80, que ainda mais perceptvel quando se emprega uma amostra de dados anuais iniciada em 1960 ou mesmo em 1948.

Anlise de Estacionaridade

Usando como exemplo o caso do AR(1), j vimos que a distino entre srie (processo) estacionria e no estacionria mas integrada crucial sob vrios pontos de vista: momentos (at ordem dois) e comportamento da srie. Tambm os mtodos 13 e a incerteza de previso dependem fortemente da natureza da srie.
Recorde que, aps a instruo de estimao de cada modelo pelo OLS, bastante fcil obter as respectivas previses usando o TSP. Por exemplo, neste caso: SMPL 2001:3 2001:4; FORCST PREV; PRINT PREV;". Por outro lado, inmeras estatsticas de anlise da qualidade das previses podem ser obtidas com o comando ACTFIT. Por exemplo: ACTFIT OBS PREV;", com OBS" e PREV" a representarem, respectivamente, as sries de observaes e de previses. 13 Este ponto no foi desenvolvido mas o seu tratamento bastante simples. Suponha-se, por exemplo, que yt I(1), do tipo yt = m + yt1 + ut , com ut um processo ARMA (estacionrio). Ento,
12

24

Por outro lado, tambm o efeito de longo prazo dos choques depende dessa natureza. Usando como exemplo de novo o caso do AR(1) estacionrio (|| < 1) e recuperando a equao (1), yt = m(1 + + 2 + 3 + . . .) + ( t +
t1

+ 2

t2

+ . . .),

repare-se que os choques tm um efeito transitrio, que se vai diluindo com a passagem do tempo. Em termos formais: yt / ts = s . Por conseguinte, lims yt / ts = lims s = 0. Pelo contrrio, para um processo integrado de primeira ordem, o efeito dos choques ou inovaes permanente, no se vai diluindo com a passagem do tempo 14 . Usando de novo o caso do passeio aleatrio para ilustrao, relembre-se a equao (3): t X yt = y0 + mt + i.
i=1

Ou seja, supondo que o processo foi iniciado h muito tempo, lims yt / ts = 1. como se a economia se lembrasse" hoje completamente de todos os choques, mesmo daqueles que ocorreram h muito tempo no passado. Por outro lado, ainda, os mtodos de estimao e de inferncia tradicionais, formulados para sries estacionrias, em geral funcionam mal para as sries no estacionrias. No captulo 5, a propsito da anlise multivariada, estudar-se- uma motivao adicional.

7.1

Sries econmicas: estacionrias em tendncia (TSP) ou por diferenciao (DSP)?

Embora til e motivadora, a anlise anterior no a mais relevante para sries econmicas como as do produto, do consumo, do investimento, do ndice de preos, do rendimento, da moeda, etc.. Todas estas sries tm uma caracterstica comum: uma tendncia (ou comportamento de longo prazo) crescente com o tempo. Ento, obviamente, como no tm mdia constante ao longo do tempo, no so estacionrias. Todavia, dois modelos muito distintos esto disponveis para aproximar este tipo de comportamento: o modelo (ou processo) de estacionaridade em tendncia (TSP,
a previso para yt+1 dada por y t+1 = m + yt + u t+1 , com u t+1 = Et (ut+1 ). 14 Rera-se que este aspecto no parece ser completamente razovel: embora a economia parea ser por vezes afectada por choques permanentes, alguns (muitos) choques tm natureza transitria, no a afectando de forma duradoura.

25

trend stationary process ) e o de estacionaridade por diferenciao (DSP, dierence stationary process ) ou de raiz unitria (RU). Segundo a hiptese TSP, a srie yt pode escrever-se como yt = f (t) + ut , onde f (t) uma funo do tempo e ut representa um processo (ARMA) estacionrio. Por exemplo, assumindo uma tendncia linear determinstica, que a hiptese tradicionalmente considerada, ter-se-ia yt = 0 + 1 t + ut . Todavia, como as sries econmicas tm, em geral, uma taxa de crescimento aproximadamente constante, o modelo de tendncia exponencial revela-se, frequentemente, mais adequado: yt = exp[ 0 + 1 t + ut ], donde resulta ln(yt ) = 0 + 1 t + ut , (5) isto , com a presena da tendncia linear na srie logaritmizada.15 Em ambos os casos, o aspecto a realar que os desvios em relao tendncia (ut ) so assumidos como estacionrios. Ora esta viso corresponde perspectiva tradicional dos ciclos econmicos: a tendncia determinstica seria determinada pelo crescimento quantitativo e qualitativo da populao, pela acumulao de capital, pelo progresso tecnolgico, etc.. Os ciclos econmicos representariam apenas perturbaes transitrias relativamente a essa tendncia. Por outras palavras, os efeitos dos choques econmicos dissipar-se-iam mais ou menos rapidamente com o tempo. Pelo contrrio, teorias mais recentes como a dos ciclos econmicos reais que atribuem a totalidade das utuaes do produto aos choques de produtividade , ou do rendimento permanente, por exemplo, salientam a forte persistncia dos choques sobre variveis como o produto e o consumo, respectivamente. Assim, a melhor maneira de representar estatisticamente essas sries seria atravs de processos integrados, isto , estacionrios por diferenciao (DSP) ou de raiz unitria (RU). De facto, retomando, por exemplo, o caso do passeio aleatrio com deriva, yt = 1 + yt1 + t e resolvendo recursivamente, j vimos que a presena da tendncia crescente (desde que 1 > 0) tambm facilmente acomodada por um processo integrado
15

No que se segue, utilizar-se- apenas yt mesmo que se trate de um srie previamente logaritmizada.

26

60

50

40

30

20

10 0 10 20 30 40 50 60 70 80 90 100

Figure 3: Exemplo de srie estacionria por diferenciao P ou de raiz unitria: yt = y0 + 1 t + t i=1 i . Como esta equao mostra, a grande diferena relativamente ao modelo de estacionaridade em tendncia (TS) que a presena da RU introduz tambm uma tendncia estocstica. Ou seja, os desvios relativamente tendncia determinstica so, segundo a hiptese DSP ou de raiz unitria, no estacionrios. Na gure" 3 apresenta-se um exemplo de uma srie gerada com base num passeio aleatrio com deriva positiva, cujo aspecto semelhante ao de muitas sries macroeconmicas. A questo a responder , pois, a seguinte: os desvios em relao tendncia determinstica so meramente transitrios, existindo como que uma mo invisvel" que volta a colocar a economia no caminho da tendncia determinstica ou, pelo contrrio, os choques econmicos tm um efeito permanente? Na fase inicial da revoluo das razes unitrias" (nas dcada de 80 e em boa parte da de 90), foram sobretudo estas motivaes decorrentes do debate (poltico-)econmico que a alimentaram. Todavia, como j vimos, os dois modelos tm tambm implicaes estatsticas claramente dissemelhantes. Por outro lado, como bvio, o procedimento adequado para a estacionarizao depende da natureza da srie: a) se esta for TS deve remover-se a tendncia determinstica, usando-se os resduos OLS da regresso (4); b) no caso DSP, obviamente, deve diferenciar-se a srie. Saliente-se que incorrecto estacionarizar uma srie TS diferenciando-a e estacionarizar uma srie DS removendo a tendncia determinstica: relativamente ao primeiro caso, por exemplo se yt = 0 + 1 t+ t , se diferenciarmos 27

a srie obtm-se yt = 1 + t t1 , isto , a diferenciao introduz uma raiz unitria no polinmio MA, que no invertvel; relativamente segunda armao, e tomando como exemplo o caso do passeio aleatrio com deriva, yt = m + yt1 + t , j vimos que ele se pode escrever como P yt = y0 + mt + t i=1 i (reveja-se a equao (3)). Desta forma, como a tendncia estocstica se mantm, a remoo da tendncia determinstica insuciente para estacionarizar o processo. Por outro lado, salienta-se que a anlise de estacionaridade deve ser vista preferencialmente como a dos desvios em relao a uma componente determinstica: esta pode no existir, ou pode ser dada apenas por uma constante ou por dummies" sazonais, ou por uma tendncia determinstica adicionada s anteriores, etc. . Por exemplo, para saber a ordem de integrao da srie dada por yt = 0 + 1 t + 2 t2 + ut , a presena do polinmio em t irrelevante: a natureza de ut que determina a ordem de integrao de yt . Assim, a denio de ordem de integrao dada anteriormente agora tornada mais precisa 16 : um processo estocstico, yt , sem componentes determinsticos, integrado de ordem d, yt I (d), quando s aps ser diferenciado d vezes se torna estacionrio (no o sendo ainda aps d 1 diferenciaes). Desta forma, emprega-se a notao yt I (0) para representar uma srie (processo) que no necessita ser diferenciada nenhuma vez para se tornar estacionria (embora possa ser no estacionria, como no caso TS). Mais geralmente se, excluindo os termos determinsticos, o processo yt se escrever como (L)yt = (L) t , onde (L) e (L) representam, respectivamente, os polinmios autoregressivo e de mdia mveis, e se o primeiro tiver d razes unitrias, com as restantes fora do crculo unitrio, ento pode escrever-se (1 L)d (L)yt = (L) t , onde todas as razes de (L) se encontram fora do crculo unitrio, isto , (L)d yt = (L) t .
Seguindo Engle, R. F. e Granger, C. W. J. (1987), Co-integration and Error Correction: Representation, Estimation and Testing, Econometrica, 55, 251-76.
16

28

Assim, determinar a ordem de integrao de uma srie o mesmo que determinar o nmero de razes unitrias do seu polinmio autoregressivo, e da a designao de razes unitrias autoregressivas e de testes de razes unitrias (autoregressivas). Em geral, h evidncia emprica de que muitas sries econmicas so bem aproximadas por processos I(1); algumas sero I(0)" e muito poucas, apenas algumas sries nominais como as dos ndices de preos ou do stock de moeda, aparentam ser I(2). Na anlise que se segue, s as hipteses I(1) e I(0) sero consideradas.

7.2

Testes de razes unitrias: Testes DF e ADF

Pelas razes apontadas e tambm pela sua importncia como instrumento preliminar da anlise multivariada, os testes de razes unitrias tornaram-se muito importantes nos ltimos 20 anos. Inmeros testes foram propostos mas ainda hoje so os testes de Dickey e Fuller os mais importantes nas aplicaes empricas. 7.2.1 Testes DF

Inicia-se a anlise com o teste mais comum, para escolher entre o modelo TS yt = 0 + 1 t + ut , com ut um processo AR(1) estacionrio, e o modelo DS mais simples com deriva, isto , com uma RU: yt = 1 + yt1 + t . Como os dois modelos so no encaixados, necessrio especicar um modelo mais geral de que ambos resultem como caso particular. Pode mostrar-se que esse modelo mais geral do tipo yt = + t + yt1 + t , (6) com t iid, obtendo-se o TSP quando < 1 e o DSP quando = 1. Trata-se ento de testar a hiptese nula de uma RU com base nesta equao, isto , H0 : = 1 yt I (1), contra a alternativa de estacionaridade em tendncia, H1 : < 1 yt I (0), e note-se que o teste unilateral esquerdo: a regio crtica ser toda denida na aba esquerda da distribuio da estatstica de teste. Esta uma estatstica-t, representada 1)/ com ct = ( . 29

Todavia, a estatstica de teste calcula-se ainda mais facilmente se subtrairmos yt1 a ambos os membros de (6): yt = + t + ( 1)yt1 + t , isto , yt = + t + yt1 + t , onde se fez = ( 1). Ou seja, trata-se agora simplesmente de testar H0 : = 0 vs H1 : < 0, / teste que se pode basear no rcio-t de : ct = . Como mostraram Dickey e Fuller, a distribuio da estatstica de teste (sob H0 ) no uma t-Student nem uma normal (nem mesmo assimptoticamente) 17 . A distribuio assimpttica algo complicada, envolvendo os chamados processos de Wiener (ou movimentos Brownianos), no simtrica e com mediana e moda menores que zero, e foi primeiramente tabelada por Dickey e Fuller (usando mtodos de simulao) 18 . Da que o nome adoptado para a distribuio tenha sido o desses investigadores, o mesmo acontencendo com os testes, vulgarmente conhecidos como testes DF. Todavia, nem sempre se justica a incluso do termo de tendncia determinstica na equao de teste. esse o caso, por exemplo, para sries como as das taxas de inao, ou de desemprego, ou de juro, 19 etc.. Para casos como esse a questo : sero os desvios em relao a uma constante no estacionrios? Ou seja, em vez de (7), a regresso de teste agora yt = + yt1 + t , continuando a testar-se H0 : = 0 vs H1 : < 0, / com base no rcio-t de , agora representado com c = . Note-se, contudo, que tambm a distribuio da estatstica de teste muda, deslocando-se para a direita, isto ,
Porque sob H0 a srie no estacionria, o que invalida a utilizao dos mtodos de inferncia clssicos. 18 Dickey, D. A. e Fuller, W. A. (1979), Distribution of the estimators for autoregressive time series with a unit root, Journal of the American Statistical Association, 74, 427-31 e Fuller, W. A. (1976), Introduction to Statistical Time Series, John Wiley & Sons. 19 Adicionalmente, rera-se que variveis deste tipo no so logaritmizadas, pois no s no apresentam um comportamento de crescimento exponencial, como j se encontram sob a forma de taxa de variao.
17

(7)

(8)

30

os valores crticos no so os mesmos que para o caso anterior, mas sim mais pequenos em valor absoluto (veja-se o quadro 2). Finalmente, se a srie oscilar em torno de zero (o que raramente ocorre com sries econmicas), nem sequer a constante includa na equao de teste, que passa a ser dada simplesmente por yt = yt1 + t , (9) / representando-se com nc = a estatstica DF. Os valores crticos so ainda mais pequenos em valor absoluto que no caso anterior (veja-se o quadro 2). No quadro 2 apresentam-se os valores crticos assimptticos mais comuns para os testes de razes unitrias. Note-se ainda que em alguns trabalhos foram propostos valores crticos exactos (para amostras nitas). Todavia, estes requerem que, alm de no autocorrelacionados, os erros das equaes de teste tenham distribuio normal e sejam homocedsticos. Desta forma, alm de mais simples, a utilizao dos valores crticos assimptticos poder ser mais robusta. Contudo, no se deve perder de vista a sua natureza. Quadro 2 Valores crticos assimptticos para os testes DF estatstica 1 % 2.5% 5% 10% ct 3.96 3.67 3.41 3.13 c 3.42 3.12 2.86 2.57 nc 2.58 2.23 1.95 1.62
Fonte: Fuller, W. A. (1996), Introduction to Statistical Time Series, table 10.A.2, p. 642, John Wiley & Sons.

Na prtica, o problema da escolha da regresso de teste a usar ((7), (8) ou (9)) tem implicaes mais importantes do que alguns julgam. Assim, por um lado, incluir regressores determinsticos desnecessrios (ou irrelevantes) reduz a potncia do teste. Isto , por exemplo, se a regresso adequada for a de (8) mas for empregue a de (7), fornecendo a estatstica ct , o teste tem menos potncia que o baseado na primeira (ou seja, na estatstica c ). Por outro lado, a excluso de regressores determinsticos relevantes tambm reduz a potncia dos testes mas, neste caso, de forma ainda mais grave que no anterior, pois esta tende para zero quando n 20 . Como se sugeriu implicitamente, em geral, a escolha entre (7), (8) e (9) pode basearse numa representao grca da srie sob anlise. Todavia, sobretudo em caso de
Recorde-se que o comportamento normal" da potncia de um teste contra uma alternativa xa de tender para um quando n . Assim, neste caso tem-se um comportamento muito mau.
20

31

dvida, o raciocnio econmico deve prevalecer sobre a anlise grca. Assim, por exemplo, uma anlise grca da srie trimestral (ou mensal) da taxa de juro, observada apenas entre os anos 1990 e 1999, sugere a presena de uma tendncia determinstica decrescente com o tempo. Todavia, essa apenas uma caracterstica da amostra observada, no fazendo sentido que o modelo adequado para a taxa de juro contenha um termo de tendncia determinstica. Assim, a regresso de teste a empregar deve ser a de (8) (e no a de (7)). Por outro lado, deve procurar-se trabalhar com amostras que correspondam a um espao temporal bem maior que os 10 anos deste exemplo. 7.2.2 Testes ADF

Os testes da subseco anterior podero, no entanto, no ser vlidos. De facto, reparese que, em todos os casos, o modelo assumido sob a hiptese nula muito restritivo: trata-se de um simples AR(1), que pode ser insuciente para capturar a evoluo da srie em funo dos seus valores passados. Por outras palavras, pode ser necessrio recorrer a um AR(2) ou, mais geralmente, a um AR(p), com p > 1, para conseguir uma aproximao razovel ao comportamento univariado da srie. Ora, nesse caso, pode mostrar-se que os erros das equaes de teste anteriores sero autocorrelacionados, o que torna a inferncia baseada nas estatsticas DF invlida. Por outras palavras, nessas circunstncias as estatsticas DF no tm (sob H0 ) a distribuio de Dickey-Fuller. A soluo proposta por Dickey, Fuller e Said para esse problema consiste em usar uma autoregresso de ordem sucientemente elevada, que permita que os resduos das equaes de teste no apresentem sintomas de autocorrelao. Assim, por exemplo, para o caso DSP vs. TSP, em vez de (7) deve empregar-se a equao de teste yt = + t + yt1 +
k X i=1

i yti + t ,

(10)

onde k determinado de forma a que os erros tenham um comportamento prximo do de um processo rudo branco (e continuando a testar-se H0 : = 0 vs H1 : < 0) 21 . A justicao para o nome destes testes, augmented DF", ou melhor, ADF(k), clara: as equaes dos testes DF ((7), (8) ou (9)) so aumentadas com desfasamentos da varivel dependente. Todavia, emerge um novo problema: o da escolha de k. Muito frequentemente, os resultados dos testes sero muito sensveis a esse valor. Pode tambm mostrar-se que, com um k mal escolhido, errando-se por defeito, os testes tendero a ter nvel real
21

Para o caso de um modelo AR(p), pode mostrar-se que k = p 1.

32

superior ao nominal (usualmente 5% 22 ). Por outro lado, um valor para k mais elevado que o estritamente necessrio retirar potncia aos testes. Trata-se de uma situao em que a estratgia t-sig, do geral para o particular, tem obtido mais argumentos favorveis, sobretudo quando o objectivo principal reside no controlo da dimenso dos testes. Assim, inicia-se o processo com um k sucientemente elevado (kmax ) e vai-se tentando simplicar a autoregresso com testes-t individuais sobre os coecientes de desfasamento mais elevados, at se obter uma rejeio. Eventualmente poder-se- chegar a ADF(0), isto , a uma estatstica DF. Todavia, tambm os testes de Breusch-Godfrey devero ser usados de forma complementar: se a eliminao de um desfasamento insignicante zer surgir sintomas de autocorrelao residual at a inexistentes, esse desfasamento reintroduzido na equao de teste. Como j se referiu, o valor escolhido para kmax depende, em geral, da dimenso da amostra. Assim, por exemplo, para muitas das sries anuais disponveis para a economia Portuguesa, com n 40, poder-se- iniciar o processo com kmax = 4 ou 5.

7.3

Exemplo

A ttulo de exemplo vai resolver-se o exerccio 43. No quadro seguinte apresentam-se vrias estatsticas obtidas das seguintes equaes de regresso, estimadas pelo OLS com base em 40 observaes anuais, onde Ut representa a taxa de desemprego de um pas da OCDE: Ut = + Ut1 +
k X j =1

j Utj + vt , j Utj + wt .

(11)

Ut = + t + Ut1 +

Com base nesses resultados, e justicando devidamente as suas opes, o que pode concluir sobre a ordem de integrao de Ut ? Assim, trata-se de testar H0 : Ut I (1) vs. H1 : Ut I (0), ou seja, com a notao apresentada no enunciado, H0 : = 0 vs. H1 : < 0. E o primeiro problema a resolver o da escolha da equao: (11) ou (12). Ora, no faz qualquer sentido que uma varivel como a taxa de desemprego contenha uma tendncia
Isto , tendero a rejeitar H0 quando ela verdadeira mais frequentemente que nos 5% dos casos assumidos.
22

k X j =1

(12)

33

equa. k (11) (11) (11) (11) (11) (12) (12) (12) (12) (12) 0 1 2 3 4 0 1 2 3 4

AIC

DW

3.42 1.75 19.79 1.11 33.6[.00] 2.98 0.77 3.89 2.45 3.6[.00] 10.9[.03] 2.80 0.66 3.20 1.74 0.8[.40] 5.8[.21] 2.79 0.55 2.44 2.00 1.0[.30] 5.4[.25] 2.83 0.60 2.49 1.94 0.5[.61] 4.0[.41] 3.45 1.75 19.63 1.11 29.5[.00] 3.01 0.77 3.86 2.45 3.0[.00] 10.1[.04] 2.82 0.67 3.25 1.75 0.8[.43] 5.7[.22] 2.83 0.57 2.46 1.98 1.0[.33] 4.8[.30] 2.86 0.62 2.48 1.94 0.6[.55] 3.8[.43]

h alt

k / BG(4) k 5.43 2.96 0.85 1.04 5.39 2.97 0.79 0.98

(crescente ou decrescente). Isto , trata-se de analisar a (no-) estacionaridade em torno de uma constante, e no em torno de uma tendncia determinstica. Desta forma, toda a informao fornecida na parte inferior da tabela deve ser desprezada, isto , deve usar-se apenas a informao produzida pelas equaes do tipo da (11). O quadro contm informao suciente para usar a estratgia t-sig, com kmax = 4. Como essa estratgia ser complementada com testes para deteco de autocorrelao, formalizem-se as respectivas hipteses:
, H0k : vt s sem autocorrelaco de 1a ordem vs. H1k : no H0 , sendo bvio que no se deve usar a estatstica d de Durbin-Watson, e

, , , H0 k : vt s no autocorrelacionados at ordem 4 vs. H1k : no H0 .

Iniciando a anlise com k = kmax = 4, constata-se que no se encontram indcios signicativos da presena de autocorrelao: o valor-p da estatstica h alt de 0.61, e o da BG(4) de 0.41, no se rejeitando as hipteses nulas ao nvel usual (de 5%). Desta forma, as inferncias a efectuar para a respectiva equao parecem ser vlidas. Os testes a empregar no processo de simplicao sequencial so H0k : k = 0 vs. H1k : k 6= 0, e para k = 4 tem-se t4 = 1.04. Usando a aproximao normal para a distribuio das estatsticas de teste e = 0.05, tem-se RC = {tk : |tk | 1.96}. 34
00 00

Desta forma, a hiptese nula no rejeitada e tenta-se simplicar a equao eliminando o desfasamento de ordem 4. Para k = 3, o primeiro passo consiste em validar a excluso de Ut4 , testando a presena de autocorrelao nos erros da nova equao. Ora, como os valores-p das estatsticas halt e BG(4) so, respectivamente, 0.30 e 0.25, no se encontram sintomas de autocorrelao, pelo que a simplicao efectuada parece ser aceitvel. / A tentativa de simplicao para k = 2 tambm no rejeitada pois t3 = 0.85 RC. Desta forma, sobe-se mais uma linha no quadro e tenta-se avaliar se a simplicao no originou o aparecimento de autocorrelao nos erros da nova equao. No parece ser esse o caso pois, mais uma vez, as estatsticas h alt e BG(4) so insignicantes aos nveis habituais: a primeira com um valor-p de 0.40 e a segunda com 0.21. Todavia, a tentativa de simplicao seguinte, para k = 1, claramente rejeitada: t2 = 2.96, 00 ) = 2, produzindo o que leva a rejeitar H02 . Desta forma, o k seleccionado k(= k ADF(2) = c = 3.20. Usando = 0.05, a regio crtica vem dada por RC = { c : c < 2.86}. Por conseguinte, a hiptese nula rejeitada. Embora os valores crticos tenham apenas validade assimpttica (e a amostra bastante pequena), note-se que mesmo que se usasse = 0.025 a nula de raiz unitria continuaria a ser rejeitada. Desta forma, a evidncia contra a hiptese de raiz unitria parece ser bastante forte. Doutra forma, a srie parece poder ser melhor aproximada por um modelo estacionrio em torno de uma constante, no parecendo ser necessrio diferenci-la. Finalmente, note-se ainda que se tivssemos empregue a equao que minimiza a estatstica AIC ter-se-ia obtido k = 3 e, consequentemente, c = 2.44 no permitiria rejeitar a hiptese de raiz unitria. Tal como neste, em muitos casos empricos a escolha do k pode ser crucial para a deciso a tomar.

35

Você também pode gostar