Você está na página 1de 15

Revista

ADM.MADE, Rio de Janeiro, ano 12, v.16, n.2, p.87-101, maio/setembro, 2012 Revista do Mestrado em Administrao e Desenvolvimento Empresarial da Universidade Estcio de S Rio de Janeiro (MADE/UNESA). ISSN: 2237-5139 Contedo publicado de acesso livre e irrestrito, sob licena Creative Commons 3.0. Editora responsvel: Isabel de S Affonso da Costa Organizador do nmero temtico: Marco Aurlio Carino Bouzada

Anlise Espectral Singular: Comparao de Previses em Sries Temporais


Renata de Miranda Esquivel1 Valter de Senna2 Gecynalda Soares da Silva Gomes3


Uma verso preliminar deste artigo foi apresentada e publicada nos Anais do XVI Congreso Latino- Iberoamericano de Investigacin Operativa/XLIV Simpsio Brasileiro de Pesquisa Operacional - CLAIO/SBPO, setembro de 2012, Rio de Janeiro RJ. Artigo recebido em 17/11/2012 e aprovado em 17/12/2012. Artigo convidado submisso e avaliado em double blind review. 1 Mestre pelo Programa de Ps-Graduao em Modelagem Computacional e Tecnologia Industrial do Centro Integrado de Manufatura e Tecnologia (PPGMCTI/CIMATEC/SENAI). Endereo: Av. Orlando Gomes, 1845 - Piat - Salvador, BA - CEP: 41650-010. Email: esquivel.renata@hotmail.com. 2 Doutor em Pesquisa Operacional com Ps-Doutorado em Estatstica pela University of Southampton (UK). Professor do PPGMCTI/CIMATEC/ SENAI. Av. Orlando Gomes, 1845 - Piat - Salvador, BA - CEP: 41650-010. Email: valter.senna@gmail.com. 3 Doutora em Cincias da Computao pela Universidade Federal de Pernambuco (UFPE). Professora do Departamento de Estatstica da Universidade Federal da Bahia (EST/UFBA). Endereo: Av. Adhemar de Barros, s/n Campus de Ondina Salvador, BA CEP: 40170-110. Email: gecynalda@yahoo.com.

Renata de Miranda Esquivel, Valter de Senna e Gecynalda Soares da S. Gomes

88

Anlise Espectral Singular: Comparao de Previses em Sries Temporais


Os mtodos estatsticos para anlise de sries temporais encontram-se amplamente desenvolvidos na literatura e vrios modelos clssicos preditivos esto disponveis em softwares estatsticos. Contudo, cada modelo clssico exige suposies relacionadas s caractersticas dos dados, e o uso adequado dos modelos exigir verificaes dessas suposies, o que pode demandar esforos na etapa de identificao do padro de comportamento da srie temporal. Como alternativa, pode-se utilizar a tcnica conhecida como Anlise Espectral Singular. A Anlise Espectral Singular realiza uma decomposio da srie temporal em poucos componentes independentes. Este mtodo no exige o conhecimento sobre o modelo paramtrico da srie temporal e pode ser aplicado em qualquer srie com alguma estrutura potencial. O presente artigo objetiva avaliar a capacidade preditiva da SSA comparando-a com alguns modelos clssicos para sries temporais. Com esta finalidade, examinamos duas sries temporais com caractersticas distintas: uma srie proveniente da rea da meteorologia e uma srie gerada artificialmente. Observou-se, de uma maneira geral, que a previso SSA conseguiu representar melhor as variaes existentes na srie meteorolgica e no particular processo ARIMA simulado. A utilizao da metodologia da SSA proporcionou resultados to bons ou superiores aos gerados pelos mtodos clssicos considerados neste artigo. Palavras-chave: singular spectrum analysis; sries temporais; previso. Keywords: singular spectrum analysis; time series; forecast.

Singular Spectrum Analysis: Comparative Studies of Forecasting in Time Series


Statistical methods for the analysis of time series abound in the literature and classical predictive models are available in many statistical softwares. However, each classical model requires assumptions related to the characteristics of the data and appropriate use of the models requires verification of these assumptions. Alternatively, one can use a powerful technique known as Singular Spectral Analysis. The Singular Spectral Analysis aims at a decomposition of the series in a few independent components. This method does not require knowledge of the parametric model of the series and can be applied in series with any potential structure. This article aims to evaluate the predictive ability of the SSA by comparing it with some classical models for time series. To this end we examined two series with different features, one containing meteorological data and the other an artificially generated series. It was observed, in general, that the prediction SSA better represent the variation found in the series of the meteorological area and in the specific simulated ARIMA process. Using the methodology SSA provided results as good as or greater than those generated by classical methods considered in this paper.

1. Introduo O desenvolvimento de mtodos estatsticos para anlise de dados obtidos em situaes em que as observaes so dependentes tem apresentado crescimento vertiginoso nas ltimas dcadas. Em particular, as novas propostas de tcnicas para a modelagem de dados provenientes de sries temporais tm ganhado destaque na literatura especializada. Ao se trabalhar com sries temporais, o objetivo mais usual a predio de valores
Revista ADM.MADE, Rio de Janeiro, ano 12, v.16, n.2, p.87-101, maio/setembro, 2012.

Anlise Espectral Singular

89

futuros. A necessidade de obter previses precisas de eventos futuros ou suas consequncias, sejam climticas, econmicas, epidemiolgicas ou de qualquer natureza, tem levado a um constante desenvolvimento de tcnicas de previso em sries temporais. Os mtodos estatsticos clssicos para anlise de sries temporais encontram-se bem documentados na literatura pertinente. Contudo, boa parte desses mtodos requer conhecimento especializado para sua correta aplicao. Sendo assim, o uso adequado dos modelos clssicos exigir verificaes das suas suposies, o que demanda esforos e experincia, na anlise exploratria dos dados. A Anlise Espectral Singular (SSA, do ingls Singular Spectrum Analysis), se apresenta como uma alternativa relativamente simples e poderosa. A SSA um mtodo no paramtrico usado na anlise de sries temporais e que exige pouco conhecimento prvio do comportamento da srie. Essa tcnica investiga o comportamento das sries histricas atravs da decomposio e da reconstruo dos seus componentes constitutivos, caracterizando os estgios da SSA. A ferramenta SSA, na literatura tcnica, tem-se mostrado til nas anlises de sries das reas de meteorologia, geofsica, fsica, climatologia, economia, sade e em vrios outros campos do conhecimento. Essa ferramenta pode ser aplicada em sries curtas ou longas, sries no estacionrias ou estacionrias, ruidosas ou no, ou seja, em qualquer srie temporal com alguma estrutura (GOLYANDINA; NEKRUTKIN; ZHIGLJAVSKY, 2001; HASSANI, 2007). Vale salientar que a SSA no se detm a realizar previses de valores futuros, mas tambm tem a finalidade de identificar e de extrair padres geradores da srie temporal. O presente artigo objetiva comparar o algoritmo de previso SSA e algumas estratgias preditivas clssicas. Com esta finalidade, analisamos duas sries temporais com caractersticas distintas: uma srie proveniente da rea da meteorologia (estudo emprico) e uma srie artificial (estudo simulado). 2. Materiais e Mtodos 2.1. Tcnicas clssicas Os mtodos clssicos - que comumente apresentam bom poder preditivo - utilizados nesse trabalho comparativo so os algoritmos de alisamento exponencial de Holt (SEH) e de Holt-Winters (H-W), os mtodos de Box e Jenkins (os modelos autorregressivos integrados de mdias mveis - ARIMA - e a classe de modelos autorregressivos integrados de mdias mveis sazonais -SARIMA). A descrio dessas estratgias preditivas clssicas pode ser encontrada em muitos referenciais tericos, por exemplo Box e Jenkins (1970), Brillinger (2001), Brockwell e Davis (2002) e Morettin e Toloi (2006). O uso adequado do algoritmo de Holt-Winters se faz em decorrncia da presena de sazonalidade nos dados da srie, independentemente da presena da tendncia. J o
Revista ADM.MADE, Rio de Janeiro, ano 12, v.16, n.2, p.87-101, maio/setembro, 2012.

Renata de Miranda Esquivel, Valter de Senna e Gecynalda Soares da S. Gomes

90

algoritmo de Holt adequado se existe basicamente uma tendncia linear na srie. Para a utilizao do mtodo de Box e Jenkins se exige conhecimento sobre as propriedades das classes de modelos, alm da experincia do analista, no que tange identificao do modelo mais apropriado aos dados - fatos que dificultam a aplicao da metodologia de Box e Jenkins. 2.2. Singular Spectrum Analysis (SSA) 2.2.1. Breve descrio da SSA Bsica A tcnica SSA bsica fundamenta-se em dois estgios complementares: decomposio e reconstruo da srie temporal. Cada estgio composto por dois passos que formam os quatro passos da tcnica (em ingls): embedding, singular value decomposition (SVD), grouping e diagonal averaging . Decomposio No estgio da decomposio, a srie temporal inicial decomposta em uma soma de poucas subsries, de modo que cada subsrie possa ser identificada e interpretada como componentes constitutivos. Primeiro passo: embedding

Considere uma srie temporal unidimensional real e no nula, isto , com pelo menos um valor diferente de zero, Yt = Y1,... , YN, sendo N o comprimento da srie ou a quantidade de observaes ao longo do intervalo de tempo investigado. Inicialmente, a srie original unidimensional transformada em uma srie multidimensional com dimenso L, onde L dito o comprimento da janela. Este o nico parmetro deste passo e representa a quantidade de componentes em que a srie decomposta. Ele deve ser um valor inteiro, entre 2 L N, e, segundo resultados tericos, o tamanho de L deve ser suficientemente grande, mas no superior a N / 2 (HASSANI, 2007). A srie temporal multidimensional, que uma sequncia de vetores constitudos por elementos da srie Yt , forma a matriz apresentada na expresso (1), denominada matriz trajetria, resultado desse primeiro passo (GOLYANDINA; NEKRUTKIN; ZHIGLJAVSKY, 2001; HASSANI, 2007; HASSANI; HERAVIC; ZHIGLJAVSKY, 2009).

(1),

Revista ADM.MADE, Rio de Janeiro, ano 12, v.16, n.2, p.87-101, maio/setembro, 2012.

Anlise Espectral Singular

91

em que K = N L + 1 o nmero de vetores deslocados no tempo. Segundo passo: singular value decomposition (SVD)

Neste passo, decomposio do valor singular, realizada a decomposio da matriz trajetria X em uma soma de matrizes elementares. Seja S = X XT e 1 ... L 0 autovalores de S, com U1 , ..., UL, os correspondentes autovetores, formando um sistema ortonormal. Representando os componentes principais da matriz trajetria como
Vi = X Ui
T

, i = 1, 2,K , d a decomposio representada como:

X = E1 + ... + Ed (2) , T E onde d denota o nmero de autovalores diferentes de zero da matriz S e i = i U i V i matrizes elementares. O conjunto ( ,U ,V ) conhecido como o i-simo autotriple da matriz trajetria X i i i e i o seu valor singular (GOLYANDINA; NEKRUTKIN; ZHIGLJAVSKY, 2001; HASSANI, 2007; HASSANI; HERAVIC; ZHIGLJAVSKY, 2009). Reconstruo Terceiro passo: grouping

No terceiro passo ocorre a juno das matrizes elementares Ei em vrios grupos e a soma delas dentro de cada grupo. O passo grouping particiona o conjunto de ndices da expresso (2) (1 , ..., d ) em subconjuntos disjuntos I1, ... , Im., fornecendo a representao X= EI1 + ... +EIm (3) Portanto, o resultado desse passo a representao da matriz trajetria como uma soma de matrizes resultantes (EI1;...; EIm). A escolha dos conjuntos I1, , Im a segunda e ltima deciso necessria para a aplicao do mtodo SSA. Essa escolha baseada na propriedade denominada separabilidade. A separabilidade entre os conjuntos pode ser mensurada pela correlao ponderada, calculada da seguinte forma: a correlao ponderada entre duas subsries Yt (1) e Yt (2) pode ser expressa como,
Revista ADM.MADE, Rio de Janeiro, ano 12, v.16, n.2, p.87-101, maio/setembro, 2012.

Renata de Miranda Esquivel, Valter de Senna e Gecynalda Soares da S. Gomes

92

em que a norma da i-sima subsrie dada por com o produto interno sendo definido por

onde os pesos wc so dados por wc = min{ c, L, N-c }, e assume-se que L N/2. Em geral, avalia-se a correlao ponderada entre o sinal, que o agrupamento dos principais autotriples, e o rudo, que o grupo formado pelos autotriples remanescentes. Se o valor absoluto da correlao ponderada muito pequeno, tem-se que as duas sries so quase ortogonais. Diz-se, ento, que estes componentes so separveis. Quarto passo: diagonal averaging

A operao realizada neste ltimo passo obtm, para cada uma das matrizes resultantes, uma aproximao para os componentes da srie original; ou seja, transforma cada matriz da decomposio agrupada (3) em uma nova srie de tamanho N, que pode ser considerada como uma aproximao da srie original. 2.2.2. Algoritmo recorrente de previso =Y +Y + + Y a srie reconstruda ou aproximada, conforme o segundo Seja Y 1 2 N estgio da SSA. A previso dos valores futuros !!! , com h = 1, , M, obtida a partir da seguinte expresso recorrente:

Em que os ap so os coeficientes da combinao linear entre os L-1 ltimos termos da srie reconstruda. claro que, quanto maior o nmero de passos frente (h), mais as previses dependero da qualidade das predies anteriores. Para que a predio considere pelo menos um valor aproximado da srie original, necessrio um horizonte de no mximo M = L-1. Os nmeros formam os M termos preditos pelo algoritmo recorrente de previso, fundamentado no SSA bsico. Detalhes sobre o funcionamento do algoritmo esto disponveis na obra de
Revista ADM.MADE, Rio de Janeiro, ano 12, v.16, n.2, p.87-101, maio/setembro, 2012.

Anlise Espectral Singular

93

Golyandina, Nekrutkin e Zhigljavsky (2001). 3. Desenvolvimento dos Estudos 3.1. Cenrios Visando comparar os mtodos propostos e recomendados na literatura de sries temporais com a metodologia SSA, foram definidos dois cenrios, para os quais modelaram- se e estimaram-se valores futuros de uma srie temporal real (estudo emprico) e uma srie artificial (estudo simulado). No estudo emprico considerou-se uma srie meteorolgica, com dados da velocidade mdia do vento, os quais foram armazenados a cada intervalo de 30 minutos. Esta srie abrange o perodo entre 03 de setembro de 2010 s 12:00 e 12 de setembro de 2011 s 11:30, totalizando 17.892 observaes ao longo do perodo especificado. Consideraram-se, para o conjunto de teste, as informaes de 2.688 instncias no tempo. A coleta foi realizada em uma mini estao meteorolgica, localizada na unidade CIMATEC do SENAI-BA, que se encontra instalada altura de 36 metros em relao ao nvel do solo. Esta srie meteorolgica ser rotulada como VENTO neste trabalho. Para o estudo simulado, uma srie temporal foi gerada de acordo com o processo estocstico ARIMA (p=1, d=1, q=2). O parmetro da parte regressiva foi fixado em 0,4 e os valores para os parmetros de mdias mveis foram 1 = 0,3 e 2 = 0,8. A escolha dos parmetros fundamentou-se em exemplos do livro Morettin e Toloi (2006). Para esse processo, foram geradas 212 observaes, as 12 ltimas alocadas no conjunto de teste. 3.2. Medidas de preciso A avaliao das capacidades preditivas dos mtodos considerados foi conduzida em diferentes horizontes de previso. Para a extensa srie meteorolgica, os seguintes horizontes frente foram considerados: 1, 24, 48, 96, 192, 336, 672, 1008, 1344, 2016, 2688. Para as avaliaes na srie simulada foram considerados os 12 passos frente. Os resultados das previses foram comparados utilizando-se o erro quadrtico mdio (MSE) e o erro percentual total (TPE) e, claro, o erro cometido na estimao para cada horizonte. O erro quadrtico mdio (MSE) definido pela expresso abaixo:

a previso de Y ) e n a quantidade de so os erros de previso ( Y em que e j = Y j Y j j j


observaes reservadas para o conjunto de teste, com k = T- n. O erro percentual total (TPE), fornece uma medida relativa do erro. O TPE calculado como
Revista ADM.MADE, Rio de Janeiro, ano 12, v.16, n.2, p.87-101, maio/setembro, 2012.

Renata de Miranda Esquivel, Valter de Senna e Gecynalda Soares da S. Gomes

94

3.3. Processo de modelagem 3.3.1 Tcnicas clssicas Conforme veremos a seguir, a srie emprica (VENTO) no estacionria, exibindo tendncia e sazonalidade. Usaremos o algoritmo de Holt-Winters na forma aditiva porque a srie possui valores nulos. Para o mtodo de Box-Jenkins, o mais adequado para modelar as variaes na srie meteorolgica foi o SARIMA. A srie emprica precisou de apenas uma diferena para se tornar um processo integrado [I(1)] e, assim, especificou-se a classe do modelo SARIMA (p,1,q)(P,D,Q). A seleo do modelo mais adequado para representar o processo gerador da srie baseou-se no critrio AIC (critrio de informao de Akaike e Akaike (1973, 1974)). Na modelagem clssica para a srie artificial foi utilizado o alisamento exponencial de Holt (SEH) e um modelo correspondente, da classe ARIMA. Utilizou-se a SEH ao invs do Holt-Winters porque a srie simulada no apresenta comportamentos sazonais. O modelo ARIMA foi considerado como um padro ouro, isto , o ARIMA serviu como medida para comparao dos outros mtodos adotados, na medida em que se espera que a predio realizada nos dados oriundos do processo estocstico puro tenha maior preciso do que a feita com as demais tcnicas. 3.3.2. SSA Como foi discutido na Seo 2.2.1, a modelagem via SSA feita mediante a escolha dos dois nicos parmetros, a saber, o comprimento da janela L (no estgio de decomposio) e o processo estrutural de agrupamento, na reconstruo da srie temporal. Na anlise via SSA considerou-se o comprimento timo da janela (Ltimo=N/2) para a srie artificial e, para a srie VENTO, por dificuldades computacionais, baseamos a escolha do valor de L no perodo sazonal da srie - ou seja escolheu-se um comprimento mltiplo da sazonalidade. A separao entre o sinal e o rudo na fase de reconstruo das sries foi avaliada de acordo com os valores singulares e a correlao ponderada. Alm dos critrios ora citados, foi usado tambm o percentual acumulado de explicabilidade dos possveis componentes formadores do sinal.

Revista ADM.MADE, Rio de Janeiro, ano 12, v.16, n.2, p.87-101, maio/setembro, 2012.

Anlise Espectral Singular

95

4. Resultados Estudo emprico As caractersticas da srie temporal VENTO podem no ser identificadas facilmente atravs do seu grfico temporal. Assim como apresentado na Figura 1, nota-se uma grande massa de dados ao longo dos instantes de tempo. Para avaliar a suposio de estacionariedade foi usado o bem conhecido teste KPSS (KWIATKOWSKI et. al., 1992), que rejeitou a hiptese (p-valor < 0,01). Alm disso, os testes de Box-Pierce (BOX; PIERCE, 1970) e de Ljung-Box (LJUNG; BOX, 1978) apontaram a existncia de autocorrelaco conjunta, estatisticamente significante (p < 2,210-16). De acordo com esses testes, temos indcios de que a srie VENTO no estacionria. Com o intuito de facilitar a visualizao da periodicidade da srie, considerou-se um recorte da srie temporal VENTO. A Figura 1(b) apresenta uma ampliao do componente sazonal, com o comportamento do componente peridico para os 336 instantes de tempo iniciais. Notamos uma repetio sazonal na srie, com uma amplitude igual a 48, que corresponde aos 48 instantes de medio efetuadas por dia. Figura 1: Velocidade mdia do vento ao longo do tempo (a). Comportamento sazonal para os primeiros 336 instantes de tempo (b).

Fonte: Adaptao do autor (Esquivel, 2012).


Revista ADM.MADE, Rio de Janeiro, ano 12, v.16, n.2, p.87-101, maio/setembro, 2012.

Renata de Miranda Esquivel, Valter de Senna e Gecynalda Soares da S. Gomes

96

Modelagem Os dois modelos de Box-Jenkins que apresentaram menores valores no critrio AIC foram SARIMA (2,1,2)x(1,1,1), que rotulamos como SARIMA 1 (AIC igual a 35394,05) e SARIMA (3,1,3)x(1,1,1), identificado como SARIMA 2 (AIC igual a 35389,52). Para a modelagem via SSA, usamos um comprimento de janela L= 4884 = 4032. Ao analisar as correlaes ponderadas, nota-se que, a partir do componente de posto 200, seguem-se muitos componentes com correlaes baixas, os quais iro compor o grupo do rudo. Pela anlise do comportamento dos principais autovetores, notou-se comportamento peridico representado pela formao dos pares de autovetores de postos (2, 3) e (4, 5). Ao finalizar a anlise dos estgios da SSA (decomposio e reconstruo), aplicou-se o algoritmo recorrente de previso SSA na srie reconstruda a partir dos 1000 primeiros componentes da SVD, por motivos computacionais. Previso A Tabela 1 apresenta um comparativo geral dos resultados de previso de cada mtodo analisado. Essa tabela resume a acurcia das tcnicas, apresentando o erro quadrtico mdio (MSE) e o erro percentual total (TPE).

Tabela 1 - Comparao entre as tcnicas consideradas, para a srie (VENTO)

Fonte: Adaptao do autor (Esquivel, 2012).

Observa-se que, de acordo com o MSE, o mtodo de Holt-Winters sazonal aditivo foi superior aos demais, pois, para quase todos os horizontes, os MSE's para este mtodo foram inferiores ao SARIMA 1, ao SARIMA 2 e SSA. Excetua-se o passo h= 24, para o qual a SSA se mostrou superior. Se a avaliao utiliza o erro relativo, TPE, o algoritmo Holt-Winters e a SSA vencem em igual quantidade de horizontes. O algoritmo Holt-Winters apresentou
Revista ADM.MADE, Rio de Janeiro, ano 12, v.16, n.2, p.87-101, maio/setembro, 2012.

Anlise Espectral Singular

97

melhor desempenho em horizontes maiores (h= 672, 1008, 1344, 2016, 2688) enquanto que, para previses de curto e de mdio prazos (h=24, 48, 96, 192 e 336), a previso SSA apresentou melhor performance.

Figura 2 - Previses dos mtodos comparadas com os valores reais (VENTO)

Fonte: Adaptao do autor (Esquivel, 2012).

Nota-se, na Figura 2, que o algoritmo recorrente de previso SSA conseguiu detectar melhor as flutuaes das velocidades mdias do vento [valor real] em comparao ao Holt-Winters aditivo e os modelos ARIMA sazonais, retratando melhor o conjunto de teste. Nota-se tambm que o algoritmo Holt-Winters resultou em predies melhores do que os modelos ARIMA sazonais, uma vez que o segmento correspondente (em verde) possui uma amplitude um pouco maior do que as observadas nos segmentos em azul (SARIMA 1 e SARIMA 2). A ordem de performance dos mtodos escolhidos foi, portanto, SSA (com componentes 1 a 1000) seguida do Holt-Winters aditivo, depois SARIMA (3,1,3)x(1,1,1) e por fim SARIMA (2,1,2)x(1,1,1). Estudo simulado O grfico com a estrutura do processo ARIMA simulado (ver Figura 3a) e com o logaritmo dos autovalores resultantes da decomposio SSA (ver Figura 3b), esto apresentados abaixo.
Revista ADM.MADE, Rio de Janeiro, ano 12, v.16, n.2, p.87-101, maio/setembro, 2012.

Renata de Miranda Esquivel, Valter de Senna e Gecynalda Soares da S. Gomes

98

Figura 3a - Processo ARIMA Figura 3b - Logaritmo dos autovalores.

Fonte: Adaptao de Esquivel (2012). Fonte: Adaptao de Esquivel (2012).

Atravs da Figura 3a, observa-se que o processo ARIMA simulado indica uma clara tendncia decrescente com algumas flutuaes, que aparentemente no podem ser qualificadas como sazonais. A Figura 3b mostra o espectro da matriz trajetria utilizada na decomposio SSA. Podemos notar que a decomposio desta srie proveniente de um processo ARIMA indica claramente um componente de tendncia, representado pelo primeiro autovalor em destaque. Nota-se tambm que a Figura 3b exibe trs grandes fases ao longo dos 100 postos dos autovalores. Ao investigarmos a primeira fase, se considerarmos um agrupamento consistindo de somente os 16 primeiros autovalores como sinal e os demais componentes como rudo, observamos uma correlao ponderada entre o sinal e o rudo de 0,0069, sendo que o sinal explica 99,66% da variao da srie. As tomamos os 20 primeiros autovalores, observamos uma correlao ponderada entre o sinal e o rudo de 0,0039, sendo que o sinal explica agora 99,77% da variao da srie. Ao usarmos os 88 primeiros autovalores obtemos como resultados 0,0017 e 99,99% respectivamente. De posse dessas opes de agrupamento, aplicou-se o algoritmo recorrente de previso na srie simulada, confrontando as previses geradas a partir dos diferentes espaos trajetria. Os melhores resultados foram obtidos utilizando-se os 88 primeiros autovalores, resultado j antecipado. Ou seja, para a srie originria do processo ARIMA (1,1,2), o melhor resultado preditivo observado corresponde ao sinal formado pelos 88 primeiros autotriples. A Tabela 2 apresenta os valores futuros (rotulados na tabela como Real'), as
Revista ADM.MADE, Rio de Janeiro, ano 12, v.16, n.2, p.87-101, maio/setembro, 2012.

Anlise Espectral Singular

99

diferenas entre os valores originais do conjunto de teste e os previstos por cada tcnica (nomeados como Erro'), alm das medidas MSE e TPE. Pode-se observar que houve superestimao das predies em todos os horizontes e mtodos avaliados. Ao analisar o MSE, nota-se que a liderana do padro ouro permaneceu nos horizontes h = 2, 3, 4, 5 ficando em segundo lugar nos passos h de 6 a 12. Para esses ltimos horizontes a SSA se revelou melhor e ficou em segunda posio no passo 5. Ao avaliar o erro relativo, o desempenho agora foi semelhante ao observado para o MSE. Nota-se que o padro ouro apresenta a melhor performance em trs dos horizontes ( 2, 3 e 4) e fica com a segunda posio para os passos restantes. Por outro lado, a SSA mostrou-se melhor em oito dos horizontes (h = de 5 a 12) e foi o segundo melhor resultado nos passos 2 e 4.

Tabela 2 - Comparao entre as previses (Processo terico ARIMA)


Fonte: Adaptao do autor (Esquivel, 2012).

A Figura 4 compara os mtodos preditivos selecionados e o conjunto de teste, para o processo estocstico ARIMA.
Revista ADM.MADE, Rio de Janeiro, ano 12, v.16, n.2, p.87-101, maio/setembro, 2012.

Renata de Miranda Esquivel, Valter de Senna e Gecynalda Soares da S. Gomes

100

Figura 4 - Comparao das previses (Processo ARIMA)

Fonte: Adaptao do autor (Esquivel, 2012).

Observa-se graficamente que o padro ouro e o alisamento exponencial de Holt (SEH) geraram predies quase em linha reta, simplificando em demasia o comportamento real dos valores futuros, sendo que, para o padro ouro, as previses foram quase constantes. Os resultados obtidos pela SSA, por outro lado, acompanham a curva do conjunto de teste, embora exibam mais variaes do que as apresentadas pelos dados reais. 5. Consideraes Finais O presente artigo teve, como objetivo, apresentar a metodologia SSA e fazer uma breve avaliao da sua capacidade preditiva em duas sries, uma emprica e outra simulada, confrontando-a com alguns importantes mtodos clssicos - a saber, a suavizao exponencial de Holt (SEH), a suavizao exponencial de Holt-Winters (H-W) e a classe de modelos de Box e Jenkins. No contexto do estudo emprico, verificou-se que a SSA mostrou- se melhor nas previses a curto e a mdio prazos, levando em considerao o erro relativo (TPE). Por outro lado, utilizando-se o MSE, o algoritmo de Holt-Winters apresentou melhor desempenho preditivo. No estudo da srie simulada, observou-se que, tanto pelo MSE quanto pelo TPE, a SSA exibiu predies mais precisas para o processo ARIMA (1,1,2), processo bastante comum em sries reais. De uma forma geral, nota-se que o algoritmo recorrente de previso SSA consegue representar melhor as variaes existentes nos dados, como flutuaes sazonais e picos, caractersticas encontradas com frequncia em sries histricas. A previso SSA apresentou, assim, comportamento global mais condizente com a realidade das sries. Uma grande vantagem em aplicar a SSA em substituio aos modelos de Box-Jenkins
Revista ADM.MADE, Rio de Janeiro, ano 12, v.16, n.2, p.87-101, maio/setembro, 2012.

Anlise Espectral Singular

101

refere-se sua simplificao no entendimento das sries temporais e consequente diminuio da interveno do analista. Isto porque o processo de modelagem e previso via SSA leva em considerao fundamentao terica que envolve a decomposio e a reconstruo dos componentes constitutivos da srie temporal, sem prejuzo da sua capacidade preditiva. Sua utilizao produziu resultados to bons ou mesmo superiores aos gerados pelos mtodos clssicos considerados neste artigo. Referncias
AKAIKE, H. Maximum likelihood identification of Gaussian autoregressive moving average models. Biometrika, v.60, p.255-265, 1973. ______. A new look at the statistical model identification. IEEE Transactions on Automatic Control, AC-19, p.716-723, 1974. BOX, G.E.P.; JENKINS, G.M. Time series analysis: forecasting and control. So Francisco: Holden-Day, 1970. ______.; PIERCE, D.A. Distribution of residual correlations in autoregressive-integrated moving average time series models. Journal of the American Statistical Association, v.65, p.1509-1526, 1970. BRILLINGER, D.R. Time series: data analysis and theory. Philadelphia: SIAM, 2001. (Classics in Applied Mathematics Series). BROCKWELL, P.J.; DAVIS, R.A. Introduction to time series and forecasting. 2nd ed. New York: Springer, 2002. (Springer Texts in Statistics). ESQUIVEL, R.M. Anlise espectral singular: modelagem de sries temporais atravs de estudos comparativos usando diferentes estratgias de previso. 173 p. Dissertao (Mestrado) - Programa de Ps-graduao em Modelagem Computacional e Tecnologia Industrial (PPGMCTI), Universidade Federal da Bahia, Salvador, 2012. GOLYANDINA, N., NEKRUTKIN, V. e ZHIGLJAVSKY, A. Analysis of time series structure: SSA and related techniques. New York: Chapman & Hall/CRC, 2001. HASSANI, H. Singular Spectrum Analysis: methodology and comparison. Journal of Data Science, v.5, p.239-257, 2007. HASSANI, H., HERAVIC, S. e ZHIGLJAVSKY, A. Forecasting European industrial production with SSA. International Journal of Forecasting, v.25, p.103118, 2009. KWIATKOWSKI, D; PHILLIPS, P.C.B.; SCHMIDT, P. e SHIN, Y. Testing the null hypothesis of stationarity against the alternative of a unit root. Journal of Econometrics, v.54, p.159-178, 1992. LJUNG, G.M.; BOX, G.E.P. On a measure of lack of fit in time series models. Biometrika, v.65, p.297- 303, 1978. MORETTIN, P.A.; TOLOI, C.M.C. Anlise de sries temporais. So Paulo: Edgard Blucher/ ABE- Projeto Fisher, 2006.

Revista ADM.MADE, Rio de Janeiro, ano 12, v.16, n.2, p.87-101, maio/setembro, 2012.