Você está na página 1de 5

MODELOS ESTATSTICOS DE FUNO DENSIDADE DE PROBABILIDADE PARA CRIAO DE SRIES TEMPORAIS

Renato S. Gomide, Ramon F. E. Campos, Marcus F. Vieira


Programa de Ps-Graduo em Engenharia Eltrica e da Computao da Universidade Federal de Gois, Escola de Engenharia Eltrica e de Computao, Laboratrio de Bioengenharia e Biomecnica, Goinia Gois, renato.s.gomide@gmail.com

Resumo - Este trabalho tem como finalidade apresentar um estudo que qualifica sries temporais artificiais criadas por mtodos estatsticos. Por meio de uma srie temporal real dada a anlise detalhada do comportamento da srie (no domnio do tempo e da freqncia) com o intuito de extrair as principais caractersticas comportamentais para a criao das sries temporais artificiais. Os resultados deste estudo contribuem para auxiliar na tomada de deciso em relao ao mtodo de criao de sries temporais artificiais para que estas possuam confiabilidade e similaridades estatsticas. Palavras-Chave Distribuio, estimao, funo densidade de probabilidade, predio, srie temporal.

A grande dificuldade est na escolha da tcnica de predio a ser utilizada em determinada aplicao. H o uso de mtodos que avaliam a qualidade da srie temporal artificial em relao srie real. Algumas tcnicas foram utilizadas neste estudo com o intuito de prover uma anlise qualitativa das sries artificiais. O trabalho est organizado na descrio da srie temporal real e a extrao das caractersticas estatsticas da srie. Logo aps so apresentados os mtodos utilizados para a gerao de sries temporais artificiais. Finalmente realizado um paralelo entre as sries e como pode ser efetuada a escolha da srie que melhor representa a srie real. II. ESTUDO DA SRIE TEMPORAL A srie temporal utilizada no desenvolvimento deste trabalho foi obtida a partir do histrico de valores de fechamento dirio das aes da empresa estatal Petrobrs (PETR4). Os dados coletados correspondem ao perodo de janeiro de 2003 at o dia quatro de novembro de 2010, totalizando 1.950 amostras (Figura 1).

STATISTICAL MODELS OF PROBABILITY DENSITY FUNCTION FOR CREATION OF TIME SERIES


Abstract The aim of this work is to present a study that qualifies artificial times series created by statistical methods. Based on a real time series is build a detailed analysis of the behavior of the series (in time and frequency domain) in order to extract the main behavioral features for creating artificial time series. The results of this approach contribute to assist in decision making related to creation method of the artificial time series improving its reliability and statistical similarities. 1 Keywords Distribution, estimation, probability density function, prediction, times series. I. INTRODUO A predio de sries temporais e identificao de sistemas so problemas bastante explorados. As solues encontradas so utilizadas em vrios segmentos comerciais (como o mercado de aes, telecomunicaes, gesto estratgica...) e cientficos (aplicaes meteorolgicas, comunicao de dados, simuladores...). Este estudo apresenta uma anlise crtica de alguns mtodos estatsticos de predio dado por estimadores e funo distribuio de probabilidade (FDP) [1].

Fig. 1. Evoluo das aes da PETR4 no perodo de janeiro de 2003 at novembro de 2010.

importante destacar que a srie temporal escolhida possui o comportamento crescente no decorrer de sua evoluo, h apenas uma queda brusca no valor das aes devido a fatores econmicos da poca [2]. A Tabela I mostra algumas caractersticas estatsticas da srie em estudo (mdia, varincia, desvio padro, valor mximo e covarincia). TABELA I Algumas caractersticas estatsticas da srie temporal
Atributo Mdia Varincia Desvio Padro Valor Mximo Covarincia Valor 19,82 118,51 10,88 47,72 118,51

A FDP da srie temporal foi extrada por meio do estimador Kernel Smoothing [3]. A Figura 2 apresenta a comparao da FDP obtida com o histograma da srie temporal.

Fig. 4. Srie artificial e histograma obtido a partir da distribuio de Poisson

O modelo de distribuio de Poisson (Figura 4) possui uma curva bastante caracterstica, no qual a concentrao das probabilidades no simtrica, dividindo o eixo x no ponto mdio. possvel notar que a rea de um lado (que equivale probabilidade) mais concentrada que a do outro lado. J o comportamento da srie artificial obtida atravs do modelo de distribuio exponencial no teve coerncia com a srie real. Foram acrescentados valores bem alm do valor mximo da srie real. A Figura 5 apresenta este comportamento indesejado. possvel notar que os valores que extrapolam o valor mximo da srie real possuem probabilidades significativas.
Fig. 2. Comparativo entre a FDP obtida pelo estimador Kernel Smoothing e o histograma da srie temporal

Dado o estudo estatstico do comportamento da srie temporal, possvel realizar a comparao das sries artificiais. A. Gerao de Sries Artificiais Por Meio de Distribuies Foram produzidas sries artificiais de acordo com alguns modelos de distribuio: Normal, Poisson e Exponencial. A srie artificial calculada a partir da distribuio normal apresentou os valores bem prximos da srie real, mas ainda com uma grande diferena: o histograma da srie real apresenta dois picos prximos de 10 e 20, enquanto o histograma da srie sinttica apresenta apenas um pico prximo a 40, conforme apresentado na Figura 3.

Fig. 5. Srie artificial e histograma obtido a partir da distribuio exponencial

A Tabela II lista o comparativo entre a mdia, valor mximo e varincia da srie temporal real e as sries artificiais geradas a partir de modelos de distribuio.

TABELA II Comparativo entre mdia, valor mximo e varincia das sries artificiais e real
Srie Real Normal Poisson Exponencial Mdia 19,82 39,63 40,96 228,08 Valor Mximo 47,72 43,08 106,91 1.620,10 Varincia 118.51 0,99 225,31 4.168,00

Fig. 3. Srie artificial e histograma obtido a partir da distribuio normal

Esta primeira etapa do experimento permite observar que mesmo com sries que possuem a FDP prximas da srie real, a distribuio dos valores ao longo do tempo pode fugir de contexto. O histrico da ao em questo possui o comportamento de crescimento, e avaliando os fatores econmicos (fator exgeno), h a certeza de que dificilmente haver quedas bruscas. Mesmo no acompanhando a particularidade da srie temporal em questo, a anlise do sinal pode ser feita no domnio da freqncia, servindo tambm como critrio de avaliao da eficcia do mtodo de gerao escolhido. A Figura 6 apresenta a comparao entre as densidades espectrais de potncia das sries artificiais e real. A partir dos grficos das densidades espectrais, possvel visualizar que a srie artificial de distribuio Normal assemelha-se srie real. J as sries artificiais obtidas atravs das distribuies de Poisson e Exponencial j estabilizam em valores prximos a 50 dB. Esta anlise permite capturar as freqncias do processo e auxiliar na identificao da periodicidade da srie.

B. Gerao de Sries Artificiais Por Meio de Estimao de Funo Densidade de Probabilidade Ao invs de utilizar modelos de distribuio clssicos, h mtodos que extraem as FDPs de uma srie no determinstica. Neste experimento foram utilizados dois mtodos: de Kolmogorov Smirnov e o Estimador de Densidade Kernel [4][3]. O mtodo de Kolmogorov Smirnov possui como resposta a FDP de forma suavizada, pois a sua concepo consiste na composio de vrias funes contnuas. J o Estimador de Densidade Kernel constri a FDP a partir da freqncia de ocorrncia dos valores discretos. A Figura 7 ilustra as duas FDPs construdas.

Fig. 7. Comparao entre as estimaes das FDPs

O Estimador de Densidade Kernel conseguiu reproduzir a FDP original de forma aceitvel, pois manteve as particularidades da distribuio dos valores das aes. O comparativo entre as FDPs real e artificial (pelo Estimador de Densidade Kernel) apresentado na Figura 8.

Fig. 6. Densidades espectrais de potncia das sries artificiais e real

A execuo do teste de Aceitao-Rejeio se d nos seguintes procedimentos: Gerar um nmero aleatrio u; Gerar um nmero aleatrio v a partir da funo g(x); Se c * u f(v) / g(v), o valor aceito; Caso contrrio calculado novos nmeros aleatrios u e v para serem submetidos no teste. A srie artificial criada pelo teste de Aceitao-Rejeio apresentada na Figura 10.

Fig. 8. Relao entre as FDPs real e artificial

Para a gerao de uma nova srie artificial, foi escolhida a FDP obtida pelo Estimador de Densidade Kernel. Alm disso, foi utilizado o teste de Aceitao-Rejeio para a incluso dos valores artificiais [5]. A parametrizao do teste de Aceitao-Rejeio deve satisfazer a condio da equao (1). (1) f ( x) c * g ( x) Onde:
Fig. 10. Srie artificial construda pelo teste de Aceitao-Rejeio

f(x) - FDP da srie sinttica. c - Constante a ser escolhida. g(x) - FDP para gerao. Na configurao do teste foi utilizado c igual a 2 (obtido de forma emprica) e a funo g(x) uma funo de distribuio normal. A visualizao da configurao no plano cartesiano auxilia na compreenso do teste (Figura 9). A srie g(x) * c representada pela cor rosa satisfaz a condio da equao (1).

Apesar da FDP obtida ser bastante fiel original, o comportamento da nova srie no domnio da freqncia bem diferente (Figura 11).

Fig. 10. Srie artificial construda pelo teste de Aceitao-Rejeio

O ganho do sinal estabiliza em torno de 20 dB, podendo este ser ou no um critrio de excluso do mtodo: ir depender do problema em questo. III. CONCLUSES Aps a anlise dos histogramas, funes densidade de probabilidade, atributos estatsticos (varincia, desvio padro, valor mximo...) e a anlise espectral de anlise de potncia, foi possvel escolher o modelo de distribuio Normal como o processo que possui maior semelhana com a srie temporal real. Alguns histogramas e FDPs de outros modelos tambm ficaram prximos do ideal, porm a anlise que tornou esta deciso vivel foi o da estimao do espectro de potncia. A anlise da srie temporal no pode ser vista apenas no domnio do tempo, necessrio tambm fazer a comparao no domnio da freqncia, pois h problemas em que determinadas freqncias no podem estar com o ganho fora da faixa esperada.

Fig. 9. Configurao do teste de Aceitao-Rejeio

Os mtodos estudados neste trabalho podem ser aplicados em problemas no qual o comportamento da srie esteja enquadrado em uma faixa de valores independentes do tempo. So mtodos fceis de serem codificados e no possuem custo computacional significativo. Estudos futuros sero realizados com o objetivo de avaliar a criao de sries temporais utilizando redes neurais e neurofuzzy. Ser explorada tambm a utilizao de modelos paramtricos auto-regressivos. REFERNCIAS BIBLIOGRFICAS [1] L. T. G. Fortes, F. D. S. Silva, Aplicao Potencial da Previso Climtica Probabilstica na Gesto de Recursos Hdricos: o Caso de Cantareira, So Paulo, XVI Congresso Brasileiro de Meteorologia, Setembro 2010. [2] InsiderNews (2011). Petrobras: crise derruba aes no ano e transforma euforia em coisa do passado. Acedido em 20 de Maio de 2011, em: http://www.insidernews.com.br. [3] A. W. Bowman, A. Azzalini, Applied Smoothing Tchiniques for Data Analysis, Oxford University Press, New York, 1997. [4] Z. I. Botev, J. F. Grotowski, D. P. Kroese, Kernel Density Estimation Via Diffusion, The Annals of Statistics, vol. 38, no. 5, pp. 2916-2957, December 2009. [5] R. A. Kronmal, A. V. Peterson, A Variant of the Acceptance-Rejection Method for Computer Generation of Randon Variables, Journal of the American Statistical Association, vol. 76, no. 374, pp. 446-451, June 1981.