Escolar Documentos
Profissional Documentos
Cultura Documentos
89
Zhang et al. (1998) apresentaram estudo sobre o previsão, dependendo do país analisado e do
estado da arte das redes neurais aplicadas no horizonte de previsão.
problema da previsão. Os autores concluíram que Catalão et al. (2007) realizaram projeções do
as características das redes neurais, como a preço da energia para os mercados de curto
adaptabilidade, não-linearidade e o mapeamento prazo da Espanha e Califórnia através das redes
de uma função trazem um desempenho neurais e os resultados foram comparados com
satisfatório de previsão. Porém, para esse os modelos ARIMA e Naive desenvolvidos pelos
problema específico, resultados não são trabalhos de Contreras et al. (2003) e Conejo et
conclusivos se as redes neurais são melhores al. (2005). O algoritmo de Levenberg-Marquardt
que os métodos estatísticos clássicos como Box- foi aplicado para treinar a rede e a conclusão foi
Jenkins. de que a rede neural superou as técnicas ARIMA
Shabri (2001) comparou Box-Jenkins e redes e Naive para todas as previsões realizadas.
neurais com algoritmo backpropagation para a Sobreiro et al. (2009) identificaram uma lacuna na
previsão de cinco séries temporais distintas. Os previsão do preço dos combustíveis, que ficou
resultados indicaram que para as séries com mais evidente quando se observa o etanol no
tendência e sazonalidade, Box-Jenkins e as redes Brasil. Os autores compararam as redes neurais
neurais tiveram bom desempenho na previsão. de arquitetura perceptron de múltiplas camadas
No entanto, para séries que apresentam padrão com o ARIMA e os resultados obtidos através dos
irregular, o modelo Box-Jenkins superou a erros indicaram que as redes neurais tiveram
acurácia das redes neurais. melhor performance para previsão do preço do
Bressan (2001) utilizou modelos ARIMA, etanol quando comparado ao ARIMA.
estruturais, bayesianos e redes neurais para a Pasquotto (2010) utilizou as redes de Elman para
previsão de séries temporais de negociações de previsão de séries temporais mensais da
contratos futuros do boi gordo, café e soja em demanda por produtos farmacêuticos, demanda
operações de compra e venda de contratos por adubos e tráfego aéreo e comparou os
nesses mercados. A conclusão foi de que o resultados com modelos lineares sazonais
melhor desempenho preditivo nos três mercados através de Box-Jenkins. A conclusão foi de que a
foi obtido pelo ARIMA em função de sua Box-Jenkins foi superior ao modelo da rede de
adaptabilidade e estrutura parcimoniosa. Elman para as três variáveis analisadas. A
Gomes (2005) comparou as redes neurais presença de tendência e sazonalidade nas séries
recorrentes para séries temporais com memória temporais teve impacto negativo na qualidade de
curta e longa, tendo como referência modelos previsão das redes neurais.
ARIMA e ARFIMA. As redes neurais recorrentes
apresentaram bons resultados para as séries 1 – Material e métodos
espaciais (variáveis de solo) devido a não- 1.1 - Material
linearidade. Para várias séries econômicas de Os preços se referem ao consumidor final
inflação em países desenvolvidos, as redes (R$/litros), no período de janeiro de 2005 até
recorrentes, redes feedforward e modelos dezembro de 2011, totalizando 84 observações
lineares se alternaram como melhores para mensais. Optou-se por trabalhar com os preços
1
90
medianos, já que essa medida de tendência wt = série temporal estacionária no
central não é afetada pelos valores extremos. instante t ;
Para Box-Jenkins utilizou-se a transformação i = parâmetro auto-regressivo;
logarítmica da amostragem com o objetivo de
= parâmetro de média móvel;
estabilizar a variância e aplicou a normalização
dos dados para a rede neural.
t ~ N (0, ) 2
= ruído branco, com média
observada
yt é substituída por w t que indica (1 1 B ... q B q )(1 1 B s ... Q B Qs ) t
abaixo: (B ) (B s ) d D
s yt (B ) (B S ) t
2
91
= operador de média móvel contrário, outra especificação deve ser escolhida
sazonal; para modelar a série temporal.
Como um dos obstáculos na modelagem Box-
Jenkins é a definição da ordem (p, d, q), que é 1.2.2 - Rede neural de Elman
considerada subjetiva e de difícil verificação, Conforme Fausett (1994), as redes neurais
optou-se pela seleção automática desses artificiais são generalizações matemáticas de
parâmetros através do pacote Forecast do cognição humana ou biologia neural. O
programa R para identificar o melhor modelo para conhecimento adquirido ocorre através de um
descrever a série temporal. Hyndman e processo de aprendizagem e as transmitâncias
Khandakar (2008) descreveram esse pacote. dos pesos sinápticos, às quais estão submetidos
O primeiro parâmetro identificado é o número de os fluxos de informações através da rede que são
diferenciações d necessárias para tornar a série utilizadas para armazenar o conhecimento obtido.
estacionária, escolhido com base no teste KPSS. A figura abaixo ilustra esse modelo artificial.
Posteriormente determinam-se os parâmetros
auto-regressivo e de média móvel que podem Figura 1. Generalização de neurônio artificial
assumir valores entre 0 a 3 e os operadores auto-
Pesos
regressivo sazonal e de média móvel sazonal de
x1 wk 1
ordens P e Q, que podem assumir valores entre 0
Saída
Entradas
um ruído branco através dos testes Box-Pierce e Em que yk é a saída do neurônio; φ (.) é a função
Ljung-Box, no qual os coeficientes de de ativação que restringe a amplitude de saída do
autocorrelações amostrais dos erros devem ser neurônio; x1, x2, ..., xn são os sinais de entrada do
estatisticamente iguais a zero, é necessário neurônio; e wk1, wk2, ..., wkn são os pesos
identificar se os mesmos apresentam distribuição sinápticos do neurônio em questão.
normal através do teste Shapiro-Wilk e Jarque- Para Zhang et al. (1998), uma das principais
Bera que verifica se os momentos da série críticas as redes neurais é que elas são uma
estimada são iguais aos da normal (MATOS, “caixa-preta”, pois não existe forma explícita para
2000). analisar e explicar a relação entre as entradas e
Se o modelo identificado for adequado, o mesmo saídas, dificultando a interpretação dos
pode ser utilizado para realizar previsões, caso resultados. Essa rede pode produzir previsões
satisfatórias, mas geralmente oferecem um
3
92
pequeno conhecimento sobre a estrutura dos A rede de Elman foi desenvolvida no pacote
dados. RSNNS do R (Bergmeier e Benitez, 2010),
A rede neural desenvolvida por Elman (1990) através das etapas descritas abaixo:
possui conexões recorrentes dos neurônios i) Organização da base de dados com
ocultos para uma camada de unidades de as informações relevantes;
contexto que consistem em atrasos unitários. ii) Separação dessas informações em
Essas unidades de contexto armazenam as dois grupos destinados à fase de treinamento e
saídas dos neurônios ocultos por um período de outra de teste. O treinamento deve ser
tempo, e então realimenta de volta para a caracterizado por possuir uma boa representação
camada de entrada. Os neurônios ocultos têm um da população em análise. Estudos apresentados
registro de suas ativações passadas, o que por Granger (1993), Tang e Fishwick (1993)
capacita a rede a realizar tarefas de aprendizado indicam que pelo menos 20% da amostra deve
que se estendem no tempo. ser utilizada para validar o modelo obtido na fase
A camada de entrada possui neurônios sensoriais de treinamento. Com base nesses trabalhos, as
que recebem um sinal externo e o propagam sem 71 primeiras observações da amostragem foram
alterá-lo. A camada de saída possui neurônios consideradas para a fase de treinamento e as
lineares em que as saídas são somas demais aplicadas na validação da rede;
ponderadas de seus respectivos sinais de iii) A etapa seguinte foi à normalização
entrada. A camada intermediária tem neurônios estatística dos dados que teve como objetivo
que apresentam funções de ativação lineares ou adaptar os dados de entrada a faixa dinâmica das
não-lineares e a camada de contexto é formada funções de ativação da rede neural. Essa
por neurônios que apenas memorizam as normalização está descrita em Weigend et al.
ativações dos neurônios da camada (1992) e apresentada na equação abaixo:
intermediária, atuando com operadores de ( yt y)
yt* (10)
defasagens em um instante de tempo (ZUBEN, σy
1996). A figura abaixo representa uma Em que:
generalização da rede de Elman.
yt* valor normalizado; yt = valor real
ou observado;
σy desvio padrão da amostra; y
Figura 2. Rede de Elman
média amostral;
Camada de saída
iv) Finalmente, a rede foi treinada e
4
93
alterar a combinação entre esses diferentes O termo de erro et equivale ao valor observado
parâmetros.
menos o estimado, ou seja, e y ˆ
t y e n =
número de observações.
1.2.3 - Medidas de erros
A escolha de uma medida específica depende se
2 – Resultados e discussões
o objetivo é selecionar um método mais preciso
Através da análise gráfica da decomposição da
para previsão ou calibrar um determinado
série de preços, nota-se um comportamento
modelo. Como o objeto de estudo é a
sazonal homogêneo e estável em todos os anos,
comparação entre métodos de previsão, optou-se
o que já era esperado, considerando a
por utilizar quatro medidas específicas: ME (erro
sazonalidade da produção da cana-de-açúcar,
médio), MAE (média absoluta dos erros), RMSE
que implica no preço dos produtos
(raiz do erro quadrático médio) e MAPE (média
sucroalcooleiros. Também existe uma tendência
absoluta percentual dos erros), conforme
de crescimento justificada pelo aumento da frota
equações abaixo.
de veículos flexfuel e conseqüente elevação da
n
1 demanda pelo produto, o que ao final pressiona
ME et 1 n n n
n t 1 MAE | et | 1 1 et os níveis de preços.
n t 1RMSE et2
MAPE x100
nt1 n t 1 yt
0.3 0.4 0.5 0.6 0.7 0.8
0.05
Sazonalidade
seasonal
0.00
-0.05
0.70
Tendência
0.60
trend
0.50
0.40
0.05 0.10
remainder
Resíduos
-0.05 0.00
time
5
94
2.1 - Box-Jenkins verdadeiros valores desses parâmetros. Outro
Após a identificação do ARIMA (2,1,3)(0,0,1)[12], ponto observado é que os valores dos critérios de
estimou-se os parâmetros desse modelo. É informação AIC e BIC apresentaram resultados
possível verificar que os mesmos se encontram negativos, o que é plausível, já que eles
dentro do intervalo de confiança que contém os dependem a função de verossimilhança.
Pela figura seguinte, percebe-se que o sobrepostos à reta (b), representando indícios de
histograma dos resíduos do modelo é simétrico normalidade.
(a) e que a maioria dos pontos se encontram
95
Figura 4. Histograma (a) e QQ-Plot dos resíduos (b)
(a) (b)
0.10
14
12
0.05
10
Quantis da amostra
8
Frequência
0.00
6
4
-0.05
2
0
O teste Shapiro-Wilk indicou que não existem empírica coincidem com os da normal, ao nível de
evidências para rejeitar a hipótese de significância de 5%. Portanto, a análise gráfica
normalidade, com nível de significância de 5%. preliminar de normalidade dos resíduos foi
Paralelamente, o teste Jarque-Bera caracterizou confirmada pelos resultados dos testes ilustrados
que o terceiro e quarto momentos da distribuição a seguir.
A análise conjunta dos testes Ljung-Box e Box os resíduos não se correlacionam, portanto mais
Pierce indicaram que não há indícios para rejeitar um dos pressupostos da modelagem Box-Jenkins
a hipótese nula de ruído branco, ao nível de foi satisfeito, conforme resultados apresentados
significância de 5%. Ou seja, pode-se afirmar que abaixo.
1
96
Tabela 4. Testes de Autocorrelação
Modelo Autocorrelação
ARIMA(2,1,3)(0,0,1)[12] Box-Pierce Ljung-Box
Estatística X²= 0,0046 X² = 0,0047
p-value 0,9461 0,9451
Fonte: Dados da pesquisa.
1
97
Figura 5. Processo de aprendizagem da rede neural
20
15
Weighted SSE
10
5
0
Iteration
A tabela abaixo apresenta os erros da rede Elman representa a validação do modelo neural. Os
calculados para a fase de treino, ou seja, o demais indicadores de erros também
processo de aprendizado e a fase de teste que apresentaram resultados satisfatórios.
ME -0,02% 0,44%
1
98
2.3 - Análise comparativa entre modelos A tabela seguinte indica os erros dos métodos
O modelo estatístico permitiu identificar os propostos. Embora a validação da rede neural
padrões de comportamento como tendência e seja realizada com base na fase de testes, para a
sazonalidade presentes na série estudada. Após análise comparativa entre os modelos, optou-se
a validação do método de Box-Jenkins, o mesmo por calcular os erros sobre as etapas de
apresentou bons resultados de previsão. Já a validação e teste para que as medidas de erro
aplicação da rede neural de Elman na previsão do tivessem o mesmo número de observações
preço do etanol em Goiás se mostrou uma daquela apresentada por Box-Jenkins, visto que a
ferramenta relevante, embora esta técnica não comparação entre modelos com diferenças de
permita identificar padrões de comportamentos tamanho entre as amostras fica prejudicada.
existentes na série.
ME 0,36% 0,07%
1
99
Figura 6. Valores observados e preditos pelos modelos para o preço do etanol em Goiás
2,300
2,200
2,100
2,000
1,900
Preço - R$/litros
1,800
1,700
1,600
1,500
1,400
1,300
jan/05
jan/06
jan/07
jan/08
jan/09
jan/10
jan/11
out/05
out/06
out/07
out/08
out/09
out/10
out/11
abr/05
abr/06
abr/07
abr/08
abr/09
abr/10
abr/11
jul/05
jul/06
jul/07
jul/08
jul/09
jul/10
jul/11
Observado Previsto ARIMA Previsto Rede neural
1
100
desempenho e complexidade, podendo ser [10] FARAWAY, J., CHATFIELD, C. Time series
forecasting with neural networks: a case study.
estendido para a previsão de outras séries
Research Report 95-06. University of Bath, 20 p.,
temporais. 1995.
TANG, Z.; FISHWICK, P.A. Feedforward neural ZUBEN, F.J.V. Modelos paramétricos e não-
nets as models for time series forecasting. ORSA paramétricos de redes neurais. 1996. 243 p.
Journal on Computing. v.5, n. 4, p. 374-385, Tese (Doutorado em Engenharia Elétrica),
1993. Universidade Estadual de Campinas, Campinas,
1996.
WEIGEND, A.S.; HUBERMAN, B.A.;
RUMELHART, D.E. Predicting sunspots and
2
102