Escolar Documentos
Profissional Documentos
Cultura Documentos
ARIMA MODELS APPLICATION ON SOYBEAN PRICE SERIES IN THE NORTH OF PARANA STATE
RESUMO
Este estudo tem por objetivo analisar a srie de preos diria da soja do Norte do Paran que compreende o espao temporal dos anos de 2000 (a partir de janeiro) a 2011 (at outubro) e descrever seu comportamento com previses a curto prazo. Ou seja, verificar se a dinmica temporal da varivel melhor explicada por um processo: Autorregressivo de ordem p, Mdia mvel de ordem q; Autorregressivo e Mdia mvel de ordem p,q; Autorregressivo, Integrado e Mdia mvel de ordem p,d,q; ou ARIMA sazonal de ordem (p,d,q), (P,D,Q). Para responder a tal questionamento foi utilizada a metodologia Box e Jenkins (1976). A manipulao dos dados foi baseada na anlise grfica e em testes estatsticos da prpria metodologia, atravs da qual, observou-se que o modelo ARIMA (5,0,0) ou simplesmente AR (5), respondeu como o melhor modelo dentre o conjunto de modelos testados para prever o preo da soja.
ARIMA MODELS APPLICATION ON SOYBEAN PRICE SERIES IN THE NORTH OF PARANA STATE
SUMMARY
This paper aims at analysing daily price listo f soyabean in the North of Parana state from January, 2000 to October, 2011, describing its behavior within a short term forecast. It was observed if the variable time dynamics would be better explained by an order autoregressive process p, order moving average q; autoregressive and order moving average p, q; autoregressive, integrated and order moving average p, d, q; or order ARIMA seasonal (p, d, q), (P, D, Q). Box and Jenkins (1976) methodology was used. Data were analysed based on graphics and on the methodology statistical tests through which it was observed that ARIMA model (5,0,0) or simply AR (5) showed better response as the best model among the tested series to forecast soyabean price.
1. INTRODUO Nos ltimos anos, o Brasil vem se apresentando como pas destaque no fornecimento e na comercializao de bens agrcolas. A sua lista de exportaes abrange desde produtos agrcolas at produtos de maior valor agregado. Neste cenrio, os bens de primeira ordem, ou seja, primrios, tornam-se mais evidentes na composio da receita advinda do setor de exportao nacional. Estes bens primrios que so classificados como commodities angariam maior relevncia econmico-financeira na formao do Produto Interno Bruto (PIB). Assim, o glycine max, ou simplesmente, feijo de soja, surge como um dos mais antigos produtos agrcolas comercializado. Atualmente a soja domina tanto o mercado de protena vegetal quanto o de leo comestvel. De acordo com Klaus (2005), o leo surgiu como subproduto do processamento do farelo de soja e tornouse um dos lderes mundiais no mercado de leos. O cultivo da soja teve seu auge produtivo mais precisamente na Regio Sul, sobretudo nos Estados do Rio Grande do Sul e Paran, a partir da dcada de 80. Sua cultura estendeu-se para a Regio Centro-Oeste, principalmente para os
De acordo com a Emater (2012), o consumo mundial estimado de soja gira em torno de 254,90 milhes de toneladas e as exportaes esto estimadas em 90,89 milhes de toneladas. Os EUA participam com aproximadamente 83,17 milhes de toneladas, cerca de 34% da produo mundial. J o Brasil, ainda de acordo com Emater, tem 40,6% de participao no comrcio mundial. Devido a enorme quantidade de rea apropriada para o cultivo da soja e da no explorao de muitas delas ou das zonas de fronteiras agrcolas no definidas, o Brasil figura neste mbito como um dos principais pases produtores e exportadores da
commodity confere soja, de acordo com Margarido e Sousa (1998), uma forte dependncia do mercado internacional, principalmente, dos preos cotados na Chicago Board of Trade (CBOT). Entre os anos de 1990 a 1995, o preo desta commodity foi influenciado pelo preo da CBOT, embora se tenha evidncias que no houve transmisso integral (MARGARIDO; SOUSA, 1998). Vale a pena ressaltar que so inmeros os fatores que apresentam influncia sobre a formao de preo da soja, mas, dentre eles, podem ser citados: a taxa de cmbio e o preo futuro da soja na Bolsa de
4
Mercado e Futuros de So Paulo (BM&F, 2011). Diante do exposto, este artigo visa aplicao de modelos ARIMA
regulares de tempo durante um perodo determinado. Para a anlise de uma srie temporal, inicialmente deve-se modelar o fenmeno estudado, sendo que, a partir deste ponto, pode ser feita a descrio do comportamento da srie, as suas
(Autorregressivos Integrados de Mdias Mveis) nos preos de comercializao da soja do Norte do Paran com a finalidade de auxiliar os produtores e empresrios na comercializao dessa commodity.
estimativas e finalmente a avaliao dos fatores que influenciam no comportamento da srie, tendo em vista a definio da relao causa e efeito.
Uma
srie
temporal
ou
srie
da famlia ARIMA que melhor representa a srie que poder ser utilizado para fazer as previses segundo a Figura 1:
histrica pode ser entendida como uma sequncia de dados obtidos em intervalos
Estimao
Verificao ou diagnstico
Previso
Os
modelos
ARIMA
so
necessrio que a srie temporal em estudo seja estacionria, ou de outro modo, no apresente tendncia ou sazonalidade. Para um bom ajuste do modelo, faz-se
amplamente utilizados para casos e estudos de preos. Suas construes se baseiam em modelos estatsticos lineares, em que as sries temporais envolvidas na anlise so obtidas por um processo determinstico ou estocstico, cuja natureza poder ser representada por meio de um modelo matemtico. Sfadi (2004) afirma que
necessria a utilizao de tcnicas em que a estrutura residual forme um white noise (rudo branco), ou seja, o resduo seja uma varivel aleatria independente e
identicamente distribuda. Outra informao relevante que o modelo bsico de um processo estocstico a sequncia de rudos brancos, ou seja,
5
varivel aleatria independente com mdia zero e varincia constante. sabido que quando no apresenta rudo branco, um modelo apresenta dependncia nos valores passados e tende a ser autocorrelacionado. A autocorrelao indicar que para a anlise da srie de preos h modelos que no so adequados para realizar previses mais precisas. 2.1 Processo de estimao do modelo ARIMA
como tendo distribuio normal, mdia zero, varincia constante e no correlao. Em termos estatsticos, considerando-se que E[x] denota a mdia terica do valor de x, a sequncia considerada um
A equao (1) representa um Dentre as classes de modelos propostos por Box e Jenkins (1976), ser destacado, neste artigo, o ARIMA, que pode ser representando da seguinte forma: modelo denominado como Autorregressivo integrado de mdia mvel, ou
simplesmente ARIMA. Sua equao pode ser escrita tambm no seguinte formato: sendo . O termo modelo autorregressivo
Nesta
equao,
termo
utilizado quando se pode escrever uma srie temporal na forma escrita passados.
Transcrevendo a srie em termos de choques aleatrios, tem-se o modelo de mdia mvel, ou seja, onde Se considerarmos a srie, , quando , o modelo ser conhecido como passeio aleatrio ou random walk, uma das caractersticas desse modelo violar a condio de estacionariedade.
6
representa uma sequncia de choques aleatrios e independentes uns dos outros, uma poro no controlvel do modelo chamado comumente de rudo branco, se a srie apresenta a no estacionariedade. Os parmetros at possibilitam
Um modelo estacionrio se para todo t e t-s , tivermos: mdia (i) (ii) , varincia constante; (iii) ( ( , covarincia constante. Na maioria das vezes, para ( )
constante;
autocorrelao e autocorrelao parcial, a partir dos quais so construdos os respectivos correlogramas: FAC (funo de autocorrelao) e FACP (funo de autocorrelao parcial), que por sua vez representam as inspees grficas das defasagens. Este correlograma delimita um intervalo de confiana para os coeficientes no qual as estatsticas da FAC e FACP devem variar e definido por:
que
srie temporal I(d) e depois de diferenciar d vezes ela pode ser modelada usando um modelo AR(p), este modelo para ser escrito como (FRANSES, 1998):
pode
autocorrelao parcial fora desse intervalo, exceto para a defasagem diferentes um, de so zero,
estatisticamente (2)
,t=p+d,p+d+1,...n.
sugerindo no estacionaridade da srie. Outro tipo de teste amplamente utilizado para a verificao da
O modelo representado por (2) normalmente abreviado por ARI (p,d), ou seja, Autorregressivo de ordem p e integrado de ordem d. Quando uma srie temporal apresenta uma tendncia
estacionaridade o Dickey-Fuller (DF), que testa a hiptese nula da existncia de raiz unitria na srie. Caso esta hiptese no seja rejeitada, a srie possuir raiz unitria, portanto, no ser estacionria. Para evitar o problema da autocorrelao dos resduos, recomenda-se a utilizao do
provavelmente ela poder ser representada por um modelo integrado ARI, ARIMA ou IMA. 2.2 Teste de Estacionaridade Segundo Ardes e Pereira (2008), o teste mais simples para analisar a
teste ADF (Dickey-Fuller Aumentado), que engloba a equao das defasagens para eliminao do problema de autocorrelao dos resduos.
2.4 Critrios de seleo (penalizadores de modelos) Os critrios de seleo com base na varincia estimada mais utilizados so o AIC e o BIC, que podem ser definidos por: AIC (Akaikes Information
A estatstica Ljung-Box (1978) muito utilizada para diagnosticar se a srie temporal possui autocorrelao. Sua
observaes e K representa o nmero de parmetros estimados. Esta estatstica de teste tambm segue uma distribuio QuiQuadrado com k-p-q graus de liberdade. A grande nfase atribuda estatstica de Ljung-Box metodologia est no fato as que esta
Criterion): BIC = T ln (SQR) + n ln(T) onde: T o tamanho da amostra; SQR a soma dos quadrados dos resduos e n o nmero de parmetros (MARCHEZAN, 2007). Em linhas gerais, dentre os vrios modelos apresentados, escolhe-se aquele que apresenta o menor AIC e BIC. Salienta-se tambm que a escolha dever levar em considerao ou seja, os modelos que de
possui
melhores
propriedades para amostras finitas do que a estatstica Box e Pierce (1970), mas ambas seguem a mesma interpretao. De acordo com Sfadi (2004) e Gujarati (2000), se o
parcimoniosos, apresentam o
aqueles nmero
menor
conjuntamente, pois so complementares e no excludentes. Como neste artigo sero testados alguns conjuntos de modelos ARIMA, ser escolhido apenas um deles, o qual
autocorrelacionados. Porm isso implica em aceitar a hiptese, alternativa ( que pelo menos uma autocorrelao de
Em
resumo,
foram
feitos
os
seguintes procedimentos: a) Teste de estacionaridade (ADF); b) Verificao de autocorrelaes residuais (FAC e FACP); c) Testes de significncia para com o conjunto de modelos ARIMA encontrados; e) Aplicao dos critrios penalizadores (AIC) e, por fim, a verificao da qualidade do modelo para realizar previso de preos. Para a manipulao dos
estudo, a ARIMA, parte do princpio de que os modelos economtricos podem ser desenvolvidos a partir da
inicialmente por Box e Jenkins (1976). Os dados coletados referem-se aos preos dirios da soja comercializada no Norte do Paran, entre os perodos histricos de janeiro de 2010 a outubro de 2011, totalizando 2672 observaes, obtidos por meio do banco de dados do site Bloomberg (2012). 4. RESULTADOS
procedimentos estatsticos do presente estudo, foram utilizados neste estudo os seguintes softwares computacionais:
Figura 2 Srie ndice de preos da soja do Norte do Paran de janeiro de 2010 a outubro de 2011
Serie de Preos Soja
60 x 20
0
30
40
50
500
1000
1500
2000
2500
Observa-se, na Figura 2, que os preos da soja do Norte do Paran apresentam uma tendncia no uniforme em seus preos, ou seja, em
diversas alteraes temporais, o que demonstra que a srie em estudo na realidade tem uma grande variabilidade, de modo que a mesma pode ser ponderada como no estacionria.
-0.05
0.0
0.05
Para melhor entendimento do comportamento da srie de preos da soja, foi criada uma srie defasada (Figura 3), denominada de srie de retornos - preo soja, obtida por: , onde o preo de hoje da
soja e
dessa diferena, visualizam-se os retornos da srie e, determinar a dependncia temporal dos preos. Os grficos
contemplados na Figura (3) evidenciam o relacionamento e a variabilidade dos dados da commodity soja.
10
Series : soja.rt
Series : soja.rt
Analisando
correlograma
dados observados, pois se verifica pouca dependncia temporal entre os preos na relao presente-passado da srie em estudo, o que fato essencial para a posterior descoberta acerca do modelo mais ajustado para a realizao de previses de preos do ativo soja.
expresso na Figura 4, percebe-se que a srie primitiva de dados (2 grfico) apresenta uma dependncia temporal em relao aos dias observados na relao presente-passado. J no 1 grfico (srie defasada), nota-se a presena estrutural da aleatoriedade nos
11
-6 -4 -2 0
500
1000
1500
2000
2500
-1.0
ACF 0.0
1.0
10
30
-0.04
PACF 0.04
0
0.0
6
p-value 0.4
10
De
acordo
com
os
modelos
comportamento dos preos, quase no se notou a presena da autocorrelao nos dados (FAC), verificou-se tambm baixa autocorrelao parcial (FACP) e os valores p da srie em estudo ficaram abaixo de 5% de significncia estatstica, indicando um forte grau de ajuste do modelo escolhido (verificar tabela 1 e tabela 2).
autorregressivos testados neste estudo (Figura 5), o que mais se ajustou em termos de significncia estatstica foi o ARIMA (5,0,0), ou seja, o modelo AR(5) sem diferenciao e sem mdia mvel, onde o AR(5), indica o nmero de termos autorregressivos. Atravs aplicao desse modelo, obteve-se uma maior aleatoriedade no
12
Tabela 1- Output dos Modelos ARIMA testados no S-Plus Call: arima.mle(x = soja.rt, model = list(ar = c(0.1, 0.1, 0.1, 0.1, 0.1))) Method: Maximum Likelihood Model : 5 0 0 Coefficients: AR : 0.15724 0.00065 0.00671 0.04053 -0.04903 Variance-Covariance Matrix: ar(1) ar(2) ar(3) ar(4) ar(1) 3.741921e-004 -5.823551e-005 -1.193795e-007 -2.503579e-006 ar(2) -5.823551e-005 3.828503e-004 -5.829929e-005 2.663250e-007 ar(3) -1.193795e-007 -5.829929e-005 3.828336e-004 -5.829929e-005 ar(4) -2.503579e-006 2.663250e-007 -5.829929e-005 3.828503e-004 ar(5) -1.231061e-005 -2.503579e-006 -1.193795e-007 -5.823551e-005 ar(5) ar(1) -1.231061e-005 ar(2) -2.503579e-006 ar(3) -1.193795e-007 ar(4) -5.823551e-005 ar(5) 3.741921e-004 Optimizer has converged Convergence Type: relative function convergence AIC: -15.351,52(Critrio de Informao penalizador) Atravs de uma rpida inspeo nos valores do output do programa S-Plus acerca do conjunto de modelos ARIMA testados (Tabela 1), pode-se visualizar que o modelo AR(5) ou ARIMA incompleto, apresenta-se com a melhor matriz de covarincia, ou seja, os coeficientes mais significantes estatisticamente. Como forma de comprovao
acerca dos resultados estatsticos, a tabela 2, demonstra os valores do Critrio penalizador AIC, cuja finalidade
descrever o modelo mais parcimonioso, ou de outro modo, o que envolva o menor nmero de parmetros possveis a serem estimados e que da explique varivel bem o
comportamento
resposta.
13
Tabela 2 Valores dos AICs encontrados AR 1 10.000,00 -15.376,64 -15.367,16 -15.360,23 -15.355,94 AR 2 -15.381, 61 -15.374,67 -15.367,99 -15.358,24 -15.356,85 AR 3 -15.380,17 -15.375,57 -15.365,24 -15.358,91 -15.352,61 est AR 4 -15.378,21 -15.370,20 -15.361,43 -15.361,22 -15.350,39 representada AR 5 -15.382,54 -15.373,36 -15.370,02 -15.361,70 -15.351,52 pelos pontos em
J o Plot da previso (ver Figura 6) realizada nos preos apresentou um forte ajuste em relao tendncia da srie de preos, o que pode se comprovado a seguir, onde a mdia de acerto da previso
destaque, que por sua vez denotam um comportamento cclico em torno da mdia das expectativas futuras da previso.
Para comprovar as expectativas em torno da qualidade do modelo escolhido a fim de se fazer a previso de preos, foi feito o teste de verificao da qualidade da previso (Figura 7), onde se pde verificar que a previso feita atravs do modelo ARIMA (5,0,0) revelou-se ser
realidade da srie de preos da soja do Norte do Paran, cujo valor ficou em R$ 47,28. Esse valor foi obtido por meio do mtodo de previso um passo a frente, considerando-se o prximo ms como perodo de referncia.
15
5. CONCLUSO
Atravs metodologia de
da
aplicao sries
da
2011.
temporais REFERNCIAS ARDES, A. F.; PEREIRA, M.W. G. Potencialidade da utilizao de modelos de series temporais na previso no preo do trigo no estado do Paran. Revista de Economia Agrcola, So Paulo, v. 55, n. 1, p. 6376, jan./jun., 2008. BM&F. BOVESPA. Contratos futuros de soja: vencimentos. Disponvel em:< <http://www.bmf.com.br/bmfbovespa/page s/contratos1/Agropecuarios/pdf/Soja_Fut_Liquidacao_Financeira.pdf>. Acesso em: 20 set. 2012. BOX, G. E. P.; JENKINS, G. M. Time series analysis forecasting and control. Edio revisada. San Francisco: Holden Day, 1976. BOX, G. E. P.; PIERCE, D. A. Distribution of residual autocorrelations in autoregressive-integrated moving average time series models. J. Am. Stat. Assoc., New York, v. 65, n. 332, p. 1509-1526, 1970. EMATER. Instituto de Assistncia Tcnica e Rural. Disponvel em<http://www.emater.go.gov.br/w/3446> Acesso em: 20 set. 2012. ENDERS, W. Applied econometric time series. New York: John Wiley, 1995. GUJARATI, D.N. Econometria bsica. So Paulo: Makron Books, 2000. KLAUS,W. Soja sua fantstica histria. Porto Alegre: Imprensa Livre, 2005.
16
desenvolvida por Box e Jenkins (1976), o pesquisador pode modelar uma srie que tenha comportamento temporal presente nos dados coletados e escolher o melhor modelo do ponto de vista de significncia estatstica entre um conjunto de possveis modelos concorrentes. Com a manipulao deste ferramental estatstico, tornou-se possvel a escolha ou sugesto de um modelo matemtico representativo para os preos da soja do Norte do Paran. Para modelar a srie de preos utilizou-se Integrado o modelo de Autorregressivo Mveis nvel de
Mdias com um
[ARIMA(5,0,0)]
defasagem (chamado de retorno dos preos da soja) que, por sua vez, respondeu aos testes economtricos com maior robustez e preciso estatstica. Por fim, vale salientar que este estudo deu nfase a apresentao e manipulao da metodologia Box e Jenkins (1976), servindo de base para a realizao de outros estudos a posteriori. Alm disso, foi possvel concluir que essa metodologia satisfez os requisitos para a escolha do modelo mais apropriado para fazer
MARCHEZAN, A. Previso do preo dos principais gros do Rio Grande do Sul. Monografia de Especializao em Estatstica e Modelagem Quantitativa, UFSM, Santa Maria/RS, 2007. MARGARIDO, M. A. & SOUSA, E. L. de. Formao de preos da soja no Brasil. Anais do 36 Congresso Brasileiro de Economia e Sociologia Rural, p. 773-784, 1998. LJUNG, G. M. & BOX, G. E. P. On a measure of lack of fit in time series models. Biometrika, v. 65, p. 297-303, 1978. RUSSO, S. L. Grficos de controle para variveis no-conformes autocorrelacionadas. Tese de Doutorado. Programa de Ps-graduao em Engenharia de Produo, UFSC, Florianpolis/SC, 2002. SFADI, T. Uso de sries temporais na anlise de vazo de gua na represa de Furnas. Cincia Agrotcnica,Lavras,v.28,n.1,p.142148,jan/ fev,2004. SOUZA, G. P.; SAMOHYL, R.W; MIRANDA, R.G. Modelos simplificados de previso empresarial. Rio de Janeiro: Editora Cincia Moderna, 2007. YIN, Robert K. Estudo de caso: planejamento e mtodos. 2. ed. Porto Alegre: Bookman, 2001.
17