Escolar Documentos
Profissional Documentos
Cultura Documentos
MERCADOSDEENERGAUSANDOELLENGUAJ ER
TIMESERIESANALYSISANDFORECASTINGINENERGY
MARKETSUSINGTHERLANGUAGE
JUANDAVIDVELSQUEZHENAO
ProfesorAsociado, EscueladeSistemas,UniversidadNacionaldeColombia,jdvelasq@bt.unal.edu.co
YRISOLAYAMORALES
ProfesoraAsociada,EscueladeSistemas,UniversidadNacionaldeColombia, yolayam@bt.unal.edu.co
CARLOSJAIMEFRANCOCARDONA
ProfesorAsociado, EscueladeSistemas,UniversidadNacionaldeColombia, cjfranco@bt.unal.edu.co
Recibidopararevisar agosto19de2010,aceptado noviembre26de2010,versinfinal diciembre1de2010
RESUMEN: El anlisis de series de tiempo y la prediccin de variables econmicas son tpicos centrales de
investigacinenelcampodelaenerga.Enesteartculo,serevisanlosprincipalesaspectosdellenguajeRparael
comput estadstico, y se discute su utilidad potencial para los investigadores y profesionales en mercados de
energa.Tambin,serevisanlasprincipalesfuncionesdisponiblesparaelanlisisdeseriesdetiempoysepresentan
algunosejemplosdesuuso.
PALABRASCLAVE: ProyectoR,software estadstico,demanda,precios,produccin.
ABSTRACT:Timeseriesanalysisandforecastingofeconomicvariablesarecentralresearchtopicsintheenergy
field. In this paper, we review the main aspects of the R language for statistical computing, and we stress the
potential usefulness for researchers and practitioners of energy markets. Also, we review the main available
functionsfortimeseriesanalysisandforecasting,andwepresentsomeexampleoftheiruse.
KEYWORDS:Rproject,statisticalsoftware,demand,prices,production.
INTRODUCCIN
Elmodeladoyanlisisdelasrelacionesentrelas
variables econmicasyfinancieras endiferentes
mercados deenerga(electricidad,petrleo,gas,
carbn, biocombustibles, etc.) son dos de los
principales ejesdeinvestigacindelaeconoma
energticalasmetodologasutilizadasprovienen
de diversos campos del conocimiento que
incluyen,
entre otros, la economa, la
econometra, la investigacin de operaciones,
la estadstica y las finanzas. Gran parte del
anlisis est centrado
en descubrir y
entenderlarelacinentrediferentesvariablesas
comosu dinmica, apartirdelainformacin
histrica. Vase por ejemplo [1] [2][3].
Dyna,Ao78,Nro.165,pp.287296.Medelln,Febrero de2011.ISSN00127353
288
Velsquezetal
Dyna165,2011
formaquemuchosprogramas escritosenSyS
plus pueden ejecutarse enRsin modificaciones.
S y Splus son lenguajes de muy alto nivel
diseados para [12]:La exploracin y
visualizacin de datos el modelado estadstico
ylaprogramacincondatos.
2.1
Adquisicinylicencia
Inter fazdeusuar io
289
Infor macindisponible
290
Velsquezetal
paquetesdesarrolladospordiferentesautores,los
cuales pueden ser instalados desde la barra de
men paquetes/Instalar paquete(s). Los
paquetes deben ser cargados manualmente en
cada sesin mediante la opcin Cargar
paquetedelmenPaquetesoatravsdela
funcin library(). Los principales paquetes
disponibles para el anlisis y la prediccin de
series de tiempo se encuentran listados en la
Tabla 1. A continuacin, se discute algunas de
sus principalesfunciones,agrupadas deacuerdo
conlasprincipalesfasesdedesarrollounmodelo
explicativoopredictivo.
3.1
Entr adadelosdatos
+146182,137728,148932,156751,
+ 177998,174559,198079,189073,
+175702,180097,155202,174508,
+154277,144998,159644,168646,
+166273,190176,205541,193657,
+182617,189614,174176,184416,
+158167,156261,176353,175720,
+193939,201269,218960,209861,
+198688,190474,194502,190755,
+166286,170699,181468,174241,
+210802,212262,218099,229001,
+203200,212557,197095,193693,
+188992,175347,196265,203526,
+227443,233038,234119,255133,
+216478,232868,221616,209893,
+194784,189756,193522,212870,
+248565,221532,252642,255007,
+206826,233231,212678,217173,
+199024,191813,195997,208684,
+244113,243108,255918,244642,
+237579,237579,217775,227621),
+start=1960,frequency=12)
>
Dyna165,2011
Enelmarcodelos modelosARIMA,elanlisis
exploratoriosebasaprincipalmenteenelusode
contrastes deraces unitarias yelanlisis de los
grficos de las funciones de autocorrelacin
simple y parcial no obstante, cuando hay
presencia de no linealidades, tanto en la media
como en la varianza, se deben utilizar otras
herramientasexploratorias.
En la Tabla 3, se resumen y describen las
principalesfuncionesdisponiblesparaelanlisis
exploratorio de una serie de tiempo. Para
ejemplosdetalladosvase[20][21],[22][23].
3.3
Especificacinypr onstico
291
Tabla1.Principalespaquetesparaelanlisisdeseriesdetiempo
Table1. Mainpackagesfortimeseriesanalysis
Paquete
Descripcin
expsmooth
DatosdellibroForecastingwithexponentialsmoothing:thestatespaceapproach[24].
FinTS
Funciones,datosyejemplosdellibroAnalysisofFinancialTimeSeries"[28].
forecast
stats
Paquetebaseconfuncionesestadsticasbsicas
tseries
Funcionesydatosparaelanlisisdeseriesdetiempoyfinanzascomputacionales[30].
uroot
Contrastesderacesunitariasparaseriesdetiempoconcomponentesperidicas
292
Velsquezetal
Tabla2. Funcionesparatransformarunaseriedetiempo
Table2. Functionsfortimeseriestransformation
Paquete
Descripcin
ts()
stats
Creaunobjetotimeseries
window()
stats
Permiteseleccionarunsubconjuntodedatosdeunaseriedetiempo
diff()
base
Diferenciacinaplicadanvecesparaunretardodefinidoporelusuario
lag()
stats
Computalaversinretardadadeunaseriedetiempo.
stl()
stats
filter()
stats
Filtradolinealdeunaseriedetiempo
200000
150000
100000
gasdem
250000
Funcin
1960
1965
1970
1975
Time
Dyna165,2011
293
Tabla3.Funcionesparagraficarycalcularestadsticosdescriptivosdeunaseriedetiempo
Table3. Functionsforplottingandcalculatingdescriptivestatisticsofatimeseries
Funcin
Paquete
Descripcin
plot()
graphics
Funcingenricaparagraficarobjetosdellenguaje
plot.ts()
stats
Graficaunaseriedetiempo
sd()
stats
Desviacinestndar
var()
stats
Varianza
hist()
graphics
Histograma
density()
stats
Estimacinnoparamtricadelafuncindedensidaddeprobabilidad
qqnorm()
stats
GraficaQQ
qqline()
stats
AgregaunlneaalagrficaQQquepasaporel1eryel3r.cuartil.
acf()
stats
Funcindeautocorrelacinsimple
pacf()
stats
Funcindeautocorrelacinparcial
ccf()
stats
Funcindeautocorrelacincruzada
eacf()
TSA
Funcindeautocorrelacinsimpleextendida
tsdisplay()
forecast
Produceungrficodelaseriedetiempo,suACFysuPACF
lag.plot()
stats
Diagramadirigidodedispersin
adf.test()
tseries
ContrasteaumentadodeDickeyFuller
pp.test()
tseries
ContrastedeintegracindePhillipsPerron
kpss.test()
tseries
ContrastedeestacionalidaddeKwiatkowskiPhillipsSchmidtShin.
>lines(fitted(m1),col='red',lwd=2)
>lines(p1$mean,col='red',lwd=2)
>grid()
>abline(v=(1973+11/12))
>
Enestecasoelmodeloobtenidoes:
>m1
Series:yfit
ARIMA(2,1,0)(0,1,2)[12]
Call:auto.arima(x=yfit,d=1,D=1,
max.p=5,max.q=5,max.P=2,
max.Q=2,max.order=5,start.p=2,
start.q=2,start.P=1,start.Q=1)
Coefficients:
ar1ar2sma1sma2
1.01980.6720 0.7255 0.1540
s.e.0.06110.06240.11310.0924
sigma^2estimatedas22130445:
loglikelihood=1539.5
AIC=3089AICc=3089.4
BIC=3104.22
3.4
Diagnstico
EnlaTabla5,selistanlasprincipalesfunciones
para realizar el diagnstico de los residuales
294
Velsquezetal
obtenidodespusdecalibrarunmodelodeseries
detiempo.
4
CONCLUSIONES
Tabla4. Modelos
Table4.Models
Funcin
Paquete
Descripcin
HoltWinters()
stats
Suavizadoexponencial
ar()
stats
Ajustaunmodeloautorregresivo(AR)alaseriedetiempoanalizada
arima()
stats
AjustaunmodeloARIMAalaseriedetiempoanalizada
auto.arima()
forecast
BuscaelmejormodeloARIMAparaunaseriedetiempo
StructTS()
stats
Ajustaunmodeloestructuralaunaseriedetiempo
garch()
stats
AjustaunmodeloGARCHaunaseriedetiempo
theta()
forecast
PronsticousandoelmtodoTheta
rwf()
forecast
Pronsticobasadosuponiendoquelaserieesunpaseoaleatorio
Tabla5. Funcionesparaeldiagnsticodelmodelo
Table5. Model residualsdiagnosticfunctions
Funcin
Paquete
Descripcin
tsdiag()
stats
DiagnosticPlotsforTimeSeriesFits
Box.test()
stats
ContrastesdeBoxPierceyLjungBox
jarque.bera.test()
tseries
ContrastedenormalidaddeJarqueBera
McLeod.Li.test()
TSA
ContrastedenolinealidaddeMcLeodLi
Dyna165,2011
295
200000
150000
100000
gasdem
250000
(a) Pronsticousandoauto.arima()
1960
1965
1970
1975
Time
200000
150000
100000
gasdem
250000
(b)PronsticousandoHoltWinters()
1960
1965
1970
1975
Time
[2]
FERDERER,J.P.Oilprice volatilityand
themacroeconomy.JournalofMacroeconomics,
18,126,1996
[3]
YU, L. WANG, S. LAI, K. K. 2008.
Forecasting crude oil price with an EMDbased
neural network ensemble learning paradigm.
EnergyEconomics,30, 5,pp.26232635.
[4]
LIZARDO, R.A. MOLLICK, A. V.
2010. Oil price fluctuations and U.S. dollar
exchangerates.EnergyEconomics32,2,pp.399
408.
[5]
CONEJO, A.J. CONTREAS, J.
ESPNOLA, R. PLAZAS, M.A. 2005.
Forecasting electricity prices for a dayahead
poolbased electric energy market. International
JournalofForecasting 21,3,pp. 435462.
[6]
TAYLOR, J.W. DE MENEZES, L.M.
MCSHARRY, P.E. 2006. A comparison of
univariate methods for forecasting electricity
demand up to a day ahead.International Journal
ofForecasting 22,1, pp. 116.
[7]
VELSQUEZ, J. D. FRANCO, C. J.
GARCA,H.A.2009.Unmodelonolinealpara
la prediccin de la demanda de electricidad en
Colombia,EstudiosGerenciales,25,112,pp.37
54.
[8]
IHAKA,R.,GENTLEMAN,R.1996. R:
A language for data analysis and graphics.
Journal of Computational and Graphical
Statistics5,pp. 299314.
[9]
BECKER, R. CHAMBERS, J. M.
WILKS, A. 1988. The (new) S language: A
296
Velsquezetal
[10] CHAMBERS,J.M.1998.Programming
withdata:AguidetotheSlanguage.NewYork:
SpringerVerlag.
[22] COWPERTWAIT.P.S.P.METCALFE,
A. 2009.Introductory Time Series with R.
SpringerSeriesinStatistics.Springer.