Você está na página 1de 13

17/6/2015

ModelandoelIPSAconRapidMiner.IPSAFinancialTimeSeriesModelingwithRapidMiner|WebMining

PoweringWebIntelligence
EspaolEnglish

BusinessIntelligence&Analytics
DataMining
NoticiasyTendencias
WebMining
WMLabs
WebMining>DataMining>ModelandoelIPSAconRapidMiner

ModelandoelIPSAconRapidMiner
EscritoporWebMiningConsultoresel04deMarzode2011EnlaCategoraDataMining,
WMLabs
Megusta

Twittear

Share

Comosomosaficionadosalabolsa,nosllegellunesrecin
pasado,uninformeburstildeunbanconacional,queno
mencionaremosqueeselChile,dondenosrecomendabacomprar
ciertasaccionesdelRetail.Ayersucediquelasacciones
recomendadasporelbancosufrieronunaimportantebaja
arrastrandoalabolsaaunacadacercanaal1%.Malasnoticias
paralosqueestnanadentro.nimochicos,vamosquese
puedelograrlaliquidez!.
Sihanpodidoseguirlasnoticiasdelabolsalocal,sabrnquedesdeelsingularanunciodel
BancoCentral,endiciembrepasado,labolsahaexperimentadobastanteprdidasygran
volatilidad,yunacadacercanaal7%en2meses.Algunosbuscanresponsables,otros
analizanlasconsecuencias.Mientrastanto,anosotros,simplesmortalesespectadores,se
nosocurrilagenialideadeplantearuntutorialdeModelamientodeSeriesdeTiempocon
tnicasdeDataMining,paralocualutilizaremoslaherramientaRapidMineryanalizaremos
nadamsynadamenosque,tatatataaannn:nuestroqueridoIPSA.

http://www.webmining.cl/2011/03/modelandoelipsaconrapidminer/

1/13

17/6/2015

ModelandoelIPSAconRapidMiner.IPSAFinancialTimeSeriesModelingwithRapidMiner|WebMining

Requerimientos
Antesdepartir,cabedestacarqueparapoderseguirestetutorialesnecesariotenernocionesdel
usodeRapidMiner,queesunaherramientaopensourcedeDataMiningampliamenteusada
enelmundoacadmicoycomercial.Paraaprenderunpocomsrecomendamosseguirlos
tutoriales(yalgunosvideotutoriales)disponiblesenelsitiowebdeRapidI(laempresaque
desarrolllaherramienta)ypracticarelusogeneraldelosoperadores,talescomoReadCSV,
SetRoleyWindowing,entreotros.Aqudejamosunlinkaotrotutorialdondeseexplicael
usodeoperadores.
Partimosentonces.
LoprimeroquenecesitaremosesdescargarRapidMinereinstalarloenelequipo.Seguidode
esto,actualizarlo(nostrosusamoslaversinRapidMiner5.1.3paraestetutorial)ydescargarla
extensinSeriesProcessing(nosotrosusamoslaversin5.1.1)paramodelamientodeSeriesde
Tiempo.Parahaceresto,debesiralmenHelp>UpdateRapidMinerydescargareinstalarlos
componentes,comomuestralasiguientefigura:

ActualizarRapidMinereinstalarcomponentes....
Unavezinstaladalaherramienta,necesitaremosdescargarlosdatos.Paraello,utilizaremosuna
muestradedatosdelIPSA,quepodemosdescargardesdeestelink,outilizarlamuestraque
construimosnosotrosapartirdelamisma.Lamuestraqueconstruimoscorrespondealaseriede
tiempodiariadelndiceIPSAdesdeel03011994al23022011,enlaquetenemosde
encabezadolaFecha,elpreciodeApertura,deCierre,elMximodeldayelMnimo.Esta
muestrapuedeserdescargadadesdeaqu(enformatoCSV)ylucecomosemuestra:
http://www.webmining.cl/2011/03/modelandoelipsaconrapidminer/

2/13

17/6/2015

ModelandoelIPSAconRapidMiner.IPSAFinancialTimeSeriesModelingwithRapidMiner|WebMining

MuestradelIPSA
Hemosborradointencionalmentelosvaloresmayoresal23022011parapoderutilizarlospara
validarnuestraprediccin.Estosdatospuedendescargarsedesdeestelink.
Resumiendo,hacemoselsiguientechecklist:
1. DescargareinstalarRapidMinerconlaextensinSeriesProcessingOK
2. DescargarmuestradeentrenamientodelIPSAdesdeel03011994al23022011OK
3. DescargarmuestradevalidacindelIPSAcondatosmayoresal23022011OK
Todobien?.Okey,ahoraestamostotalmentearmados.Comenzaremosunnuevoproyectode
RapidMiner

ModelandoelIPSAconRapidMiner
Parapartir,iniciaremosinsertandoeloperadorReadCSVquenospermitirleerelarchivodela
muestradeentrenamientodelIPSAquedescargamosanteriormente.Fijamosalgunosdelos
losparmetros:rutadelarchivo,encabezados,formatodefecha(ddmmyyyy),entreotros.Esto
sepuedehacerfcilmenteconunwizarddeimportacinquetieneesteoperador.
LuegoagregamoseloperadorSetRoleydefinimoselcampoFechacomoid.Estonospermitir
definirelordenamientodelaserie.Luego,utilizaremoseloperadorWindowing(ubicadobajo
Series,Windowing)paraconstruirunmodelomultivariado(conlasvariablesdelpreciode
Apertura,Cierre,MaximoyMinimo)codificadocomounaseriedetiempo,dondewindowsize
definelaventanadetiempocondatos(decadavariable)paraexplicarlavariabledefinidacomo
label(enestecaso,elpreciodecierre).Usamosentonceswindowsizeiguala1,queindicaque
tendremos1ejemplo(1datodecadavariable)quedefineelvalordelpreciodecierre(label)del
prximoda.
http://www.webmining.cl/2011/03/modelandoelipsaconrapidminer/

3/13

17/6/2015

ModelandoelIPSAconRapidMiner.IPSAFinancialTimeSeriesModelingwithRapidMiner|WebMining

ModelandoelIPSAconRapidMiner
LuegoutilizaremoseloperadorSlidingWindowValidation(ubicadobajoSeries,Evaluation,
Validation)yconstruiremosunmodeloutilizandolatcnicadeSupportVectorMachines
(ubicadobajoModelling).EntestingutilizamoseloperadorApplyModel(ubicadobajoModel
Application)yeloperadorForecastingPerformance(ubicadobajoSeries,Evaluation,
Performance)paraevaluarnuestromodelo.
Trainning&Testing
OK,ledamosaRunaRapidMineryluegodeunratoobtenemosnuestromodelo.
Enelresultado,vemoslapestaaExampleSet(Windowing)yPerformanceVector(Performance).
Laprimeranosmuestralosdatosresultantesdelentrenamientoyelvalordelaprediccindel
preciodecierre(label).PodemosverestosdatosenDataViewograficarlosusandoPlotView,
comomuestralasiguentefigura.Aqupodemosverelvalorrealdelpreciodecierre(Cierre0)de
colorrojoylaprediccin(label)encolorazul.
Plotview
Unavistadeacercamientoparalosltimosdas,lucecomolasiguientefigura.Elvalorrealdel
preciodecierre(Cierre0)decolorrojoylaprediccin(label)encolorazul.
http://www.webmining.cl/2011/03/modelandoelipsaconrapidminer/

4/13

17/6/2015

ModelandoelIPSAconRapidMiner.IPSAFinancialTimeSeriesModelingwithRapidMiner|WebMining

Plotviewzoom
SivamosalaotrapestaaPerformanceVector(Performance),podemosverlacalidaddenuestro
modeloynosdamoscuentaqueenesteejemploobtuvimosunpredictiontrendaccuracyde
0.472,locualnoesmuybuenmodelo.Aquesdondechocamosconladurarealidad:la
http://www.webmining.cl/2011/03/modelandoelipsaconrapidminer/

5/13

17/6/2015

ModelandoelIPSAconRapidMiner.IPSAFinancialTimeSeriesModelingwithRapidMiner|WebMining

prediccindeseriesdetiempoesrealmenteuntrabajoduro!.Podemossubirelvalorde
laprecisintratandodeagregarotrosindicadoresalmodelootomarunhorizontedetiempoms
cortoparamejorarlaprediccin,porejemplo3aos(enesteejemplousamosdesdeelao94a
lafecha)paraobtenerunvalordeprecisinmayor,digamoscomomnimo0.6.Paraefectos
educativosseguiremosconnuestroejemploutilizandoelvalorobtenido.

http://www.webmining.cl/2011/03/modelandoelipsaconrapidminer/

6/13

17/6/2015

ModelandoelIPSAconRapidMiner.IPSAFinancialTimeSeriesModelingwithRapidMiner|WebMining

PredictionTrendAccuracy
Muybien,asumiendoquenuestraprediccinnoesmuybuena,haremoslaprediccindelvalor
delpreciodecierredelIPSAparalosprximos5dasaplicandoelmodeloanteriormente
obtenido.Paraello,copiamoslosoperadoresReadCSV,SetRole,Windowingyagregamosun
nuevooperadorApplyModel.EneloperadorReadCSV(2),comomuestralafigura,utilizamosla
muestradevalidacinquedescargamosanteriormente.Porsuparte,ymuyimportante,enel
operadorWindowing(2),notenemosquecrearlavariablelabel(createlabeloff)ydejamosel
horizonteen0(horizon=0).Loanterioresporqueharemosaplicaremoselmodeloparacrearla
prediccin.
Finalmente,laconfiguracindenuestroproyectoenRapidMinerquedaras:
Aplicandoelmodelo
DamosaRunyobtenemoselsiguienteresultado:
Resultadosdelaprediccin
QuetambinpuedeverseenelsiguientePlotview:
Resultadosdelaprediccin(Plotview)
Enlasiguientetablapodemosvereldetalledelresultado(laprediccinyelvalorrealdelprecio
http://www.webmining.cl/2011/03/modelandoelipsaconrapidminer/

7/13

17/6/2015

ModelandoelIPSAconRapidMiner.IPSAFinancialTimeSeriesModelingwithRapidMiner|WebMining

de

cierre).
Resultadosdelaprediccin
Puesbien,ahoraesmomentodedecirquenoesmuybuenopredecirpreciosenseriesde
tiempofinancierasporqueescasiimposibleobtenerunnmeroexacto.Afortunadamentelo
http://www.webmining.cl/2011/03/modelandoelipsaconrapidminer/

8/13

17/6/2015

ModelandoelIPSAconRapidMiner.IPSAFinancialTimeSeriesModelingwithRapidMiner|WebMining

ques

podemoshacer
esdeterminar
ladireccin
delprecio.Por
ejemplo,como
semuestraen
latablaanterior,
elmodelo
predicequeparael25022011elpreciodecierreaumentar(a$4323.672)yqupasenla
realidad:efectivamenteaument(a$4373.900).Delmismomodo,parael28022011elmodelo
predicequeelprecionuevamenteaumentar(a$4391.609)yqupasenlarealidad:
efectivamenteaument(a$4444.570).Noobstante,notodoesbueno,paraeldasiguiente(01
032011)elmodelopredicequeelpreciosube(a$4408.429)peroenlarealidadbaja(a
$4400.670)conrespectoaldaanterior.
Podemosverentoncesque,enlasumadeaciertosyerroresalpredecirladireccindelpreciode
cierre,podemosobtenerunaprecisinbastantebuena,peronoasobtenerunvalordelpreciode
cierrepreciso.Probablementeestoesloquefrustraamuchagenteyanosotroscuantoutiliza
redesneuronales(osupportvectormachines)paraencontrarlafrmulamgicaparapredecirla
bolsa.Entonces,heaquunsecreto:estopuedesermuytilparahacerunanlisisdevolatilidad,
http://www.webmining.cl/2011/03/modelandoelipsaconrapidminer/

9/13

17/6/2015

ModelandoelIPSAconRapidMiner.IPSAFinancialTimeSeriesModelingwithRapidMiner|WebMining

esdecir,predecirladireccindelpreciodecierreylograrporejemplounaaltaprecisin,digamos
sobre60%,endeterminarladireccindelospreciosdecierrehistricos.Peroestetemaser
paraunprximotutorial
Bueno,esoestodoporestavez.Ojalesteartculohayasidodeutilidadparaustedes.Desdeya
quedaninvitadosapostearsuscomentariosmsabajo.Recuerdenquesuscomentariosnos
motivanaseguirescribiendomsartculos.Recibanuncordialsaludoynosleemosla
prxima!.Ah!,senosolvidaba,lesdejamosenellinkdemsabajo,elproyectoenRapidMiner
paraquedescarguenypractiquen.Ahoras,adis!
Link:ArchivosfuentesparaRapidMiner

Quizstepodrainteresarmirartambinestosartculos:
1. CargandodatosexternosaQlikview
2. GoogleMapsenQlikview

Etiquetas:BI,Bolsa,BusinessIntelligence,Cdigofuente,DataMining,Forecasting,
IPSA,RapidMiner,SeriesdeTiempo,Software,SourceCode,SupportVector
Machines,TimesSeries

11Comentarios
1. javier
25Mayo201122:48pm
Muyinteresantearticulo,esperoquesiganpublicandoarticulosrelacionadosconlabolsay
KDD.
Saludos
Iniciesesinpararesponder
WebMiningConsultores
1Julio201119:10pm
http://www.webmining.cl/2011/03/modelandoelipsaconrapidminer/

10/13

17/6/2015

ModelandoelIPSAconRapidMiner.IPSAFinancialTimeSeriesModelingwithRapidMiner|WebMining

Graciasportucomentario.Chequeamientrastanto
http://www.webmining.cl/2011/06/dashboarddelipsaconqlikview/
Saludos!
Iniciesesinpararesponder
2. luis
2Octubre201111:43am
holaamigosdewebmining,
graciasporpublicarestepostsobreelmanejodeseriesdetiempoconrapidminer,enel
quetengoelsiguienteproblema:
realicetodoslospasoscomofuerondescritos,peroalejecutarelprocesomeapareceel
siguienteerror,relacionadoaloperadorwindowing:
TheoperatorisnotabletoworkontheattributeFecha.
Graciasyesperomepuedanayudar.
Iniciesesinpararesponder
WebMiningConsultores
3Octubre201111:50am
Graciasportucomentarios.
Respectoalproblemaquetienes,debesactualizarlospathalosarchivosIPSA.csve
IPSAtest.csvincludosenlosarchivos(veropcincsvfileenRapidminer).Saludos,
WebMiningConsultoresLimitada
Iniciesesinpararesponder
3. fsotomayor
19Noviembre20113:04am
Hola.
Unaconsulta.Enesteejemplo,hubieseservidodealgohabernormalizadolosatributos
apertura,mximoy/omnimo?
Gracias.
Saludos.
http://www.webmining.cl/2011/03/modelandoelipsaconrapidminer/

11/13

17/6/2015

ModelandoelIPSAconRapidMiner.IPSAFinancialTimeSeriesModelingwithRapidMiner|WebMining

Iniciesesinpararesponder
WebMiningConsultores
19Noviembre201114:50pm
Porququieresnormalizar?.Esunaseriedetiempo
Iniciesesinpararesponder
4. cone_gb
13Marzo201214:25pm
Estimados,
Necesitamosrealizaresteejemploparaunadisertacinenlauniversidadynonosresulta,
necesitamosayuda.Favorcomunicarseparapoderhecharandarlo.
Iniciesesinpararesponder
WebMiningConsultores
13Marzo201216:20pm
Estimado:Sinecesitaayuda,contactenosycontratenuestrosservicios.Saludos,
WebMiningConsultoresLimitada
Iniciesesinpararesponder
5. Anarquia05bw
24Septiembre20125:10am
ExcelentePublicacionnometomomuchotiempoadaptarloalescenarioquetengo..
totalmenteentendiblesiganasimasquerecomendadosnopuedenestar
Iniciesesinpararesponder
WebMiningConsultores
24Septiembre20129:02am
Excelente!.Graciasportucomentario.Saludos,
WebMiningConsultoresLtda.
Iniciesesinpararesponder
6. Anarquia05bw
2Octubre20124:21am
http://www.webmining.cl/2011/03/modelandoelipsaconrapidminer/

12/13

17/6/2015

ModelandoelIPSAconRapidMiner.IPSAFinancialTimeSeriesModelingwithRapidMiner|WebMining

Unaconsultaestimadosunacosaesentrenarelmodeloyotraesprobarloaplicandoel
modelodiseado..seentiende.peroalprobarseingresadatosreales..elarchivotest..
yseverificalaprediccionytendencia..peroacasonosepodriaintentarsaberlaprediccion
paraeldia03022011(segunejemplo?)sinningunaentradadedatos?yeldiseoen
rapidminernomuestralafuncionmatematicaobtenidodedichaserie?esassonalgunas
inquietudesquesequedaron
Iniciesesinpararesponder

Escribeunarespuesta
Debeestarconectadoparaescribiruncomentario.

http://www.webmining.cl/2011/03/modelandoelipsaconrapidminer/

13/13

Você também pode gostar