Escolar Documentos
Profissional Documentos
Cultura Documentos
Dedicatoria
Le dedico esta tesis a mis Padres Ernesto y Rosita, primero
por todos los buenos valores que me inculcaron y me
prepararon para salir adelante en la vida, y segundo por todo
el sacrificio y esfuerzo en darme una educacin y permitirme
seguir mi bsqueda de conocimientos apoyndome
incondicionalmente en los buenos y malos ratos del difcil
camino de un estudiante de postgrado. Sin su apoyo, esta
tesis que es la culminacin de mi larga jornada de estudios no
hubiese sido posible. Ahora iniciare una nueva jornada,
donde tengo la seguridad que les seguir dando
satisfacciones y alegras, gracias por todo su amor.
A mi amor y luz Fabiola, gracias por todo tu amor y apoyo
incondicional, has trado un nuevo sentido a mi vida, gracias
por ser como eres.
A la familia Arias-Thompson, a la ta Ada por apoyarme de
muchas formas durante tantos aos en esta enorme Ciudad
de Mxico, va tambin por el to Santiago (q. e. p. d.) siempre
recuerdo con afecto sus sabrosas platicas de sobremesa.
A mis amigos de siempre: Adrin Arturo, Luis Eduardo,
Carlos, Manuel, Marco, Martn y Vctor, por escucharme
siempre en los buenos y malos ratos de mis estudios de
postgrado, y por todos los buenos momentos que hemos
pasado juntos.
Agradecimientos
Agradezco a mi Asesor el Dr. Jess Figueroa Nazuno por
estos cuatro aos de fructfera colaboracin, el compartir sus
conocimientos conmigo y sobre todo su amistad.
A todos los compaeros del grupo de investigacin presentes
y pasados, de cada uno aprend algo valioso.
A todos los compaeros del grupo con los que colabore y
cuyas contribuciones ayudaron a construir la presente tesis,
muchas gracias!
Agradezco en forma especial a mi amigo y colega Hugo
Jimnez Hernndez por brindarme su amistad y apoyo
incondicional, gracias por todo!
A los miembros de mi comit de tesis por todas sus valiosas
sugerencias y comentarios que enriquecieron la presente
tesis, gracias!
Agradezco al Centro de Investigacin en Computacin del
Instituto Politcnico Nacional, por el apoyo recibido en todos
los aspectos y en especial de parte de todo su personal que
facilitan a los estudiantes el diario trabajo, y por su esfuerzo
en la formacin de nuevos investigadores en computacin
que nuestra querida patria tanto necesita.
Finalmente, le agradezco al Instituto Politcnico Nacional el
apoyo recibido para la realizacin de mis estudios, tanto en lo
acadmico como en lo econmico mediante la Beca
Institucional del IPN.
Resumen
En este trabajo se presenta un estudio experimental sobre la
predictibilidad de series de tiempo. Se caracterizan series de tiempo
de orgenes diversos y se evalan con una metodologa estndar
diferentes modelos de prediccin y tambin de modelado. Se
construyen mtricas para medir la predictibilidad de series de tiempo y
la capacidad de los modelos para la prediccin o el modelado. Se
investiga la relacin de la predictibilidad con respecto al
comportamiento dinmico de las series de tiempo, su relacin con las
estructuras que dicho comportamiento genera en las series de tiempo
y la relacin de los parmetros dinmicos con los que se calcula la
predictibilidad, con los modelos para prediccin o modelado. Los
resultados muestran que hay una relacin no lineal entre la
predictibilidad y el comportamiento dinmico de las series de tiempo; y
que existe una relacin entre la estructura de las series de tiempo y su
predictibilidad, expresada por medio de patrones de estructura
bsicos. En cuanto a los modelos, no se encontraron patrones
comunes de respuesta con respecto a los diferentes parmetros que
caracterizan la dinmica de las series. Finalmente, explotando las
diferencias entre los modelos para predecir a las series de tiempo, se
desarrollaron y evaluaron con xito dos nuevas tcnicas para la
combinacin de modelos de prediccin: GABoost y CombFEC, que
permiten la mejora de los resultados de la prediccin de series de
tiempo.
Abstract
In this work a experimental study about the time series predictability is
presented. Time Series from different origins are characterized, and
different models for forecasting and modeling are evaluated with a
standard methodology. Metrics for the measurement of time series
predictability, and for the measurement of model capability for
forecasting and modeling are constructed. An investigation is done
about the relationship between the predictability and the dynamical
behavior of time series, the relationship between the structures
generated by this behavior and the predictability, and the relationship
between the dynamical parameters used to calculate the predictability
and the models used in forecasting or modeling. The results show that
there is a non linear relationship between the predictability and the
dynamical behavior of the time series, and there is a relationship
between the structure of time series and its predictability, expressed
through basic structural patterns. About the models, no common
patterns of response related with the different parameters that
characterize a time series were found. Finally, exploiting the
differences between the models for time series forecasting, two new
techniques for model combination: GABoost and CombFEC, were
developed and evaluated successfully, these techniques allows the
improvement of the time series forecasting results.
Contenido
I
Conceptos Fundamentales
1 Introduccin
1.1
Motivacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2
Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3
1.4
1.5
Desarrollo de la Tesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
18
Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Series de Tiempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.4
2.5
El Modelo de Prediccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.6
2.7
2.8
29
3.1
Antecedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.2
3.3
Discusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
38
4.1
Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.2
Estadsticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.3
4.2.1
4.2.2
Anlisis de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.3.1
4.4
4.5
4.6
Exponentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.5.2
Dimensiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.5.3
Teora de la Informacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.6.1
4.7
Frecuencia Dominante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
Entropas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
Teora de la Computacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.7.1
Complejidad Relativa LZ . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.7.2
61
5.1
Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
5.2
Tcnicas de Prediccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
5.3
5.2.1
Tcnicas Estadsticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
5.2.2
5.2.3
Tcnicas de Modelado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.3.1
Tcnicas Estadsticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.3.2
5.3.3
II
81
6.1
Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
6.2
SOM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
6.2.2
GHSOM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
6.3
6.4
94
95
7.1
Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
7.2
7.3
7.4
7.5
Discusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
8.2
8.3
8.4
8.3.1
8.3.2
Discusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
149
9.1
Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
9.2
9.2.2
9.3
9.2.3
9.2.4
9.3.2
9.3.3
9.4
9.5
Discusin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182
183
III
Combinacin de Predictores
223
IV
Conclusiones
269
270
276
Parte I
Conceptos Fundamentales
Captulo 1
Introduccin
1.1
Motivacin
Desde los tiempos de Isaac Newton cuando logro formalizar matemticamente el conocimiento
emprico producto de las observaciones experimentales de fenmenos astronmicos, algunas de
ellas sintetizadas en las leyes postuladas por Johannes Kepler, y construir su obra cumbre
Philosophiae Naturalis Principia Mathematica, la prediccin de la dinmica de los sistemas
basndose en la construccin de modelos matemticos, ha sido el camino a seguir en la bsqueda
de entender a los sistemas de la ms diversa naturaleza. Sin embargo, desde el inicio de este
triunfo del ingenio humano se encontraron dificultades tales como la imposibilidad de resolver
el problema de tres cuerpos en interaccin en forma analtica, es decir, se tenia la expresin
matemtica pero no la posibilidad de resolverla en forma exacta, a lo largo de la historia al tratar
de estudiar sistemas cada vez de mayor complejidad, nuevas limitantes han surgido a los mtodos
tradicionales para construir y modelar los sistemas, y nuestra capacidad de predecir la dinmica
de ellos se ha visto limitada, lo que ha motivado el surgimiento de mtodos no tradicionales
para modelar y predecir la dinmica de un sistema, como son los modelos algortmicos los cuales
permiten el anlisis de la dinmica a partir de datos experimentales del sistema, sin necesidad
de construir y resolver un modelo matemtico sobre dicho sistema [1, 2].
El modelado y prediccin de la dinmica de un sistema (de origen natural o artificial) se
encuentra limitado en muchos casos por la dificultad experimental para obtener informacin de
la totalidad de los grados de libertad (variables independientes) que describen dicha dinmica,
9
10
entender mejor las limitaciones de las tcnicas evaluadas. An cuando hay diversos trabajos
de investigacin y reportes de competencias, donde se presenta la comparacin de diferentes
modelos de prediccin [14, 24, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42], en
dichos trabajos se encuentra que presentan una o ms de las siguientes limitaciones:
Uso de un grupo pequeo de series de tiempo para evaluar los modelos o incluso de una
sola serie de tiempo.
Uso de diferentes mtricas de error de prediccin.
Muchas de las series usadas son especficas de un sistema en particular, por ejemplo de
tipo econmico o financiero.
Comparacin de modelos del mismo origen.
Se busca evaluar nicamente el rendimiento (i.e. el error de prediccin) de los modelos,
pero no su capacidad de prediccin.
No se considera la existencia de relaciones entre las caractersticas de las series de tiempo
y el tipo de modelo de prediccin.
Todo lo anterior, indica la falta de metodologas estndares para la evaluacin y comparacin
de las tcnicas de prediccin y modelado.
An cuando se han desarrollado diferentes tcnicas de prediccin, se conoce muy poco sobre
las relaciones entre los modelos de prediccin de series de tiempo y las caractersticas de las
series, lo anterior es consecuencia del avance del conocimiento sobre prediccin de series de
tiempo en extensin pero no en profundidad.
Al intentar predecir el comportamiento de una variable del sistema con datos conocidos sobre
su dinmica (Serie de Tiempo) se tiene la limitante de la confiabilidad de la prediccin, es decir
hasta que rango de tiempo (Horizonte de Prediccin) el error de la prediccin es aceptable para
el tipo de informacin que se est prediciendo. El error en la prediccin o en el modelado,
no puede ser ignorado, y tampoco es posible eliminarlo del todo, pero si es posible tratar de
minimizar su efecto en los resultados de la prediccin. Una de las estrategias ms exitosas
para mejorar el resultado de una prediccin es la combinacin de predictores, en la literatura
11
existen numerosos trabajos sobre este tema [29, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54], la
estrategia de combinacin consiste en la optimizacin de la relacin entre el bias y la varianza
del conjunto de datos predichos [11]. A pesar de los muchos trabajos sobre combinacin de
modelos de prediccin, es importante continuar con el desarrollo de nuevas tcnicas, ya que
ningn predictor individual o combinado es capaz de predecir toda la variedad de series de
tiempo, es decir no hay modelos de prediccin universales [55, 56]. Al explotar por medio de la
combinacin de los predictores, las diferentes capacidades de los modelos, es posible extender
el horizonte de prediccin para las series de tiempo al mejorar la prediccin resultante.
En la Figura 1-1, se presentan en forma esquemtica los problemas mencionados en esta
seccin y que son motivo de estudio de esta tesis doctoral.
1.2
Objetivos
Los motivos enunciados en la seccin anterior, son la base para el desarrollo de los objetivos
con los cuales esta tesis doctoral se propone contribuir al estudio del problema de prediccin
de series de tiempo en dos temas bsicos: la predictibilidad de las series de tiempo y la
mejora de la prediccin basndose en la combinacin de modelos de prediccin. A
continuacin se enuncian los objetivos de este trabajo:
Medir la predictibilidad de las series de tiempo construyendo mtricas basadas en un
conjunto de parmetros dinmicos de las series.
Desarrollo de una metodologa experimental para la evaluacin y comparacin de la capacidad de prediccin (o de modelado) de diferentes tcnicas.
Los dos objetivos anteriores son la base para el desarrollo de un estudio experimental
sobre la predictibilidad de series de tiempo.
Desarrollo de nuevos mtodos para mejorar la prediccin de una serie de tiempo, por medio
de la combinacin de predictores, haciendo uso de analogas de tcnicas de aprendizaje
de mquina (Machine Learning) tales como: Bagging y Boosting, adems de las basadas
en fundamentos estadsticos bsicos.
12
SERIES DE TIEMPO:
Sistemas Naturales (Series de
Tiempo de Observaciones
Experimentales)
Sistemas Artificiales (Series de
Tiempo de Observaciones
Experimentales)
Modelos Computacionales y
Matemticos (Series Generadas
Numricamente)
Prediccin y
Modelado de Series
de Tiempo:
Problema de
Reduccin del Error
de la Prediccin
Combinacin de
Modelos de
Prediccin
Anlisis de Series de
Tiempo:
Problema de Medir la
Predictibilidad
de las Series
13
1.3
Las contribuciones originales al estudio de la prediccin de series de tiempo son las siguientes:
Estudio en forma global de un conjunto de series de tiempo de diferentes orgenes.
Identificacin de los parmetros ms significativos para la caracterizacin de la predictibi
lidad de series de tiempo.
Desarrollo de una (s) mtrica (s) de predictibilidad en base no a una sola caracterstica (de
origen computacional, de teora de sistemas dinmicos no lineales, etc.) sino considerando
a todo un conjunto de parmetros de las series de tiempo.
Estudios comparativos para tcnicas de modelado y para tcnicas de prediccin basados
en modelos y teoras diferentes por medio de una metodologa experimental estandarizada.
Desarrollo de mtricas de capacidad de prediccin y modelado.
Identificacin de la forma en que se agrupan las series de tiempo con relacin a los parme
tros con los que se determina su predictibilidad.
Estudio de las relaciones entre la estructura de las series de tiempo y su predictibilidad.
Estudio de las relaciones entre la dinmica de las series de tiempo y su predictibilidad.
Estudio de las relaciones entre los parmetros de las series de tiempo y los modelos.
Desarrollo de tcnicas para mejorar la prediccin en series de tiempo, utilizando ideas de
Machine Learning (Boosting), Estadstica y Algoritmo Gentico; para la combinacin de
predictores no lineales basados en Redes Neuronales y Teora de Sistemas Dinmicos No
Lineales.
1.4
Se presenta a continuacin una serie de puntos que no se estudian en la presente tesis doctoral,
y que permiten acotar los temas de estudio de la misma:
14
1.5
Desarrollo de la Tesis
En la Figura 1-2, se presenta el diagrama del contenido de la tesis y como se relacionan los
diferentes captulos, los cuales pertenecen a alguna de las cuatro partes temticas en que se
divide la presente tesis. El captulo 2, presenta el marco conceptual a partir del cul se desarrolla
este trabajo. El captulo 3, presenta una revisin del estado del arte sobre la predictibilidad
de series de tiempo. El captulo 4, se describen las tcnicas de anlisis de series de tiempo
empleadas en este trabajo. El captulo 5, describe las tcnicas de prediccin y modelado que
fueron evaluadas. El captulo 6, describe las tcnicas de anlisis de datos usadas en el estudio
de los resultados experimentales. Los captulos 7 y 8 presentan respectivamente, los resultados
experimentales de caracterizar las series de tiempo y de evaluar las tcnicas de prediccin y
modelado. El captulo 9, presenta el desarrollo y evaluacin de las mtricas de predictibilidad
y capacidad de prediccin y modelado. El captulo 10, presenta los resultados del estudio de
las relaciones de la predictibilidad de series de tiempo. El captulo 11, presenta el desarrollo
y evaluacin de dos tcnicas para la combinacin de predictores. Finalmente el captulo 12,
15
presenta las conclusiones de esta tesis y posibles lneas de trabajo futuro. Adicionalmente,
se tiene el captulo 13 que presenta los siguientes apndices: "trabajos derivados de la tesis
(artculos, ponencias, posters, seminarios)", "gua sobre las metodologas experimentales para
la caracterizacin de las series de tiempo y de las tcnicas de prediccin y modelado", "anlisis
de gramticas (pendiente de la curva como una medida de predictibilidad)", "visualizando los
parmetros dinmicos de las series de tiempo", "sobre la no universalidad de los modelos de
prediccin" y "comentario sobre los teoremas no free lunch".
16
Tesis Doctoral:
Medicin de la Predictibilidad de Series de Tiempo: Un Estudio Experimental
Resumen
Captulo 1 Introduccin
Motivacin
Objetivos
Contribucin Original de la Tesis
Que no se Estudia en este Trabajo (Acotacin de la
Tesis Doctoral)
Desarrollo de la Tesis
Captulo 2 Marco
Conceptual de la
Prediccin de Series
de Tiempo
Introduccin
Sistemas de Origen
Natural y Artificial
Series de Tiempo
El Problema de
Prediccin de Series
de Tiempo
El Modelo de
Prediccin
Limitaciones de los
Modelos y del Proceso
de Prediccin
Predictibilidad de
Series de Tiempo
Patrones de
Predictibilidad en
Series de Tiempo
Captulo 9 Mtricas de la
Predictibilidad de Series
de Tiempo y Coeficientes
de Capacidad para
Prediccin y Modelado
Introduccin
Mtricas de la
Predictibilidad de Series de
Tiempo
Comparacin de las
Mtricas de Predictibilidad
Coeficientes de Capacidad
de Prediccin y de
Modelado
Discusin
Captulo 3 La
Predictibilidad de Series
de Tiempo: Estado del
Arte
Antecedentes
Estado del Arte
Discusin
Captulo 7 Clculo de
Parmetros de las Series
de Tiempo
Introduccin
Descripcin del Conjunto
Experimental de Series de
Tiempo
Parmetros de las Series
de Tiempo
Datos Experimentales
Discusin
Captulo 12 Conclusiones
y Lneas de Trabajo
Futuro
Conclusiones
Lneas de Trabajo Futuro
Captulo 11 Combinacin
de Predictores :
Mejorando la Prediccin
de las Series de Tiempo
Introduccin
Tcnicas Clsicas de
Combinacin de
Predictores
GABoost: Busqueda de
Pesos con Algoritmo
Gentico Cannico para
Minimizacin del Error de
Prediccin RMSE
CombFEC: Combinacin
de Predictores con una
Funcin de Pesos de Error
y Correlacin
Discusin
Captulo 6 Tcnicas
para el Anlisis de
Conjuntos de Datos
Multivariados
Introduccin
Mapas Auto
Organizados (SOM y
GHSOM)
Anlisis con
Escalamiento
Multidimensional
(MDS)
Anlisis de
Correlacin Bivariada
Captulo 8 Evaluacin de
Tcnicas de Prediccin y
de Modelado de Series de
Tiempo
Introduccin
Mtodo Experimental
Resultados Experimentales
Discusin
Captulo 10 Relaciones de la
Predictibilidad de Series de Tiempo
Introduccin
Agrupamiento de Series de Tiempo en
base a Parmetros de Predictibilidad
Relacin Predictibilidad-Estructura de
Series de Tiempo
Relacin entre las Caractersticas de los
Modelos con su Capacidad de
Prediccin o de Modelado
Relacin Parmetros de PredictibilidadModelos de Prediccin y Modelado
Discusin
Captulo 13 Apndices
Trabajos Derivados de la Tesis (Artculos,
Ponencias, Posters, Seminarios)
Gua sobre las Metodologas Experimentales
para la Caracterizacin de las Series de
Tiempo y de las Tcnicas de Prediccin y
Modelado
Anlisis de Gramticas (Pendiente de la Curva
como una Medida de Predictibilidad)
Visualizando los Parmetros Dinmicos de las
Series de Tiempo
Sobre la No Universalidad de los Modelos de
Prediccin
Comentario sobre los Teoremas No Free Lunch
Captulo 5 Tcnicas de
Prediccin y de Modelado
de Series de Tiempo
Introduccin
Tcnicas de Prediccin
Tcnicas de Modelado
Captulo 2
Introduccin
La dinmica de un sistema (de origen natural o artificial) puede estudiarse con series de tiempo,
una serie de tiempo es un conjunto de datos obtenidos a partir de una observacin experimental
del sistema, o mediante el clculo numrico de las ecuaciones de movimiento (en el caso particular que sea posible calcular su solucin). Las series de tiempo contienen informacin sobre
las variables independientes de un sistema (grados de libertad) que determinan su dinmica,
la extraccin de esta informacin es un problema que se estudia mediante el anlisis (caracterizacin), prediccin y modelado de las series de tiempo. La caracterizacin de las series de
tiempo tiene como objetivo la extraccin de la mayor cantidad de informacin sobre el comportamiento de la serie es decir, sobre la dinmica del sistema representado, y as identificar
o construir la mejor o mejores tcnicas que puedan predecir o en su caso modelar la dinmica
del sistema expresada por la serie de tiempo. Las tcnicas de prediccin y modelado buscan
extraer la mayor cantidad de informacin (proceso de aprendizaje) sobre la dinmica de la serie
de tiempo, para construir modelos que reproduzcan (modelado) o extrapolen (prediccin) el
comportamiento de la serie.
En este trabajo doctoral se busca generar conocimiento sobre el problema de prediccin
de series de tiempo, no con la construccin de tcnicas, algoritmos o mtodos particulares
18
Tcnicas de Anlisis de
Series de Tiempo
Experimentos
Computacionales
Series de
Tiempo
Mtricas
Estudio de la Predictibilidad
de Series de Tiempo
Estructura de
Series de Tiempo
Dinmica de
Series de Tiempo
Modelos de
Series de Tiempo
Comportamiento de la
Predictibilidad
Combinacin de Modelos
19
2.2
En la naturaleza existen sistemas que llamamos de origen natural tales como los de tipo biolgico
por ejemplo: sistemas de un organismo multicelular (sistema nervioso, sistema celular, sistema
inmunolgico), sistemas de tipo bioqumico (el metabolismo), sistemas de tipo ecolgico (ecosistemas, cadenas alimenticias). Otros sistemas de origen natural son de tipo fsico: dinmica
atmosfrica, dinmica de los ocanos, etc. Por otro lado, existen sistemas de origen artificial
es decir creados por el hombre por ejemplo: sistemas de tipo socioeconmico (la guerra, el
comercio, la economa de un pas), sistemas de tipo cultural (Internet) [57]. Los sistemas anteriores son estudiados de forma experimental, los experimentos sobre estos sistemas generan gran
cantidad de informacin expresada como secuencias de datos que llamaremos series de tiempo
(las cuales se definen formalmente ms adelante), a las series de tiempo generadas mediante
mediciones experimentales las clasificamos como series naturales.
Otra forma de generar series de tiempo, es a partir del estudio de la dinmica de sistemas
generados a partir de experimentos computacionales como por ejemplo autmatas celulares [58],
o partculas bajo la influencia de un potencial [14]. Tambin es posible obtener series de tiempo
a partir de la solucin numrica de expresiones matemticas de modelos fsicos (como en el
caso del sistema de ecuaciones diferenciales de Lorenz) [59] o de construcciones matemticas
abstractas como el Problema de Collatz en Teora de Nmeros [60, 61]. A las series de tiempo
cuyo origen son sistemas artificiales generados con simulaciones por computadora o sobre la base
de la solucin de expresiones matemticas las clasificamos como series de tiempo sintticas.
La Tabla 2.1 presenta ejemplos de sistemas que generan series de tiempo naturales y sintticas.
20
(2.1)
Origen del Sistema
Tipo de Sistema
Sistema
Natural
Biolgico
Nervioso
Natural
Biolgico
Inmunolgico
Natural
Biolgico
Metabolismo
Natural
Fsico
El clima
Natural
Fsico
El Oceano
Natural
Qumico
Reacciones Qumicas
Artificial
Cultural
Internet
Artificial
Social
La guerra
Artificial
Social
El comercio
Artificial
Matemtico
Mapas Discretos
Artificial
Computacional
Automatas Celulares
En esta tesis doctoral se estudia a las Series de Tiempo, las cuales representan el comportamiento dinmico (en general en el tiempo) de variables experimentales de sistemas de origen
natural o artificial.
2.3
Series de Tiempo
dicha trayectoria tiene una correspondencia biunvoca con la trayectoria original de la dinmica
del sistema en el espacio Rm de m dimensiones [62]. Posteriormente Takens (1980), propuso
y demostr un teorema para la reconstruccin de la trayectoria del atractor en el espacio
fase a partir del embebido de la serie de tiempo [63]. La Figura 2-2 ilustra el proceso de la
reconstruccin de la trayectoria de un atractor, la cual representa la dinmica de un sistema, a
partir de una serie de tiempo. En dicha figura, se ilustra como a la trayectoria original de la
dinmica del sistema en el espacio Rm y que es representada por el funcional F , le corresponde
la serie de tiempo en el espacio R2 (considerando en forma explicita a la variable tiempo t)
donde ahora la dinmica del sistema se representa por una aproximacin al funcional original
denominado F 0 , dado que por el teorema debido a Whitney, se sabe que existe la funcin
invertible que permite la conexin entre la trayectoria original y la reconstruida a partir de
la serie de tiempo, entonces es posible reconstruir, aplicando la idea del embebido a la serie
original (teorema de Takens), la trayectoria original del sistema en un espacio de dimensin Rp
y de esta forma recuperar la informacin sobre la dinmica del sistema que se encuentra oculta
dentro de la serie de tiempo.
A partir de las ideas anteriores se construye la siguiente definicin formal para las series de
tiempo:
Definicin 1 Sea ST = {x(1), x(2), x(3), x(4), ...., x(t), ...., x(N )} una secuencia de datos experimentales para un intervalo de tiempo T = N, de una variable u observable x(t) de un
sistema de origen natural o artificial S, al conjunto ST se le denomina Serie de Tiempo.
En la presente tesis doctoral, se considera el estudio de un conjunto de series de tiempo {STi }
cuyos orgenes son observables de diferentes sistemas (naturales y artificiales), para estudiar
dicho conjunto se hace abstraccin de sus sistemas de origen, en el sentido de que no son
los sistemas que las originaron lo que se estudia en esta tesis, sino las series de tiempo como
estructuras de informacin. Dichas estructuras, poseen un conjunto de caractersticas comunes
cuantificables (parmetros) que permiten su estudio y comparacin.
22
23
2.4
Al estudiar un sistema se busca modelar la dinmica del mismo y como fin ltimo realizar
predicciones sobre dicha dinmica, para lograr lo anterior se desarrollan experimentos con los
que se obtiene informacin sobre el comportamiento de algunas de las variables del sistema y con
dicha informacin se trata de inferir las relaciones causales entre dichas variables que permitan
desarrollar un modelo aproximado del sistema. Si dicho modelo es soluble analtica o numricamente entonces es posible modelar al sistema y proponer predicciones sobre su dinmica. Sin
embargo, las limitaciones experimentales para obtener la informacin sobre las variables de un
sistema y / o las limitaciones de las matemticas para resolver los modelos que se proponen, no
permiten tener la suficiente informacin para desarrollar modelos solubles de la dinmica del
sistema en todos los casos. En el caso de que se tenga la observacin experimental de una o ms
variables del sistema, pero no exista un modelo soluble del sistema, es posible construir otro
tipo de modelo el cual reproduzca el comportamiento del observable u observables (representado
por una o varias series de tiempo) de tal forma que se pueda realizar una prediccin sobre la
dinmica observada. Es importante aclarar que estos modelos no tienen una relacin directa
con la dinmica del sistema de donde se obtuvo experimentalmente la serie de tiempo, de hecho
el relacionar el modelo de comportamiento de una serie de tiempo con la dinmica del sistema
es un problema abierto [3]. A continuacin se presenta la definicin formal del problema de
prediccin de series de tiempo.
Definicin 2 Sea F (x1 (t) , x2 (t) , ...xk (t)) el funcional que describe en forma completa la
dinmica del sistema S, dicho funcional no es conocido en forma explicita.
Definicin 3 Sea F 0 una aproximacin al funcional F , que modela la dinmica del sistema
S pero cuya forma analtica o no es conocida en forma completa o no es soluble en forma
numrica.
Definicin 4 Dado un sistema S para el cual se tiene una aproximacin F 0 al funcional F ,
cuya forma analtica no se conoce en forma completa o no es soluble numricamente, pero se
tiene una serie de tiempo ST para un intervalo de tiempo T , sobre la variable x(t) del sistema
S, entonces es posible construir un modelo P que permita predecir el comportamiento de dicha
variable para un tiempo t > T .
24
2.5
El Modelo de Prediccin
La construccin del modelo de prediccin es la parte central del estudio de series de tiempo,
la mayora de los modelos de prediccin se basan en la Auto Regresin propuesta por Yule en
1927 [15], representada por la siguiente ecuacin,
yb(k) =
p
X
i=1
ai y(k i) e(k)
(2.2)
donde yb(k) es la prediccin del valor que corresponde al tiempo k, a partir de la combinacin
lineal de los p valores anteriores de la forma y(k i), mas un termino de error e(k); con
modificaciones este modelo ha sido base de tcnicas de prediccin desarrolladas en Estadstica
[11, 12], Teora de Sistemas Dinmicos No Lineales [3, 13, 14] y Redes Neuronales [15, 16, 17, 18];
en menor cantidad se han desarrollado otros mtodos para resolver el problema de prediccin
por ejemplo con Estadstica Bayesiana [64].
En la literatura se habla de la construccin de modelos, mtodos, algoritmos o tcnicas de
prediccin, y muchas veces no se separa con claridad a las tcnicas que estrictamente modelan
una serie de tiempo (interpolacin de puntos de la serie) y a las tcnicas que adems de modelar
la serie la predicen (extrapolacin de puntos), en esta tesis doctoral, se hace una clara diferencia
entre las tcnicas que modelan y aquellas que predicen, ya que el verdadero reto es predecir el
comportamiento de la serie de tiempo considerando que se posee informacin incompleta sobre
el sistema, y existen limitaciones inherentes a los modelos y al proceso de prediccin mismo
(ver siguiente seccin).
2.6
25
en la dificultad para ser predichas por las tcnicas o mtodos de prediccin (predictibilidad
de la serie), algunas series de tiempo poseen cierto grado de caos, el cual introduce un error
que crece en forma exponencial, por otra parte si poseen aleatoriedad la suposicin de ciertas
tcnicas basadas en auto regresin de que hay memoria entre los datos, no es valida, este tipo
de error lo definimos como un error debido a las caractersticas de las series, es un error de tipo
sistemtico sobre el cual no se tiene control [65], a este error se le define como Error Intrnseco
en el presente trabajo.
Por ltimo el error experimental (en el caso de series de tiempo derivadas de observaciones
experimentales), introduce un error en forma de ruido [3, 66, 67], que se define en este trabajo
como Error de Medicin.
Este conjunto de limitaciones, introduce un Error de la Prediccin definido como:
(2.3)
2.7
Una serie de tiempo contiene informacin sobre la dinmica de un sistema, la cual en principio es
posible recuperar dada la existencia de una funcin invertible como se mencion en la seccin
2.3, sin embargo la existencia de dicha funcin no garantiza a priori que sea posible modelar
la dinmica de una serie de tiempo y en consecuencia predecir su comportamiento futuro,
ya que los modelos de prediccin poseen limitaciones para modelar dicha dinmica, como se
mencion en la seccin 2.6. Para lograr una mejor comprensin del problema de prediccin
de series de tiempo, es necesario caracterizar dicho proceso, para ello se estudia la predictibi
lidad de las series de tiempo usando diferentes parmetros que relacionan la dinmica de las
series de tiempo con la predictibilidad de las mismas, los parmetros proporcionan informacin
sobre las series de tiempo desde diferentes facetas (i. e. multiplican la informacin sobre su
dinmica): Estadstica, Sistemas Dinmicos No Lineales, Teora de la Informacin y Teora
26
2.8
Las limitaciones de los modelos de prediccin para las series de tiempo, motivan la bsqueda
e identificacin de Patrones de Predictibilidad que ayuden a un mejor entendimiento de la
dinmica del proceso de prediccin de series de tiempo. Estos patrones se expresan en forma de
clases y relaciones derivadas del anlisis de las series de tiempo y de las tcnicas (o modelos) de
prediccin. Un patrn es un concepto local, el cul es vlido para un subconjunto de variables
o datos o ambos [72]. La definicin formal de las ideas anteriores es la siguiente:
Definicin 6 Sea DST el conjunto de datos que contienen informacin sobre un conjunto {STi }
de series de tiempo.
Definicin 7 Sea Pj el modelo de prediccin j esimo, entonces se define a CP = {Pj (STi )}
como un conjunto de modelos de prediccin para las series de tiempo.
27
28
Captulo 3
La Predictibilidad de Series de
Tiempo: Estado del Arte
3.1
Antecedentes
Las bases formales del anlisis de series de tiempo se deben a los trabajos de Euler (1707-1783),
dAlembert (1717-1783), Lagrange (1736-1813) y Fourier (1768-1830) que desarrollaron la idea
de la descomposicin de una seal en componentes harmnicas [73]. Los primeros anlisis de
series de tiempo, se atribuyen a la comunidad astronmica la cual aplic el anlisis de Fourier a
seales de origen astronmico, el objetivo era la bsqueda de periodicidades en los datos (datos
de actividad solar: manchas solares, datos de ndices de luminosidad en estrellas variables).
Los primeros mtodos datan de 1772 y 1778, cuando Lagrange sugiri mtodos para identificar
periodicidades ocultas, Buijs-Ballot propuso procedimientos computacionales para el anlisis
estadstico de datos astronmicos en 1847. Sin embargo, es Sir Arthur Schuster a quien se puede
considerar el iniciador de los mtodos modernos de anlisis de series de tiempo en el dominio
de la frecuencia, con su propuesta en 1889 del anlisis de periodogramas, de la mano de los
desarrollos analticos en los 1890s, la bsqueda de mecanismos de clculo automatizados llevo
a la construccin de dispositivos tales como los analizadores armnicos de Henrici-Conradi y de
Michelson-Stratton, que an cuando tuvieron un xito limitado, nos recuerdan la importancia
del desarrollo de la computadora para el clculo numrico intensivo requerido en el anlisis de
seales [73]. El siguiente gran desarrollo en el estudio de las series de tiempo, tuvo lugar en
29
el dominio del tiempo, por medio de dos artculos, uno en 1927 por Yule [74], y otro en 1937
por Slutsky [75]. En dichos trabajos, se rechaza la hiptesis determinista con componentes
harmnicas para analizar y modelar las series de tiempo, en favor de modelos basados en
causalidad aleatoria, el modelo de auto regresin y el modelo de promedio mvil, se originan
respectivamente a partir de dichos trabajos. Los trabajos de Kolmogorov (1941) y Wiener (1930
y 1950) completaron los fundamentos de la construccin de los predictores lineales para seales
estadsticamente estacionarias iniciados por Yule [76, 77, 78]. En 1965 el estudio de series de
tiempo basado en el anlisis de Fourier (dominio de la frecuencia) alcanzo su madurez, con
el desarrollo por parte de Cooley y Tukey del algoritmo de la transformada rpida de Fourier
(FFT), que redujo considerablemente el esfuerzo para calcular el periodograma de una seal [79].
Por otra parte, en el dominio del tiempo, Box y Jenkins, publicaron en 1976 el libro titulado:
Time-series Analysis, Forecasting and Control, en el cual desarrollaron una metodologa en el
dominio de tiempo mediante la combinacin de diferentes temticas y presentando aplicaciones
en prediccin y control, por primera vez mostraron al gran pblico en una forma unificada el
alcance del estudio de series de tiempo, presentando casos como la prediccin del nmero de
pasajeros en una aerolnea o el anlisis del proceso de combustin en una caldera de gas. Por
ltimo, adaptaron la metodologa de anlisis para su uso mediante la computadora [80]. En la
dcada de 1980s nuevos desarrollos matemticos, en algoritmos y en poder de cmputo abren
la posibilidad de estudiar series de tiempo que presentan comportamiento catico, an cuando
el estudio de sistemas caticos se remonta a Poincar a fines del siglo XIX [81], se tuvo que
esperar al desarrollo de las computadoras y el desarrollo de algoritmos para estudiar los sistemas
caticos a detalle en forma no slo analtica sino tambin experimental. Los trabajos de Whitney
(1936) y posteriormente de Takens (1980) dieron las bases formales de la reconstruccin en el
espacio fase de la dinmica de un sistema a partir de una serie de tiempo (observable de dicha
dinmica) [62, 63].
Los avances anteriores han permitido el desarrollo tanto de tcnicas de anlisis de series de
tiempo como de tcnicas de prediccin, sin embargo muy poco se ha avanzando para entender
los mecanismos del proceso de prediccin de series de tiempo, en particular en la comprensin
de la predictibilidad de las series de tiempo, en la siguiente seccin se hace una revisin de los
trabajos publicados al respecto en la literatura especializada.
30
3.2
G=
var(
yt+j,t )
var(yt+j )
(3.1)
donde yt+j,t es la prediccin optima (i.e. media condicional) para el tiempo t +j realizada al
tiempo t y yt+j es el valor original para el tiempo t + j [103]. Diebold y Killian (1998) proponen
la siguiente definicin de predictibilidad basada en el cociente de los errores de prediccin para
una prediccin a corto plazo (numerador) y una de largo plazo (denominador), de tal forma
31
P (s, k) = 1
E(L(t+s|t ))
E(L(t+k|t ))
(3.2)
E L t+s|t es la prdida esperada de una prediccin de corto plazo, y respectivamente
E(L(t+k|t )) es la prdida esperada de una prediccin de largo plazo, tal que k s y k esta
fija cuando s varia dentro de algn rango. La definicin para ser operativa requiere la seleccin
de una funcin de prdida particular y de un modelo de prediccin particular, por ejemplo se
puede seleccionar como funcin de prdida el error medio cuadrado (MSE ) y como modelo el
auto regresivo AR(p) [82], esta definicin es operacionalmente similar a la medida estadstica U
propuesta por Theil (1966) [104]. Otros ejemplos de mtricas de predictibilidad en el rea de
Econometra son las desarrolladas por Kaboudan (1998) y una variante desarrollada por Duan
y Povinelli (2001) las cuales se basan en definir la predictibilidad de series de tiempo a partir
de la capacidad de un algoritmo de Programacin Gentica de generar un modelo de la serie,
entonces se dice que la serie es GP-predecible [105, 106, 107, 108, 109], la mtrica de Kaboudan
llamada mtrica mide la probabilidad de que una serie de tiempo sea GP-predecible, se basa
en comparar dos salidas: el mejor modelo generado de un conjunto simple de datos antes de ser
alterado mediante la mezcla de los datos en forma aleatoria (boostrap), con respecto al mejor
modelo generado con el conjunto de datos alterado [107, 108, 109]. Especficamente, las variaciones no explicadas, las cuales son medidas mediante la suma del error cuadrado (SSE ) antes
y despus de la modificacin de las series {Yt }, t = 1, 2, ...., N, son comparadas. La variacin
no explicada en {Yt } antes de la mezcla es
T
X
(Yt Yt )2
SSE =
(3.3)
t=1
32
SSES =
T
X
(St St )2
(3.4)
t=1
SSE
SSES
(3.5)
C(s) = 1
M SEyb (s)
M SEy(s)
s = 1, .....S
(3.6)
donde MSEyb(s) es el error medio cuadrado esperado del modelo para la prediccin al tiempo
33
3.3
Discusin
34
como una propiedad intrnseca de la serie de tiempo medida por medio de un parmetro
y algunos ms como dependiente tanto de la serie como del modelo de prediccin.
Al evaluar las mtricas no hay trabajos que utilicen conjuntos de series de tiempo de
diferente origen en dicha evaluacin, ni comparaciones con otras mtricas.
Los principales objetivos de los trabajos que se han desarrollado sobre predictibilidad
son: cuantificar el error de prediccin o incertidumbre debida al modelo de prediccin e
identificar las zonas de alta predictibilidad dentro de una serie de tiempo.
No hay en el estudio de las series de tiempo un marco conceptual terico unificado,
bsicamente el problema de la prediccin de series de tiempo ha sido resuelto a partir
de un conjunto de avances en diferentes reas como son: la Estadstica, la Econometra,
el Anlisis de Fourier, la Teora de Sistemas Dinmicos No Lineales, etc.; donde estas
reas son usadas para la formalizacin matemtica y el desarrollo de tcnicas de anlisis,
modelado y prediccin de las series de tiempo. Tambin la prediccin de series de tiempo
se ha beneficiado de la Computacin tanto para la implementacin de las tcnicas y
algoritmos desarrollados en las otras reas, como para la aplicacin y el desarrollo de
nuevas soluciones de anlisis y prediccin de las series.
Finalmente, los resultados de la revisin del estado del arte sobre la predictibilidad de series
de tiempo, dan soporte a la investigacin desarrollada en este trabajo de tesis en la cual:
Se han construido y evaluado una serie de mtricas de predictibilidad que: dependen
de las series de tiempo, las mtricas consideran un conjunto de diferentes parmetros
dinmicos de las series para calcular la predictibilidad, las mtricas se pueden calcular en
forma experimental.
Las mtricas se evaluaron utilizando un conjunto amplio de series de tiempo de diferente
origen y adems se compararon con mtricas adicionales.
Se estudiaron diferentes aspectos del comportamiento de la predictibilidad como son: la
relacin entre la predictibilidad y el comportamiento dinmico de las series de tiempo, la
relacin entre la predictibilidad y la estructura de las series de tiempo, la relacin entre la
36
37
Captulo 4
Introduccin
38
4.2
Estadsticas
Los mtodos de anlisis de series de tiempo basados en estadstica clsica y moderna han sido
ampliamente utilizados en especial para el estudio de series de tiempo de tipo econmico y
social.
4.2.1
A partir del anlisis estadstico clsico se obtienen un conjunto de parmetros que caracterizan
la distribucin estadstica de un conjunto de datos, en particular estos pueden pertenecer a una
serie de tiempo, a continuacin se describen los parmetros estadsticos que fueron evaluados
con el objetivo de determinar su utilidad en la caracterizacin de la predictibilidad de series de
tiempo:
1 Valor promedio. Conocido tambin como media aritmtica o media, se define como la
suma del conjunto N de datos de la muestra dividida entre el valor N [133]. Su expresin
matemtica es:
hxi =
N
1 X
x1 + x2 + x3 + .... + xN
=
xk
N
N
(4.1)
k=1
39
7 Desviacin promedio.
Desviaci
onP romedio =
N
X
k=1
|xk hxi|
N
(4.2)
p
E [(x E(x))2 ]
(4.3)
E(x) =
xk pk
(4.4)
40
4.2.2
R=T2
(4.5)
x=
(4.6)
12
sn = n
v
u n
uX
t (x(t) x)2
(4.7)
t=1
(4.8)
La serie resultante posee una media de cero. Ahora se crea una serie acumulativa X con
valores de la forma:
X1 = (Z1 + Zr ) r = 2, ..., n
(4.9)
Ntese que por definicin, el ltimo valor de X (que es Xn ) siempre ser cero ya que Z
tiene una media de cero. El rango ajustado, Rn , es el mximo menos el valor mnimo de Xr :
42
(4.10)
El subndice n para Rn ahora ndica que ste es el rango ajustado para x1 , ...., xn . Dado
que X ha sido ajustado para tener media cero, el valor mximo de X siempre es mayor o igual
a cero, y el mnimo siempre ser menor o igual a cero. Luego, el rango ajustado Rn es siempre
no negativo.
El rango ajustado Rn es la distancia que el sistema viaja para el ndice de tiempo n. Si
se hace n = T , se puede aplicar la ecuacin 4.5, considerando que la serie de tiempo x es
independiente para valores crecientes de n. Sin embargo, la ecuacin 4.5, se aplica slo a series
de tiempo que poseen las caractersticas de movimiento Browniano: media cero y varianza igual
a uno. Para extender este concepto a otros tipos de series, es necesario generalizar la ecuacin
4.5 para tomar en cuenta sistemas que no son independientes. Hurst encontr que la forma ms
general de la ecuacin es:
(R/S)n = c nH
(4.11)
(4.12)
con persistencia de tendencia negativa entonces el exponente es mayor que cero y menor a 0.5.
4.3
Anlisis de Fourier
4.3.1
Frecuencia Dominante
La frecuencia dominante se obtiene a partir del clculo del espectro de potencias ya sea por
medio de la transformada rpida de Fourier o el mtodo de mxima entropa, permite determinar
si existe alguna frecuencia caracterstica de la seal, las series de carcter aleatorio poseen
espectros de potencia amplios sin ninguna frecuencia dominante, lo mismo se aplica en cierto
grado para las series caticas. En el caso de las series peridicas y cuasi peridicas stas poseen
espectros con picos bien definidos representativos de sus frecuencias caractersticas.
44
4.4
El Anlisis Espectral Singular (SSA) es una tcnica para el anlisis de series de tiempo que
incorpora elementos del anlisis clsico de series de tiempo (i.e. Anlisis de Fourier, Anlisis
Estadstico) as como elementos modernos (i.e. Teora de Sistemas Dinmicos). Esta tcnica
permite la identificacin y extraccin de componentes oscilatorias de una serie de tiempo lo que
es de utilidad para el estudio de su estructura. La descomposicin de la serie de tiempo consiste
en componentes aditivas que se interpretan como: componentes de tendencias (trends) es decir
partes suaves y de variacin lenta de la serie, componentes oscilatorias (quizs con diferentes
amplitudes) y componentes de ruido (pero no en el sentido estocstico ya que slo se trata con
una trayectoria simple de la serie y no una muestra de trayectorias). El origen de la tcnica se
asocia a la publicacin de una serie de artculos por Broomhead y King (1986) y Broomhead et.
al. (1987) [137]. La tcnica SSA es utilizada en el anlisis de series climticas, metereolgicas
y geofsicas. En particular, en el estudio sobre la predictibilidad de las series de tiempo, es de
inters explorar la tcnica SSA en combinacin con el anlisis de componentes principales (que
se describe en la subseccin 4.4.1), con el objetivo de identificar si existen relaciones entre la
estructura de las componentes de las series de tiempo y la predictibilidad. La versin bsica de
SSA consiste de 4 pasos que se describen a continuacin.
Primer paso (etapa de descomposicin), sea X = (x(0), x(1), ..., x(N 1)) una serie de
tiempo de longitud N, y L sea un entero, el cual se le llama longitud de ventana. Sea K =
N L+1 y se definen los vectores de retardo (embebido) Xj = (xj1 , ..., xj+L2 )T , j = 1, 2, ...., K
y la matriz de trayectoria
X = (xi+j2 )L,K
i,j=1 = [X1 , ..., XK ]
(4.13)
La matriz X es una matriz de Hankel, lo que significa que todos los elementos a lo largo
de la diagonal i + j = constante, son iguales. La construccin de la matriz de trayectoria es el
primer paso del algoritmo de SSA.
El segundo paso (etapa de descomposicin), es la descomposicin de valor singular (SVD)
de la matriz X, la cual se logra por medio de los eigenvalores y eigenvectores de la matriz
S = XXT de tamao L L. Esto proporciona una coleccin de L valores singulares, los cuales
45
son las races cuadradas de los eigenvalores de la matriz S, y los correspondientes vectores
singulares izquierdo y derecho. Los vectores singulares izquierdo de X son los eingenvectores
ortonormales de S llamados tambin funciones empricas ortogonales, los vectores singulares
derecho son los eingenvectores de la matriz XT X. Se obtiene entonces una representacin de
X como una suma de rango uno de matrices biortogonales Xi con i = 1, ..., d, donde d L es
el nmero de valores singulares de X diferente de cero.
Como el tercer paso (etapa de reconstruccin), se separa el conjunto de ndices I = {1, ..., d}
en varios grupos I1 , ..., Im y se suman las matrices Xi dentro de cada grupo. El resultado de
este paso es la representacin:
X=
m
X
Xi .
(4.14)
iIk
k=1
xn =
m
X
k=1
x(k)
n con n = 0, ..., N 1,
(4.15)
(k)
donde para cada k la serie xn es el resultado del promediado sobre las diagonales de la
matriz XIk .
4.4.1
Relacionado con la descomposicin de la serie de tiempo por parte de la tcnica SSA, se encuentra el anlisis de componentes principales (PCA), una vez que la serie a sido separada
en las diferentes series componentes se les aplica el PCA como una herramienta de anlisis
complementaria, a continuacin se presenta la descripcin de dicho anlisis. El anlisis de
componentes principales, consiste en la bsqueda de las componentes linealmente independien
tes que proyectan a un conjunto de datos multivariado (i. e. multidimensional) en diferentes
direcciones en un espacio de dos dimensiones (aunque no est limitado a este nmero de dimensiones), estas componentes deben cumplir las siguientes condiciones: las combinaciones lineales
de las componentes proporcionan la mxima varianza de la muestra de datos, las combinaciones
46
lineales deben estar no correlacionadas entre s. En resumen el objetivo del anlisis de componentes principales es la reduccin de la dimensionalidad del conjunto de datos para facilitar su
interpretacin [72].
Para calcular las componentes principales se procede de la siguiente forma, sea X una matriz
de datos n p en la cual las filas representan casos (cada fila es un vector de datos x(i)) y
las columnas representan las variables. Estrictamente la i esima fila de esta matriz es la
transpuesta xT del i esimo vector de datos x(i), dado que la convencin que se toma es
considerar vectores de datos como vectores columnas p 1 en lugar de vectores filas 1 p.
Adems se asume que X es centrada a la media, de forma que el valor de cada variable es
relativo a la media muestreada para esa variable (i. e. la media estimada ha sido sustrada
para cada columna).
Sea a el vector columna p 1 de los pesos de proyeccin (no conocidos hasta ahora) que
resultan en la mayor varianza cuando los datos X son proyectados a lo largo de a. La proyeccin
p
X
T
aj xj . Ntese, que
de cualquier vector de datos particular x es la combinacin lineal a x =
j=1
se puede expresar a los valores proyectados sobre a de todos los otros vectores de datos en X
2a = (Xa)T (Xa) = aT XT Xa = aT V a
(4.16)
cero). La varianza de los datos proyectados 2a (escalar a maximizar) se puede expresar como
una funcin de a y de la matriz de covarianza de los datos V.
Para maximizar 2a es necesario aplicar una restriccin de normalizacin sobre los vectores
a la cual es: aT a = 1.
Entonces el problema de optimizacin se rescribe como la maximizacin de la cantidad
u = aT Va (aT a 1)
donde es un multiplicar de Lagrange. Diferenciando con respecto a a se tiene
47
(4.17)
u
= 2Va 2a = 0
a
(4.18)
(V I) a = 0
(4.19)
j es el j esimo eigenvalor.
Una caracterstica que se observa es que para conjuntos de datos de alta dimensionalidad, en
los cuales las variables estn frecuentemente bien correlacionadas, es comn encontrar que para
un nmero relativamente pequeo de componentes principales (por decir 5 a 10) se captura el
90% o ms de la varianza en los datos.
4.5
A diferencia de los mtodos lineales (basados en teora estadstica, anlisis de Fourier) los cuales
interpretan las estructuras regulares en los datos como correlaciones lineales, es decir que la
dinmica del sistema se basa en lo siguiente: ante pequeas perturbaciones la respuesta del
sistema es pequea, y que el comportamiento irregular (diferente a oscilaciones peridicas o
a un crecimiento exponencial) del sistema se atribuye a una perturbacin externa de carcter aleatorio; las tcnicas de anlisis no lineal (Teora de Sistemas Dinmicos No Lineales o
Teora de Caos) toman en consideracin que sistemas no lineales caticos pueden producir comportamiento irregular de los datos a partir de un sistema de ecuaciones deterministas. Este
comportamiento irregular es interpretado como ruido por los mtodos de anlisis lineal. Las
48
tcnicas de anlisis no lineal se pueden agrupar en las siguientes categoras: Reconstruccin del
Espacio Fase, Dimensiones, Exponentes de Lyapunov, Entropas, de Datos Sustitutos (Surrogate Data) y Reduccin del Ruido [3, 138, 139].
4.5.1
Exponentes
Exponente de Lyapunov
Los exponentes de Lyapunov son medidas de la deformacin en el espacio fase representada por
los movimientos relativos de trayectorias cercanas de un atractor (donde la serie de tiempo es
una proyeccin en 1-D de la dinmica del mismo), miden la evolucin de trayectorias vecinas
en el espacio fase. En otras palabras miden la inestabilidad de la dinmica del sistema debido
a cambios en sus condiciones iniciales. El nmero de exponentes corresponde al nmero de
dimensiones del atractor. El exponente principal de Lyapunov, que corresponde al exponente
de mayor magnitud se considera una medida promedio de la sensibilidad del sistema a cambios
en las condiciones iniciales y por ende a las desviaciones de las trayectorias del atractor, es una
medida de la predictibilidad del sistema [138]. El clculo de este exponente se basa en construir
una vecindad en el espacio fase de tipo esferoidal que posee un conjunto de ejes principales
pi . Esta vecindad contiene a un conjunto de puntos de diferentes trayectorias del atractor
del sistema, la vecindad se mueve siguiendo la evolucin de las trayectorias, para seguir esta
evolucin la vecindad sufre deformaciones las cuales producen cambios en las magnitudes de
los ejes que la definen, los exponentes de Lyapunov se determinan por el ritmo de cambio de
la magnitud de los ejes principales de la vecindad, se les llama exponentes porque el ritmo
de cambio sigue un comportamiento de tipo exponencial. Su expresin matemtica es de la
siguiente forma:
bti (t) =
pi (t)
pi (0)
(4.20)
(4.21)
al i esimo eje.
4.5.2
Dimensiones
Ni
(N 1)
nmero de puntos que como mximo se encuentran en la vecindad quitando a i). Finalmente
se calcula la llamada suma de correlacin
C(R) =
N
1 X
pi (R)
N
(4.22)
i=1
Esta definicin cumple que C(R) = 1 si todos los puntos caen dentro de la distancia R
respecto de cada uno de ellos. Si R es menor que la distancia ms pequea entre puntos de la
trayectoria, entonces pi = 0 para todo i y C(R) = 0.
Aplicando la funcin de paso Heaviside:
50
(x) = 0 si x < 0
(4.23)
(x) = 1 si x 0
se reescribe al nmero relativo pi (R) como
N
X
1
(R |xi xj |)
pi (R) =
N 1
(4.24)
j=1,j6=i
C(R) =
N
N
X
X
1
(R |xi xj |)
N(N 1)
(4.25)
i=1 j=1,j6=i
(4.26)
log C(R)
R0 log R
(4.27)
R0
o tomando logaritmos
Dc = lim
La dimensin de correlacin cuantifica la correlacin espacial local entre puntos de la trayectoria del atractor en el espacio fase [140].
Dimensin de Capacidad Para estimar la dimensin de objetos irregulares, por ejemplo
fractales, es posible acercarse a la medida exacta de los mismos utilizando mtricas que escalan
con el comportamiento de estos objetos, para indicar esta posibilidad es que se utilizan relaciones
de la forma
Dcap = lim
log N
log(1/)
(4.28)
D2 = lim
(4.29)
donde la dimensin fractal mide el nmero de estados N del sistema presentes en un volumen
de radio R [139, 140].
Dimensin Embebida
Aunque la dimensin embebida no corresponde a la familia de dimensiones de tipo exponencial como las definidas en los prrafos anteriores, se sita de igual forma en la categora ms
general de dimensin. La dimensin embebida, corresponde a la dimensin necesaria para la
reconstruccin en el espacio fase del atractor, que forman las trayectorias de los estados de la
dinmica del sistema. Dicha dimensin se obtiene a partir de una serie de tiempo del sistema,
mediante la aplicacin de las ideas establecidas por el teorema de Takens. El valor de la dimensin embebida corresponde de igual forma con el nmero de grados de libertad del sistema
dinmico [138].
4.5.3
Los mapas de recurrencia fueron descritos por primera vez por J. P. Eckmann, S. O. Kamphorst
y D. Ruelle en Recurrence plots of dynamical systems en 1987 [8, 142]. Este anlisis cua
litativo (va la visualizacin del mapa) y cuantitativo (va el clculo de parmetros derivados
del mapa) permite la deteccin de patrones ocultos y cambios estructurales de los datos que
52
conforman una serie de tiempo, as como la identificacin de similitudes entre diferentes series
de tiempo bajo estudio, ms adelante en el captulo 10, se explota la informacin visual de
los mapas de recurrencia para el anlisis de la relacin entre estructura y predictibilidad de
las series de tiempo. La idea bsica que sustenta a los mapas de recurrencia es que una serie
de tiempo es el producto de un proceso dinmico donde interaccionan las variables relevantes
del mismo en el tiempo. Y que es posible recuperar la informacin sobre este proceso multiva
riado a partir de la serie de tiempo de una variable medida experimentalmente [63]. En el caso
del anlisis VRA, una serie de tiempo se expande a un espacio multidimensional, en la cual la
dinmica del sistema tiene lugar. Para ello se aplica el embebido de coordenadas de retardo,
con el cual se reproduce el espacio fase del sistema dinmico bajo estudio. Para realizar la
expansin de la seal al espacio fase M-dimensional, cada observacin de la seal original X(t)
se sustituye con un vector
(4.30)
(4.31)
53
54
55
%Recurrencia =
#RECURS
rea Triangular
(4.32)
Determinismo
Este parmetro se obtiene tambin a partir del anlisis de cuantificacin de recurrencia, permite
medir el porcentaje de determinismo en el sistema, se calcula con la siguiente frmula,
56
%Determinismo =
#P RecDiag
#RECURS
(4.33)
donde #P RecDiag corresponde al nmero de puntos recurrentes que forman lneas diagonales hacia arriba en el mapa de recurrencia, y el denominador corresponde a la misma definicin
usada en el clculo de la recurrencia. En el caso de que el #RECURS = 0, se asigna el valor
de -1 al determinismo.
4.6
4.6.1
Teora de la Informacin
Entropas
pi log2 pi
(4.34)
H=
X1
log2 n = log2 n
n
(4.35)
Dado que se asume una distribucin de probabilidades uniforme, la ecuacin 4.35 es una
frontera superior para la entropa. Conforme n , la resolucin crece, y el contenido de
informacin de una medida se incrementa, pero slo hasta el nivel definido por la exactitud de
la medicin. En resumen, la entropa de Shannon es una medida de la cantidad de informacin
que se obtiene al observar un sistema y tomar una medida para especificar su estado [138, 145].
57
(4.36)
la expresin detallada es
Iy;x =
Ns
Ns X
X
P (xi , yi ) log2
i=1 j=1
P (xi , yj )
P (xi )P (yj )
(4.37)
donde Ns corresponde al nmero de probabilidades diferentes a cero, P (xi , yi ) es la probabilidad de ocurrencia de xi dado yj , P (xi ) y P (yj ) son las probabilidades para xi e yj .
En el caso particular de las series de tiempo, la informacin mutua mide el promedio de
informacin que poseen en comn una medicin en el instante t1 respecto a una medicin en el
instante t2 [138, 139].
4.7
4.7.1
Teora de la Computacin
Complejidad Relativa LZ
Es una medida de la complejidad algortmica que mide el nmero de nuevas subcadenas descubiertas conforme una secuencia evoluciona de izquierda a derecha. Cada nueva subcadena
incrementa en 1 la complejidad. Esta medida esencialmente toma en cuenta las repeticiones de
patrones a todos los niveles estructurales, capturando no slo la complejidad de la dinmica de
58
la cadena sino tambin su complejidad jerrquica [126, 146]. El clculo de este parmetro se
describe a continuacin, la fuente de la secuencia S = s1 s2 s3 .... es revisada y rescrita como una
concatenacin w1 w2 w3 ... de palabras wk seleccionadas de tal forma que w1 = s1 y wk+1 es la
palabra ms corta que no ha aparecido previamente. Por ejemplo, la cadena 0011101001011011
es transformada como 0.01.1.10.100.101.1011. Una vez que una nueva palabra ha sido identificada, la seal es nuevamente inspeccionada, con la adicin de un smbolo ms, si el bloque
actual sta ya presente en la lista. De esta forma, cada palabra wk+1 es la extensin de alguna
palabra wj en la lista, donde 0 j k y, por convencin, w0 es la palabra vaca . Dado
que wk+1 = wj s, con s el smbolo de entrada actual, wk+1 se codifica como el par (j, s). La
especificacin del entero j requiere a lo mas un nmero logb Nw (N) del alfabeto de smbolos,
donde Nw (N) N es el nmero total de palabras cdigo y N es la longitud de la secuencia de
entrada. De aqu, la longitud total L(N) de la secuencia codificada crece como
(4.38)
para N creciente. Mientras N sea pequea, L(N) puede exceder a N (como en el ejemplo
de arriba). Cuando N 1, sin embargo, las palabras wk se vuelven tan largas que ellas son
ms eficientemente identificadas por medio de sus nmero de orden j (la posicin del prefijo) en
la lista y por el sufijo s ms que por una descripcin directa. El nmero Nw (N) de palabras en
una revisin diferente (i.e., consistente de palabras diferentes) de una secuencia S = s1 s2 ...sN
satisface
Nw (N) c
N
lnb N
(4.39)
4.7.2
(4.40)
59
denomina reglas de produccin de una gramtica para la serie de tiempo [116, 117]. El nmero
de reglas de produccin para una serie de tiempo es una medida de complejidad (de origen
computacional), en la cual a mayor nmero de reglas de produccin necesarias para generar la
gramtica de la serie corresponde con una mayor dificultad de prediccin o tambin un menor
predictibilidad de la serie de tiempo [10]. Partiendo de una gramtica libre de contexto que se
define como la tupla G = (V, T, P, S) donde:
V = conjunto finito de variables.
T = conjunto finito de terminales.
P = conjunto finito de producciones de la forma A donde A es una variable y es
una cadena de smbolos tomados de (V T ) .
S = variable inicial.
se construye la gramtica para la serie de tiempo. El conjunto de los smbolos terminales
representan la diferencia entre valores contiguos de la serie, de esta forma para el mismo comportamiento de la serie en diferentes secciones de la misma, dicho comportamiento queda codificado
con un solo smbolo de la gramtica. Esta variable a su vez, puede formar parte de la definicin
de otra variable y as recursivamente.
El algoritmo para obtener la gramtica consiste de las siguientes etapas:
Se cuantifican los valores de la serie de tiempo en valores discretos de 0 a 100.
Se codifica la serie discretizada mediante la tcnica de Modulacin por Codificacin de
Pulsos Diferencial (DPCM) [147]. De manera que la serie ahora est representada por las
diferencia de los valores contiguos de la misma.
Se genera la gramtica de la seal codificada, mediante el algoritmo de Sequitur [148].
Una vez generada la gramtica se obtiene el nmero total de reglas de produccin (RP),
parmetro que se aplica en este trabajo para la caracterizacin de la predictibilidad en las series
de tiempo.
60
Captulo 5
Tcnicas de Prediccin y de
Modelado de Series de Tiempo
5.1
Introduccin
5.2
5.2.1
Tcnicas de Prediccin
Tcnicas Estadsticas
ARIMA
Box y Jenkins desarrollaron su modelo ARMA (ver una descripcin ms detallada en la seccin
5.3), el cual consiste en la unin de dos modelos primitivos, el primero de ellos es el Auto Regresivo (AR), en estadstica se tiene la tcnica de regresin que consiste en que una variable puede
ser modelada o predicha utilizando una combinacin lineal de una o ms variables distintas. En
el caso de la auto regresin la variable es modelada mediante la combinacin lineal de los valores
previos de ella misma. Un modelo auto regresivo asume que el valor actual de la serie es igual
al promedio pesado de un nmero finito de valores previos, ms una constante de oset, ms
un trmino de ruido aleatorio, estos trminos aleatorios se les llama shocks. El segundo modelo
primitivo que juega un papel importante en la aproximacin de Box-Jenkins es el promedio
mvil (Moving Average, MA). Este modelo nos dice que el valor actual de una serie de tiempo
es igual a la suma pesada de un nmero finito de shocks previos, ms una constante de oset y
el shock actual [80]. Box y Jenkins encontraron que era posible diferenciar en forma implcita
62
a la serie de tiempo, de tal forma que se lograr la condicin estacionaria que es necesaria
para el uso adecuado del modelo ARMA, luego aplicar dicho modelo y posteriormente integrar
el resultado para regresar al dominio original, a este proceso se le denomina ARIMA. La notacin para un modelo ARIMA es una extensin de la correspondiente a un modelo ARMA:
ARIMA(p, d, q), donde d es el nmero de operaciones de diferenciacin que tienen lugar antes
de aplicar el modelo ARMA y tambin es el nmero de integraciones necesarias para regresar
al dominio original de la serie de tiempo. El nmero de trminos del modelo AR se define como
p y el nmero de trminos del modelo MA como q [16, 73].
5.2.2
T
X
n=0
w(n)x(k n)
(5.1)
63
(5.2)
La red FIR Nq corresponde a una red restringida que acta sobre una ventana finita de la
entrada, entonces la expresin anterior se rescribe como:
(5.3)
la retro propagacin temporal para adaptar la red (y(k) acta como la respuesta deseada).
Ntese que se realiza una adaptacin de lazo abierto; ambas la entrada y la respuesta deseada
son proporcionadas por la serie de entrenamiento conocida. La salida actual de la red no es
retro alimentada como entrada durante el entrenamiento (adaptacin de ecuacin de error). La
expectativa del error cuadrado a minimizar es de la forma:
(5.4)
donde y1T (k) = [y(k 1), y(k 2), .., y(k T )] especfica el regresor.
Una vez que la red es entrenada, la prediccin iterativa de largo plazo se logra tomando la
estimacin yb(k) y alimentando esta de regreso a la entrada de la red (lazo cerrado):
y (k 1)]
yb(k) = Nq [b
(5.5)
requiere conocer la funcin de densidad de probabilidad, para inferirla a partir de los datos
de entrenamiento se aplica el mtodo de estimacin de la densidad de Parzen, el cual estima
la funcin de densidad univariada a partir de una muestra aleatoria, el estimador converge en
forma asinttica a la densidad verdadera conforme la muestra de datos se incrementa. Este
mtodo utiliza una funcin de peso W (d) llamada kernel o funcin potencial, la cual tiene su
valor ms grande en d = 0, este valor decrece rpidamente conforme el valor absoluto de d
se incrementa. Estas funciones de peso estn centradas en cada dato de entrenamiento, y el
valor de cada funcin de la muestra de datos est determinado por su distancia d respecto del
dato muestra. Luego la funcin de densidad de probabilidades es una suma escalada para todos
los datos muestra. Matemticamente la funcin de densidad para una muestra de n datos se
expresa como
n
g(x) =
x xi
1 X
W(
)
n
(5.6)
i=1
(5.7)
Otra funcin de peso que se utiliz en este trabajo fue la correspondiente a la funcin
recproca
W (d) =
1
1 + d2
(5.8)
65
yi (t) = f(
n
X
j=1
wij xj i ), i, 1 i m
(5.9)
ZZ
66
(5.10)
(5.11)
el cual es la suma ponderada del riesgo emprico Remp [f] con respecto a los datos (xi , yi )i =
1, 2, .., n y a un trmino de complejidad kwk2 . En su formulacin bsica, la SVM encuentra una
funcin de decisin f(x) = sign(x + b) que minimiza el error de prediccin en el conjunto de
entrenamiento y procura el mejor desempeo en la generalizacin.
Una de las principales caractersticas de las SVM es el uso de funciones de kernel para
extender la clase de funciones de decisin al caso no lineal [154]. Esto se hace mapeando los
datos desde el espacio de entrada X a un amplio espacio de caractersticas mediante una
funcin , y resolviendo el problema de aprendizaje lineal en .
:X
(5.12)
La funcin real no necesita ser conocida, es suficiente tener una funcin de kernel k que
calcule el producto interno en el espacio de caractersticas.
(5.13)
Las SVM pueden ser aplicadas a resolver el problema de prediccin de series de tiempo
mediante la siguiente representacin, si tenemos una serie de tiempo ST = {x1 , x2 , ..., xN }
podemos separarla en ventanas w = (xi , ..., xi+p1 ) de tamao p. Entonces hay que encontrar
una funcin f : Rp R, tal que f (xi , ..., xi+p1 ) = xi+p para cada i {0, N p} [20]. La
tcnica de SVM evaluada en este trabajo se llama MySVM [19], y fue modificada para utilizar
una representacin de ventana deslizante en el conjunto de entrenamiento del algoritmo SVM
y realizar predicciones de mltiples puntos [20]. Se construyeron dos modelos uno que utiliza
el kernel de tipo radial y otro con el kernel de tipo lineal.
5.2.3
sn+1 = f(sn )
(5.14)
donde f(sn ) es una funcin suave no conocida que depende del punto sn , realizando la
aproximacin local para f (sn ) mediante una expansin de Taylor es posible encontrar la solucin
a la expresin anterior. La condicin que se pide es la minimizacin de la varianza del conjunto
de puntos:
2 =
sj Un
(sj+1 an sj bn )2
(5.15)
sd
n+1 = an sn + bn
(5.16)
68
2 =
X
(sn+1 fp (sn ))2
(5.17)
donde fp es una funcin no lineal en forma cerrada con p parmetros, con respecto a los
cuales la expresin anterior debe ser minimizada. Es posible utilizar polinomios (como en esta
tcnica), funciones de base radial, redes neuronales, polinomios ortogonales, etc.. Los resultados
dependen de que el anzatz (aproximacin o estimacin) seleccionado fp sea adecuado para
modelar la funcin no lineal desconocida y de que tan deterministas son los datos a modelar
[3].
K-Vecinos Cercanos (K-Nearest-Neighbours)
La idea principal detrs de este mtodo es el predecir el valor objetivo de una nueva observacin a partir de observaciones conocidas realizadas en el pasado (base de casos). La nueva
observacin es comparada con todos los elementos de la base de casos. Las k observaciones
pasadas ms similares son luego seleccionadas como referencias para el nuevo candidato. La
medida de similitud se define frecuentemente como la distancia entre las nuevas y las viejas
observaciones. Los valores objetivo de las k referencias son combinadas por ejemplo, con un
promedio simple, para obtener el valor objetivo de la nueva observacin. El mtodo de k vecinos
cercanos imita la habilidad humana conocida como reaccin a una nueva situacin con la ayuda
de la experiencia pasada. El mtodo de k vecinos cercanos pertenece a la clase de algoritmos de
aprendizaje basados en instancias en el campo de aprendizaje de mquina (Machine Learning),
ya que emplea instancias en lugar de modelos. Este mtodo pertenece a la clase de mtodos
no parmetricos. No son necesarias suposiciones sobre la distribucin de los datos analizados
[155]. En el caso de la prediccin de series de tiempo, la aplicacin de este mtodo consiste en
la reconstruccin del atractor en el espacio fase, para posteriormente identificar los k vecinos
cercanos que corresponden a estados similares del sistema y que pertenecen a trayectorias cercanas a la trayectoria donde se predice el estado siguiente no conocido [3, 156], la Figura 5-1
69
Estado a predecir
Trayectorias
vecinas
K vecinos
cercanos
5.3
Tcnicas de Modelado
5.3.1
Tcnicas Estadsticas
ARMA
George Box y Gwilym Jenkins en 1976 propusieron que muchas series podran ser explicadas
mediante un modelo relativamente simple, este modelo est basado en dos modelos primitivos
[80]. El primero de ellos es el Auto Regresivo (AR), en estadstica se tiene la tcnica de regresin
que consiste en que una variable puede ser modelada o predicha utilizando una combinacin
lineal de una o ms variables distintas. En el caso de la auto regresin la variable es modelada
mediante la combinacin lineal de los valores previos de ella misma. Un modelo auto regresivo
asume que el valor actual de la serie es igual al promedio pesado de un nmero finito de
valores previos, ms una constante de oset, ms un trmino de ruido aleatorio. Estos trminos
70
aleatorios se les llama shocks, por definicin estos trminos son independientes entre s y con
respecto a la serie de tiempo, adems estn idnticamente distribuidos y se asume poseen media
cero y una varianza finita, estrictamente deberan seguir una distribucin normal. El modelo
primitivo de AR se expresa como:
(5.18)
(5.19)
El nombre de promedio mvil no es precisamente el mejor. Desde el punto de vista estadstico la expresin anterior implica que los pesos son positivos y su suma igual a la unidad, pero
no es necesario que se cumpla estrictamente lo anterior. En este caso la constante de oset
si corresponde a la media de la serie de tiempo, esto debido a que por definicin los trminos
shock poseen media cero.
En apariencia ambos modelos parecen ser muy similares pero no son idnticos, de hecho se
complementan. Muchos procesos fsicos se describen mejor con modelos cuyos trminos a pesar
de ser simples en forma, se extienden hacia atrs en el tiempo considerablemente, lo cual como
se mencion anteriormente dificulta el clculo de los parmetros del modelo cuando estos son
demasiados. Aqu es donde una propiedad importante de los modelos AR y MA es de utilidad,
se puede mostrar que un modelo finito de un tipo es matemticamente equivalente a un modelo
infinito de otro tipo. Por ejemplo, la siguiente expresin muestra la equivalencia de un trmino
simple de un modelo AR y un modelo MA con nmero de trminos infinito,
71
(5.20)
(5.21)
Este modelo sigue siendo popular ya que funciona bien para una gran cantidad de problemas
reales. En la literatura se acostumbra definir al nmero de trminos del modelo AR como p
y al nmero de trminos del modelo MA como q, entonces se dice que se tiene un modelo
ARMA(p, q) [16, 73].
5.3.2
E(wji , j , wkj , k ) =
1 XX
2
X
0
0
t f
wkj y k
j
(5.22)
mediante el descenso por gradiente, con un gradiente respecto a los pesos de la capa de
salida y otro respecto de los de la capa oculta
0
wkj =
E
0
wkj
E
wji = w
ji
72
(5.23)
0
h
i
0
0
0
f ( k )
k yj , con k = tk f ( k )
0
k
!
X
X 0 0
f (
j)
wji =
j xi , con j =
k wkj
0
wkj =
(5.24)
En estas expresiones est implcito el concepto de propagacin hacia atrs de los errores
0
que da nombre al algoritmo, obsrvese como se propaga hacia atrs la seal de error k para
calcular la seal de error j .
Red Neuronal de Funciones Radiales con aprendizaje de retro propagacin (RBFNBP)
Este modelo es una red unidireccional para aproximacin funcional que puede incorporar aprendizaje supervisado y no supervisado. La arquitectura de una red de funciones de base radial
(RBF) cuenta con tres capas de neuronas: de entrada, oculta y de salida. Las neuronas de
entrada, simplemente envan la informacin del exterior hacia las neuronas de la capa oculta.
Las neuronas de la capa de salida son lineales, esencialmente calculan la suma ponderada de
las salidas que proporciona la capa oculta. La diferencia fundamental entre la arquitectura de
este modelo y el de un perceptrn multicapa, se centra en la operacin de las neuronas ocultas.
stas, en vez de computar la suma ponderada de las entradas y aplicarle una funcin de tipo
sigmoideo, operan en base a la distancia que separa el vector de entradas respecto del vector
sinptico que cada una almacena (denominado centroide), cantidad a la que aplican una funcin radial con forma Gaussiana. Es decir, as como en un perceptrn multicapa las neuronas
ocultas poseen una respuesta de rango infinito (cualquier vector de entrada, con independencia
del lugar del espacio de entrada de donde proceda puede causar que la neurona se active), en
la red RBF las neuronas son de respuesta localizada, pues slo responden con una intensidad
apreciable cuando el vector de entradas presentado y el centroide de la neurona pertenecen a
una zona prxima en el espacio de entradas. Sea xi las entradas de la red, yj las salidas de
la capa oculta, y zk las salidas de la capa final (y globales de la red). Cada neurona j de la
capa oculta almacena un vector cji , el centroide; a cada una de estas neuronas se le calcula la
distancia euclidiana rj que separa el vector de entradas xi de su centroide
73
rj2 = kx cj k2 =
X
(xi cji )2
(5.25)
(r) = er
2 /2 2
(5.26)
El trmino funcin de base radial procede precisamente de la simetra radial de estas funciones (el nodo da una salida idntica para aquellos patrones que distan lo mismo del centroide).
La salida de la neurona oculta j es
rj2 /22j
yj = e
=e
X
i
(5.27)
zk =
wkj yj + k =
wkj (rj ) + k
(5.28)
siendo wkj el peso que conecta la neurona oculta j con la salida k, y k un parmetro
adicional de la neurona k, que por similitud con el perceptrn llamaremos umbrales (bias).
Esta expresin es similar a la correspondiente al perceptrn con una capa oculta y neuronas
de salida lineales. El aprendizaje de la red se realiza en dos partes, primero se entrena a
las neuronas ocultas Gaussianas, para ello se determinan los centroides cji por medio de el
algoritmo k-medias, luego se procede al clculo de los parmetros de escala j de cada neurona,
para lo cual suele hacerse uso de criterios heursticos. La segunda parte del entrenamiento
corresponde a las neuronas de salida donde se calculan los pesos wkj y los umbrales k , en este
caso se utiliz el algoritmo de retro propagacin (backpropagation) descrito anteriormente para
74
namiento por medio de una implementacin de Algoritmo Gentico con el fin de obtener la
mejor arquitectura de la red.
El modelo RNAP se define matemticamente como:
ybk = [(x1,k , x2,k , ..., xni ,k , x1,k1 , x2,k1 , ...., xni ,knl , yk1 , yk2 , .., ykn2 )]max
min
(5.29)
donde ybk R, es la salida de la red, (x, y) R es una funcin no lineal, xi X, son las
[(z)]max
min
max
(z) max
,
(z) min
min
(5.30)
(5.31)
... + a (z , z , ..., z )
p
(5.32)
nv
donde los trminos ai (z1 , z2 , ..., zi ) son polinomios homogneos de grado total i, para i =
0, .., p.
76
Para describir el proceso de aprendizaje de la red RNAP se definen los siguientes trminos:
Error de aproximacin de RNAP
k=1
k=1
1X
1X
(yk (zk ))2 =
(yk ybk )2 , y n = (y1 , y2 , ..., yn )
errn (y , (z)) =
n
n
n
(5.33)
(5.34)
(5.35)
con 0.
Una vez definidos estos conceptos el problema de aprendizaje de RNAP consiste en encontrar
la estructura de p (z) que verifica la desigualdad descrita por 5.35.
El problema de aprendizaje de RNAP para una arquitectura especfica puede ser representado como un problema de optimizacin con los siguientes pasos:
min
Wb
W R
(5.36)
donde errn (yn , (z))|Wb es el error definido en 5.33 para un valor determinado del vector
binario Wb .
El objetivo del algoritmo gentico es encontrar el valor de Wb para el cual el vector de pesos
W hace que se cumpla 5.35. Este arreglo puede ser obtenido utilizando el mtodo de mnimos
cuadrados y queda expresado como:
77
(5.37)
k=1
donde:
Mb (zk ) = M WBT
n
!1
X
N =
Mb (zk )T
(5.38)
k=1
Los pasos que sigue el Algoritmo Gentico para obtener la estructura ptima de RNAP se
pueden resumir de la siguiente manera:
1 Se obtiene la poblacin inicial de forma aleatoria.
2 Se selecciona al mejor conjunto de individuos de la poblacin inicial utilizando como
funcin objetivo el error de aproximacin de RNAP definido en 5.33.
3 Se obtiene una nueva poblacin Ag utilizando los operadores de recombinacin y mutacin
propios de Algoritmo Gentico.
4 Se reevala la funcin objetivo utilizando el error de aproximacin de RNAP.
5 Se regresa al paso 3 hasta que se alcance el mximo nmero de generaciones o hasta
que alguno de los individuos extrados del proceso de seleccin satisfaga la desigualdad
descrita en 5.35.
Dado que RNAP asigna dinmicamente el nmero de neuronas y de generaciones necesarias
en el entrenamiento, los nicos parmetros manipulables exteriormente son:
Pot, representa la mxima potencia a alcanzar en la aproximacin polinomial.
Eta, representa la dispersin del ruido presente en los datos de entrada.
Phiest, define la estructura de la matriz de aprendizaje.
Esta tcnica como se ver posteriormente posee una excelente capacidad para modelar a
series de tiempo de diferentes caractersticas [160, 161, 162].
78
5.3.3
Predict
Esta tcnica de modelado se basa en la idea de aproximacin con modelos locales mencionada
en la descripcin de la tcnica de prediccin Nstep de la seccin 5.2, en este caso se realiza una
aproximacin local manteniendo el orden cero de la misma, esto es, se aproxima la dinmica
localmente por una constante [3]. En el espacio fase reconstruido, todos los vecinos del punto
sn dentro de una vecindad Un son buscados, para entonces calcular el siguiente punto usando
la expresin,
s[
n+k =
1 X
sj+k
|Un |
(5.39)
sj Un
Polynom
Esta tcnica de modelado se basa en el mismo algoritmo de la tcnica de prediccin Polynomp
descrita en la seccin 5.2, la funcin fp para construir el modelo corresponde a un polinomio,
los parmetros p del polinomio ocurren en forma lineal en la funcin f y pueden ser encontrados
con lgebra lineal y la solucin es nica. Esta ventaja se pierde si la funcin a construir posee
parmetros que ocurren en forma no lineal [3].
rbf
En esta tcnica, se aplica nuevamente el algoritmo de construccin de modelos globales descrito
para la tcnica Polynomp, pero ahora la funcin fp corresponde a funciones de base radial [3].
Se define una funcin escalar (r) que tiene solo argumentos positivos r. Adicionalmente, se
seleccionan k centros yi en el atractor. Incluyendo la funcin constante como la funcin base
de orden cero, se obtiene
fp (x) = 0 +
k
X
i=1
i (kx yi k)
(5.40)
Funciones base tpicas son las de forma de campana, con un mximo a r = 0 y un decaimiento rpido hacia cero conforme r crece. Pero tambin es posible usar funciones crecientes
79
para ello se selecciona un vecindario mnimo definido tal que el predictee est contenido dentro
del simplex ms pequeo (con dimetro mnimo) formado por los m + 1 vecinos cercanos. La
modelacin se obtiene proyectando el dominio del simplex en su rango, esto es mediante el
seguimiento de donde los puntos del simplex terminan a p pasos de tiempo. Para obtener el
valor modelado se calcula donde el predictee original se ha movido dentro del rango del simplex,
dando un peso exponencial a sus distancias originales respecto de los vecinos relevantes. Este
mtodo es no parmetrico por lo que no utiliza informacin a priori sobre el modelo usado para
generar la serie de tiempo, solamente la informacin de los datos de la serie [163].
80
Captulo 6
Introduccin
El amplio conjunto de datos experimentales generados en esta tesis, requiri del uso de tcnicas de anlisis de estadstica multivariada y reconocimiento de patrones, que ayudasen en
la extraccin, reconocimiento y clasificacin de los patrones ocultos en los datos, mediante
la reduccin de las dimensiones de los conjuntos multidimensionales de datos experimentales
[72, 164]; para la bsqueda de las posibles relaciones entre caractersticas de las series de tiempo,
su predictibilidad y los modelos de prediccin. Para estudiar los diferentes conjuntos de datos,
se seleccionaron tres tcnicas: Mapas Auto Organizados (GHSOM), Anlisis con Escalamiento
Multidimensional (MDS) y Anlisis de Correlacin Bivariada. Los Mapas Auto Organizados
permiten estudiar el agrupamiento de los datos en base a una mtrica de similitud que adems
es de carcter jerrquico, por su parte el Anlisis con Escalamiento Multidimensional permite
observar como se agrupan los datos usando una mtrica de tipo Euclidiano. El Anlisis de
Correlacin Bivaria da, permite estudiar la correlacin que existe entre diferentes variables
experimentales y de esta forma inferir posibles relaciones de dependencia entre ellas. La informacin generada con las tcnicas se complemento entre s, y permiti extraer conocimiento
sobre la predictibilidad de las series de tiempo y sus relaciones. En el presente captulo se
describen a detalle las tcnicas mencionadas, la seccin 6.2 describe la tcnica de Mapas Auto
81
Organizados y su derivacin los Mapas Auto Organizados Jerrquicos. La seccin 6.3, describe
la tcnica de Anlisis con Escalamiento Multidimensional. Finalmente, la seccin 6.4 describe
el Anlisis de Correlacin Bivariada.
6.2
6.2.1
Un Mapa Auto Organizado (SOM ) es una red neuronal de alimentacin hacia adelante (feedforward) que utiliza un algoritmo de entrenamiento no supervisado, y mediante un proceso
llamado auto organizacin, configura las unidades de salida en una representacin topolgica
de los datos originales. SOM pertenece a una clase general de mtodos de redes neuronales, las
cuales son tcnicas de regresin no lineal que pueden ser entrenadas para aprender o encontrar
relaciones entre las salidas y entradas u organizar los datos de tal forma que es posible identificar patrones o estructuras existentes entre los datos. SOM reduce datos multidimensionales a
un mapa de menor dimensin o malla de neuronas.
El algoritmo SOM se basa en el aprendizaje competitivo no supervisado. Este algoritmo
proporciona una mapeo que preserva la topologa del espacio de mayor dimensin en el espacio
de unidades del mapa (neuronas). Las unidades de mapa generalmente forman una malla de
dos dimensiones, entonces el mapeo corresponde de una alta dimensionalidad a un plano.
La propiedad de preservacin de la topologa significa que un Mapa Auto Organizado agrupa
vectores de datos de entrada similares en neuronas: es decir puntos que estn cerca uno del
otro en el espacio de entrada son mapeados a unidades de mapa cercanas en el Mapa Auto
Organizado. SOM puede ser de utilidad como una herramienta de agrupamiento (clustering)
as como para visualizar datos de alta dimensionalidad.
El proceso de crear un Mapa Auto Organizado requiere de dos capas de unidades de procesamiento: la primera es la capa de entrada que contiene unidades de procesamiento para cada
elemento en el vector de entrada, la segunda es una capa de salida o malla de unidades de
procesamiento que estn conectadas en forma total con las unidades de la capa de entrada.
El nmero de unidades de procesamiento en la capa de salida se define en base a la forma y
tamao inicial del mapa que se desea construir. A diferencia de otras redes neuronales no hay
82
Ganador
Entradas
Vecindario
6.2.2
GHSOM
En la seccin anterior se explicaron los fundamentos de los Mapas Auto Organizados (SOM), los
cuales permiten visualizar datos de alta dimensionalidad en un espacio de dos dimensiones, de
tal forma, que la similitud entre los datos de entrada es preservada. Sin embargo, estos mapas
poseen dos limitantes la primera consiste en la necesidad de conocer a priori la arquitectura
de la red en trminos del nmero y arreglo de los elementos neuronales de procesamiento, la
segunda es que no permiten la visualizacin de las posibles relaciones jerrquicas entre los datos
agrupados por sus similitud [167]. Lo anterior motiva, el uso de los Mapas Auto Organizados
Jerrquicos (Growing Hierarchical Self-Organizing Maps, GHSOM ) para estudiar las relaciones
de agrupamiento y jerarquas de los diferentes conjuntos de datos generados en esta tesis.
La base de los mapas GHSOM, es utilizar una estructura de jerarquas de mltiples capas
84
Unidad error
Unidad error
Unidades
insertadas
Vecino ms disimil
Vecino ms disimil
Capa 0
Capa 1
Capa 2
Capa 3
6.3
86
Figura 6-4: Grfica de MDS para un conjunto de pases agrupados por su desarrollo tecnolgico
y econmico
88
-3
Dimensin 2
-2.0
-1.5
-1.0
-.5
0.0
koreanor
.5
1.0
1.5
2.0
-2
pakistan
china
india
mexico
turquia
-1
argentin
cuba
sudafric
ucrania
brasil
rusia
Dimensin 1
grecia
irlanda
portugal
espaa
polonia
repcheca
eslovaqu
hungria
israel
taiwan
francia
uk
islandia
noruega
finland
suiza
suecia
luxembur
koreasur
newzelan
austria
aust
singapur
belgica
alemania
japon
usa
Riqueza Econmica
italia
dinamarc
holanda canada
Anlisis MDS
ij de representa la proximidad entre los parmetros para las series de tiempo STi y STj
donde ij = (ci cj )2 , siendo ck un parmetro de la serie de tiempo k esima. La matriz de
proximidades es entonces de la forma:
11
12
21 22
= .
.
.
.
n1 n2
....
....
....
....
....
1n
2n
(6.1)
nn
El algoritmo inicia con una matriz aleatoria X Mnm , donde n, al igual que antes, es el
nmero de series de tiempo, y m es el nmero de dimensiones. En este ejemplo se considera
m = 2. Cada valor xij representa la coordenada de la STi en la dimensin j. As, la matriz X
toma la forma
x11
x12
x21 x22
X= .
.
.
.
xn1 xn2
....
....
....
....
....
x1m
x2m
xnm
(6.2)
A partir de esta matriz X se puede calcular la distancia existente entre dos series de tiempo
cualesquiera i y j, simplemente aplicando la frmula general de la distancia de Minkowski:
"m
#1
p
X
p
(xit xjt )
dij =
(6.3)
t=1
donde p puede ser un valor entre 1 e , en este caso se toma p = 2. A partir de estas
distancias se puede obtener una matriz de distancias que se denomina D Mnn ,
89
d11
d12
....
d21 d22
D= .
.
.
.
dn1 dn2
....
....
....
....
d1n
d2n
dnn
(6.4)
La solucin proporcionada por el MDS debe ser tal que haya la mxima correspondencia
entre la matriz de proximidades inicial y la matriz de distancias obtenidas D, lo cul se logra
modificando la matriz X de forma iterativa de la forma
BX
2n
(6.5)
2ij
si i = j
ij
(6.6)
X=
en donde B tiene como elementos:
bij =
bii =
X X 2 ik
dik
si i = j
bij = 0 si dij = 0
(6.7)
(6.8)
Existen dos modelos bsicos de MDS que son: el modelo de escalamiento mtrico y el modelo
de escalamiento no mtrico. En el primero de ellos se considera que los datos estn medidos en
escala de razn o en escala de intervalo y en el segundo que los datos estn medidos en escala
ordinal. Para el caso de las series de tiempo se aplica el modelo de escalamiento no mtrico, ya
que es ste el que permite formar clases o agrupaciones, a diferencia del escalamiento mtrico
que arroja informacin de tipo cuantitativo [132]. El modelo de escalamiento no mtrico no
presupone una relacin lineal entre las proximidades y las distancias, sino que establece una
relacin montona creciente entre ambas, es decir, si ij < kl dij dkl . Para conocer la
precisin del modelo se construye una medida de precisin, se sabe que las distancias son una
funcin de las similitudes, es decir,
90
(6.9)
de esta forma se tiene que dij = f( ij ). Esto no deja ningn margen de error. Sin embargo,
en las proximidades empricas es difcil que se tenga la igualdad, por lo que generalmente se
tiene que dij f( ij ) con f( ij ) = a + bij donde a y b son constantes a determinar. A las
transformaciones de las proximidades por f se les llama disparidades. Ahora se puede definir
el error cuadrtico como
(6.10)
(6.11)
i,j
6.4
Cuando medimos objetos sobre dos variables que representan propiedades o parmetros de los
mismos, no solo es de inters el medir la tendencia central y la variacin de dichas variables,
91
sino tambin su asociacin, si la hay, entre las dos variables. La asociacin entre dos variables
puede a su vez ser de dos tipos: correlacional y experimental. En relaciones experimentales, el
experimentador controla los valores de una de las variables asignndolos en forma aleatoria y
observa los cambios provocados en la otra variable que se mide. En relaciones correlacinales,
no se tiene control sobre los valores de las variables de los objetos bajo estudio. nicamente se
observa como las dos variables covarian en su ambiente natural. Estas son variables aleatorias
en las cuales cualquier objeto tiene una probabilidad de poseer un valor dado de estas variables
que no estn bajo control del experimentador. La distincin bsica entre las dos relaciones yace
en si el experimentador asigna valores a la variable de los objetos en una forma aleatoria sin bias
o si la asignacin es histrica por naturaleza por medios desconocidos. Finalmente llegamos a
la definicin de anlisis de correlacin , el estudio de las relaciones que existen entre variables
aleatorias, incluyendo la identificacin y sntesis de tales relaciones. En estudios experimentales
controlados, interpretaciones causales pueden ser hechas sobre las relaciones observadas. Por
otra parte, en investigaciones correlacinales no existen interpretaciones causales que pueden
ser hechas con seguridad.
Ya sea que las relaciones sean correlacinales o experimentales, se pueden etiquetar con
varias expresiones que identifican la forma del patrn de las asociaciones existentes entre los
valores de las variables involucradas. Por ejemplo, puede darse el caso que ambas variables
posean valores con tendencia creciente o tendencia decreciente en dicho caso se dice que estn
relacionadas en forma positiva o directa. Pero tambin puede darse que cuando los valores de
una variable crecen los de la otra decrecen, en cuyo caso existe una relacin negativa o inversa.
Tambin puede darse el caso que en un rango de valores las variables presenten una relacin
directa y en otro rango de valores presenten una relacin inversa, a este tipo de relaciones se les
denomina no montonas. Adems las relaciones pueden ser de tipo lineal o no lineal, tambin
puede ocurrir que las relaciones sean cclicas. Por ltimo cuando se encuentra que no existe
una asociacin sistemtica entre los valores de dos variables se dice que las variables no estn
relacionadas, son no correlacionadas, son ortogonales o independientes entre s [171].
Existen diferentes mtodos de correlacin bivariada, en todos ellos se busca calcular un
coeficiente de correlacin que cuantifique la relacin entre dos variables (su grado de asociacin),
este coeficiente de correlacin se identifica por la letra r. Su expresin ms conocida esta dada
92
por
r=
n
X
(xi x)(yi y)
i=1
nsx sy
(6.12)
donde (xi x) es la desviacin del valor individual de un objeto sobre la variable x con
respecto de la media de dicha variable, (yi y) es la desviacin del valor de un objeto sobre la
variable y con respecto de la media de dicha variable, sx y sy son las desviaciones estndar de
las variables x e y, por ltimo n es el nmero de pares de observaciones. El rango de valores de
correlacin se encuentra entre -1 y 1, el signo del coeficiente indica la tendencia de la relacin
(directa o inversa), y su magnitud indica la fuerza de la misma, por ejemplo valores cercanos a
uno corresponden a una asociacin fuerte entre las variables.
Entre los coeficientes ms utilizados se encuentra el coeficiente de correlacin de Pearson
que mide asociaciones de tipo lineal entre dos variables. A pesar de la limitante del coeficiente
de ser una medida de asociacin lineal, el anlisis de correlacin es de mucha utilidad para
explorar las relaciones entre los diferentes parmetros de las series de tiempo, la predictibilidad
de las mismas y los modelos de prediccin.
93
Parte II
94
Captulo 7
Introduccin
7.2
estocstico), esta forma de clasificar a las series de tiempo fue un primer intento de entender
la predictibilidad de las mismas, usando como base la idea de que el comportamiento dinmico
observado indicaba mayor predictibilidad en el caso de las series peridicas y en un conjunto
discreto de clases de comportamiento dinmico, una menor predictibilidad correspondera a las
series con comportamiento estocstico o aleatorio, dicha clasificacin fue propuesta originalmente en forma independiente por Figueroa-Nazuno et. al. y Sprott en diversas publicaciones
[8, 131, 172, 173].
Este conjunto de series de tiempo por sus caractersticas dinmicas son series con estructuras muy variadas desde las ms simples como las de tipo peridico hasta series complejas
como las correspondientes a fenmenos naturales tales como un sismo, las series son utilizadas
ampliamente en los trabajos reportados en la literatura especializada, por lo que son una muestra representativa del estudio experimental sobre la prediccin de series de tiempo, las series
seleccionadas a diferencia de las series de los sistemas comnmente analizados en aplicaciones
como demografa, econometra, comercio, etc., son series que llevan a las tcnicas de prediccin
al limite de sus capacidades de modelado. A continuacin se describe a cada una de las series
de tiempo estudiadas en esta tesis.
1 Sine. Serie peridica generada para 10 ciclos generada por la funcin
f (x) = Seno(x)
(7.1)
2 Vanderpol. Serie peridica generada por una ecuacin diferencial, que es modelo del paso
de la carga electrica (denotada por y) a travs de un circuito oscilador de un tubo de
vaco (triodo) [59]. Su ecuacin es:
dy
d2 y
+ (y 2 ) + 2 y = 0
dt2
dt
(7.2)
ax(t )
dx
= bx(t) +
dt
1 + [x(t )]10
(7.3)
xn+1 = rxn (1 xn )
(7.4)
donde n = ao, x = Nmero de insectos que nacen, r = Nmero de huevos puestos por
cada insecto en promedio que eclosionan al ao n+1.
7 Lorenz. Serie catica generada por un sistema de ecuaciones diferenciales: modelo de
conveccin de fluidos (conveccin de Rayleigh-Benard) la cual se presenta en la atmsfera
terrestre [59, 140, 175]. El sistema de ecuaciones es de la forma:
dX
dt
dY
dt
= e
X +
eY
= XZ + reX Y
dZ
dt
(7.5)
= XY ebZ
donde
e = 10, re = 28 y e
b = 8/3 son parmetros adimensionales, X es proporcional a la
97
x = (y + z)
(7.6)
y = x + 0.2y
z = 0.4 + xz 5.7z
9 Ikeda. Serie catica generada a partir de un mapa construido en el plano complejo:
modelo de la dinmica de pulsos de luz que viajan a travs de un medio no lineal [59]. La
expresin matemtica es de la forma:
z(n + 1) = a + R exp(i(
p
))
(1 + |z 2 (n)|)
(7.7)
donde z(n) representa al pulso que viaja a travs de dicho medio. Los parmetros tienen
los valores a = 1, R = 0.9, = 0.4 y p = 6.
10 Henon. Serie catica generada a partir de un mapa: modelo simplificado del mapa de
Poincar para el modelo de Lorenz [59, 177]. La expresin matemtica es de la forma:
a = 1.4;
b = 0.3;
x(n + 1) = 1 a x2 (n) + y(n);
(7.8)
y(n + 1) = b x(n);
11 Cantor. Serie catica generada por el conjunto de Cantor (teora de conjuntos), el cual
es un conjunto cerrado que consiste enteramente de puntos de frontera cada uno de los
cuales es un punto lmite de dicho conjunto [59].
12 Tent. Serie catica generada por un mapa de tipo lineal por partes [59]. Su expresin
matemtica es de la forma:
98
xn+1
= 1 2 xn
1
2
(7.9)
(7.10)
F = A Sen( t)
(7.11)
(7.12)
15 Laser (Concurso Santa Fe). Serie compleja obtenida a partir de mediciones experimentales de la intensidad de pulsos de lser NH3 Infrarrojo Lejano, condiciones de la frecuencia: frecuencia serie Laser 3 frecuencia serie A1 [14].
16 Dow Jones. Serie compleja obtenida a partir del ndice Industrial Dow Jones del NYSE
(New York Stock Exchange), la serie corresponde al promedio semanal de los precios al
cierre de operaciones para el periodo del 01/07/1900 al 03/08/1996.
99
17 Kobe. Serie compleja obtenida a partir de un acelerograma del sismo de Kobe del 16
de enero de 1995. La serie corresponde a la aceleracin vertical, las mediciones fueron
realizadas en Hobart, Australia por la Universidad de Tasmania, a partir de las 20:56:51
(GMT) durante 51 minutos a intervalos de 1 segundo.
18 EEG. Serie compleja obtenida a partir de un electroencefalograma humano [3].
19 ASCIITXT. Serie compleja generada a partir de cdigo de texto ASCII.
20 El nio. Serie compleja obtenida a partir de la medicin experimental de la dinmica de
una variable del fenmeno climtico el nio.
21 HIV DNA. Serie compleja obtenida a partir del cdigo del DNA del Virus de Inmunodeficiencia Humana HIV (1 = A, 2 = C, 3 = G, 4 = T ).
22 Human DNA. Serie compleja obtenida a partir del cdigo del DNA Humano.
23 Lovaina (Concurso Universidad de Lovaina). Serie compleja generada a partir del modelo
generalizado del circuito de Chua [27]. La expresin matemtica es de la forma:
x1 = [x2 h(x1 )]
x2 = x1 x2 + x3
(7.13)
x3 = x2
donde
h(x1 ) = m5 x1 +
1X
(mi1 mi ) (|x1 + ci | |x1 ci |)
2
(7.14)
i=1
100
26 SP500. Serie compleja obtenida a partir del ndice Financiero de Standard & Pool para
las 500 empresas mas importantes de la bolsa de valores de Nueva York.
27 Star. Serie compleja obtenida a partir de la medicin de la intensidad luminosa de una
estrella variable.
28 Brownian Motion. Serie estocstica generada a partir del modelado del movimiento browniano (proceso de ruido blanco integrado).
29 White Noise. Serie estocstica generada a partir del modelado de proceso de ruido blanco
(ruido aleatorio uniforme).
A continuacin en las Figuras 7-1 a 7-15, se presentan las grficas de cada una de las series
de tiempo, los datos usados para graficar a cada serie de tiempo corresponden a los primeros
1000 datos, para tener una mejor visualizacin en las grficas presentadas de la dinmica de
las series, los datos fueron muestreados con una razn de 1/5, la razn de muestreo conserva la
informacin relevante de la estructura de las series de tiempo al graficar un total de 200 datos
[178].
La Figura 7-16, muestra la tabla con el tipo de comportamiento dinmico de cada serie y
si sta es medida experimentalmente (serie natural) o generada artificialmente (serie sinttica).
El conjunto de series seleccionado presenta los diferentes tipos de dinmicas correspondientes
a la clasificacin de Figueroa-Nazuno et. al. [8, 131, 172].
7.3
1.0
0.5
x(n)
0.0
-0.5
-1.0
200
400
600
800
1000
x(n)
-1
-2
200
400
600
800
102
1000
4.6
4.4
4.2
4.0
x (n)
3.8
3.6
3.4
3.2
3.0
2.8
2.6
200
400
600
800
1000
x (n)
3.8
3.6
3.4
3.2
3.0
2.8
200
400
600
800
103
1000
1.4
1.2
x(n)
1.0
0.8
0.6
0.4
0.2
0.0
200
400
600
800
1000
x(n)
0.8
0.6
0.4
0.2
0.0
200
400
600
800
104
1000
20
15
10
5
x(n)
0
-5
-10
-15
-20
200
400
600
800
1000
10
x(n)
-5
-10
200
400
600
800
105
1000
1.5
1.0
x(n)
0.5
0.0
-0.5
200
400
600
800
1000
x(n)
0.5
0.0
-0.5
-1.0
-1.5
-2.0
200
400
600
800
106
1000
1.0
0.8
x (n)
0.6
0.4
0.2
0.0
200
400
600
800
1000
x (n)
0.6
0.5
0.4
0.3
200
400
600
800
107
1000
3.0
2.5
x(n)
2.0
1.5
1.0
0.5
0.0
200
400
600
800
1000
Serie de Tiempo A1
1.2
1.0
x(n)
0.8
0.6
0.4
0.2
0.0
200
400
600
800
Serie de Tiempo D1
Figura 7-7:
108
1000
2.5
2.0
x(n)
1.5
1.0
0.5
0.0
200
400
600
800
1000
0.10
x (n)
0.08
0.06
0.04
0.02
200
400
600
800
109
1000
1.5
1.0
x (n)
0.5
0.0
-0.5
-1.0
200
400
600
800
1000
x (n)
0.2
0.0
-0.2
-0.4
-0.6
-0.8
200
400
600
800
110
1000
1.2
1.0
x(n)
0.8
0.6
0.4
0.2
200
400
600
800
1000
2.8
x(n)
2.6
2.4
2.2
2.0
1.8
200
400
600
800
111
1000
4.0
3.5
x (n)
3.0
2.5
2.0
1.5
1.0
200
400
600
800
1000
0.8
x (n)
0.6
0.4
0.2
0.0
200
400
600
800
112
1000
0.4
0.2
x (n)
0.0
-0.2
-0.4
-0.6
-0.8
200
400
600
800
1000
x (n)
0.5
0.0
-0.5
-1.0
-1.5
-2.0
200
400
600
800
113
1000
3.0
2.5
x (n)
2.0
1.5
1.0
0.5
0.0
200
400
600
800
1000
x (n)
2
1
0
-1
-2
200
400
600
800
114
1000
0.3
0.2
0.1
x (n)
0.0
-0.1
-0.2
-0.3
-0.4
200
400
600
800
1000
x (n)
-2
-4
200
400
600
800
1000
115
1.0
0.8
x (n)
0.6
0.4
0.2
0.0
200
400
600
800
1000
116
Serie de Tiempo
Comportamiento
Dinmico
Tipo de Origen
Sine
Vanderpol
Peridico
Peridico
Artificial
Artificial
Qperiodic2
Cuasiperidico
Natural
Qperiodic3
Cuasiperidico
Natural
Mackey-Glass
Catico
Artificial
Logistic
Lorenz
Rossler
Ikeda
Henon
Cantor
Tent
A1
D1
Laser
Dow Jones
Kobe
EEG
ASCIITXT
El nio
HIV DNA
Human DNA
Lovaina
Plasma
Primos
SP500
Star
Catico
Catico
Catico
Catico
Catico
Catico
Catico
Complejo
Complejo
Complejo
Complejo
Complejo
Complejo
Complejo
Complejo
Complejo
Complejo
Complejo
Complejo
Complejo
Complejo
Complejo
Artificial
Artificial
Artificial
Artificial
Artificial
Artificial
Artificial
Natural
Artificial
Natural
Natural
Natural
Natural
Artificial
Natural
Natural
Natural
Artificial
Natural
Artificial
Natural
Natural
Brownian Motion
Estocstico
Artificial
White Noise
Estocstico
Artificial
117
Tipo de
Parmetro
Alcance de
Parmetro
Tipo de
Informacin
que
proporciona
Rango de
valores que
toma la serie
de tiempo
Rango de
Datos
Estadstica
Clsica
Estadstico
Global
Resolucin
Estadstica
Clsica
Estadstico
Global
Desviacin
Promedio
Estadstica
Clsica
Estadstico
Global
Desviacin
Standard
Estadstica
Clsica
Estadstico
Global
Skewness
Estadstica
Clsica
Estadstico
Global
Kurtosis
Estadstica
Clsica
Estadstico
Global
Moda
Estadstica
Clsica
Estadstico
Global
Correlacin
de Pearson
Estadstica
Clsica
Estadstico
Global
Tiempo de
Correlacin
Estadstica
Clsica
Estadstico
Global
Granularidad
de la serie de
tiempo
Medida de
dispersin de
la
distribucin
de datos de
la serie
Medida de
dispersin de
la
distribucin
de datos de
la serie
Grado de
asimetra de
la
distribucin
de datos de
la serie
Medida de
dispersin de
la
distribucin
de datos de
la serie
Valor ms
frecuente de
la
distribucin
de valores
Grado de
correlacin
entre dos
valores de la
serie
Intervalo
mximo de
correlacin
entre dos
valores en la
serie
Indican
Representaci
Predictibilida
Transformaci
n de la
d:1. No
n de la
Serie de
Indican
Informacin
Tiempo
Predictibilida
d: 0
Espacio en
donde se
calcula
Espacio
Euclideano
Serie de
Tiempo
Sin cambio
Espacio
Euclideano
Serie de
Tiempo
Sin cambio
Espacio
Euclideano
Serie de
Tiempo
Sin cambio
Espacio
Euclideano
Serie de
Tiempo
Sin cambio
Espacio
Euclideano
Serie de
Tiempo
Sin cambio
Espacio
Euclideano
Serie de
Tiempo
Sin cambio
Espacio
Euclideano
Serie de
Tiempo
Sin cambio
Espacio
Euclideano
Serie de
Tiempo
Sin cambio
Espacio
Euclideano
Serie de
Tiempo
Sin cambio
118
Tipo de
Parmetro
Alcance de
Parmetro
Valor
Promedio
Estadstica
Clsica
Estadstico
Global
Valor Medio
(Mediana)
Estadstica
Clsica
Estadstico
Global
Valor Mnimo
Estadstica
Clsica
Estadstico
Global
Valor
Mximo
Estadstica
Clsica
Cuartil
Mnimo
Estadstica
Clsica
Estadstico
Global
Cuartil
Mximo
Estadstica
Clsica
Estadstico
Global
Exponente
de Hurst
Estadstica
Moderna
Estadstico
Global
Estadstico
Anlisis de
Componente
Componente Espacial/Te
s Principales
s
mporal
(5 primeras)
Estructurado
Global
Global
Tipo de
Informacin
que
proporciona
Espacio en
donde se
calcula
Valor
promedio de
Espacio
la
distribucin Euclideano
de valores de
la serie
Valor medio
de la
Espacio
distribucin
Euclideano
de valores de
la serie
Mnimo valor
encontrado
Espacio
en la
Euclideano
distribucin
de datos
Indican
Predictibilida
Representaci
Transformaci
d:1. No
n de la
n de la
Indican
Serie de
Informacin
Predictibilida
Tiempo
d: 0
Serie de
Tiempo
Sin cambio
Serie de
Tiempo
Sin cambio
Serie de
Tiempo
Sin cambio
Serie de
Tiempo
Sin cambio
Serie de
Tiempo
Sin cambio
Serie de
Tiempo
Sin cambio
Serie de
Tiempo
Sin cambio
Informacin
contenida en
cada
Componente Separacin
Espacio
subserie
s de Serie de
de la
componente Euclideano
Tiempo
Informacin
sobre la serie
de tiempo
original
Mximo valor
encontrado
Espacio
en la
Euclideano
distribucin
de datos
Valor que
indica el 25%
Espacio
de datos de
Euclideano
la
distribucin
Valor que
indica el 75%
Espacio
de datos de
Euclideano
la
distribucin
Correlacin
de largo
Espacio
alcance
Euclideano
(memoria)
119
Exponente
de Lyapunov
Dimensin
de
Correlacin
Dimensin
de
Capacidad
Teora de
Sistemas
Dinmicos
No Lineales
Teora de
Sistemas
Dinmicos
No Lineales
Teora de
Sistemas
Dinmicos
No Lineales
Dimensin
Fractal
Teora de
Sistemas
Dinmicos
No Lineales
Dimensin
Embebida
Teora de
Sistemas
Dinmicos
No Lineales
Teora de
Sistemas
Dinmicos
No Lineales
Teora de
%
Sistemas
Recurrencia Dinmicos
No Lineales
Teora de
%
Sistemas
Determinism
Dinmicos
o
No Lineales
%Entropa
Espacio
Temporal
Entropa de
Shannon
Informacin
Mutua
Promedio
Indican
Representaci
Predictibilida
Transformaci
n de la
d:1. No
n de la
Serie de
Indican
Informacin
Tiempo
Predictibilida
d: 0
Tipo de
Parmetro
Alcance de
Parmetro
Tipo de
Informacin
que
proporciona
Topolgico
Global
Horizonte de
Prediccin
Espacio
Fase
Atractor
Multiplicacin
de la
Informacin
Topolgico
Local
Correlacin
espacial local
Espacio
Fase
Atractor
Multiplicacin
de la
Informacin
Espacial
Local
Grado de
autosimilitud
del sistema
Espacio
Fase
Atractor
Multiplicacin
de la
Informacin
Global
Dimensin
promedio en
una vecindad
de tamao
epsilon sobre
el atractor
Espacio
Fase
Atractor
Multiplicacin
de la
Informacin
Global
Estimado del
nmero
grados de
libertad del
sistema
Espacio
Fase
Atractor
Multiplicacin
de la
Informacin
Grado de no
correlacin
espacial
Espacio
Euclideano
Mapa de
Recurrencia
Multiplicacin
de la
Informacin
Periodicidad
Espacial/Te
Global/Local y estructuras
mporal
definidas
Espacio
Euclideano
Mapa de
Recurrencia
Multiplicacin
de la
Informacin
Espacio
Euclideano
Mapa de
Recurrencia
Multiplicacin
de la
Informacin
Espacio
Euclideano
Mapa de
Recurrencia
Multiplicacin
de la
Informacin
Informacin
mutua
contenida en
una variable
Espacio
para dos
Euclideano
instantes de
tiempo
diferentes
Mapa de
Recurrencia
Multiplicacin
de la
Informacin
Espacial
Topolgico
Espacial/Te
Global/Local
mporal
Determinism
Espacial/Te
o en base a
Global/Local
mporal
patrn de
recurrencia
Cantidad de
Informacin
que puede
Teora de
Probabilistico Global/Local ser extrada
Informacin
al medir el
estado del
sistema
Teora de
Probabilistico
Informacin
Global
Espacio en
donde se
calcula
Serie de
Estructuras y
tiempo
Reduccin
Complejidad Teora de Computacion
jerarqua de
Espacio
Global/Local
Codificada
de la
LZ Relativa Computacin
al
cadenas de Discretizado
Simblicame Informacin
datos
nte
Nmero de
reglas
Serie de
gramticales
tiempo
Reduccin
Reglas de
Teora de
para modelar
Espacio
Computacional Global/Local
Codificada
de la
Produccin Computacin
la serie
Discretizado
Simblicame Informacin
(complejidad
nte
computacion
al)
Figura 7-19: Tabla de las caractersticas de los parmetros de las series de tiempo
120
7.4
Datos Experimentales
Para calcular los diferentes parmetros el conjunto de series de tiempo fue estandarizado en el
nmero de datos para cada una de ellas, se consider a los primeros 1000 datos, ya que algunos
de los parmetros pueden tener la caracterstica de ser extensivos, es decir, ser dependientes de
la cantidad de datos de las series de tiempo. Las tablas de datos generadas corresponden al
clculo de las siguientes clases de parmetros:
Parmetros estadsticos que proporcionan informacin sobre la distribucin estadstica de
los datos de cada serie de tiempo, este tipo de informacin adems es til en la construccin de modelos de prediccin de series de tiempo [11, 179], los parmetros son: Rango
de Datos, Resolucin, Desviacin Promedio, Desviacin Estandar, Skewness, Kurtosis,
Moda, Auto correlacin, Tiempo de Correlacin, Valor Promedio, Valor Medio, Valor
Mnimo, Valor Mximo, Cuartil Mnimo y Cuartil Mximo.
El parmetro de estadstica moderna exponente de Hurst, descrito en el captulo 4, que
permite cuantificar la persistencia y memoria en el comportamiento de una serie.
El parmetro de frecuencia dominante que permite determinar si hay una frecuencia
caracterstica de la serie de tiempo.
El parmetro de porcentaje de varianza en las componentes principales, obtenido del
anlisis de componentes principales (PCA) para las componentes de las series de tiempo.
Estas componentes son el producto de descomponer las series con el anlisis espectral
singular (SSA). El porcentaje de varianza se calcul para cada una de las primeras 5
componentes de las series de tiempo. Este parmetro se interpreta como la cantidad
de informacin sobre la serie de tiempo que cada componente posee, producto de la
descomposicin de la seal. Ms adelante, en el captulo 10, se presenta un anlisis sobre
la relacin entre predictibilidad de una serie y la informacin de sus componentes, como
parte del estudio correspondiente a la relacin entre parmetros de tipo estructural y la
predictibilidad de las series de tiempo.
El conjunto de parmetros no lineales basados en la teora de sistemas dinmicos, los
cuales son indispensables en la caracterizacin de la dinmica de las series de tiempo,
121
7.5
Discusin
122
Captulo 8
Evaluacin de Tcnicas de
Prediccin y de Modelado de Series
de Tiempo
8.1
Introduccin
123
8.2
Mtodo Experimental
Tcnica de
Prediccin
Fundamenta
cin Terica
Inteligencia
Red
Artificial
FIRNet
Neuronal con
(Aprendizaje
Filtros FIR
de Mquina)
Red
Neuronal
Inteligencia
Probabilistica
Artificial
PNNGauss con funcin
(Aprendizaje
de
de Mquina)
aprendizaje
gaussiana
Red
Neuronal
Inteligencia
Probabilistica
Artificial
PNNRecipro
con funcin
(Aprendizaje
cal
de
de Mquina)
aprendizaje
reciproca
MLFFN
Descripcin
Red
Neuronal
Multicapa
Inteligencia
hacia delante
Artificial
(Perceptron
(Aprendizaje
Multicapa
de Mquina)
caso basico
sin capa
oculta)
Maquina de
Vectores de
Soporte
MySVM
(Kernel de
Multipunto (
Funciones:
kernel dot)
de tipo
producto
punto)
Maquina de
Vectores de
Soporte
MySVM
(Kernel de
Multipunto (
kernel radial) Funciones:
de base
radial)
Modelo de
funciones
Polynomp polinomiales
en el espacio
fase
Nstep
Inteligencia
Artificial
(Aprendizaje
de Mquina)
Inteligencia
Artificial
(Aprendizaje
de Mquina)
Teoria de
Sistemas
Dinamicos
No Lineales
Modelo de
Teoria de
aproximacin
Sistemas
por funciones
Dinamicos
locales en el
No Lineales
espacio fase
Modelo de
Teoria de
aproximacin
Sistemas
por promedio
Dinamicos
K-Nearestde vecinos
No Lineales y
Neighbours
cercanos en
Aprendizaje
el espacio
de Mquina
fase
ARIMA
Modelo de
Auto
Regresion y
Promedio
Movil
Integrado
Estadstica
Tcnica de
Modelado
Descripcin
Fundamenta
cin Terica
FFNBP
Red
Neuronal
Inteligencia
hacia
Artificial
adelante con
(Aprendizaje
retropropaga
de Mquina)
cion
(perceptron)
RBFNBP
Red
Neuronal con
Inteligencia
Funciones de
Artificial
Base Radial
(Aprendizaje
con
de Mquina)
retropropaga
cion
ANFIS
RNAP
Predict
Polynom
rbf
Sugimay
ARMA
Red
Neuronal y
Lgica
Difusa
(hbrido)
Red
Neuronal
Artificial
Polinomial y
Algoritmo
Genetico
(hbrido)
Inteligencia
Artificial
(Aprendizaje
de Mquina)
Inteligencia
Artificial
(Aprendizaje
de Mquina)
Modelo de
aproximacin
Teoria de
por funciones
Sistemas
locales en el
Dinamicos
espacio fase:
No Lineales
funcin
constante
Modelo de
Teoria de
funciones
Sistemas
polinomiales
Dinamicos
en el espacio
No Lineales
fase
Modelo de
Teoria de
funciones de
Sistemas
base radial
Dinamicos
en el espacio
No Lineales
fase
Modelo de
aproximacin
por promedio Teoria de
Sistemas
pesado de
Dinamicos
vecinos
cercanos en No Lineales
el espacio
fase
Modelo de
Auto
Regresion y
Promedio
Movil
Estadistica
RMSE : El Error Medio Raz Cuadrada, representa la medida tpica de error de prediccin,
su expresin matemtica es la siguiente:
"
N
1 X p
2
RM SE =
(xi xoi )
N
i=1
# 12
(8.1)
donde N es el nmero de datos predichos, xpi corresponde al i esimo dato predicho y xoi
corresponde al i esimo dato original. Un valor cercano a cero indica una buena prediccin, el
trmino de la diferencia al cuadrado le da mayor peso a las grandes discrepancias entre valores
originales y los predichos. Es una medida de error global pues realiza un promedio sobre el
conjunto de datos predichos [11, 12].
BE : El Error Bias, es una medida de la tendencia a subpredecir o sobrepredecir un
conjunto de datos, su expresin matemtica es la siguiente:
BE =
N
1 X p
(xi xoi )
N
(8.2)
i=1
donde N es el nmero de datos predichos, xpi corresponde al i esimo dato predicho y xoi
corresponde al i esimo dato original. Es muy til para identificar cuando un modelo (por
ejemplo, aquel generado a partir del entrenamiento de una red neuronal) se ha sub o sobreentrenado, ambos casos no son adecuados para lograr una prediccin o modelado ptimo. Un Error
Bias positivo indica una tendencia a sobremodelar y un Error Bias negativo a submodelar a
la serie de tiempo. Como el anterior, es una medida de error global pues realiza un promedio
sobre el conjunto de datos predichos [11, 12].
LRSE : El Error Local, calcula el error para cada punto predicho de una serie de tiempo
ST , su expresin es:
(8.3)
MAE : El Error Local Promedio, promedia el error local de cada punto predicho para una
serie de tiempo ST , su expresin matemtica es:
128
MAE =
N
1 X p
|xi xoi |
N
(8.4)
i=1
donde N es el nmero de datos predichos, xpi corresponde al i esimo dato predicho y xoi
corresponde al i esimo dato original [11, 12].
hRMSEj ik : Este es un promedio de los promedios del error RMSE para el conjunto de
tcnicas (ya sea de prediccin o de modelado), donde el error RMSEj (ver ecuacin 8.1)
corresponde a la j esima serie de tiempo que fue predicha (o fue modelada) con xito
por la k esima tcnica. Para su clculo se obtiene primero el promedio del error RMSE
para todos los L casos exitosos de una tcnica, a este promedio lo identificamos como el
promedio RMSE de la tcnica k esima:
L
1X
RMSEj
hRMSEj ik =
L
(8.5)
j=1
el segundo paso consiste en el clculo del promedio para el conjunto de promedios RMSE
obtenidos a partir de las M tcnicas evaluadas:
M
1 X
hRM SEj ik
hRMSEj ik =
M
(8.6)
k=1
hBEj ik : Este es el promedio de los promedios del error BE para el conjunto de tcnicas,
1 X
hBEj ik
hBEj ik =
M
(8.7)
k=1
hMAEj ik : De la misma forma se define el promedio de los promedios del error MAE
para el conjunto de tcnicas, su expresin es:
1 X
hMAEik
hMAEj ik =
M
k=1
129
(8.8)
8.3
Resultados Experimentales
8.3.1
Tcnicas de Prediccin
Las siguientes figuras presentan grficas que son una muestra de los diferentes experimentos
de prediccin realizados con xito. La Figura 8-3, ejemplifica la prediccin ideal es decir,
con un mnimo error y un excelente seguimiento de la dinmica de la serie. La Figura 84, corresponde al caso en cual las caractersticas de la serie (en este caso la dinmica catica)
impiden una prediccin mas all de un nmero pequeo de valores futuros. El siguiente ejemplo,
que corresponde a la Figura 8-5, presenta el caso de la prediccin en la cual la tendencia y
frecuencia de la dinmica se reproducen, sin embargo, las variaciones de la amplitud no logran
ser predichas. Por ltimo, la Figura 8-6 muestra el caso en el cul se sigue la tendencia de la
serie aunque presentando un error no despreciable.
Original
Prediccin
1.6
1.4
1.2
x (n)
1.0
0.8
0.6
0.4
0.2
0.0
4010
4020
4030
4040
4050
Original
Prediccin
2.0
1.5
1.0
x (n)
0.5
0.0
-0.5
-1.0
-1.5
-2.0
1910
10
1920
20
1930
30
1940
40
1950
50
Original
0.75
Prediccin
0.70
0.7
0.65
0.60
0.6
x (n)
0.55
0.50
0.5
0.45
0.40
0.4
0.35
0.30
0.3
0.25
1910
10
1920
20
1930
30
1940
40
1950
50
131
Original
0.65
Prediccin
0.6
0.60
0.55
0.5
0.50
x (n)
0.45
0.4
0.40
0.35
0.3
0.30
0.25
0.2
0.20
0.15
0.1
0.10
0.05
0.0
0.00
-0.05
1910
1920
1930
1940
1950
Sine
Vanderpol
Qperiodic2
Qperiodic3
MackeyGlass
Logistic
Lorenz
Rossler
Ikeda
Henon
Cantor
Tent
A1
D1
Laser
Dow Jones
Kobe
EEG
ASCIITXT
El nio
HIV DNA
Human DNA
Lovaina
Plasma
Primos
SP500
Star
Brownian
Motion
White Noise
Total de
Series
Predichas
por cada
Tcnica
Serie de
Tiempo
0
0
0
1
0
1
0
1
1
0
1
1
0
0
0
1
0
1
0
0
0
0
0
0
0
12
1
0
1
0
0
1
0
0
1
0
1
0
0
0
0
0
0
1
0
0
0
0
0
0
0
FIRNet
1
1
1
1
PNNGauss
1
1
0
1
PNNReciprocal
9
0
1
1
0
0
0
1
1
0
1
1
0
0
0
0
0
0
0
0
0
0
0
1
1
0
1
MLFFN
10
0
1
1
0
0
0
1
1
0
0
0
0
0
0
1
0
1
0
0
0
0
0
1
1
1
1
MySVM Multipunto
(kernel dot)
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
1
MySVM Multipunto
(kernel radial)
13
1
1
1
0
0
0
1
1
0
1
0
1
0
0
0
0
0
1
0
0
0
0
1
1
1
1
11
1
1
0
0
1
0
1
1
0
1
0
1
0
0
0
0
0
0
1
0
0
0
1
0
0
1
Polynomp
16
1
1
1
0
1
0
1
1
0
1
1
0
0
0
1
0
1
1
1
0
0
0
1
1
0
1
Nstep
Tcnica de Prediccin
17
1
0
1
1
1
0
1
1
0
1
1
1
1
0
0
0
1
1
0
0
0
0
1
1
1
1
K-NearestNeighbours
Inteligencia Artificial
Estadstica
0
0
0
0
0
0
1
0
0
1
1
0
1
0
0
0
1
0
0
0
0
1
1
0
0
0
ARIMA
4
6
6
1
5
0
8
8
0
8
5
3
2
0
3
0
6
3
2
0
0
1
10
8
4
9
Total de
Tcnicas que
Predicen a
cada Serie
de Tiempo
nicas evaluadas. Al construir estas grficas se quera no solo que mostrarn el comportamiento
del error de prediccin sino tambin, que fuese posible una comparacin en magnitud del e
rror, ello no es posible sin una normalizacin previa a su evaluacin de las diferentes series de
tiempo, para que las magnitudes resultantes de los errores sean del mismo orden. Las series
normalizadas para que la magnitud de sus datos estuviese en el rango 102 , 101 como el resto
del conjunto de series fueron: A1, Laser, Dow Jones, Kobe, ASCIITXT, El nio, Human DNA
y Primos. Es importante aclarar tambin, que todos los casos graficados que poseen un valor
cero en los errores, corresponden a los fracasos en la prediccin de las series correspondientes.
La grfica de la Figura 8-8 sobre el error RMSE, muestra que salvo dos casos extremos,
el error RMSE es pequeo para la mayora de las tcnicas de prediccin, el promedio de este
error para todas las tcnicas de prediccin es de hRMSEj ik = 0.1717. Los casos de error con
valor mximo corresponden a las tcnicas MLFFN y MySVM Multipunto con el kernel radial,
estos valores mximos indican el castigo a discrepancias grandes entre los datos predichos y los
originales para estas series de tiempo en particular. La serie de tiempo cuya prediccin gener
un mayor error con cada tcnica que la predijo fue Henon. Los datos obtenidos sobre el error
RMSE como una medida de tipo global (i. e. promedio sobre el conjunto de datos predichos
para cada serie), nos indican, no solo que en general el RMSE presenta un valor pequeo (i. e.
hay buenas predicciones) para las diferentes tcnicas, sino tambin que este comportamiento es
independiente del nmero de series predichas por cada tcnica.
La grfica de la Figura 8-9, muestra el comportamiento del error BE, nuevamente los casos
extremos corresponden a las tcnicas mencionadas en el anlisis del error RMSE, se observa que
el ajuste de los modelos de prediccin a las series de tiempo es cercano al ptimo, ya que el BE
es cercano a cero en la mayora de los casos. En promedio el error BE para todas las tcnicas
de prediccin es de hBEj ik = 0.0097, lo que indica que es cercano al ptimo aunque hubo
una ligera tendencia al subaprendizaje por parte de la mayora de las tcnicas. Por ltimo, el
comportamiento del error es independiente del nmero de series predichas por cada tcnica.
La grfica de la Figura 8-10, muestra el comportamiento del error MAE, con excepcin
de los casos extremos mencionados anteriormente, el error MAE que cuantifica el error local
promedio de una prediccin, se observa es pequeo para el conjunto de tcnicas de prediccin,
Figura 8-8: Grfica de superficie del error RMSE para la prediccin de series de tiempo
135
RMSE 4
1 2
3 4
5 6
7 8
9 10
11 12
13 14
15 16
17 18
19 20
21 22
Serie de Tiempo
23 24
25 26
27 28
29
C1
C4
C7
Predictor
C10
0-1
1-2
2-3
3-4
4-5
5-6
6-7
7-8
Figura 8-9: Grfica de superficie del error BE para la prediccin de series de tiempo
136
BE
1 2
3 4
5 6
7 8
9 10
11 12
13 14
15 16
17 18
19 20
21 22
Serie de Tiempo
23 24
25 26
27 28
29
C10
1.5-2
-5.5
-5
-4.5
C1
C4
C7
Predictor
-5.5--5
-5--4.5
-4.5--4
-4--3.5
-3.5--3
-3--2.5
-2.5--2
-3.5
-4
-2--1.5
-1.5--1
-1--0.5
-0.5-0
0-0.5
0.5-1
-3
-2.5
-2
-1.5
-1
-0.5
1-1.5
2-2.5
1.5
0.5
2.5-3
3-3.5
3.5-4
4-4.5
4.5-5
5-5.5
2.5
3.5
4.5
5.5
BE Tcnicas de Prediccin
que el error local generado por las predicciones no crece en forma apreciable para el intervalo
de prediccin de N = 50 unidades. Igual que para los otros dos errores se observa, que su
comportamiento es independiente del nmero de series predichas por cada tcnica.
8.3.2
Tcnicas de Modelado
Las siguientes Figuras presentan grficas que son una muestra de diferentes experimentos de
modelado realizados con xito. La Figura 8-11, muestra el ejemplo de una modelacin con un
ajuste a la serie original muy cercano al ptimo. La Figura 8-12, presenta un modelo en el cul
para los primeros puntos de la serie se logra reproducir la dinmica de la misma, pero debido
a su dinmica catica, posteriormente el modelo no logra ajustarse a la serie en forma ptima.
La Figura 8-13, muestra un modelo que aunque no puede realizar un ajuste fino a la dinmica
de la serie, es capaz de modelar la tendencia dominante de la serie de tiempo. Por ltimo, la
Figura 8-14 muestra el caso en el cual el modelo reproduce la tendencia de la serie pero falla
en ajustarse a la amplitud de la misma.
La Figura 8-15, presenta la tabla Matriz de Modelado de las series de tiempo con las dife
rentes tcnicas evaluadas. En esta matriz, como en la correspondiente a tcnicas de prediccin,
se codifica con los valores de: 1 = Modelado, 0 = NoModelado, los resultados de la totalidad
de los experimentos realizados para evaluar al conjunto de tcnicas. La primera caracterstica
sobre las tcnicas de modelado es que el nmero de xitos de varias de ellas, sobrepasa al nmero
de xitos del mejor predictor, lo que indica la diferencia en la dificultad de resolver un problema
de prediccin y uno de modelado. Por ejemplo, dos series que no fueron predichas con xito son
D1 y Brownian Motion, las cuales lograron ser modeladas por varias de las tcnicas; tambin
algunas series predichas por solo una tcnica de prediccin como son las series Ikeda y Star,
lograron ser modeladas por un mayor nmero de tcnicas.
Se observa que no hay una tcnica de modelado que presente una superioridad clara con
respecto a las dems para modelar a las series de tiempo, las dos tcnicas con mayores xitos son
RNAP (23 xitos) y Sugimay (22 xitos), seguidas por las tcnicas ANFIS (20 xitos) y ARMA
(19 xitos). Las tcnicas RNAP y ANFIS estn construidas en base a algoritmos hbridos
y su origen es la Inteligencia Artificial, la tcnica Sugimay se basa en la Teora de Sistemas
Dinmicos No Lineales y la Tcnica ARMA se basa en Estadstica. Tambin se observa que las
137
Figura 8-10: Grfica de superficie del error MAE para la prediccin de series de tiempo
138
M
A
E
1 2
3 4
5 6
7 8
9 10
11 12
13 14
15 16
17 18
19 20
21 22
Serie de Tiem
po
23 24
25 26
27 28
29
M
AETcnicasdeP
rediccin
C1
C
4
C7
Predictor
C10
0-1
1-2
2-3
3-4
4-5
5-6
6-7
Original
Modelado
2
x (n)
-1
-2
910
10
920
20
930
30
940
40
950
50
Original
Modelado
1.0
0.8
x (n)
0.6
0.4
0.2
0.0
910
920
930
940
950
139
Original
Modelado
0.6
0.4
x (n)
0.2
0.0
-0.2
-0.4
10
20
30
40
50
Original
2.0
Modelado
1.8
1.6
1.4
1.2
x (n)
1.0
0.8
0.6
0.4
0.2
0.0
10
20
30
40
50
140
tcnicas cuyo origen es la Teora de Sistemas Dinmicos No Lineales son las de menor capacidad
de modelado de las series de tiempo: Predict, Polynom y rbf. En general, las tcnicas basadas
en Inteligencia Artificial poseen una capacidad de modelado superior, siendo las que aplican
mtodos hbridos las mejores de todas.
La evaluacin del error de modelado genero tres Matrices de Error de Modelado, las cuales
no solo permiten el anlisis de la propagacin del error del modelado para cada una de las
tcnicas, sino tambin utilizar esta informacin para construir una mtrica para cuantificar la
capacidad de modelado de las mismas.
Nuevamente se presentan las grficas de superficie para las matrices de errores RMSE, BE
y MAE correspondientes al modelado de las series de tiempo. La Figura 8-16, muestra que
el comportamiento del error RMSE presenta en general valores pequeos (i.e. hay buenos
uno, la tcnica a pesar de tener capacidad de modelar gran nmero de series de tiempo, presenta
un rendimiento deficiente para el aprendizaje de la dinmica de las series de tiempo, lo que se
refleja en el ajuste de los modelos a las series, esto corrobora lo observado en la tabla de la
Figura 8-15, que muestra el bajo rendimiento de las tcnicas derivadas de Teora de Sistemas
Dinmicos No Lineales para modelar series de tiempo. Si se excluye la tcnica Sugimay para
el clculo del promedio del error RMSE, se obtiene hRMSEj ik = 0.0830 que es un valor ms
representativo del comportamiento del error RMSE para las tcnicas de modelado. En forma
similar al caso de las tcnicas de prediccin, el comportamiento del error es independiente de
la capacidad de cada tcnica para modelar a las series de tiempo.
La Figura 8-17, muestra el comportamiento del error BE para el caso de modelado de series
de tiempo, los casos extremos corresponden a la tcnica Sugimay que muestra el subaprendizaje
de la tcnica, lo cual deteriora su capacidad de modelar a las series de tiempo de forma adecuada.
Para el resto de las tcnicas se observa que el error BE es cercano a cero, lo cul indica un ajuste
ptimo de los modelos a las series de tiempo, el promedio del error BE para todo el conjunto de
tcnicas es hBEj ik = 0.0567, que muestra que hubo una ligera tendencia al subaprendizaje
por parte de la mayora de los modelos, sin embargo la magnitud de este promedio es dominada
por la tcnica Sugimay, por lo cual no se considera un valor confiable, si se excluye a dicha
141
142
Sine
Vanderpol
Qperiodic2
Qperiodic3
MackeyGlass
Logistic
Lorenz
Rossler
Ikeda
Henon
Cantor
Tent
A1
D1
Laser
Dow Jones
Kobe
EEG
ASCIITXT
El nio
HIV DNA
Human DNA
Lovaina
Plasma
Primos
SP500
Star
Brownian
Motion
White Noise
Total de
Series
Modeladas
por cada
Tcnica
Serie de
Tiempo
1
1
1
1
0
1
0
0
1
1
0
0
0
0
0
0
0
0
1
0
0
0
1
1
0
14
1
1
1
1
0
1
0
0
1
1
0
1
0
1
0
0
0
0
1
0
0
0
1
1
0
16
FFNBP
1
1
1
1
RBFNBP
1
1
1
1
ANFIS
20
1
1
1
1
0
0
1
1
1
1
1
1
0
0
1
0
1
1
0
0
0
1
1
1
1
1
Hibridos
RNAP
23
1
1
1
1
1
0
1
1
1
1
1
1
1
0
1
0
1
1
1
0
0
1
1
1
1
1
Predict
9
0
1
1
0
0
0
0
1
0
1
1
0
0
0
0
0
1
0
0
0
0
0
1
1
0
0
Polynom
5
1
0
0
0
0
0
1
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
1
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
0
rbf
Tcnica de modelado
Teoria de Sistemas Dinmicos No Lineales
22
1
1
1
0
1
0
1
1
1
1
1
1
1
0
1
0
1
1
1
0
0
1
1
1
1
1
Sugimay
Inteligencia Artificial
19
0
1
1
0
0
0
1
1
0
1
1
1
1
0
1
0
1
1
1
0
0
1
1
1
1
1
6
7
7
2
4
0
6
7
5
7
6
4
4
0
4
0
5
6
3
0
0
6
9
9
7
6
Total de
Estadstica Tcnicas que
Modelan a
cada Serie
de Tiempo
ARMA
Figura 8-16: Grfica de superficie del error RMSE para el modelado de series de tiempo
143
RMSE
1 2
3 4
5 6
7 8
9 10
11 12
13 14
15 16
17 18
19 20
21 22
23 24
25 26
SeriedeTiem
po
27 28
29
C1
C4
C7
Modelo
0-1
1-2
2-3
3-4
4-5
5-6
tcnica se obtiene un valor promedio de hBEj ik = 0.0015. En forma similar al caso de las
siendo su resultado hMAEj ik = 0.1497. En general, para el resto de las tcnicas el error
lo cual indica que el error local de los modelos no crece en forma apreciable para un intervalo
de modelado de N = 50 unidades. Finalmente, como en el caso de las tcnicas de prediccin,
el comportamiento del error se observa es independiente de la capacidad de cada tcnica para
modelar a las series de tiempo.
8.4
Discusin
En este captulo se present una metodologa para la evaluacin y comparacin de dos conjuntos
de tcnicas que representan respectivamente, diferentes modelos para la prediccin y para el
modelado de series de tiempo. Esta metodologa genera un conjunto de matrices de datos que
junto con los matrices correspondientes a la caracterizacin de las series de tiempo (ver captulo
7), proporcionan informacin til para el desarrollo de mtricas de capacidad de prediccin (o
modelado) y para el estudio de la predictibilidad de las series de tiempo.
Para el caso de las tcnicas de prediccin (predictores), se encuentra que las mejores tcnicas
corresponden a aquellas cuyo origen es la Teora de Sistemas Dinmicas No Lineales y que se
basan en la construccin de modelos locales en el espacio fase. La magnitud del error de
prediccin RMSE es pequeo y cercano a cero, como una medida de carcter global, muestra
que los modelos de prediccin son buenos. Por su parte el error BE, muestra que los modelos
se ajustan casi en forma ptima a la dinmica de las series, y en promedio hay una tendencia
de las tcnicas al subaprendizaje. Por ltimo, el error MAE como medida del comportamiento
del error local de prediccin, muestra que este no crece en forma apreciable para el conjunto
144
Figura 8-17: Grfica de superficie del error BE para el modelado de series de tiempo
145
BE
-4
-3.5
-3
-2.5
-2
-1.5
-1
-0.5
0.5
1 2
3 4
5 6
7 8
9 10
11 12
13 14
15 16
17 18
19 20
21 22
23 24
25 26
Serie de Tiempo
27 28
29
BE Tcnicas de Modelado
C1
C4
C7
Modelo
-4--3.5
-3.5--3
-3--2.5
-2.5--2
-2--1.5
-1.5--1
-1--0.5
-0.5-0
0-0.5
Figura 8-18: Grfica de superficie del error MAE para el modelado de series de tiempo
146
MAE
0.5
1.5
2.5
3.5
4.5
1 2
3 4
5 6
7 8
9 10
11 12
13 14
15 16
17 18
19 20
21 22
23 24
25 26
Serie de Tiempo
27 28
29
MAETcnicas de Modelado
C1
C4
C7
Modelo
0-0.5
0.5-1
1-1.5
1.5-2
2-2.5
2.5-3
3-3.5
3.5-4
4-4.5
4.5-5
147
148
Captulo 9
Mtricas de la Predictibilidad de
Series de Tiempo y Coeficientes de
Capacidad para Prediccin y
Modelado
9.1
Introduccin
Existen pocos trabajos en los cuales se realice un anlisis para caracterizar la predictibilidad
(o equivalentemente la dificultad de prediccin) de una serie de tiempo. En el captulo 3, se
present un panorama del estado del arte en el estudio de la predictibilidad de series de tiempo.
Se encontr que entre los trabajos reportados, varios de ellos utilizan al exponente de Lyapunov
como el parmetro que ms se identifica con la predictibilidad de series de tiempo [3, 84, 118,
119, 120, 121, 122, 123, 124]. Sin embargo, el considerar un solo parmetro para medir la
predictibilidad como el exponente de Lyapunov o la Entropa de Informacin de Shannon, no
proporciona informacin suficiente sobre la dinmica de las series de tiempo para determinar
adecuadamente la predictibilidad.
En este captulo se desarrollan una serie de mtricas para medir la dificultad de prediccin
de las series de tiempo y en consecuencia su predictibilidad, en base a un conjunto finito de
149
parmetros ortogonales que caracterizan a las series de tiempo. Dichos parmetros tienen
diferentes bases tericas: Estadstica, Anlisis de Fourier, Anlisis SSA, Teora de Sistemas
de Dinmicos No Lineales y Anlisis de Gramticas. La seccin 9.2, presenta el desarrollo de
diferentes mtricas de predictibilidad de series de tiempo. En la seccin 9.3, se presenta un
anlisis comparativo entre las diferentes mtricas desarrolladas. En la seccin 9.4, se presenta
el desarrollo de coeficientes de capacidad de prediccin y de modelado para la evaluacin en
forma cuantitativa de las tcnicas (i. e. los modelos) para predecir o modelar series de tiempo.
Finalmente, en la seccin 9.5 se discuten los resultados presentados a lo largo del captulo.
9.2
9.2.1
Para el desarrollo de una mtrica de predictibilidad de las series de tiempo, primero es necesario
identificar a aquellos parmetros que en base a su definicin, se sabe que proporcionan informacin relevante sobre las caractersticas de la dinmica de la serie de tiempo. El segundo paso,
es verificar si los parmetros seleccionados son ortogonales entre s, como se mencion en la
seccin 7.3, la ortogonalidad asegura que cada uno de los parmetros proporcionan informacin
diferente (i.e. complementaria) sobre las series de tiempo. Mediante un anlisis de correlacin
bivariada es posible identificar el grado de ortogonalidad (i.e. independencia) de los parmetros.
En el captulo 7, se describieron las tablas de datos correspondientes a los diferentes anlisis
realizados al conjunto de series de tiempo bajo estudio. Las tablas de datos que corresponden
a parmetros estadsticos caracterizan la distribucin estadstica de los datos de las serie de
tiempo. Analizando las definiciones de estos parmetros, se encuentra que los parmetros son
de tipo esttico, es decir, no proporcionan informacin sobre la dinmica de la serie de tiempo y
en consecuencia no son tiles para cuantificar la predictibilidad de una serie de tiempo, aunque
son tiles en la construccin de modelos de prediccin de origen estadstico (ver tablas en las
Figuras 7-17 y 7-18).
Para complementar lo anterior, las Figuras 9-1 y 9-2 presentan tablas del anlisis de co
rrelacin bivariada de los parmetros estadsticos con respecto al nmero de predicciones exitosas (NumPred) para cada serie de tiempo y tambin con respecto al nmero de modelaciones
150
151
Correlacin Bivariada
Parmetros
Estadsticos
Rango de Datos
0.117
Resolucin
Desviacin
Promedio
Desviacin
Estandar
Skewness
Kurtosis
-0.09
0.163
0.162
0.068
-0.11
Moda (Mxima
Probabilidad)
-0.003
Correlacin de
Pearson
(Autocorrelacin)
0.281
Tiempo de
Correlacin
0.078
Valor Promedio
0.123
Valor Medio
0.094
Valor Mnimo
-0.095
Valor Mximo
0.133
Cuartil Mnimo
0.014
Cuartil Mximo
0.186
Figura 9-1: Tabla de correlacin bivariada de los parmetros estadsticos respecto a la prediccin
de series de tiempo
152
Correlacin Bivariada
Parmetros
Estadsticos
Rango de Datos
0.204
Resolucin
Desviacin
Promedio
Desviacin
Estandar
Skewness
Kurtosis
-0.164
0.268
0.259
0.034
-0.164
Moda (Mxima
Probabilidad)
0.027
Correlacin de
Pearson
(Autocorrelacin)
0.583
Tiempo de
Correlacin
0.16
Valor Promedio
0.098
Valor Medio
0.074
Valor Mnimo
-0.199
Valor Mximo
0.19
Cuartil Mnimo
-0.078
Cuartil Mximo
0.234
Figura 9-2: Tabla de correlacin bivariada de los parmetros estadsticos respecto al modelado
de series de tiempo
153
Parmetro
de Serie de Abreviatura
Tiempo
Correlacin
de Pearson
ACO
(Autocorrelac
in)
Exponente
EH
de Hurst
Frecuencia
FD
Dominante
Exponente
EL
de Lyapunov
Dimensin
de
DCO
Correlacin
Dimensin
de
DCA
Capacidad
Dimension
DF
Fractal
Dimensin
DE
Embebida
Entropa
Espacio
EET
Temporal
(%)
Recurrencia
REC
(%)
Determinism
DET
o (%)
Entropa de
Informacin
ES
(Shannon)
Informacin
Mutua
IMP
Promedio
Complejidad
CRLZ
Relativa LZ
Nmero de
Reglas de
RP
Produccin
154
La Figura 9-4, muestra la tabla de los resultados del anlisis de correlacin para el conjunto
de parmetros seleccionados para caracterizar la predictibilidad de las series de tiempo.
Parmetros
ACO
EH
FD
EL
DCO
DCA
DF
DE
EET
REC
DET
ES
IMP
CRLZ
RP
ACO
1
0.728
-0.471
-0.161
-0.205
0.148
-0.085
0.324
-0.533
0.244
0.718
0.548
0.299
-0.577
0.245
1
-0.01
0.107
0.337
-0.041
-0.443
0.268
-0.143
-0.237
-0.011
-0.243
0.175
-0.008
1
-0.306
-0.174
-0.127
-0.03
0.458
-0.241
-0.529
-0.338
-0.264
0.506
0.426
1
0.098
-0.115
0.173
0.059
-0.211
-0.145
-0.182
-0.301
0.306
-0.154
1
0.172
0.016
-0.011
-0.062
0.299
0.328
0.051
-0.227
0.091
1
0.065
0.117
-0.078
-0.176
-0.152
0.068
-0.013
0.145
1
-0.08
0.282
0.216
0.181
0.173
0.046
0.235
1
-0.189
-0.695
-0.414
-0.536
0.718
0.45
1
0.381
0.485
0.441
-0.17
0.01
ES
IMP CRLZ RP
1
0.718 1
0.527 0.358 1
-0.834 -0.6 -0.586 1
-0.184 -0.14 -0.055 0.335 1
Figura 9-4: Tabla de correlacin bivariada del conjunto de parmetros de las mtricas de predictibilidad
Entre los parmetros se observa que algunos presentan una fuerte correlacin por ejemplo,
el Determinismo y la Complejidad Relativa LZ que poseen una correlacin inversa entre s, o
el Exponente de Hurst y la Auto Correlacin que poseen una correlacin directa entre s. En
el caso de los parmetros cuya correlacin es dbil, esto es indicativo de su mayor ortogona
lidad con respecto a los dems parmetros. En general, ninguno de los parmetros posee una
correlacin (o dependencia) significativa con todo el conjunto de parmetros. Cada uno proporciona informacin diferente sobre la dinmica de las series de tiempo, por lo cul, se considera
importante el combinarlos para cuantificar la predictibilidad de las series de tiempo.
Una vez definido el conjunto de parmetros para caracterizar la predictibilidad de series de
tiempo, a continuacin se describe el desarrollo de las mtricas de predictibilidad propuestas
en este trabajo.
155
9.2.2
CCOP (STi ) = F Di + EHi + ELi + DCOi + DCAi + EETi + RECi + DETi + ESi + RPi (9.1)
156
157
La Figura 9-6, muestra la tabla para los valores discretizados de los parmetros calculados
y el correspondiente CCOP para el conjunto de series de tiempo.
Este coeficiente, como primera propuesta de una mtrica de predictibilidad, permiti verificar en forma experimental la idea de utilizar un conjunto de parmetros de diversos orgenes
para cuantificar la predictibilidad de series de tiempo. Sin embargo, posee dos desventajas:
La discretizacin de los parmetros genera perdida de informacin en relacin con las
series.
Los intervalos de discretizacin de los parmetros dependen del conjunto de series de
tiempo, si este conjunto crece o disminuye, los intervalos deben de ser recalculados y
los valores del CCOP para cada serie ajustarse, lo cul hace que el coeficiente no sea
invariante.
9.2.3
En la seccin anterior, se ha desarrollado una primera mtrica que unifica y expresa cuantitativamente por medio de un coeficiente, a un conjunto de parmetros que caracterizan a las series
de tiempo y que permiten cuantificar la dificultad de prediccin de las mismas. Sin embargo,
este coeficiente posee dos desventajas: perdida de informacin y que no es invariante. Para
resolver estas desventajas se diseo una nueva mtrica que se denomina Coeficiente de Dificultad de Prediccin 1 (CDP1 ), para construir esta mtrica se parte de un conjunto de nueve
parmetros ortogonales, adems de los siguientes criterios:
El conjunto de parmetros ortogonales una vez definido es cerrado, es decir, no puede
aumentar o disminuir.
No se discretiza a los parmetros, con lo cul no se pierde informacin sobre las series de
tiempo y se logra que el coeficiente sea invariante.
Cada parmetro posee el mismo peso en la construccin del coeficiente.
Hay dos tipos de relaciones en los parmetros: Una relacin directa, es decir a mayor
valor de un parmetro es mayor la dificultad de prediccin de la serie de tiempo; o a
158
159
Qperiodic3
0
1
0
0
0
0
0
0
Rossler
Ikeda
Henon
Cantor
Tent
A1
0
0
1
1
0
0
0
0
0
DowJones
Kobe
EEG
ASCIITXT
El nio
0
0
0
Primos
SP500
WhiteNoise
Motion
0
Plasma
Star
Lovaina
0
0
HIVDNA
HumanDNA
0
0
D1
Laser
0
0
Lorenz
Brownian
Exponente
Dominante deLyapunov
Frecuencia
Logistic
Glass
Qperiodic2
Mackey-
0
1
Sine
de Hurst
Tiempo
Vanderpol
Exponente
Seriede
(Shannon)
Temporal
Capacidad
Correlacin
Espacio
de
de
Entropade
Entropa
Dimensin
Dimensin
Produccin
Reglas de
Nmero de
21
16
18
18
20
18
16
13
18
20
20
19
15
11
16
19
17
15
20
19
18
14
13
18
17
14
13
12
12
(CCOP)
de Prediccin
Complejidad
Coeficiente de
(9.2)
Parmetro
Origen
Exponente de Lyapunov
No Lineal
Exponente de Hurst
Estadstica
Dimensin de Capacidad
No Lineal
Dimensin de Correlacin
No Lineal
No Lineal
Entropa de Shannon
Informacional
Porcentaje de Determinismo
No Lineal
Porcentaje de Recurrencia
No Lineal
Reglas de Produccin
Computacional
160
(9.3)
Parmetro
Abreviatura
Unidades
Exponente de Lyapunov
EL
Exponente de Hurst
EH
[bit]
[tiempo]
[desplazamiento]
[tiempo]
Dimensin de Capacidad
DCA
[adimensional]
Dimensin de Correlacin
DCO
[adimensional]
EET
[adimensional]
Entropa de Shannon
ES
[bit]
Porcentaje de Determinismo
DET
[adimensional]
Porcentaje de Recurrencia
REC
[adimensional]
Reglas de Produccin
RP
[reglas]
(9.4)
Parmetro
Unidad Adimensionada
Exponente de Lyapunov
[bit] [tiempo]
[tiempo] [bit]
Entropa de Shannon
1
[bit] [bit]
Exponente de Hurst
[tiempo]
[desplazamiento]
[tiempo]
[desplazamiento]
Reglas de Produccin
1
[reglas] [reglas]
parmetros que indican la facilidad para predecir la serie de tiempo (relacin inversa),
dichas propiedades son: Exponente de Hurst, Entropa de Shannon, Porcentaje de Determinismo y Porcentaje de Recurrencia. La tabla 9.5 muestra la tendencia de los parmetros
respecto de la dificultad de prediccin.
(9.5)
Parmetro
Abreviatura
Tendencia
Exponente de Lyapunov
EL
Directa
Exponente de Hurst
EH
Inversa
Dimensin de Capacidad
DCA
Directa
Dimensin de Correlacin
DCO
Directa
EET
Directa
Entropa de Shannon
ES
Inversa
Porcentaje de Determinismo
DET
Inversa
Porcentaje de Recurrencia
REC
Inversa
Reglas de Produccin
RP
Directa
Los valores de los parmetros son tomados en su forma original con la excepcin del
parmetro exponente de Hurst, el cual por presentar tanto valores positivos como negativos
o cero, para considerarlo en la mtrica se transformo mediante la siguiente expresin:
EH = |EH 0.5|
(9.6)
El cociente que se obtiene con los parmetros de las series de tiempo es de la forma:
EL + DCA + DCO + EET + RP
EH + ES + DET + REC
(9.7)
(CDP1 ) es:
CDP1 = Log10
+1
(9.8)
P redictibilidad =
1
CDP1
(9.9)
9.2.4
La mtrica anterior consista de 9 parmetros de las series de tiempo, los cuales fueron seleccionados por caracterizar diferentes aspectos de la dificultad de prediccin (y por ende de la
predictibilidad) de una serie de tiempo, sin embargo, queda la pregunta de si estos parmetros
son suficientes para cuantificar la predictibilidad de una serie de tiempo, por ello, se desarrollo
una segunda mtrica la cual en su forma funcional es idntica a la anterior pero a la cual se
le incorporaron parmetros adicionales de las series de tiempo que tambin son indicadores de
la dificultad de prediccin, estos parmetros son: la Dimensin Embebida (DE ), la Dimensin Fractal (DF ), la Informacin Mutua Promedio (IMP), la Auto Correlacin (ACO) y la
Complejidad Relativa LZ (CRLZ ). La tabla 9.10 muestra el origen de estos parmetros,
(9.10)
Parmetro
Origen
Dimensin Embebida
No Lineal
Dimensin Fractal
No Lineal
Informacional
Autocorrelacin
Estadstica
Complejidad Relativa LZ
Computacional
163
Serie de
Tiempo
Sine
Vanderpol
Qperiodic2
Qperiodic3
MackeyGlass
Logistic
Lorenz
Rossler
Ikeda
Henon
Cantor
Tent
A1
D1
Laser
Dow Jones
Kobe
EEG
ASCIITXT
El nio
HIV DNA
Human DNA
Lovaina
Plasma
Primos
SP500
Star
Brownian
Motion
White Noise
Coeficiente de
Dificultad de
Predictibilidad
Prediccin con 9
(1/CDP1)
parmetros (CDP1)
0.512997545
0.604397824
0.799020327
1.131340574
1.949327066
1.654539378
1.251532615
0.88390713
1.522174611
0.656954855
2.148616946
0.974519472
0.888900691
3.076784726
2.068058885
2.782220495
1.276447623
1.122688313
1.32138263
1.136091261
0.529138344
1.180443197
2.722554831
1.989644041
1.502251915
0.658902795
0.611454124
1.223627448
2.489831953
2.133683262
1.789566214
1.679878416
0.465415672
1.026146762
1.124985063
0.325014614
0.483545225
0.359425143
0.783424233
0.890719168
0.756783067
0.880210978
1.889864932
0.847139449
0.367302061
0.502602465
0.665667316
1.517674546
1.63544567
0.81724221
0.401633531
0.468673124
0.558794635
0.595281177
1.042379904
0.95934313
3.497587263
0.28591138
Figura 9-7: Tabla de resultados sobre la predictibilidad en series de tiempo con la mtrica CDP1
164
(9.11)
Parmetro
Abreviatura
Unidades
Dimensin Embebida
DE
[adimensional]
Dimensin Fractal
DF
[nmero de estados]
[volmen]
IMP
[bit]
Autocorrelacin
ACO
[adimensional]
Complejidad Relativa LZ
CRLZ
[nmero de subcadenas]
Para eliminar las dimensiones y que las unidades sean adimensionales se realizo como en el
caso de la mtrica CDP1 , un anlisis dimensional (ver tabla 9.12).
(9.12)
Parmetro
Unidad Adimensionada
Dimensin Fractal
[volmen]
[nmero de estados]
[volmen]
[nmero de estados]
1
[bit] [bit]
Complejidad Relativa LZ
(9.13)
Propiedad
Abreviatura
Tendencia
Dimensin Embebida
DE
Directa
Dimensin Fractal
DF
Directa
IMP
Inversa
Autocorrelacin
ACO
Inversa
Complejidad Relativa LZ
CRLZ
Directa
CDP2 = Log10
+1
(9.14)
P redictibilidad =
1
CDP2
(9.15)
9.3
En esta seccin se presentan los resultados de comparar las tres mtricas desarrolladas con
la mtrica denominada ndice de Dificultad de Modelado (IDM) [162], y con un conjunto de
parmetros (Exponente de Lyapunov, Entropa de Informacin de Shannon, Coeficiente de
Complejidad Relativa LZ y Nmero de Reglas de Produccin) representativos de caractersticas
con diferentes orgenes (No Lineal, Informacional y Computacional) sobre la series de tiempo. El
Exponente de Lyapunov es ampliamente usado como una medida de predictibilidad de las series
de tiempo [3, 84, 118, 119, 120, 121, 122, 123, 124]. Por su parte, la Entropa de Informacin
de Shannon es usada para determinar la cantidad de informacin en un mensaje (o seal) en
telecomunicaciones [138, 145]. En cuanto al Coeficiente de Complejidad Relativa LZ, es una
medida de complejidad algortmica de una cadena de datos [126, 146]. Por ltimo, el Nmero
de Reglas de Produccin es una medida de complejidad computacional que ha sido utilizada en
la determinacin de la predictibilidad de las series de tiempo [9, 10]. El conjunto de parmetros
ha sido descrito con detalle en el captulo 4, a continuacin se describe la mtrica ndice de
Dificultad de Modelado.
9.3.1
Para la construccin de esta mtrica se utilizaron tres parmetros de las series de tiempo:
Exponente de Lyapunov (EL) cuyo origen es la Teora de Sistemas Dinmicos No Lineales,
166
Serie de
Tiempo
Sine
Vanderpol
Qperiodic2
Qperiodic3
MackeyGlass
Logistic
Lorenz
Rossler
Ikeda
Henon
Cantor
Tent
A1
D1
Laser
Dow Jones
Kobe
EEG
ASCIITXT
El nio
HIV DNA
Human DNA
Lovaina
Plasma
Primos
SP500
Star
Brownian
Motion
White Noise
Coeficiente de
Dificultad de
Prediccin con 14
parmetros (CDP2)
Predictibilidad
(1/CDP2)
0.536188191
0.604585119
0.789694626
1.125352046
1.86501683
1.654026816
1.266312277
0.888610816
1.502452625
0.665578391
1.87158717
0.941044521
0.852835387
2.273844247
1.662901586
2.658143428
1.175060008
1.125337164
1.29667964
1.163525516
0.558037204
1.193006503
2.242075478
1.939832694
1.460186187
0.809846705
0.638748604
1.195510181
2.314944118
2.04697427
1.769062943
1.550244553
0.534305864
1.062648979
1.172559224
0.43978386
0.601358498
0.376202424
0.851020368
0.888622568
0.77120051
0.859456872
1.791995215
0.838218398
0.446015315
0.515508375
0.684844172
1.234801592
1.565561151
0.836462973
0.43197587
0.488525926
0.565271012
0.645059515
0.966610896
1.034542446
3.055508184
0.327277801
Figura 9-8: Tabla de resultados sobre la predictibilidad en series de tiempo con la mtrica CDP2
167
IEL =
ELi
ELmax
(9.16)
IES =
ESmin + 1
ESi + 1
(9.17)
IRP =
RPi
RPmax
(9.18)
(9.19)
La Figura 9-9, muestra la tabla de los valores calculados del IDM para las series de tiempo
analizadas en esta tesis.
168
Serie de
Tiempo
ndice de Dificultad
de Modelado (IDM)
Sine
Vanderpol
Qperiodic2
Qperiodic3
MackeyGlass
Logistic
Lorenz
Rossler
Ikeda
Henon
Cantor
Tent
A1
D1
Laser
Dow Jones
Kobe
EEG
ASCIITXT
El nio
HIV DNA
Human DNA
Lovaina
Plasma
Primos
SP500
Star
Brownian
Motion
White Noise
0.599
0.8
1.176
1.256
1.945
1.768
0.969
1.263
2.033
2.139
2.791
0.453
1.031
1.775
1.145
0.873
1.271
2.11
1.673
1.538
0.603
0.737
1.184
1.849
1.396
1.803
1.806
1.558
2.082
169
9.3.2
La Figura 9-10, presenta la tabla de resultados de las mtricas desarrolladas en este trabajo,
la mtrica IDM y el conjunto de parmetros seleccionados, adems de dos variables corres
pondientes a: el nmero de predicciones para cada serie de tiempo (NumPred) y el nmero
de modelaciones para cada serie de tiempo (NumMod). Estas dos variables se consideran la
referencia contra la que se comparan las mtricas y los parmetros evaluados.
A partir de la tabla que se muestra en la Figura 9-10, se observa que el comportamiento de
las mtricas y parmetros para medir la predictibilidad de las series de tiempo, es de carcter
no lineal respecto del nmero de xitos para prediccin y modelado de cada serie de tiempo
[10]. Para ilustrar lo anterior, se presenta a continuacin en la Figura 9-11, la grfica de la
predictibilidad correspondiente a la mtrica CDP2 versus el nmero de predicciones exitosas
para cada serie de tiempo (NumPred). Adems de la no linealidad observada es importante
notar la dispersin de los puntos en la grfica en especial en el caso de cero predicciones, en el
cual se observa una acumulacin de series con predictibilidad alta pero que no fueron predichas
exitosamente, a priori lo nico que se puede decir es que no se tuvo xito en la bsqueda del
modelo capaz de predecir la serie de tiempo, pero dicho modelo existe aunque no fue localizado,
hay que recordar que los teoremas de No Free Lunch imponen lmites sobre la habilidad para la
bsqueda de la solucin ptima de un problema [55, 56], y la grfica muestra de forma indirecta
esta limitacin. Se espera que al continuar desarrollando en el futuro ms estudios sistemticos
con nuevos modelos de prediccin y series de tiempo, el comportamiento de la mtrica de
predictibilidad se defina mejor al ajustarse la distribucin de resultados conforme crezca la
coleccin de datos experimentales.
Las mtricas de predictibilidad tambin muestran que el tipo de comportamiento dinmico
de las series establecido con la siguiente clasificacin: peridico o regular, cuasi peridico,
catico, complejo y aleatorio o estocstico; no esta relacionado de forma directa (o lineal )
con la predictibilidad de las series de tiempo. Por ejemplo, una serie de tiempo que tenga un
comportamiento de tipo catico o complejo puede tener una predictibilidad alta (por ejemplo:
Rossler o Dow Jones) comparable con la de series cuyo comportamiento sea ms simple como
las de tipo peridico (series Sine y Vanderpol), como se observa en la tabla de la Figura 9-12.
La Figura 9-13, muestra en orden ascendente los valores normalizados (con valor mximo
170
Figure 9-10: Tabla comparativa de las diferentes mtricas de predictibilidad de series de tiempo
171
Sine
Vanderpol
Qperiodic2
Qperiodic3
MackeyGlass
Logistic
Lorenz
Rossler
Ikeda
Henon
Cantor
Tent
A1
D1
Laser
Dow Jones
Kobe
EEG
ASCIITXT
El nio
HIV DNA
Human DNA
Lovaina
Plasma
Primos
SP500
Star
Brownian
Motion
White Noise
Serie de
Tiempo
2.14861695
0.97451947
0.88890069
3.07678473
2.06805889
2.7822205
1.27644762
1.12268831
1.32138263
1.13609126
0.52913834
1.1804432
2.72255483
1.98964404
1.50225192
0.6589028
0.61145412
1.22362745
2.48983195
2.13368326
1.78956621
1.67987842
1.0423799
3.49758726 3.05550818
18
13
14
18
19
20
15
17
19
16
11
15
19
20
20
18
13
16
18
20
18
18
16
21
0.9666109
1.87158717
0.94104452
0.85283539
2.27384425
1.66290159
2.65814343
1.17506001
1.12533716
1.29667964
1.16352552
0.5580372
1.1930065
2.24207548
1.93983269
1.46018619
0.80984671
0.6387486
1.19551018
2.31494412
2.04697427
1.76906294
1.55024455
1.52217461 1.50245263
2.082
1.558
1.768
0.969
1.263
2.033
2.139
2.791
0.453
1.031
1.775
1.145
0.873
1.271
2.11
1.673
1.538
0.603
0.737
1.184
1.849
1.396
1.803
1.806
1.945
1.606
2.043
0.76
0.601
1.049
1.452
2.301
5.728
0.477
0.2234006
1.288
0.949
0.144
1.102
1.199
2.709
2.322
0
0.322
1.0693
3.383
0.594
3.569
3.289
1.481
0.4783576
2.74038235
1.066339
0.1694183
0.03522222 0.7175364
4.78931065 0.1793841
2.45897942 0.1694183
0
0.787297
0.0204499
0.6378102
0
1.056373
3.401
0.03986314
7.02
0.2890078
0.8521749
0.229213
2.93549693 0.3786998
6.43519134 0.1993157
3.74401017
0.787297
0
0.7773312
2.107
1.036442
3.526
0.2092815
1
0.8072285
7.28
0.04982892
5.574
0.3089393
2.866
0.9766468
1.295
0.9766468
2.585
1.036442
3.102
0.5879813
0.15914973
73
85
61
63
72
71
69
72
13
79
92
66
65
79
82
80
83
9
51
77
91
78
82
90
75
4
6
6
1
5
0
8
8
0
8
5
3
2
0
3
0
6
3
2
0
0
1
6
7
7
2
4
0
6
7
5
7
6
4
4
0
4
0
5
6
3
0
0
6
Coeficiente
Total de
Total de
de Dificultad
Nmero de Tcnicas que Tcnicas que
ndice de
Entropa de
Complejidad
Exponente
de
Predicen a
Modelan a
Informacin
Reglas de
Dificultad de
de Lyapunov
Relativa LZ
Prediccin
Produccin cada Serie cada Serie
de Shannon
Modelado
(CRLZ)
(EL)
con 14
(RP)
de Tiempo de Tiempo
(IDM)
(ES)
parmetros
(NumPred) (NumMod)
(CDP2)
0.53618819
0.599
0.517
3.7118
0.05979471
27
10
9
0.60458512
0.8
1.864
4.981
0.07972627
28
8
9
0.78969463
1.176
0.925
2.445885
0.1494868
66
4
7
1.12535205
1.256
1.383
4.232
0.4384945
75
9
6
17
Coeficiente
Coeficiente
de Dificultad
de
de
Complejidad
Prediccin
de
con 9
Prediccin
parmetros
(CCOP)
(CDP1)
12
0.51299755
12
0.60439782
13
0.79902033
14
1.13134057
Serie de Tiempo
2.0
1.8
1.6
Predictibilidad (1/CDP2)
Sine
Dow Jones
Vanderpol
Human DNA
1.4
Qperiodic2
1.2
Rossler
Lorenz
Qperiodic3
Kobe Lovaina
A1
Laser Tent
El nio
Star
Mackey-Glass
Henon
Plasma
Logistic
EEG
Ikeda
1.0
0.8
0.6
0.4
0.2
0
10
172
Coeficiente
de
Serie de
Comportamie Complejidad Predictibilida Predictibilida
Tiempo
nto Dinmico
de
d (1/CDP1)
d (1/CDP2)
Prediccin
(CCOP)
Sine
peridica
12
1.94932707 1.86501683
Vanderpol
periodica
12
1.65453938 1.65402682
cuasi
Qperiodic2
13
1.25153262 1.26631228
peridica
cuasi
Qperiodic3
14
0.88390713 0.88861082
peridica
Mackeycatica
17
0.65695486 0.66557839
Glass
Logistic
catica
18
0.46541567 0.53430586
Lorenz
catica
13
1.02614676 1.06264898
Rossler
catica
14
1.12498506 1.17255922
Ikeda
catica
18
0.32501461 0.43978386
Henon
catica
19
0.48354523 0.6013585
Cantor
caotica
20
0.35942514 0.37620242
Tent
caotica
15
0.78342423 0.85102037
A1
compleja
17
0.89071917 0.88862257
D1
compleja
19
0.75678307 0.77120051
Laser
compleja
16
0.88021098 0.85945687
Dow Jones
compleja
11
1.88986493 1.79199522
Kobe
compleja
15
0.84713945 0.8382184
EEG
compleja
19
0.36730206 0.44601532
ASCIITXT
compleja
20
0.50260247 0.51550838
El nio
compleja
20
0.66566732 0.68484417
HIV DNA
compleja
18
1.51767455 1.23480159
Human DNA
compleja
13
1.63544567 1.56556115
Lovaina
compleja
16
0.81724221 0.83646297
Plasma
compleja
18
0.40163353 0.43197587
Primos
compleja
20
0.46867312 0.48852593
SP500
compleja
18
0.55879464 0.56527101
Star
compleja
18
0.59528118 0.64505952
Brownian
estocstica
16
0.95934313 1.03454245
Motion
White Noise estocstica
21
0.28591138 0.3272778
173
Exponente de Lyapunov
1.2
EL
0.8
0.6
0.4
0.2
Cantor
SP500
Plasma
Star
ASCIITXT
Henon
El nio
Vanderpol
Brownian Motion
White Noise
Ikeda
Mackey-Glass
D1
Qperiodic3
EEG
Kobe
Lovaina
Laser
Rossler
Logistic
Qperiodic2
Lorenz
Sine
Primos
Tent
A1
Human DNA
Dow Jones
HIV DNA
Series de Tiempo
174
CRLZ
0.8
0.6
0.4
0.2
Cantor
White Noise
SP500
Primos
ASCIITXT
Plasma
Kobe
HIV DNA
EEG
Ikeda
Logistic
Star
Henon
Mackey-Glass
Laser
Qperiodic3
Lovaina
A1
D1
El nio
Dow Jones
Lorenz
Rossler
Brownian Motion
Qperiodic2
Sine
Vanderpol
Human DNA
Tent
Series de Tiempo
CDP2
0.8
0.6
0.4
0.2
Cantor
White Noise
Plasma
EEG
Ikeda
Primos
Logistic
ASCIITXT
Henon
SP500
Star
El nio
Mackey-Glass
D1
Lovaina
Tent
Kobe
A1
Laser
Qperiodic3
Lorenz
Brownian Motion
Rossler
HIV DNA
Qperiodic2
Vanderpol
Human DNA
Dow Jones
Sine
Series de Tiempo
9.3.3
La Figura 9-17, presenta la tabla del anlisis de correlacin correspondiente al conjunto de datos
sobre las diferentes mtricas (ver tabla en la Figura 9-10).
A partir del anlisis de correlacin se observa que de las mtricas desarrolladas las que
poseen una correlacin significativa con las variables de referencia NumPred y NumMod, corres
pondientes al nmero de predicciones y modelaciones exitosas para cada serie, son la mtrica
CCOP y la mtrica CDP2 . Con relacin a los parmetros individuales, se observa que el
parmetro con la mejor correlacin con respecto a las variables de referencia es la Complejidad
Relativa LZ (CRLZ ), su correlacin es adems la mejor de todo el conjunto evaluado. Por
ltimo, la mejor correlacin entre este parmetro y el resto del conjunto evaluado corresponde
a la mtrica CDP2 . Es importante hacer notar que an cuando la mejor correlacin con respecto
176
White Noise
Cantor
1.0
Plasma
Ikeda
EEG
Primos
ASCIITXT
Logistic
SP500
Henon
CDP2
0.8
0.6
Star
Mackey-Glass
El nio
D1
Lovaina
Kobe
A1
Tent
Qperiodic3
Laser
Brownian Motion
0.4
0.2
Lorenz
0.0
Rossler
HIV DNA
Qperiodic2
Human DNA
Vanderpol
Dow Jones
Sine
Mtricas
CCOP
CDP1
CDP2
IDM
EL
ES
CRLZ
RP
NUM PRED
NUM MOD
Nmero de
Parmetros
de Mtrica
CCOP
1
0.783
0.826
0.724
0.473
-0.672
0.734
0.435
-0.708
-0.728
CDP1 CDP2
IDM
1
0.984
0.821
0.502
-0.683
0.774
0.425
-0.563
-0.644
1
0.826
0.56
-0.667
0.825
0.45
-0.601
-0.7
1
0.726
-0.695
0.662
0.664
-0.603
-0.483
10
14
EL
ES
1
-0.338 1
0.506 -0.6
0.426 -0.14
-0.456 0.534
-0.406 0.481
1
CRLZ
1
0.335
1
-0.674 -0.445
-0.851 -0.185
1
1
0.758
9.4
El promedio del error raz media cuadrada (PRMSE ) para el conjunto de series predichas
por cada predictor. Para poder realizar una comparacin equitativa de este parmetro
para cada predictor se asigno el valor de 1 para cada una de las series no predichas por el
predictor. La expresin correspondiente para este parmetro es:
P RM SE =
P
N
P
X
1
1 X
RM SEi +
(1)j
P i=1
N P j=1
(9.20)
P MAE =
P
N
P
X
1
1 X
MAEi +
(1)j
P
N P
i=1
(9.21)
j=1
EP =
P
N
(9.22)
La suma de los coeficientes de dificultad de prediccin para las series predichas por el
predictor:
SCDP2 =
P
X
CDP2 (i)
(9.23)
i=1
en este caso se seleccion la mtrica CDP2 la cual contiene la mayor cantidad de informacin
sobre las series de tiempo, ya que utiliza a 14 parmetros para cuantificar la dificultad de
prediccin o equivalentemente la predictibilidad de las mismas, adicionalmente, a partir del
anlisis de las mtricas de predictibilidad (ver la seccin 9.3) resulto ser la mejor mtrica
para cuantificar est caracterstica de las series de tiempo junto con el parmetro CRLZ. El
parmetro SCDP2 proporciona informacin sobre el nivel de dificultad de las predicciones
exitosas realizadas por cada predictor.
Finalmente la expresin matemtica para el coeficiente de capacidad de prediccin es:
CCAP =
SCDP2 EP
P RMSE + P M AE
(9.24)
180
Tcnica de
Prediccin
FIRNet
PNNGauss
PNNRecipro
cal
MLFFN
MySVM
Multipunto
(kernel dot)
MySVM
Multipunto
(kernel
radial)
Polynomp
Nstep
K-NearestNeighbours
ARIMA
Coeficiente de
Capacidad de
Prediccin
(CCAP)
Nmero de
Series
Predichas
1.920439941
3.648760065
9
12
1.521040683
1.490337069
10
0.125357341
3.414282627
13
3.895233526
8.339671318
11
16
10.94043514
17
1.214445183
Coeficiente
de
Nmero de
Tcnica de
Capacidad
Series
Modelado
de Modelado Modeladas
(CCAM)
FFNBP
RBFNBP
ANFIS
RNAP
Predict
Polynom
RBF
Sugimay
ARMA
9.44867589
6.2110583
19.3456088
44.2074516
1.50673888
0.53189946
0.71278845
9.1881005
16.6776503
16
14
20
23
9
5
6
22
19
181
9.5
Discusin
182
Captulo 10
Relaciones de la Predictibilidad de
Series de Tiempo
10.1
Introduccin
10.2
En la Figura 10-1, el mapa GHSOM muestra la jerarqua de las series de tiempo en base al
conjunto de parmetros formado por: Auto Correlacin (ACO), Exponente de Hurst (EH ),
Frecuencia Dominante (FD), Exponente de Lyapunov (EL), Dimensin de Correlacin (DCO),
Dimensin de Capacidad (DCA), Dimensin Fractal (DF ), Dimensin Embebida (DE ), Entropa Espacio Temporal (EET ), Porcentaje de Recurrencia (REC ), Porcentaje de Determi
nismo (DET ), Entropa de Informacin de Shannon (ES ), Informacin Mutua Promedio (IMP),
Complejidad Relativa LZ (CRLZ ) y el Nmero de Reglas de Produccin (RP). Este conjunto
de parmetros dinmicos fueron utilizados para la construccin de las diferentes propuestas de
mtricas de predictibilidad presentadas en el captulo anterior.
Para entender mejor el mapa GHSOM anterior, la Figura 10-2, muestra el rbol de jerarquas
correspondiente a dicho mapa . Se observa que el conjunto de series de tiempo se desglosa en
cinco niveles, a partir del nivel dos se forman cuatro grupos o familias de series de tiempo
las cuales a su vez se subdividen hasta alcanzar en tres casos el nivel cuatro de profundidad.
En el grupo uno, se encuentran las series HIV DNA y Tent, en el grupo dos se agrupan las
series: Sine, Vanderpol, Dow Jones, Human DNA, Brownian Motion, Qperiodic2, Rossler y
Qperiodic3; en el grupo tres las series D1, El nio, Mackey-Glass, Lorenz, Lovaina, A1, Laser
y Kobe; finalmente en el grupo cuatro se tiene a las series Henon, Ikeda, Star, Primos, Plasma,
SP500, ASCIITXT, Logistic, EEG, Cantor y White Noise. Las series agrupadas muestran la
jerarqua de similitud entre las series dentro de cada grupo o cluster, al agruparse nuevamente
y formar niveles de mayor profundidad dentro del rbol. A cada serie se le agreg el valor de
la predictibilidad (1/CDP2 ), los grupos uno y dos corresponden a las series con predictibilidad
alta, el grupo tres a las series con predictibilidad media y por ltimo el grupo cuatro corresponde
a las series con predictibilidad baja.
184
sine
hivdna
dowjones
vanderpol
humandna
tent
qperiodic3
d1
henon
star
cantor
white
noise
lorenz
El nio
ikeda
logistic
qperiodic2
brownian
motion rossler
mackey-glass
eeg
primos
lovaina
plasma
a1
kobe
asciitxt
laser
sp500
Figura 10-1: Mapa Auto Organizado Jerrquico para las series de tiempo
185
Nivel 0
Nivel 1
Nivel 2
Nivel 3
Nivel 4
hivdna (1.23)
tent (0.85)
sine (1.86)
vanderpol (1.65)
dow jones (1.79)
humandna (1.56)
brownian motion (1.03)
qperiodic2 (1.26)
rossler (1.17)
qperiodic3 (0.88)
d1 (0.77)
el nio (0.68)
mackey-glass (0.66)
lorenz (1.06)
lovaina (0.83)
a1 (0.88)
laser (0.85)
kobe (0.83)
henon (0.60)
ikeda (0.43)
star (0.64)
primos (0.48)
plasma (0.43)
sp500 (0.56)
asciitxt (0.51)
logistic (0.53)
eeg (0.44)
cantor (0.37)
white noise (0.32)
Figura 10-2: rbol de jerarquas del agrupamiento de las series de tiempo con el Mapa Auto
Organizado
186
10.3
188
1.0
1.5
-2.0
-1.5
-1.0
-.5
0.0
.5
-2
(0.53)
kobe
Agrupamiento 2
(0.83)
(0.43)
-1
henon (0.60)
ikeda
Anlisis MDS
(0.85)
tent
Dimensin 1
(1.23)
hivdna
(0.88)
qp3
(0.85)
lovaina (0.83)
laser
d1 (0.77)
rossler
(1.65)
(1.56)
humandna
qp2
(1.26)
(1.79)
dowjones
Agrupamiento 4
Agrupamiento 5
(1.17)
vandpol
sine
(1.03)
brownian
(1.86)
(1.06)
(0.88)
a1
lorenz
Agrupamiento 3
sp500
elnio
plasma (0.56)
star
(0.68)
asciitxt (0.51)
(0.64)
(0.43) primos (0.48)
eeg (0.44)
mg
cantor
whiten
(0.32)
(0.37)
(0.66)
logistic
Agrupamiento 1
Dimensin 2
Figura 10-4: Mapa de escalamiento multidimensional con las grficas de las series de tiempo
Dimensin 2
-2.0
-1.5
-1.0
-.5
0.0
.5
-2
x(t)
0
-1
200
-2.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
2.0
400
2 00
600
4 00
800
0.0
0.2
0.4
0.6
0.8
1.0
2 00
1000
80 0
400
200
1 000
0 .2
0 .4
0 .6
0 .8
1 .0
1 .2
600
400
200
800
600
400
1 000
800
whiten
6 00
cantor
0.0
0.2
0.4
0.6
0.8
1.0
x(t)
plasma
x(t)
x(t)
-2
x(t)
sp500
10 00
0.0
0.5
1.0
1.5
2.0
2.5
3.0
600
x(t)
800
0.0
0.2
0.4
0.6
0.8
1.0
-0.8
-0.6
-0.4
-0.2
0.0
0.2
0.4
0.6
0.8
1.0
200
100 0
400
600
600
800
800
1000
1000
- 0.5
0.0
0.5
1.0
1.5
2 00
200
60 0
400
80 0
600
100 0
800
-0.5
-2.0
-1.5
-1.0
-1
ikeda
4 00
0.0
0.5
1.0
1.5
2.0
1000
2 00
400
eeg
asciitxt
primos
logistic
200
400
x(t )
0.0
0.5
2 00
400
600
80 0
1000
800
1 000
200
400
600
henon
600
-0.4
-0.3
-0.2
-0.1
0.0
0.1
0.2
0.3
star
800
1000
1.8
2.0
2.2
2.4
2.6
2.8
3.0
0.3
0.4
0.5
0.6
0.7
200
600
200
2 00
4 00
400
1000
600
600
800
1 000
mg
800
tent
0.0
0.2
0.4
0.6
0.8
1.0
1.2
1.4
400
elnio
800
1000
Agrupamiento 2
x(t)
x(t)
x(t)
-1.0
x(t)
1.0
x(t)
-0.5
x(t)
x(t)
Agrupamiento 1
0.0
0.2
0.4
0.6
0.8
1.0
1.2
-0.8
-0.6
-0.4
-0.2
0.0
0.2
0.4
200
400
6 00
600
800
2 .8
3 .0
3 .2
3 .4
3 .6
3 .8
4 .0
4 .2
4 .4
800
1 000
20 0
0.0
0.5
1.0
1.5
2.0
2.5
200
4.0
1.0
1.5
2.0
2.5
3.0
3.5
400
600
600
800
400
1000
600
200
4 00
6 00
8 00
hivdna
400
qp3
1000
200
-20
-15
-10
-5
10
15
20
lovaina
0.0
0.5
1.0
1.5
2.0
2.5
3.0
a1
x(t)
Dimensin 1
200
400
d1
x(t)
x(t)
x(t)
kobe
1000
400
600
800
1 000
1000
laser
800
200
-4
-2
800
lorenz
x(t)
1.0
200
-2
-1
-1.0
-0.5
0.0
0.5
1.0
400
200
200
600
800
600
600
800
800
1 000
-10
1000
-5
10
15
40 0
600
sine
20 0
800
rossler
vandpol
400
40 0
1000
brownian
1000
10 00
x(t)
0. 02
0. 04
0. 06
0. 08
0. 10
0. 12
4.6
0.0
0.2
0.4
0.6
0.8
1.0
400
200
600
400
800
600
1000
800
1000
humandna
200
qp2
Agrupamiento 5
2.6
2.8
3.0
3.2
3.4
3.6
3.8
4.0
4.2
4.4
200
400
600
800
1000
dowjones
Agrupamiento 4
Agrupamiento 3
x(t)
1.5
x(t)
1.5
x(t)
x(t)
x(t)
Anlisis MDS
x(t)
x(t)
189
x(t)
x(t)
base de cada agrupamiento, se compararon estos patrones entre todos los grupos de series de
tiempo para comprobar que efectivamente fuesen diferentes entre s.
En las Figuras 10-7, 10-8, 10-9, 10-10, 10-11, 10-12 y 10-13; se muestran los patrones de
mapas de recurrencia que se identificaron como bsicos dentro de las series de tiempo, cada
patrn tiene asociado un agrupamiento de series de tiempo las cuales se observa poseen una
predictibilidad similar. Existen varias formas en que se relacionan las series agrupadas con los
patrones encontrados, se puede presentar el caso en que las series de un mismo grupo poseen un
patrn nico como en los patrones P2 y P5 (Figuras 10-8 y 10-10), se puede presentar ms de un
patrn bsico para un grupo de series como en los patrones P1a y P1b (Figura 10-7), se puede
presentar que dentro de un grupo de series un subconjunto de ellas tenga ms de un patrn
bsico como ocurre con los patrones P3a y P3b (Figuras 10-8 y 10-9), y se puede presentar
que un agrupamiento de series posea una predictibilidad similar pero con diferentes patrones
bsicos para las series del grupo como en los patrones P4a y P4b (Figuras 10-9 y 10-10), las
relaciones anteriores entre predictibilidad y estructura se resumen en la tabla 10.1, donde la
primera columna corresponde a los agrupamientos de las series de tiempo (ver Figura 10-5).
Agrupamiento
Relaciones de Predictibilidad-Estructura
2y5
(10.1)
190
Figura 10-5: Mapa de escalamiento multidimensional con los mapas de recurrencia de las series
de tiempo
191
Dimensin 2
-2.0
-1.5
-1.0
-.5
0.0
-2
-1
star
henon
logistic
ikeda
kobe
tent
mg
elnio
Agrupamiento 2
eeg
primos
asciitxt
whiten
cantor
sp500
Agrupamiento 1
plasma
.5
1.0
1.5
hivdna
qp3
vandpol
sine
qp2
humandna
Agrupamiento 5
rossler
dowjones
Agrupamiento 4
Agrupamiento 3
brownian
lorenz
lovaina laser
Dimensin 1
d1
a1
Anlisis MDS
3.0
Patrn P3a.
Series de Tiempo: A1,
Lovaina y Laser
2.5
2.0
x(t)
1.5
1.0
0.5
0.0
200
400
600
800
1000
Serie de Tiempo A1
0.4
0.2
x(t)
0.0
-0.2
-0.4
-0.6
-0.8
200
400
600
800
1000
Mapa de Recurrencia
192
P1b
P1a
193
P3a
Figura 10-8: Patrones bsicos de mapas de recurrencia
194
P4a
P3b
P4b
Figura 10-10: Patrones bsicos de mapas de recurrencia
196
199
10.4
200
Figura 10-14: Mapa de escalamiento multidimensional del anlisis PCA de las series de tiempo
201
Dimensin 2
-.6
-.4
-.2
-.0
.2
.4
.6
.8
-2
-1
Predictibilidad Baja
ikeda (0.43)
asciitxt (0.51)
primos (0.48)
(0.88)
(0.83)
kobe
(0.44)
a1
(0.85)
laser
(0.88)
(0.66)
eeg
mg
qp3
(1.17)
Dimensin 1
d1 (0.77)
lovaina (0.83)
rossler
(1.65)
star (0.64)
vandpol
(1.06)
tent (0.85)
(0.68)
(1.03)
(1.79)
hdna (1.56)
brownian dowjones
elnio
(1.26) qp2
(1.86) sine
lorenz
Predictibilidad Alta
Predictibilidad Media
Anlisis MDS
202
Red Neuronal.
Red Neuronal.
PNNReciproca Inteligencia
l
Artificial
Inteligencia
Artificial
Inteligencia
Artificial
Inteligencia
Artificial
Teoria de
Sistemas
Dinamicos
No Lineales
Teoria de
Sistemas
Dinamicos
No Lineales
MLFFN
MySVM
Multipunto
(kernel dot)
MySVM
Multipunto
(kernel radial)
Polynomp
Nstep
ARIMA
K-NearestNeighbours
Red Neuronal.
Inteligencia
Artificial
PNNGauss
Teoria de
Sistemas
Dinamicos
No Lineales
Red Neuronal.
Inteligencia
Artificial
Origen de
Tcnica
FIRNet
Tcnica de
Prediccin
Global
Local
Local
Global
Global
Global
Global
Global
Global
Global
Alcance de
modelo
AR
Parmetrico
Parmetrico
Parmetrico
Espacio de
Derivadas
ARMA
Promedio de
Espacio
estados del
Fase
Bsqueda de k-vecinos cercanos.
sistema
Reconstrudo
similares
Parmetrico
No
Parmetrico
Espacio
Ajuste de
Fase
una Funcin
Reconstrudo
Espacio de
Estadstico
caracterstica
FDP
s
17
16
11
13
10
12
Estadstico
FDP
Parmetrico
Parmetrico
Dependencia Nmero de
de
Series
parmetros
Predichas
Parmetrico
Retropropagacin temporal
minimizando error cuadrtico.
Mtodo de Aprendizaje
Estadstico
FDP
MA
Espacio de
Estadstico
caracterstica
FDP
s
Espacio Real
Espacio Real
Espacio Real
Espacio Real
Espacio
Equivalencia
donde actua
1.214445183
10.94043514
8.339671318
3.895233526
3.414282627
0.125357341
1.490337069
1.521040683
3.648760065
1.920439941
Coeficiente de
Capacidad de
Prediccin
(CCAP)
203
Sim ple
Teoria de
Sistem as
Dinm icos
No Lineales
Estadstica
Sugim ay
AR MA
Sim ple
Sim ple
Teoria de
Sistem as
Dinm icos
No Lineales
G lobal
Local
G lobal
G lobal
G lobal
Sim ple
rbf
Polynom
Red Neuronal.
G lobal
Local
RNAP
Red Neuronal.
G lobal
G lobal
Alcance de
m odelo
H brido
Inteligencia
Artificial
ANFIS
Red Neuronal.
Red Neuronal.
Sim ple
H brido
Inteligencia
Artificial
Teoria de
Sistem as
Dinm icos
No Lineales
Teoria de
Sistem as
Dinm icos
No Lineales
Sim ple
Inteligencia
Artificial
RB FNBP
P redict
Sim ple
M odelo
sim ple o
hbrido
Inteligencia
Artificial
O rigen de
Tcnica
FFNBP
Tcnica de
M odelado
N m ero de
Series
M odeladas
Espacio Real
ARM A
Prom edio
Espacio
Pesado de
elem entos con
Fase
Reconstrudo pesos de tipo
exponencial
Parm etrico
No
Parm etrico
Parm etrico
Parm etrico
Espacio
Ajuste de una
Fase
Funcin
Reconstrudo
Espacio
Ajuste de una
Fase
Funcin
Reconstrudo
No
Parm etrico
19
22
23
20
RBFN
Parm etrico
Espacio Real
14
D ependencia
de
parm etros
Aprendizaje con
retropropagacin, m inim izando
el error cuadratico.
M todo de Aprendizaje
16
AR
Equivalencia
Parm etrico
Espacio Real
Espacio
donde actua
16.67765029
9.188100504
0.712788452
0.531899455
1.506738879
44.20745158
19.34560877
6.211058301
9.448675887
Coeficiente de
Capacidad de
M odelado
(CCAM )
10.5
En esta seccin se investiga la relacin de los modelos de prediccin y modelado con los diferentes
parmetros dinmicos que caracterizan la predictibilidad de las series de tiempo, para realizar
el estudio anterior se utiliza la correlacin bivariada y los mapas auto organizados jerrquicos
(GHSOM). El conjunto de parmetros consiste de 12 elementos que miden caractersticas de la
dinmica de la serie de tiempo y con los cuales se construyeron anteriormente las mtricas de
predictibilidad, la Figura 10-17 muestra la tabla con los parmetros y el tipo de informacin
que proporcionan sobre las series de tiempo.
Para estudiar la sensibilidad de los modelos con relacin a los parmetros que caracterizan
a las series de tiempo, se construyo una tabla de correlacin bivariada. Para obtener los coeficientes de correlacin para cada modelo se construyo una tabla de datos como la que se muestra
en la Figura 10-18, donde las primeras doce columnas corresponden a parmetros de las series
de tiempo y la columna nmero trece corresponde a cada tcnica o modelo a analizar, en caso de
que el modelo no hubiera predicho una serie se asignaba el valor 0 y en caso de una prediccin
exitosa el valor 1. Con tablas como la mostrada se realizo el clculo de la correlacin bivariada
para obtener los coeficientes de Pearson correspondientes a cada modelo de prediccin.
En la Figura 10-19, se presenta la tabla de correlacin bivariada entre los modelos de prediccin y los parmetros dinmicos usados para caracterizar la predictibilidad de las series de
tiempo. Debido a la gran cantidad de informacin presente en la tabla, se normalizaron los
resultados de la correlacin de la siguiente forma, para cada parmetro dinmico se identifico
el mayor valor (en valor absoluto) de correlacin encontrado y con dicho valor se normalizaron
todos los valores de correlacin encontrados para dicho parmetro. Una vez normalizada la
tabla de correlacin se construyo una tabla simblica para discretizar los resultados de forma
que sea ms fcil el anlisis de los resultados de la correlacin. La tabla 10.2, muestra la escala
de valores para la discretizacin.
204
Parmetros
Alcance de
Parmetro
Exponente de
Lyapunov
Global
Horizonte de Prediccin
Dimensin de
Correlacin
Local
Dimensin de
Capacidad
Local
Dimensin
Fractal
Global
Dimensin
Embebida
Global
%Entropa
Espacio
Temporal
Global/Local
Grado de no correlacin
espacial
% Recurrencia Global/Local
Periodicidad y estructuras
definidas
%
Global/Local
Determinismo
Determinismo en base a
patrn de recurrencia
Entropa de
Shannon
Informacin
Mutua
Promedio
Informacin mutua
contenida en una variable
para dos instantes de tiempo
diferentes
Global
Complejidad LZ
Global/Local
Relativa
Reglas de
Produccin
Estructuras y jerarqua de
cadenas de datos
Nmero de reglas
gramticales para modelar la
Global/Local
serie (complejidad
computacional)
Figure 10-18: Ejemplo de conjunto de parmetros para series de tiempo predichas por la tcnica
K-Nearest-Neighbours
206
0.517
1.864
0.925
1.383
1.481
0.76
0.601
1.049
1.452
2.301
5.728
0.477
0.2234006
1.288
0.949
0.144
1.102
1.199
2.709
2.322
0
0.322
1.0693
3.383
0.594
3.569
3.289
2.043
1.606
Tabla para calcular la correlacin de Pearson entre los parmetros de las series de tiempo y la tcnica de prediccin K-Nearest-Neighbours.
Entropa
Nmero de
Dimensin
Entropa de Informacin
Dimension
Dimensin
Espacio
Recurrencia Determinism
Complejidad
Mutua
Reglas de
de
Informacin
Fractal
Embebida
Temporal
(%)
o (%)
Relativa LZ
Capacidad
(Shannon)
Promedio
Produccin
(%)
0.228
0.246
0.85
2
0
19.556
62.19
3.7118
3
0.05979471
27
0.984
0.989
1.14
2
0
7.826
66.355
4.981
7
0.07972627
28
0.923
0.679
1.1
9
0
8.148374
97.760539
2.445885
18
0.1494868
66
0.96
0.605
2.76
5
0
16.133
36.733
4.232
6
0.4384945
75
1.025
0.983
2.25
7
50
0.51034759 37.5178503 0.15914973
4
0.4783576
75
0.93
0.941
1.28
2
78
8.61304444 0.85112222 0.03522222
9
0.7175364
61
1.025
0.965
1.44
5
57
32.8839734 92.0699379 4.78931065
17
0.1793841
63
1.026
0.994
1.82
2
0
6.38852058 88.0434671 2.45897942
13
0.1694183
72
1.019
0.983
4.14
5
53
0.54849383
0
0
6
0.787297
71
0.991
0.997
1.67
2
51
9.43468507 0.63758282 0.0204499
17
0.6378102
69
0.658
0.661
0
5
84
2.193
0
0
1
1.056373
72
1.029
0.971
3.95
1
53
3.079
29.009
3.401
12
0.03986314
13
2.5
2.644
1.7
4
51
7.812
86.786
7.02
3
0.2890078
79
2.053
0.986
1.05
7
39
3.30067901 60.2251502 0.8521749
7
0.229213
92
2.096
0.961
1.94
9
47
10.716364 71.4658139 2.93549693
2
0.3786998
66
1.035
0.887
2.31
12
2
98.8534487 98.8812005 6.43519134
26
0.1993157
65
1.053
0.904
1.8
6
78
57.046522 44.3674678 3.74401017
2
0.787297
79
1.876
0.89
3.83
6
73
2.7157191
0
0
6
0.7773312
82
2.011
0.485
0.88
7
82
13.144
1.226
2.107
3
1.036442
80
1.637
0.971
2.59
9
65
0.32
44.212
3.526
8
0.2092815
83
5.017
0.953
0
8
0
0.004
31.331
1
4
0.8072285
9
1.037
0.983
0.55
12
0
24.915
98.244
7.28
20
0.04982892
51
1.027
0.958
2.39
5
47
0.547
69.791
5.574
9
0.3089393
77
0.967
0.821
0.52
10
81
1.683
0.748
2.866
3
0.9766468
91
3.55
0.044
0.79
3
80
9.705
0.412
1.295
3
0.9766468
78
1.026
0.859
0.6
3
87
20.868
4.383
2.585
2
1.036442
82
1.144
0.963
3.39
7
53
16.438
11.137
3.102
13
0.5879813
90
1.103
0.971
2.78
5
0
11.7750441 66.2786765 2.74038235
23
0.1694183
85
2.086
0.983
6.09
10
79
0
0
0
1
1.066339
73
Dimensin
Exponente
de
de Lyapunov
Correlacin
1
1
1
1
1
1
0
1
1
1
0
1
1
0
1
1
1
1
0
0
0
1
1
0
0
0
0
0
0
Prediccin
Exito =1,
Fracaso = 0
Figure 10-19: Tabla de correlacin entre los parmetros dinmicos y los modelos de prediccin
207
Produccin
Reglas de
Nmero de
Relativa LZ
Promedio
Complejidad
Mutua
Informacin
(Shannon)
-0.255
-0.413
0.022
0.362
Informacin
Entropa de
0.37
0.027
-0.333
-0.116
-0.162
0.226
-0.174
-0.247
FIRNet
Determinismo
(%)
(%)
Recurrencia
Temporal (%)
Entropa
Espacio
Embebida
Dimensin
Fractal
Dimension
Dimensin de
Capacidad
Correlacin
Dimensin de
Lyapunov
Exponente de
Series de
Tiempo
Parmetros de
-0.373
-0.666
0.327
0.506
0.549
0.174
-0.574
-0.031
-0.032
0.184
-0.22
-0.331
PNNGauss
PNNReciprocal
-0.411
-0.572
0.13
0.529
0.533
0.3
-0.44
-0.262
0.036
0.206
-0.171
-0.394
MLFFN
-0.394
-0.695
0.225
0.553
0.576
-0.033
-0.492
-0.181
-0.068
0.178
-0.243
-0.328
MySVM
Multipunto
(kernel dot)
-0.38
-0.3
-0.158
0.247
0.129
0.015
-0.468
-0.318
-0.083
-0.248
-0.263
-0.075
MySVM
Multipunto
(kernel radial)
-0.306
-0.49
-0.062
0.318
0.469
0.007
-0.252
-0.39
-0.026
0.183
-0.298
-0.418
-0.143
-0.117
-0.165
0.093
0.014
0.062
0.125
-0.267
-0.049
0.19
-0.237
-0.209
Polynomp
-0.268
-0.564
0.222
0.502
0.424
0.108
-0.279
-0.109
-0.077
0.245
-0.346
-0.314
Nstep
Tcnica de Prediccin
-0.292
-0.446
0.178
0.257
0.358
0.179
-0.376
-0.198
0.148
0.211
-0.365
-0.495
K-NearestNeighbours
Inteligencia Artificial
Tabla de la correlacin de Pearson entre los parmetros de las series y las tcnicas de prediccin
Estadstica
-0.291
-0.33
0.258
0.288
0.181
0.325
-0.208
0.21
0.201
-0.089
-0.146
-0.247
ARIMA
Tipo de Correlacin
Rango de la Correlacin
MUY ALTA
0.81 a 1.0
ALTA
0.61 a 0.809
MEDIA
0.41 a 0.609
BAJA
0.21 a 0.409
MUY BAJA
0.0 a 0.209
(10.2)
A partir de la normalizacin de los datos de la tabla de correlacin y de su posterior discretizacin, se obtuvo la tabla que se muestra en la Figura 10-20. Los parmetros de mayor
inters son aquellos que muestran correlaciones altas y muy altas para la mayora de los mo
delos de prediccin, para analizarlos con mayor facilidad, se construyo una tabla con solamente
dichos parmetros la cual se muestra en la Figura 10-21.
La tabla en la Figura 10-21, muestra los parmetros que ms influyen en los modelos al
predecir a una serie de tiempo, estos parmetros miden a su vez caractersticas de la dinmica
de las series de tiempo que el modelo trata de reproducir durante el proceso de prediccin. Los
parmetros son: Exponente de Lyapunov, Dimensin de Correlacin, Dimensin de Capacidad,
Entropa Espacio-Temporal, Determinismo, Entropa de Informacin de Shannon, Complejidad
Relativa LZ y Nmero de Reglas de Produccin.
Con respecto a los modelos para modelado, se realizo el mismo anlisis de correlacin, la
Figura 10-22 muestra la tabla de correlacin correspondiente a estos modelos.
Nuevamente, se discretizo la tabla de correlacin para analizar la informacin de la misma,
la Figura 10-23 muestra la tabla de correlacin con los datos discretizados.
Para el caso de las tcnicas de modelado (ver la tabla en la Figura 10-24), los parmetros
para los cuales los modelos presentan una mayor correlacin son: Exponente de Lyapunov, Dimensin de Correlacin, Dimensin de Capacidad, Entropa Espacio-Temporal, Determinismo,
Informacin Mutua Promedio y Complejidad Relativa LZ, y tanto en el caso de la prediccin
como de el modelado, cada modelo responde en forma particular a los diferentes parmetros y no
se observa un patrn de respuesta comn, lo cual indica que cada modelo se adapta a la dinmica
de las series de tiempo de forma diferente durante el proceso de aprendizaje o entrenamiento.
Para estudiar la forma en que se agrupan y la jerarqua de las agrupaciones de los modelos
208
Figure 10-20: Tabla discretizada de la correlacin entre los parmetros dinmicos y los modelos
de prediccin
209
Produccin
Reglasde
Nmerode
RelativaLZ
Complejidad
MutuaPromedio
Informacin
(Shannon)
Informacin
Entropade
(%)
Determinismo
Recurrencia(%)
Temporal (%)
Espacio
Entropa
Embebida
Dimensin
Fractal
Dimension
Capacidad
Dimensinde
Correlacin
Dimensinde
Lyapunov
Exponentede
Tiempo
Seriesde
Parmetrosde
FIRNet
ALTA
MEDIA
MUYBAJA
ALTA
ALTA
MUYBAJA
MEDIA
BAJA
ALTA
MUYALTA
MEDIA
MEDIA
PNNGauss
MUYALTA
MUYALTA
MUYALTA
MUYALTA
MUYALTA
MEDIA
MUYALTA
MUYBAJA
MUYBAJA
ALTA
MEDIA
ALTA
PNNReciprocal
MUYALTA
MUYALTA
BAJA
MUYALTA
MUYALTA
MUYALTA
ALTA
ALTA
MUYBAJA
MUYALTA
MEDIA
ALTA
MLFFN
MUYALTA
MUYALTA
ALTA
MUYALTA
MUYALTA
MUYBAJA
MUYALTA
MEDIA
BAJA
ALTA
ALTA
ALTA
MySVM
Multipunto
(kernel dot)
MUYALTA
MEDIA
MEDIA
MEDIA
BAJA
MUYBAJA
MUYALTA
MUYALTA
MEDIA
MUYALTA
ALTA
MUYBAJA
MySVM
Multipunto
(kernel radial)
ALTA
ALTA
MUYBAJA
MEDIA
MUYALTA
MUYBAJA
MEDIA
MUYALTA
MUYBAJA
ALTA
MUYALTA
MUYALTA
BAJA
MUYBAJA
MEDIA
MUYBAJA
MUYBAJA
MUYBAJA
BAJA
ALTA
BAJA
ALTA
ALTA
MEDIA
Polynomp
TeoriadeSistemasDinamicos NoLineales
ALTA
MUYALTA
ALTA
MUYALTA
ALTA
BAJA
MEDIA
BAJA
BAJA
MUYALTA
MUYALTA
ALTA
Nstep
TcnicadePrediccin
ALTA
ALTA
MEDIA
MEDIA
ALTA
MEDIA
ALTA
MEDIA
ALTA
MUYALTA
MUYALTA
MUYALTA
K-NearestNeighbours
InteligenciaArtificial
ALTA
MEDIA
ALTA
MEDIA
BAJA
MUYALTA
BAJA
MEDIA
MUYALTA
BAJA
BAJA
MEDIA
ARIMA
Figure 10-21: Tabla con los parmetros dinmicos cuya correlacin es alta o muy alta respecto
de los modelos de prediccin
210
Produccin
Reglasde
Nmerode
RelativaLZ
Complejidad
(Shannon)
Informacin
Entropade
(%)
Determinismo
Temporal (%)
Espacio
Entropa
Capacidad
Dimensinde
Correlacin
Dimensinde
Lyapunov
Exponentede
Tiempo
Seriesde
Parmetrosde
FIRNet
ALTA
ALTA
ALTA
MUYALTA
MUYALTA
MUYALTA
MUYALTA
MUYALTA
MUYALTA
ALTA
ALTA
PNNGauss
PNNReciprocal
MUYALTA
MUYALTA
MUYALTA
MUYALTA
ALTA
MUYALTA
ALTA
MLFFN
MUYALTA
MUYALTA
MUYALTA
MUYALTA
MUYALTA
ALTA
ALTA
ALTA
MySVM
Multipunto
(kernel dot)
MUYALTA
MUYALTA
MUYALTA
ALTA
MySVM
Multipunto
(kernel radial)
ALTA
ALTA
MUYALTA
ALTA
MUYALTA
MUYALTA
ALTA
ALTA
Polynomp
TeoriadeSistemasDinamicosNoLineales
ALTA
MUYALTA
MUYALTA
ALTA
MUYALTA
MUYALTA
ALTA
Nstep
TcnicadePrediccin
ALTA
ALTA
ALTA
ALTA
MUYALTA
MUYALTA
MUYALTA
K-NearestNeighbours
InteligenciaArtificial
SubconjuntodelatabladelacorrelacindePearsonentrelosparmetrosdelasseriesylastcnicasdeprediccin
Estadstica
ALTA
ARIMA
Figure 10-22: Tabla de correlacin entre los parmetros dinmicos y los modelos para modelado
211
Exponente de
Lyapunov
Dimensin de
Correlacin
Dimensin de
Capacidad
Dimension
Fractal
Dimensin
Embebida
Entropa
Espacio
Temporal (%)
Recurrencia
(%)
Determinismo
(%)
Entropa de
Informacin
(Shannon)
Informacin
Mutua
Promedio
Complejidad
Relativa LZ
Nmero de
Reglas de
Produccin
Parmetros de
Series de
Tiempo
-0.143
0.375
0.122
0.292
-0.504
0.05
0.408
0.154
0.442
-0.514
0.09
-0.408
-0.267
0.114
-0.062
0.055
-0.421
0.212
0.207
-0.453
-0.321
-0.322
FFNBP
-0.145
RBFNBP
-0.242
Anfis
-0.103
-0.802
0.398
0.507
0.688
0.234
-0.5
-0.03
0.157
0.272
-0.409
-0.44
RNAP
0.041
-0.706
0.459
0.37
0.497
0.152
-0.383
-0.023
0.196
0.308
-0.513
-0.345
Predict
-0.244
-0.627
0.399
0.611
0.737
0.365
-0.562
0.006
-0.149
0.276
-0.159
-0.363
Polynom
-0.603
-0.323
-0.129
0.059
0.058
-0.084
-0.126
-0.397
-0.029
-0.096
-0.192
-0.226
-0.512
-0.444
-0.065
0.048
0.273
-0.136
-0.308
-0.144
-0.017
-0.129
-0.219
-0.203
rbf
Sugimay
0.025
-0.732
0.464
0.452
0.562
0.197
-0.384
0.001
0.055
0.276
-0.449
-0.321
Tabla de la correlacin de Pearson entre los parmetros de las series y las tcnicas de modelado
Tcnica de modelado
Inteligencia Artificial
Teoria de Sistemas Dinmicos No Lineales
Hbridos
Estadstica
-0.045
-0.673
0.341
0.652
0.632
0.248
-0.423
0.157
0.142
0.211
-0.375
-0.275
ARMA
Figure 10-23: Tabla discretizada de la correlacin entre los parmetros dinmicos y los modelos
para modelado
212
Produccin
Reglas de
Nmerode
RelativaLZ
Complejidad
Promedio
Mutua
Informacin
(Shannon)
Informacin
Entropade
(%)
Determinismo
(%)
Recurrencia
Temporal (%)
Espacio
Entropa
Embebida
Dimensin
Fractal
Dimension
Capacidad
Dimensin de
Correlacin
Dimensin de
Lyapunov
Exponentede
Tiempo
Series de
FFNBP
MUYBAJA
ALTA
MUYALTA
BAJA
MEDIA
BAJA
ALTA
ALTA
BAJA
ALTA
ALTA
MEDIA
RBFNBP
MUYBAJA
ALTA
ALTA
MUYBAJA
MEDIA
BAJA
ALTA
MUYALTA
BAJA
ALTA
ALTA
BAJA
Anfis
MUYBAJA
MUYALTA
MUYALTA
ALTA
MUYALTA
ALTA
MUYALTA
MUYBAJA
ALTA
MUYALTA
ALTA
MUYALTA
ALTA
MUYBAJA
MUYALTA
MUYALTA
MEDIA
ALTA
MEDIA
ALTA
MUYBAJA
MUYALTA
MUYALTA
MUYALTA
Hbridos
BAJA
ALTA
MUYALTA
MUYALTA
MUYALTA
MUYALTA
MUYALTA
MUYBAJA
ALTA
MUYALTA
BAJA
MUYALTA
BAJA
BAJA
MUYBAJA
MUYBAJA
BAJA
BAJA
MUYALTA
MUYBAJA
BAJA
BAJA
MEDIA
Polynom
MUYALTA
MEDIA
MUYBAJA
MUYBAJA
BAJA
BAJA
MEDIA
BAJA
MUYBAJA
MEDIA
MEDIA
MEDIA
ALTA
Sugimay
MUYBAJA
MUYALTA
MUYALTA
ALTA
ALTA
MEDIA
ALTA
MUYBAJA
BAJA
MUYALTA
MUYALTA
MUYALTA
Predict
Tcnica de modelado
rbf
Parmetros de
Inteligencia Artificial
RNAP
MUYBAJA
MUYALTA
ALTA
MUYALTA
MUYALTA
ALTA
ALTA
BAJA
ALTA
ALTA
ALTA
ALTA
ARMA
Figure 10-24: Tabla con los parmetros dinmicos cuya correlacin es alta o muy alta respecto
de los modelos para modelado
213
RelativaLZ
Complejidad
Promedio
Mutua
Informacin
(%)
Determinismo
Temporal (%)
Espacio
Entropa
Capacidad
Dimensinde
Correlacin
Dimensinde
Lyapunov
Exponentede
Tiempo
Seriesde
FFNBP
ALTA
MUYALTA
ALTA
ALTA
ALTA
RBFNBP
ALTA
ALTA
ALTA
ALTA
ALTA
Anfis
MUYALTA
MUYALTA
MUYALTA
MUYALTA
MUYALTA
ALTA
MUYALTA
ALTA
MUYALTA
MUYALTA
ALTA
ALTA
MUYALTA
MUYALTA
Hbridos
ALTA
MUYALTA
MUYALTA
MUYALTA
MUYALTA
Polynom
ALTA
Sugimay
MUYALTA
MUYALTA
ALTA
ALTA
MUYALTA
MUYALTA
TeoriadeSistemasDinmicosNoLineales
MUYALTA
Predict
Tcnicademodelado
rbf
Parmetrosde
InteligenciaArtificial
RNAP
SubconjuntodelatabladelacorrelacindePearsonentrelosparmetrosdelasseriesylastcnicasdemodelado
Estadstica
MUYALTA
ALTA
MUYALTA
ALTA
ALTA
ALTA
ALTA
ARMA
214
Figure 10-25: Tabla de datos para construir mapa GHSOM de modelos en funcin de su correlacin con los parmetros de las series de tiempo
215
-0.394
-0.328
PNNReciprocal
MLFFN
Multipunto
ARIMA
Neighbours
-0.247
-0.495
-0.314
K-Nearest-
-0.209
Nstep
-0.418
Polynomp
(kernel radial)
Multipunto
MySVM
(kernel dot)
-0.075
-0.331
PNNGauss
MySVM
-0.247
FIRNet
deLyapunov
Exponente
Capacidad
Correlacin
-0.146
-0.365
-0.346
-0.237
-0.298
-0.263
-0.243
-0.171
-0.22
-0.089
0.211
0.245
0.19
0.183
-0.248
0.178
0.206
0.184
0.226
de
de
-0.174
Dimensin
Dimensin
0.201
0.148
-0.077
-0.049
-0.026
-0.083
-0.068
0.036
-0.032
-0.162
Fractal
Dimension
0.21
-0.198
-0.109
-0.267
-0.39
-0.318
-0.181
-0.262
-0.031
-0.116
Embebida
Dimensin
-0.208
-0.376
-0.279
0.125
-0.252
-0.468
-0.492
-0.44
-0.574
-0.333
(%)
Temporal
Espacio
Entropa
0.325
0.179
0.108
0.062
0.007
0.015
-0.033
0.3
0.174
0.027
(%)
0.181
0.358
0.424
0.014
0.469
0.129
0.576
0.533
0.549
0.37
(%)
Recurrencia Determinismo
0.288
0.257
0.502
0.093
0.318
0.247
0.553
0.529
0.506
0.362
(Shannon)
0.258
0.178
0.222
-0.165
-0.062
-0.158
0.225
0.13
0.327
0.022
Promedio
Mutua
Entropade Informacin
Informacin
-0.33
-0.446
-0.564
-0.117
-0.49
-0.3
-0.695
-0.572
-0.666
-0.413
RelativaLZ
Complejidad
-0.291
-0.292
-0.268
-0.143
-0.306
-0.38
-0.394
-0.411
-0.373
-0.255
Produccin
Reglasde
Nmerode
PNNRec
Nstep
MySVMrad
MLFFN
FIRNet
PNNGauss
KNN
MySVMdot
ARIMA
Polynomp
Figura 10-26: Mapa Auto Organizado Jerrquico para los modelos de prediccin
216
Nivel 0
Nivel 1
Nivel 2
Nivel 3
MySVMrad (3.41)
PNNReciprocal (1.52)
Nstep (8.33)
PNNGauss (3.64)
MLFFN (1.49)
KNN (10.94)
ARIMA (1.21)
MySVMdot (0.12)
Polynomp (3.89)
FIRNet (1.92)
Figura 10-27: rbol de jerarquas del agrupamiento de los modelos de prediccin con el Mapa
Auto Organizado
217
RBFNBP
Polynom
FFNBP
RBF
Sugimay
ARMA
RNAP
ANFIS
Predict
Figura 10-28: Mapa Auto Organizado Jerrquico de los modelos para modelado
218
prediccin) que se puede dar el caso de que modelos de mismo origen presenten una respuesta
similar de su correlacin con los parmetros dinmicos de las series como ocurre en los grupos
del nivel dos; pero tambin es posible, que ocurra el caso de que modelos de diferente origen
presenten respuesta similar de su correlacin con los parmetros dinmicos de las series, como
el caso de los grupos del nivel tres donde el modelo RNAP (Inteligencia Artificial) y el modelo
Sugimay (Teora de Sistemas Dinmicos No Lineales) pertenecen al mismo grupo, y lo mismo
ocurre para los modelos ANFIS (Inteligencia Artificial), Predict (Teora de Sistemas Dinmicos
No Lineales) y ARMA (Estadstica). Por ltimo, a diferencia de los modelos de prediccin,
se observa que la capacidad de modelado (valores entre parntesis) presenta una relacin con
la forma en que se agrupan los modelos de acuerdo a su correlacin con los parmetros de las
series de tiempo.
10.6
Discusin
La agrupacin de las series de tiempo por sus parmetros dinmicos, permiti identificar en
forma experimental que hay tres grandes grupos de series con diferente predictibilidad, etiquetada como baja, media y alta predictibilidad ; y dentro de esas agrupaciones una jerarqua de
similitud de las series. Esto muestra, la riqueza del comportamiento de la predictibilidad de series de tiempo que es consecuencia de las diferentes dinmicas de los fenmenos que las series
representan.
El haber cuantificado la predictibilidad de las series de tiempo hizo posible encontrar en
forma experimental la existencia de una relacin entre la estructura de una serie de tiempo y
su predictibilidad. Esta relacin se manifiesta con diferentes formas de representacin de las
series como son el mapa de recurrencia (VRA) y las componentes de una serie producto del
anlisis espectral singular (SSA). En particular con los mapas de recurrencia se observ que
existen patrones de estructura bsicos presentes en series de tiempo de diferente origen (natural
o artificial). Estos patrones bsicos representan dinmicas comunes para diferentes sistemas
(fsicos, matemticos, fisiolgicos, econmicos, etc.). La relacin predictibilidad-estructura se
manifiesta por el agrupamiento de series de tiempo con predictibilidad similar y donde se observ
que sus mapas de recurrencia presentaban uno o ms patrones comunes o bsicos.
219
Nivel 0
Nivel 1
Nivel 2
Nivel 3
RBFNBP (6.21)
FFNBP (9.44)
Polynom (0.53)
RBF (0.71)
Sugimay (9.18)
RNAP (44.20)
ARMA (16.67)
Predict (1.50)
ANFIS (19.34)
Figura 10-29: rbol de jerarquas del agrupamiento para los modelos de modelado con el Mapa
Auto Organizado
220
Al analizar las caractersticas de la arquitectura de los modelos y relacionarlo con su capacidad de prediccin y de modelado se encontraron los siguientes resultados:
la capacidad de prediccin ms alta corresponde a modelos cuyo alcance es local y que
actan en el espacio fase, los modelos de prediccin de alcance global y que actan en
diferentes espacios son menos eficientes en la prediccin de series de tiempo.
la capacidad de modelado ms alta corresponde a modelos cuyo alcance es global y que
actan en el espacio real, los modelos que actan en el espacio fase son menos eficientes
en el modelado de series de tiempo.
El estudio de la relacin entre los parmetros que caracterizan la predictibilidad y los mo
delos de prediccin y de modelado por medio de los anlisis de correlacin, arrojo los siguientes
resultados: no se observa un patrn o patrones de respuesta comunes de los modelos con res
pecto a los parmetros, cada modelo responde en forma particular a los diferentes parmetros,
lo que indica que cada modelo se adapta a la dinmica de las series de tiempo de forma dife
rente, lo cual intuitivamente es de esperarse dadas las diferentes arquitecturas de los modelos.
Aun cuando cada modelo responde en forma particular a los diferentes parmetros, se encontr
que los parmetros que presentan una mayor correlacin con la mayora de los modelos en
el caso de la prediccin son: Exponente de Lyapunov, Dimensin de Correlacin, Dimensin
de Capacidad, Entropa Espacio-Temporal, Determinismo, Entropa de Informacin de Sha
nnon, Complejidad Relativa LZ y Nmero de Reglas de Produccin. Y en el caso del modelado
son: Exponente de Lyapunov, Dimensin de Correlacin, Dimensin de Capacidad, Entropa
Espacio-Temporal, Determinismo, Informacin Mutua Promedio y Complejidad Relativa LZ.
Al analizar con los mapas GHSOM, la forma en que los modelos de prediccin y de modelado
se agrupan en funcin de su correlacin con los diferentes parmetros, se encontraron dos
clases de agrupamientos: modelos del mismo origen (por ejemplo, Inteligencia Artificial) que
responden globalmente de la misma forma a los parmetros de las series de tiempo, y modelos de
origen diferente que responden globalmente de la misma forma a los parmetros de las series de
tiempo. La jerarqua de los agrupamientos de modelos para el caso de la prediccin muestra que
no existe una relacin entre la forma en que los modelos se correlacionan con los parmetros y
su capacidad de prediccin. En el caso del modelado, se encontr que existe una relacin entre
221
222
Parte III
Combinacin de Predictores
223
Captulo 11
Combinacin de Predictores:
Mejorando la Prediccin de las
Series de Tiempo
11.1
Introduccin
En esta tesis se han desarrollado estudios sobre la predictibilidad de las series de tiempo y
su relacin con las caractersticas dinmicas y estructurales de las mismas, tambin sobre la
capacidad de prediccin (o modelado) de diferentes modelos y su relacin con las caractersticas
de las series de tiempo. Los resultados experimentales del presente trabajo muestran que cada
modelo de prediccin presenta una respuesta diferente a los parmetros que caracterizan a una
serie de tiempo, y en consecuencia no hay un modelo que sea capaz de adaptarse a todo el
universo de dinmicas que las series de tiempo pueden presentar, esto confirma que ante la
falta de modelos universales, una de las mejores estrategias para predecir una serie de tiempo
y a su vez mejorar el horizonte de la prediccin es mediante la combinacin de modelos de
prediccin (o combinacin de predictores).
Como se mencion en la seccin 2.6, al predecir o modelar una serie de tiempo existe un
error que es el resultado de los siguientes factores:
Las limitaciones inherentes a la simplificacin de la dinmica del sistema por el modelo
224
de prediccin.
Las propiedades del sistema como por ejemplo el caos, que provoca una desviacin de
tipo exponencial de la trayectoria del sistema para cambios pequeos en las condiciones
iniciales del mismo.
El ruido presente en la serie de tiempo de origen natural, debido al proceso de medicin
experimental de la misma.
Este error lo podemos expresar formalmente como:
(11.1)
11.2
Gran cantidad de mtodos de combinacin se han propuesto a partir del anlisis estadstico, se
dividen en dos grupos, los mtodos de varianza-covarianza y los mtodos de regresin [11, 12].
A continuacin se describen ambos grupos de combinacin estadstica de modelos de prediccin.
Los mtodos de varianza-covarianza se construyen de la siguiente forma, supongamos que
se tienen dos predicciones sin bias, para las cuales se forma la siguiente prediccin compuesta:
c
a
b
= yt+h,t
+ (1 )yt+h,t
yt+h,t
(11.2)
Debido a que la suma de los pesos es igual a la unidad, las predicciones compuestas no
tendrn bias. Adems, el error de la prediccin combinada satisface la misma relacin que las
predicciones combinadas,
(11.3)
(11.4)
donde 2aa y 2bb son las varianzas del error de prediccin y 2ab es la covarianza. Minimizando
la varianza del error de la combinacin de modelos con respecto a , se obtiene el peso de
combinacin optimo,
2bb 2ab
2bb + 2aa 22ab
(11.5)
b2ij
T
1X i
=
et+h,t ejt+h,t
T
i=1
226
(11.6)
b =
b2ab
b2bb
b2bb +
b2aa 2b
2ab
(11.7)
(11.8)
Hay muchas variaciones y extensiones del mismo por ejemplo: combinacin de pesos que
varan con el tiempo, regresiones combinadas dinmicamente, reduccin de pesos de combinacin a la igualdad (es decir promedio aritmtico de predicciones), y regresiones de combinaciones no lineales [11, 12].
11.3
11.3.1
El Algoritmo Boosting
boosting como una analoga para el desarrollo de mtodos de reduccin del error de prediccin,
a continuacin se describen a detalle dicho algoritmo.
Boosting es un mtodo general para mejorar la precisin de cualquier algoritmo de aprendizaje. El objetivo del algoritmo boosting es impulsar (boost) la precisin del proceso de aprendizaje de predictores, su fundamento terico proviene del modelo de aprendizaje PAC (Probably
Approximately Correct Model) donde la hiptesis del algoritmo de aprendizaje debe ser correcta
en forma aproximada (poseer bajo error) con una alta probabilidad, este modelo es debido a
Valiant [181]. Kearns y Valiant, fueron los primeros en proponer la pregunta de si un algoritmo
de aprendizaje dbil (i.e. de bajo rendimiento) cuyo rendimiento es ligeramente mejor que una
adivinanza aleatoria dentro del modelo PAC puede ser impulsado a una precisin arbitraria co
rrespondiente a un algoritmo de aprendizaje fuerte (i.e. de alto rendimiento) [182]. Schapire fue
el primero en desarrollar un algoritmo boosting en 1989 [183]. Posteriormente Freud desarrollo
una versin ms eficiente. En 1995 Freud y Schapire introdujeron el algoritmo AdaBoost [182],
el cual resolvi muchas de las dificultades practicas de los primeros algoritmos de boosting.
A continuacin se describe el algoritmo para mostrar cual es la forma en que opera. El
algoritmo AdaBoost toma como entrada un conjunto de entrenamiento (x1 , y1 ), ...., (xm , ym )
donde cada xi pertenece a algn dominio o espacio de instancias X, y cada etiqueta yi est
dentro de algn conjunto de etiquetas Y . Se asume en esta descripcin en la cual Y = {1, +1}.
AdaBoost llama a un algoritmo de aprendizaje dbil o base (por ejemplo, una red neuronal
para tareas de clasificacin como en este caso, aunque tambin es posible que el algoritmo de
aprendizaje realice tareas de regresin) en forma repetida en una serie de iteraciones t = 1, ...., T .
Una de las principales ideas del algoritmo es mantener una distribucin o conjunto de pesos
sobre el conjunto de entrenamiento. El peso de esta distribucin en el ejemplo de entrenamiento
i en la iteracin t se denota como Dt (i). Inicialmente, todos los pesos son iguales, pero en cada
iteracin, los pesos de los ejemplos clasificados de forma incorrecta se incrementan de tal forma
que el predictor dbil (weak learner ) es forzado a enfocarse en los ejemplos difciles del conjunto
de entrenamiento.
Esta distribucin de pesos es de la forma
Dt+1 (i) =
(11.9)
donde Zt es un factor de normalizacin (seleccionado de tal forma que Dt+1 sea una distribucin).
El algoritmo de aprendizaje tiene que encontrar una hiptesis dbil ht : X {1, +1}
apropiada para la distribucin Dt . La bondad de una hiptesis dbil se mide por su error
t = Pr [ht (xi ) 6= yi ] =
iDt
Dt (i)
(11.10)
1
2
(11.11)
(11.12)
t=1
11.3.2
P (xi )combinacion =
M
X
Wj P j (xi )
(11.13)
j=1
N
2
1 X combinacion
xi
xoriginal
RMSE =
i
N
i=1
# 12
(11.14)
Cada individuo de la poblacin esta formado por un conjunto de pesos {Wj } expresados
como nmeros reales, de la siguiente forma:
(11.15)
la funcin de ajuste (fitness function) penaliza a los individuos con mayores errores RMSE
de la forma:
fitness = 1
RMSE (k)
Max {RMSE (k)}Q
k=1
(11.16)
11.3.3
Las series de tiempo utilizadas para evaluar la tcnica de combinacin GABoost fueron seleccionadas considerando que el nmero de tcnicas de prediccin capaces de predecir su compor230
Etapa de Entrenamiento
Bsqueda de pesos para la reduccin del error de prediccin.
Evaluacin de la salida:
1
RMSE =
N
(x
combinaci n
i
original 2
i
i =1
P1Pr ueba , P2Pr ueba ,...., PMPr ueba Conjuntos de datos predichos
correspondientes al mismo intervalo de prediccin, obtenidos a
partir de M modelos de prediccin.
M
tamiento fuera al menos de dos. Para la seleccin de las tcnicas y de las series, se utiliz la
matriz de prediccin de las series de tiempo que se present en el captulo 8. El conjunto de
tcnicas de prediccin (predictores) y sus caractersticas generales se presenta en la tabla de la
Figura 11-2.
Serie de
Tiempo
Qperiodic3
MackeyGlass
Rossler
A1
Dow Jones
Comportamiento
Predictibilidad
Dinmico
Cuasiperidica
0.888610816
Catica
0.665578391
Catica
Compleja
Compleja
1.172559224
0.888622568
1.791995215
11.3.4
Resultados Experimentales
Serie de
Tiempo
Datos de
entrenamient
o para
prediccin
Qperiodic3
1900
MackeyGlass
1900
Rossler
4000
A1
1800
Dow Jones
3000
Datos
predichos
100 (1901 a
2000)
50 (1901 a
1950)
100 (4001 a
4100)
100 (1801 a
1900)
100 (3001 a
3100)
Datos de
Datos de
prueba para
entrenamient
la
o para
combinacin
busqueda de
de los
pesos
predictores
50 (1901 a
50 (1951 a
1950)
2000)
25 (1901 a
25 (1926 a
1925)
1950)
50 (4001 a
50 (4050 a
4050)
4100)
50 (1801 a
50 (1851 a
1850)
1900)
50 (3001 a
50 (3051 a
3050)
3100)
Figura 11-6: Parmetros de los experimentos para la bsqueda de los p esos ptimos
En las Figuras 11-7, 11-8 y 11-9; se muestran las grficas en las cuales se compara la serie
original, la prediccin GABoost y la prediccin con el mejor predictor individual, los casos
234
Mackey-Glass
Firnet
1,4
Original
1,2
x (n)
1,0
GABoost
0,8
0,6
0,4
0,2
0,0
0
10
15
20
25
235
A1
Nstep
1,8
1,6
GABoost
1,4
x (n)
1,2
1,0
0,8
0,6
Original
0,4
0,2
0,0
0
10
20
30
40
50
Dow Jones
Original
0,68
0,66
0,65
0,64
0,62
x (n)
0,60
0,58
0,56
0,55
0,54
GABoost
PNNGauss
0,52
0,50
0,48
0,46
0
10
20
30
40
50
236
5.0891%
0,5
0,4
RMSE
0,3
0,2
0,1
0
PNNGauss
MLFFN
Polynomp
Nstep
GABoost
Predictores
24.1256%
0,2
RMSE
0,15
0,1
0,05
0
GABoost
Nstep
Firnet
Predictores
40.0643%
RMSE
3
2
1
0
PNNGauss
MLFFN
Nstep
GABoost
Predictores
53.5234%
0.25
RMSE
0.2
0.15
0.1
0.05
0
PNNGauss
Polynomp
Nstep
GABoost
Predictores
72.4717%
RMSE
0,1
0,08
0,06
0,04
0,02
0
PNNGauss
Nstep
GABoost
Predictores
Figura 11-14: Comparacin del error RMSE para la serie Dow Jones
238
de la serie de tiempo, se comparo en forma similar que en el caso del error RMSE, las Figuras
11-15, 11-16, 11-17, 11-18 y 11-19 muestran los resultados de este anlisis. Se observa que con
excepcin de las series Mackey-Glass y A1, el error BE de la combinacin de predictores fue
menor que el correspondiente a los predictores individuales, lo que indica que la combinacin
de modelos se adapta mejor a la dinmica de las series de tiempo predichas.
BE para serie de tiempo Qperiodic3
0,08
0,06
0,04
BE
0,02
Nstep
0
-0,02
PNNGauss
MLFFN
GABoost
Polynomp
-0,04
-0,06
-0,08
-0,1
-0,12
Predictores
BE
0,01
0
Firnet
GABoost
Nstep
-0,01
-0,02
-0,03
-0,04
-0,05
Predictores
PNNGauss
MLFFN
Nstep
GABoost
BE
-0,2
-0,3
-0,4
-0,5
-0,6
-0,7
-0,8
Predictores
Figura 11-17: Comparacin del error BE para la serie Rossler
BE
0.02
0.01
0
PNNGauss
Polynomp
Nstep
-0.01
GABoost
-0.02
-0.03
Predictores
240
BE
Nstep
PNNGauss
GABoost
Predictores
241
LRSE de A
C
B
D
GABoost
0.9
0.8
0.7
0.6
LRSE
0.5
0.4
0.3
0.2
0.1
0.0
-0.1
0
10
20
30
40
50
Figura 11-20: Comparacin del error local de prediccin para la serie Qperiodic3 de los predictores individuales y la combinacin con GABoost
242
LRSE de
A
B GABoost
0.55
0.50
0.5
0.45
0.4
0.40
0.35
LRSE
0.30
0.3
0.25
0.2
0.20
0.15
0.10
0.1
0.05
0.00
0.0
-0.05
0
10
15
20
25
Figura 11-21: Comparacin del error local de prediccin para la serie Mackey-Glass de los
predictores individuales y la combinacin con GABoost
243
LRSE de GABoost
C
B
5.5
5.0
5
4.5
4.0
4
3.5
LRSE
3.0
3
2.5
2.0
2
1.5
1.0
1
0.5
0.0
0
-0.5
0
10
20
30
40
50
Figura 11-22: Comparacin del error local de prediccin para la serie Rossler de los predictores
individuales y la combinacin con GABoost
244
LRSE de GABoost
0.65
0.6
0.60
0.55
0.5
0.50
0.45
0.4
0.40
LRSE
0.35
0.30
0.3
0.25
0.20
0.2
0.15
0.10
0.1
0.05
0.00
0.0
-0.05
0
10
20
30
40
50
Figura 11-23: Comparacin del error local de prediccin para la serie A1 de los predictores
individuales y la combinacin con GABoost
245
LRSE de GABoost
0.22
0.20
0.18
0.16
0.15
0.14
LRSE
0.12
0.10
0.08
0.06
0.05
0.04
0.02
0.00
0
10
20
30
40
50
Figura 11-24: Comparacin del error local de prediccin para la serie Dow Jones de los predictores individuales y la combinacin con GABoost
RMSE
Promedio Simple
Predictores
15.3985%
Figura 11-25: Comparacin del error RMSE de la combinacin de predictores con GABoost y
promedio simple para la serie de tiempo Qperiodic3
246
0,1
0,08
0,06
0,04
0,02
0
GABoost
Promedio Simple
Predictores
-35.5835%
Figura 11-26: Comparacin del error RMSE de la combinacin de predictores con GABoost y
promedio simple para la serie de tiempo Mackey-Glass
69.6900%
RMSE de GABoost y Promedio Simple para la serie Rossler
RMSE
1,5
1
0,5
0
Promedio Simple
GABoost
Predictores
Figura 11-27: Comparacin del error RMSE de la combinacin de predictores con GABoost y
promedio simple para la serie de tiempo Rossler
247
RMSE
0,08
0,06
0,04
0,02
0
GABoost
Promedio Simple
Predictores
22.1449%
Figura 11-28: Comparacin del error RMSE de la combinacin de predictores con GABoost y
promedio simple para la serie de tiempo A1
RMSE
72.5337%
0,2
0,15
0,1
0,05
0
GABoost
Promedio Simple
Predictores
Figura 11-29: Comparacin del error RMSE de la combinacin de predictores con GABoost y
promedio simple para la serie de tiempo Dow Jones
248
11.4
11.4.1
cj (x) =
exp(zj (x))
M
X
(11.17)
exp(zk (x))
k=1
0 cj (x) 1 y
M
X
cj (x) = 1
(11.18)
j=1
249
(11.19)
Wj =
exp(fecj )
M
X
(11.20)
exp(feck )
k=1
11.4.2
Con la funcin anterior, se calculan los pesos correspondientes para la combinacin de los
predictores (o modelos de prediccin) de la serie de tiempo a la que se le desea mejorar el
resultado de su prediccin, en la Figura 11-30 se muestra la descripcin del algoritmo completo
de la tcnica CombFEC.
11.4.3
Resultados Experimentales
250
Etapa de Entrenamiento
Bsqueda de pesos para la reduccin del error de prediccin.
P1Entrenamiento , P2Entrenamiento ,..., PMEntrenamiento
Wj =
e
M
fec j
feck
k =1
fec j
fec j = (1 MAE j ) + (1 ABS ( BE j )) + (1 RMSE j ) + COPS j
251
Firnet
Mackey-Glass
1.4
Original
1.2
1.0
CombFEC
x (n)
0.8
0.6
0.4
0.2
0.0
5
10
15
20
25
A1
1.8
Nstep
1.6
Original
1.4
1.2
CombFEC
x (n)
1.0
0.8
0.6
0.4
0.2
0.0
10
20
30
40
50
252
Dow Jones
0.68
0.66
0.65
0.64
Original
0.62
x (n)
0.60
0.58
0.56
0.55
0.54
CombFEC
0.52
0.50
PNNGauss
0.48
0.46
10
20
30
40
50
253
RMSE
0.35
-4.7111%
0.3
0.25
0.2
0.15
0.1
0.05
0
PNNGauss
MLFFN
Polynomp
Nstep
CombFEC
Predictores
42.7714%
RMSE
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
FIRNet
Nstep
CombFEC
Predictores
254
RMSE
2
1.5
13.1969%
1
0.5
0
PNNGauss
MLFFN
Nstep
CombFEC
Predictores
RMSE
0.2
0.15
45.1009%
0.1
0.05
0
PNNGauss
Polynomp
Nstep
CombFEC
Predictores
255
RMSE
0.147
-0.2466%
0.1465
0.146
0.1455
0.145
PNNGauss
Nstep
CombFEC
Predictores
Figura 11-38: Comparacin del error RMSE para la serie Dow Jones
BE
0
-0.02
PNNGauss
MLFFN
Polynomp
Nstep
CombFEC
-0.04
-0.06
-0.08
-0.1
-0.12
Predictores
256
BE
0
-0.01
FIRNet
Nstep
CombFEC
-0.02
-0.03
-0.04
-0.05
Predictores
PNNGauss
MLFFN
Nstep
CombFEC
BE
-0.2
-0.3
-0.4
-0.5
-0.6
-0.7
-0.8
Predictores
257
BE
0.02
0.01
0
PNNGauss
-0.01
Polynomp
Nstep
CombFEC
-0.02
-0.03
Predictores
PNNGauss
Nstep
CombFEC
-0.143681
BE
-0.143682
-0.143683
-0.143684
-0.143685
-0.143686
-0.143687
Predictores
258
LRSE de CombFEC
0.9
0.8
0.7
0.6
LRSE
0.5
0.4
0.3
0.2
0.1
0.0
10
20
30
40
50
Figura 11-44: Comparacin del error local de prediccin para la serie Qperiodic3 de los predictores individuales y la combinacin con CombFEC
259
LRSE de CombFEC
0.55
0.5
0.50
0.45
0.4
0.40
0.35
LRSE
0.3
0.30
0.25
0.2
0.20
0.15
0.1
0.10
0.05
0.00
0.0
-0.05
5
10
15
20
25
n
Figura 11-45: Comparacin del error local de prediccin para la serie Mackey-Glass de los
predictores individuales y la combinacin con CombFEC
260
LRSE de CombFEC
5.5
5.05
4.5
4.04
3.5
LRSE
3.03
2.5
2.02
1.5
1.01
0.5
0.00
-0.5
10
20
30
40
50
Figura 11-46: Comparacin del error local de prediccin para la serie Rossler de los predictores
individuales y la combinacin con CombFEC
261
LRSE de CombFEC
0.65
0.60
0.6
0.55
0.50
0.5
0.45
LRSE
0.40
0.4
0.35
0.30
0.3
0.25
0.2
0.20
0.15
0.10
0.1
0.05
0.00
0.0
-0.05
10
20
30
40
50
Figura 11-47: Comparacin del error local de prediccin para la serie A1 de los predictores
individuales y la combinacin con CombFEC
262
LRSE de CombFEC
0.22
0.20
0.18
LRSE
0.16
0.14
0.12
0.10
0.08
10
20
30
40
50
Figura 11-48: Comparacin del error local de prediccin para la serie Dow Jones de los predictores individuales y la combinacin con CombFEC
263
RMSE
0.225
0.22
6.6623%
0.215
0.21
0.205
CombFEC
Promedio Simple
Predictores
Figura 11-49: Comparacin del error RMSE de la combinacin de predictores con CombFEC y
promedio simple para la serie de tiempo Qperiodic3
correspondiente de la combinacin de los predictores con el promedio simple, el cual es uno de
los mejores mtodos para mejorar la prediccin de series de tiempo y es usado como referencia
en la evaluacin de tcnicas de combinacin de predictores. Las Figuras 11-49, 11-50, 11-51,
11-52 y 11-53; muestran los resultados de esta comparacin. Para las series Qperiodic3, Rossler
y A1 se observa que el error RMSE es menor que en el caso de la combinacin de predictores
usando un promedio simple, en el caso de la serie Mackey-Glass se observa un error RMSE un
poco mayor que el correspondiente al promedio simple, por ltimo en el caso de la serie Dow
Jones el error RMSE es ligeramente mayor al correspondiente a la combinacin de predictores
con promedio simple. Los porcentajes de cambio del error RMSE de CombFEC respecto del
error RMSE del promedio simple se muestran en cada figura.
11.5
Discusin
En este captulo se present la descripcin de dos tcnicas de combinacin de predictores denominadas GABoost y CombFEC. La primera tcnica, tiene como base la construccin de una
combinacin de modelos de prediccin a partir de votos pesados, en analoga con el algoritmo de
aprendizaje Boosting. Pero a diferencia del algoritmo Boosting, que requiere de la construccin
264
-2.2643%
0.0805
RMSE
0.08
0.0795
0.079
0.0785
0.078
CombFEC
Promedio Simple
Predictores
Figura 11-50: Comparacin del error RMSE de la combinacin de predictores con CombFEC y
promedio simple para la serie de tiempo Mackey-Glass
RMSE
0.8
0.6
56.1029%
0.4
0.2
0
CombFEC
Promedio Simple
Predictores
Figura 11-51: Comparacin del error RMSE de la combinacin de predictores con CombFEC y
promedio simple para la serie de tiempo Rossler
265
RMSE
0.065
0.064
8.0346%
0.063
0.062
0.061
0.06
0.059
CombFEC
Promedio Simple
Predictores
Figura 11-52: Comparacin del error RMSE de la combinacin de predictores con CombFEC y
promedio simple para la serie de tiempo A1
-0.0203%
0.14605
RMSE
0.146045
0.14604
0.146035
0.14603
0.146025
0.14602
0.146015
0.14601
0.146005
CombFEC
Promedio Simple
Predictores
Figura 11-53: Comparacin del error RMSE de la combinacin de predictores con CombFEC y
promedio simple para la serie de tiempo Dow Jones
266
267
predictores (i. e. la forma de obtener los pesos ptimos de la combinacin) tiene sobre la reduccin del error de prediccin no se ha estudiado en la literatura, por lo que no es claro como
afecta la forma en que se combinan los modelos en el resultado final, esto sin duda es materia
de investigaciones futuras.
268
Parte IV
Conclusiones
269
Captulo 12
Conclusiones
Series de Tiempo
Preprocesamiento de
las Series de Tiempo
para el Clculo de los
Parmetros
Clculo de
Parmetros de Series
de Tiempo
Clculo de la
Predictibilidad de
Series de Tiempo
Preprocesamiento de
las Series de Tiempo
para la Evaluacin de
las Tcnicas
Repositorio de
Informacin sobre las
Series de Tiempo
Anlisis de la
Predictibilidad con
Tcnicas
Multivariadas
Clculo de la
Capacidad de
Prediccin (o de
Modelado) de las
Tcnicas
Repositorio de
Informacin sobre las
Tcnicas Evaluadas
Series Predichas
Tcnicas de
Prediccin (o
Modelado)
Evaluacin de las
Tcnicas con el
Conjunto de Series de
Tiempo
Identificacin de
las Series
Predichas por
cada Tcnica
Series no Predichas
Figura 12-1: Diagrama de las metodologas experimentales desarrolladas para el estudio sobre
la predictibilidad de series de tiempo
272
como la expansin del error de cada modelo, la dificultad de prediccin de las series de tiempo
y la eficiencia de los modelos para prediccin y modelado de conjuntos de series de tiempo.
La medicin de la predictibilidad de series de tiempo gener diversos resultados producto
de su anlisis experimental. La predictibilidad es no lineal con respecto al comportamiento
dinmico de las series de tiempo: peridico, cuasi peridico, catico, complejo y estocstico. La
predictibilidad de una serie es independiente del xito de un modelo o modelos para predecir o
modelar dicha serie, el modelo ad hoc para una serie de tiempo puede existir sin embargo no hay
la seguridad de poder encontrarlo en el espacio de soluciones, lo que esta mtrica proporciona
es un valor que permite comparar la predictibilidad entre series de tiempo de orgenes diversos.
Al utilizar diferentes tcnicas de anlisis multivariado se encontr que: Las series de tiempo
se agrupan en tres grandes conjuntos de acuerdo a la magnitud de su predictibilidad (baja,
media y alta) y dentro de esos conjuntos existe una jerarqua de similitud entre las series de
tiempo.
La predictibilidad presenta una relacin con la estructura de las series de tiempo, esta
relacin se observ utilizando diferentes formas de representacin de las series de tiempo, en
particular el mapa de recurrencia (VRA) hizo posible observar e identificar patrones de estructura bsicos relacionados con diferentes conjuntos de series de tiempo, las series en dichos
conjuntos, se agruparon en base a la similitud de sus parmetros dinmicos con los que se calcula su predictibilidad. Dado que el mapa de recurrencia muestra la relacin espacial-temporal
entre los valores de una serie de tiempo, el mapa muestra en forma visual la dinmica de la
estructura de la serie. Entonces, los patrones identificados corresponden a dinmicas bsicas
las cuales estn presentes en series de tiempo de diferente origen.
Al estudiar la relacin entre los modelos de prediccin y de modelado con respecto a los
parmetros dinmicos con los que obtiene la predictibilidad, no se encontr un patrn o patrones
comunes de respuesta de los modelos con respecto a los parmetros, cada modelo responde en
forma particular a los diferentes parmetros, lo que indica que se adaptan a la dinmica de las
series de tiempo de forma diferente, lo cual es de esperarse dada la arquitectura particular de
cada modelo. Al considerar la forma en que responden globalmente al conjunto de parmetros
se encontr que en el caso de la prediccin cada modelo responde en forma diferente, pero en
el caso del modelado, los modelos con mayor capacidad de modelar series de tiempo presentan
273
12.2
Estudiar otras formas de representacin de series de tiempo por ejemplo: la descomposicin emprica de modos [190, 191], y su posible utilidad en la caracterizacin de la
predictibilidad de series de tiempo.
Ampliar el conjunto de tcnicas de prediccin evaluadas para extender el alcance del
estudio sobre los modelos de prediccin y su relacin con los parmetros que caracterizan
a las series de tiempo.
Estudiar el proceso de la combinacin de diferentes modelos de prediccin para tratar de
deducir reglas empricas para la combinacin de los mismos.
275
Captulo 13
Apndices
13.1
13.1.1
276
Resumen publicado en: Memorias del XLV Congreso Nacional de Fsica, N. R. Silva
Gonzlez (Editor), Sociedad Mexicana de Fsica, 2002.
Resumen: Se presentan los resultados del anlisis de la relacin entre los parmetros que
caracterizan a las series de tiempo y la dificultad de diferentes tcnicas para la prediccin o
modelado de las mismas. Se identifican parmetros que en conjunto estn correlacionados
con la dificultad de las tcnicas para predecir o modelar a las series. El anlisis hace uso
de tcnicas de inteligencia artificial (Machine Learning) para la identificacin de dichas
correlaciones.
4 Ttulo: Matriz de Conocimiento sobre la Complejidad de Prediccin en Series de Tiempo.
Autores: E. Bautista-Thompson y J. Figueroa-Nazuno.
Presentado en: VII Congreso Iberoamericano en Reconocimiento de Patrones, Mxico, D.
F. del 19 al 22 de Noviembre del 2002.
Artculo publicado en: Reconocimiento de Patrones Avances y Perspectivas, J. L. Daz de
Len Santiago y C. Yez Mrquez (Editores), Centro de Investigacin en Computacin
IPN, 2002.
Resumen: Se presentan los resultados de la evaluacin de la capacidad de diferentes tcnicas para la prediccin y modelado de series de tiempo. Utilizando mapas autoorganizados
(SOM), se identificaron relaciones entre la capacidad de prediccin de las tcnicas y la
complejidad de las series de tiempo. Se construyeron clases de complejidad de las series
y clases de capacidad de prediccin de las tcnicas.
5 Ttulo: Anlisis de Patrones aplicado a Problemas de Teora de Nmeros: El Problema
de Collatz.
Autores: E. Bautista-Thompson, A. Villanueva-Becerril y J. Figueroa-Nazuno.
Presentado en: VII Congreso Iberoamericano en Reconocimiento de Patrones, Mxico, D.
F. del 19 al 22 de Noviembre del 2002.
Artculo publicado en: Reconocimiento de Patrones Avances y Perspectivas, J. L. Daz de
Len Santiago y C. Yez Mrquez (Editores), Centro de Investigacin en Computacin
IPN, 2002.
278
Predictor Vote) have been applied to increase the learning capability of Neural Networks
for Classification and Regression Tasks. In this work, an evolutionary approach (Genetic
Algorithm) has been developed in order to search for the weighted coecients of a combination of non linear predictors (Neural Network and Non Linear Dynamics Techniques)
that minimizes the Prediction Error (RMSE) of predicted outputs. This variant of a
boosting algorithm is evaluated for a set of Time Series from dierent origins (Economy,
Physics and Mathematics).
9 Ttulo: Prediccin de Mltiples Puntos de Series de Tiempo Utilizando Support Vector
Machines.
Autores: E. Guzmn-Ramrez, E. Bautista-Thompson y J. Figueroa-Nazuno.
Presentado en: XII Congreso Internacional de Computacin CIC 2003, Mxico, D. F. del
13 al 17 de Octubre del 2003.
Artculo Publicado en: Avances en Ciencias de la Computacin Vol. 3, J. L. Daz de Len
Santiago, G. Gonzlez Santos y J. Figueroa Nazuno (Editores), Centro de Investigacin
en Computacin IPN, 2003.
Resumen: Se presenta la evaluacin de la prediccin de mltiples puntos de series de
tiempo, mediante un corrimiento de ventana para Support Vector Machines (SVM) con
dos funciones de kernel distintas (lineal y con base radial). Para la evaluacin se utiliz un
conjunto de treinta series de diferente origen y comportamiento dinmico. Se encuentra
que la SVM posee una buena capacidad para ajustarse a las diferentes dinmicas de las
series de tiempo y presenta un buen desempeo para la prediccin de los primeros puntos
de las series utilizando la funcin de kernel radial, a pesar del proceso de expansin del
error de prediccin.
10 Ttulo: Anlisis de la Tolerancia al Ruido en el Modelado de Series de Tiempo con la Red
Neuronal RNAP.
Autores: H. Jimnez-Hernndez, E. Bautista-Thompson y J. Figueroa-Nazuno.
Presentado en: XLVI Congreso Nacional de Fsica, Mrida, Yucatn, del 27 al 31 de
Octubre del 2003.
281
Resumen Publicado en: Memorias del XLVI Congreso Nacional de Fsica, M. L. Marquina
Fbrega (Editor), Sociedad Mexicana de Fsica, 2003.
Resumen: Las Series de Tiempo son un conjunto de valores que caracterizan a un fenmeno. La discretizacin es el resultado de la medicin experimental (en el caso de fenmenos naturales) o de la generacin numrica (en el caso de un modelo analtico) de los
datos que la conforman. Es comn que se presente ruido en las mediciones experimentales
afectando de forma directa la posibilidad de modelado de las series de tiempo. El ruido
que presentan no necesariamente esta distribuido de una manera uniforme. Una manera
de disminuir el efecto del ruido es utilizar mtodos de filtrado, este proceso puede generar
perdida de informacin relevante sobre la serie de tiempo a costa de disminuir el ruido
presente en la misma. En este trabajo se presentan los resultados de la influencia de
distintos tipos de ruido y del proceso de filtrado de los mismos en modelos de series de
tiempo generadas a partir de redes neuronales con la arquitectura RNAP.
11 Ttulo: Descomposicin Emprica de Modos para el Anlisis de Series de Tiempo.
Autores: H. Jimnez-Hernndez, E. Bautista-Thompson y J. Figueroa-Nazuno.
Presentado en: Decimocuarta Reunin de Otoo de Comunicaciones, Computacin, Electrnica y Exposicin Industrial, IEEE ROC&C 2003, Acapulco, Guerrero, del 26 al 30 de
Noviembre del 2003.
Artculo Publicado en: Memorias de la Decimocuarta Reunin de Otoo de Comunicaciones, Computacin, Electrnica y Exposicin Industrial, IEEE ROC&C 2003 (formato
electrnico), IEEE Seccin Mxico, 2003.
Resumen: El anlisis de descomposicin emprica de modos es una nueva tcnica desa
rrollada por Norden E. Huang et. al., para el estudio de seales no lineales y no estacionarias. El uso del concepto de modos, es la principal diferencia con relacin a las
tcnicas derivadas del anlisis de Fourier, las cuales caracterizan de forma global a las
seales y adems requieren que estas cumplan con ser lineales y estacionarias. La capacidad de la tcnica para descomponer seales complejas en un conjunto finito de funciones
intrnsecas de modos, permite la identificacin de frecuencias instantneas a diferentes
escalas de tiempo dentro de la seal. Posibilitando no solo una caracterizacin global,
282
sino tambin local de las seales. El conjunto de funciones intrnsecas sirve adems para
estudiar las estructuras embebidas (o modos de oscilacin) dentro de la seal original, las
cuales se relacionan con la dinmica del fenmeno que la seal representa. En este trabajo, se presenta la aplicacin de esta tcnica a diferentes seales (series de tiempo) corres
pondientes a diversos fenmenos experimentales y numricos. El objetivo es mostrar la
utilidad de la tcnica para la descomposicin de una seal en sus modos de oscilacin. El
anlisis de este conjunto de modos permite el estudio de las diferentes dinmicas presentes
en el fenmeno representado por la seal original.
12 Ttulo: Prediccin de Mltiples Puntos de Series de Tiempo Utilizando Support Vector
Machines.
Autores: E. Bautista-Thompson, E. Guzmn-Ramrez y J. Figueroa-Nazuno.
Artculo Publicado en: Revista Computacin y Sistemas, enero-marzo 2004, volumen 7,
nmero 3, pginas 148-155.
Resumen: Se presenta la evaluacin de la prediccin de mltiples puntos de series de
tiempo, mediante un corrimiento de ventana para Support Vector Machines (SVM) con
dos funciones de kernel distintas (lineal y con base radial). Para la evaluacin se utiliz un
conjunto de treinta series de diferente origen y comportamiento dinmico. Se encuentra
que la SVM posee una buena capacidad para ajustarse a las diferentes dinmicas de las
series de tiempo y presenta un buen desempeo para la prediccin de los primeros puntos
de las series utilizando la funcin de kernel radial, a pesar del proceso de expansin del
error de prediccin.
13 Ttulo: Optimization of Time Series Forecasting by Combination of Models with Evolutionary Heuristic and Error-Correlation Parameters.
Autores: E. Bautista-Thompson y J. Figueroa-Nazuno.
Presentado en: Encuentro Internacional de Ciencias de la Computacin, ENC 2004, Co
lima, Colima, del 20 al 24 de Septiembre del 2004.
Artculo Publicado en: Proceedings of the Fifth Mexican International Conference on
Computer Science 2004, ENC 2004, R. Baeza-Yates, J. L. Marroquin y E. Chvez (Edi283
285
interpretar las relaciones entre las estructuras subyacentes. En este trabajo, se presentan resultados numricos utilizando las tcnicas anteriores, que muestran cmo series de
tiempo de diversos fenmenos, se agrupan en base a la similitud de sus estructuras bsicas, observndose una relacin que es no lineal entre el agrupamiento y el comportamiento
dinmico de las series de tiempo.
Las Figuras 13-1 y 13-2, presentan un cronograma de los trabajos desarrollados a la fecha
y la temtica de cada uno de ellos.
13.1.2
13.2
En el presente apndice se presenta una descripcin paso a paso de las metodologas usadas para
caracterizar las series de tiempo y las tcnicas de prediccin y modelado. Como un ejemplo se
286
2001B
Estudio sobre el
filtrado no lineal en
series de tiempo con
presencia de ruido.
2002A
Evaluacin de
tcnicas de extraccin
de patrones.
2002B
Construccin de clases e
identificacin de
relaciones entre los
parmetros de las series
de tiempo y su
predictibilidad usando
Mapas Autoorganizados.
2002B
2002B
2003A
2003A
2003A
Desarrollo de Mtrica de
Complejidad de Prediccin de
Series y Coeficiente de
Capacidad de Prediccin y
Modelado de Tcnicas.
Aplicacin de mtodos de
anlisis de series de
tiempo a otros tipos de
secuencias de datos para
la identificacin de
patrones de
comportamiento.
Evaluacin de tcnica de
modelado y desarrollo de
una mtrica de modelado
de series de tiempo.
Reduccin de Ruido
y Clculo de la
Dimensin de
Informacin en
Series de Tiempo
Descubrimiento y
Extraccin de
Subestructuras de Bases
de Datos
Anlisis de
Parmetros que
Caracterizan la
Dificultad de
Prediccin en
Series de Tiempo
Matriz de
Conocimiento sobre la
Complejidad de
Prediccin en Series
de Tiempo.
Anlisis de Patrones
aplicado a Problemas
de Teora de Nmeros:
El Problema de Collatz
Evaluacin de Red
Neuronal Artificial
Polinomial (RNAP) para el
Modelado de Series de
Tiempo
Caracterizacin de
Series de Tiempo
con Escalamiento
Multidimensional
Continuacin
2003B
Modificacin y evaluacin de
tcnica de prediccin
basada en SVM para
realizar predicciones de
mltiples puntos en series
de tiempo.
Prediccin de
Mltiples Puntos
de Series de
Tiempo Utilizando
Support Vector
Machines
2003B
Estudio de la tolerancia
al ruido en modelos de
series de tiempo.
Anlisis de la
Tolerancia al Ruido en
el Modelado de Series
de Tiempo con la Red
Neuronal RNAP
2003B
Descomposicin
Emprica de Modos
para el Anlisis de
Series de Tiempo
2004B
Desarrollo de tcnica de
combinacin de predictores
usando informacin sobre la
correlacin de los predictores con
las series de tiempo y los
diferentes errores de prediccin,
evaluacin y comparacin en
conjunto con la tcnica GABoost.
Optimization of Time
Series Forecasting by
Combination of Models
with Evolutionary
Heuristic and Error
Correlation Parameters
2004B
Classification of Time
Series Based on Their
Inner Structures
2004B
Identification of
Structure-Predictability
Relations with Pattern
Recognition
Techniques
2004B
288
13.2.1
Los pasos para la caracterizacin de la predictibilidad de las series de tiempo son los siguientes:
1 Seleccionar las series de tiempo que se desean estudiar.
2 Estandarizar el nmero de datos que posee cada serie de tiempo por medio de su preprocesamiento, para obtener un conjunto de series con la misma cantidad de datos.
3 Calcular los siguientes parmetros para cada una de las series de tiempo: Exponente
de Lyapunov, Dimensin de Correlacin, Dimensin de Capacidad, Dimensin Fractal,
Dimensin Embebida, Entropa Espacio Temporal, Recurrencia, Determinismo, Entropa
de Informacin de Shannon, Informacin Mutua Promedio, Complejidad Relativa LempelZiv, Nmero de Reglas de Produccin, Exponente de Hurst y Auto correlacin.
4 Aplicar la mtrica de Coeficiente de Dificultad de Prediccin: CDP2 para calcular la
predictibilidad de las series de tiempo bajo estudio, donde la expresin de la mtrica
como se describi en la seccin 9.2 es:
CDP2 = Log10
+ 1 (13.1)
1
CDP2
(13.2)
Series de Tiempo
Clculo de
Parmetros de Series
de Tiempo
Preprocesamiento de
las Series de Tiempo
Clculo de la
Predictibilidad de
Series de Tiempo
Repositorio de
Informacin sobre las
Series de Tiempo
Anlisis de la
Predictibilidad con
Tcnicas
Multivariadas
2.0
1.5
1.0
x (n)
0.5
0.0
-0.5
-1.0
-1.5
-2.0
0
200
400
600
800
1000
20
x (n)
15
10
0
0
200
400
600
800
291
1000
Serie de Tiempo
Doublesine
SPECTA
Comportamiento
Dinmico
peridica
compleja
Correlacin de
Pearson
(Autocorrelacin)
0.9739691
0.04924266
0.6143159
0.009643
0.015625
0.03125
1.027
0.839
Dimensin de
Correlacin
0.871
3.506
Dimensin de
Capacidad
0.604
2.619
Dimension Fractal
0.84
0.8
Dimensin
Embebida
Entropa Espacio
Temporal (%)
80
Recurrencia (%)
9.911
3.452
Determinismo (%)
47.743
Entropa de
Informacin
(Shannon)
1.653
Informacin Mutua
Promedio
0.1295552
1.056373
18
79
Exponente de
Hurst
Frecuencia
Dominante
Exponente de
Lyapunov
Complejidad
Relativa LZ
Nmero de
Reglas de
Produccin
292
13.2.2
usaron los siguientes promedios sobre las medidas anteriores: hRMSEj ik , hBEj ik ,
hMAEj ik .
293
294
1.0
1.5
-2.0
-1.5
-1.0
-.5
0.0
.5
-2
ikeda
(0.83)
kobe
elnio
Agrupamiento 2
-1
(0.43)
Anlisis MDS
(0.85)
tent
(1.23)
hivdna
(0.88)
qp3
(0.85)
(1.03)
brownian
vandpol
(1.56)
humandna
Agrupamiento 5
(1.17)
(1.79)
dowjones
Agrupamiento 4
rossler qp2 (1.26)
(1.65)
(1.54)
dsine
(1.86) sine
(1.06)
lorenz
lovaina (0.83)
laser
(0.77)
Dimensin 1
d1
(0.88)
a1
Agrupamiento 3
star
(0.56)
(0.68)
(0.43) asciitxt (0.51)
(0.64)
(0.40)
primos (0.48)
mg
specta
eeg (0.44)
cantor whiten (0.32)
(0.66)
(0.37)
logistic (0.53)
henon (0.60)
plasma
sp500
Agrupamiento 1
Dimensin 2
Figura 13-8: Comparacin del mapa de recurrencia de la serie Doublesine con el patrn bsico
asociado
Figura 13-9: Comparacin del mapa de recurrencia de la serie SPECTA con los patrones bsicos
asociados
295
y del resultado de la prediccin, se comparan ambas grficas para evaluar si los datos
predichos reproducen los originales sujetos a la siguiente regla: si la serie predicha sigue
la tendencia (trend) de la serie original, as como su amplitud, an cuando a una escala de
mayor resolucin no exista una mejor prediccin, se considera que la prediccin es buena.
7 Ahora se procede a la evaluacin de cada tcnica de prediccin usando el conjunto de
series de tiempo.
8 Una vez identificadas las predicciones exitosas para cada tcnica, se calculan los errores
de la prediccin mencionados en el paso 5.
9 Como complemento se calcula la predictibilidad de cada una de las series de tiempo usadas
en la evaluacin de las tcnicas de prediccin
10 Para finalmente determinar la capacidad de prediccin de cada tcnica usando la expresin
(ver la seccin 9.4 para una descripcin ms detallada de sus trminos):
CCAP =
SCDP2 EP
P RMSE + P MAE
(13.3)
13.3
296
Series de
Tiempo
Preprocesamiento de
las Series de Tiempo
Tcnicas de
Prediccin (o
Modelado)
Evaluacin de
las Tcnicas
con el Conjunto
de Series de
Tiempo
Identificacin de
las Series
Predichas por
cada Tcnica
Series Predichas
Clculo de los
Errores de
Prediccin
Series no Predichas
Repositorio de
Informacin
sobre las
Tcnicas
Evaluadas
Clculo de la
Predictibilidad
de Series de
Tiempo
Clculo de la
Capacidad de
Prediccin (o
de Modelado)
de las Tcnicas
Figura 13-10: Diagrama de la metodologa para calcular la capacidad de tcnicas para la prediccin o el modelado
297
Nmero de Producciones
90
85
80
75
70
65
60
55
50
45
40
35
30
25
20
15
10
5
0
-5
-10
El nio
Qperiodic3
White Noise
Lorenz
Sine
200
400
600
800
1000
Tiempo
Figura 13-11: Ejemplos de las curvas de evolucin de las reglas de produccin para las series de
tiempo
298
Nmero de Producciones
Sine
Ajuste lineal de la curva
90
85
80
75
70
65
60
55
50
45
40
35
30
25
20
15
10
5
0
-5
-10
0
200
400
600
800
1000
Tiempo
Figura 13-12: Ejemplo del clculo de la regresin lineal sobre la curva para la serie de tiempo
Sine
La Figura 13-12, muestra un ejemplo del clculo mediante regresin lineal de la pendiente
de la curva para la serie de tiempo Sine y la Figura 13-13 muestra el conjunto de parmetros
calculados (A ordenada al origen y B pendiente de la curva).
En la Figura 13-14, se presenta la tabla con los valores de la pendiente de la curva para cada
serie de tiempo usada en la tesis, junto con los datos de las variables de control: nmero de
predicciones para cada serie de tiempo (NumPred) y nmero de modelaciones para cada serie
de tiempo (NumMod).
La correlacin de la pendiente de la curva respecto a las variables de control Numpred y
NumMod se presenta en la tabla de la Figura 13-15, su correlacin con respecto a la prediccin
de las series de tiempo representada por la variable NumPred es menor a la correspondiente
a la mtrica CDP2 desarrollada en la presente tesis, lo que nuevamente corrobora que utilizar
un solo parmetro para caracterizar la predictibilidad de las series de tiempo, aunque puede ser
til en caracterizar una faceta de la predictibilidad de las series de tiempo (en este caso de tipo
299
Figura 13-13: Resultado del clculo con regresin lineal para la serie de tiempo Sine
complejidad computacional mediante el anlisis gramticas), no proporciona la informacin
suficiente para cuantificarla en forma completa.
13.4
Serie de
Tiempo
Sine
Vanderpol
Qperiodic2
Qperiodic3
MackeyGlass
Logistic
Lorenz
Rossler
Ikeda
Henon
Cantor
Tent
A1
D1
Laser
Dow Jones
Kobe
EEG
ASCIITXT
El nio
HIV DNA
Human DNA
Lovaina
Plasma
Primos
SP500
Star
Brownian
Motion
White Noise
Nmero de
Pendiente de Nmero de
la Curva de Predicciones Modelaciones
por Serie
por Serie
Reglas de
(NumMod)
Produccin (NumPred)
0.01405
0.01983
0.05915
0.07047
10
8
4
9
9
9
7
6
0.07186
0.05245
0.05752
0.06375
0.06334
0.06486
0.07048
0.00577
0.07931
0.0871
0.05892
0.05899
0.07552
0.07241
0.07423
0.07525
0.00399
0.03991
0.07015
0.08136
0.06748
0.07669
0.08624
4
6
6
1
5
0
8
8
0
8
5
3
2
0
3
0
6
3
2
0
0
1
6
7
7
2
4
0
6
7
5
7
6
4
4
0
4
0
5
6
3
0
0
6
0.07738
0.06791
Figura 13-14: Tabla de valores de la pendiente de la curva para el conjunto de series de tiempo
301
Correlacin
Nmero de
Nmero de
Predicciones Modelaciones
por Series
por Serie
(NumPred)
(NumMod)
Pendiente de
la Curva de
Reglas de
Produccin
-0.445
-0.197
Figura 13-15: Tabla de la correlacin entre la pendiente de la curva y las variables de control
NumPred y NumMod
entre s por lneas lo cul forma una figura geomtrica caracterstica. La Figura 13-16, muestra
la codificacin usada en las grficas radiales para identificar a cada uno de los parmetros, las
Figuras 13-17 a 13-21, presentan las grficas correspondientes al conjunto de series de tiempo.
La grfica de tipo radial proporciona una visualizacin de las diferentes facetas de la
dinmica de las series de tiempo, y muestra como cada parmetro proporciona diferente informacin sobre la misma, se observa que el peso de la informacin proporcionada por cada
parmetro es diferente para cada serie de tiempo, y cada serie adems posee una figura geo
mtrica caracterstica sobre su dinmica, las series de tiempo cuya predictibilidad es mayor
presentan una figura geomtrica ms abierta, mientras que las series de tiempo con una predictibilidad baja presentan una figura geomtrica ms cerrada (por ejemplo, EEG, Ikeda, SP500,
Cantor, ASCIITXT, Plasma, Primos y White Noise), las grficas ilustran la naturaleza multidimensional de la predictibilidad de las series de tiempo, y la riqueza de informacin que puede
ser extrada de una serie de tiempo.
13.5
302
Parmetro
Nmero asociado
Correlacin de Pearson
Exponente de Hurst
Exponente de Lyapunov
Dimensin de Correlacin
Dimensin de Capacidad
Dimension Fractal
Dimensin Embebida
Recurrencia (%)
Determinismo (%)
10
11
12
Complejidad Relativa LZ
13
14
303
Sine
Vanderpol
1
14
0.9
14
0.8
0.7
13
0.6
0.7
13
0.5
0.4
0.4
0.3
12
0.2
0.1
11
5
10
5
10
6
9
0.2
0.1
11
0.6
0.5
0.3
12
0.9
0.8
6
9
7
8
Qperiodic3
Qperiodic2
1
14
14
0.9
0.7
13
0.6
0.5
0.5
0.4
0.4
0.3
12
0.7
13
0.6
1
0.9
0.8
0.8
12
0.2
0.3
0.2
0.1
0.1
11
11
5
10
10
6
9
5
6
7
7
8
Mackey-Glass
Logistic
1
14
0.9
1
2
0.8
14
0.7
13
0.8
0.6
0.5
12
1
0.9
0.7
13
0.4
0.5
0.3
0.4
0.2
0.3
12
0.1
0.6
0.2
0.1
11
5
10
11
6
9
5
10
6
9
7
8
Figura 13-17: Grficas radiales de los parmetros de las series de tiempo: Sine, Vanderpol,
Qperiodic2, Qperiodic3, Mackey-Glass y Logistic
304
Rossler
Lorenz
1
14
14
0.9
0.7
0.5
0.4
0.4
0.3
12
0.2
0.1
5
10
11
6
9
0.2
0.1
11
0.6
0.5
0.3
12
0.7
13
0.6
0.8
0.8
13
1
0.9
5
10
6
9
Ikeda
Henon
1
14
1
2
0.9
14
0.8
0.6
0.7
13
0.5
0.5
0.4
0.3
0.2
0.3
12
0.1
0.1
0
11
5
10
11
6
9
5
10
6
9
Cantor
Tent
1
1
1
14
0.9
0.7
0.7
13
0.6
0.5
0.4
0.4
0.3
12
0.2
0.1
11
5
10
5
10
6
9
0.2
0.1
11
0.6
0.5
0.3
12
1
0.9
0.8
0.8
13
0.2
14
0.6
0.4
12
0.8
0.7
13
1
0.9
6
9
7
8
Figura 13-18: Grficas radiales de los parmetros de las series de tiempo: Lorenz, Rossler,
Ikeda, Henon, Cantor y Tent
305
A1
D1
14
0.9
14
0.8
0.6
0.7
13
0.5
0.4
0.4
0.2
0.3
12
0.1
0.1
0
11
5
10
11
6
9
5
10
6
9
8
Laser
Dow Jones
1
14
0.9
0.7
0.5
0.4
0.4
0.3
0.3
12
0.2
0.1
0
11
11
5
10
9
5
10
6
9
7
8
Kobe
EEG
1
1
1
14
0.9
0.7
0.7
13
0.6
1
0.9
0.8
0.8
0.6
0.5
0.5
0.4
0.4
0.3
12
0.2
0.1
13
0.6
0.5
14
0.7
13
0.6
1
0.9
0.8
0.8
12
1
13
0.2
14
0.6
0.5
0.3
12
0.8
0.7
13
1
0.9
12
0.2
0.3
0.2
0.1
0.1
11
11
5
10
10
6
9
5
6
9
7
8
Figura 13-19: Grficas radiales de los parmetros de las series de tiempo: A1, D1, Laser, Dow
Jones, Kobe y EEG
306
El nio
ASCIITXT
1
14
14
0.9
0.8
0.8
0.7
13
12
0.7
13
0.6
0.5
0.4
0.4
0.3
0.3
12
0.2
0.1
11
5
10
6
9
0.2
0.1
11
0.6
0.5
10
0.9
6
9
7
8
Human DNA
HIV DNA
1
14
14
0.9
13
0.5
0.4
0.4
0.3
12
0.2
0.1
11
5
10
5
10
6
9
6
9
Lovaina
Plasma
1
14
1
2
0.9
14
0.8
0.6
0.7
13
0.5
0.4
0.4
0.2
0.3
12
0.1
0.6
0.5
0.3
12
1
0.9
0.8
0.7
13
0.2
0.1
11
0.6
0.5
0.3
12
0.7
13
0.6
0.8
0.8
0.7
1
0.9
0.2
0.1
11
5
10
11
6
9
5
10
6
9
7
8
Figura 13-20: Grficas radiales de los parmetros de las series de tiempo: ASCIITXT, El nio,
HIV DNA, Human DNA, Lovaina y Plasma
307
SP500
Primos
1
14
14
0.9
0.8
13
0.6
0.5
0.4
0.4
0.3
0.3
12
0.2
0.1
11
5
10
10
6
9
Star
Brownian Motion
0.9
1
14
0.8
0.5
0.7
13
0.6
1
0.9
0.8
0.7
0.6
0.5
0.4
0.4
0.3
12
1
13
0.2
0.1
11
14
0.6
0.5
12
0.8
0.7
0.7
13
0.9
0.3
12
0.2
0.2
0.1
0.1
11
11
5
10
10
6
9
5
6
9
7
8
7
8
White Noise
1
14
0.9
0.8
0.7
13
0.6
0.5
0.4
0.3
12
0.2
0.1
0
11
5
10
6
9
7
8
Figura 13-21: Grficas radiales de los parmetros de las series de tiempo: Primos, SP500, Star,
Brownian Motion, White Noise
308
Linear
Euclidean F
Cubic
Euclidean U
Manhattan Block Q
Manhattan Block V
Max Norm C
Max Norm H
Max Norm M
Max Norm R
Max Norm W
By Cosine D
By Cosine I
By Cosine N
By Cosine S
By Cosine X
By Correlation E
By Correlation J
By Correlation O
By Correlation T
By Correlation Y
Nearest Neighbor
Euclidean
Euclidean K
Gaussian
Locally Constant
Euclidean
EE
Locally Linear
Euclidean JJ
Manhattan Block AA
Manhattan Block FF
Manhattan Block KK
Max Norm BB
Max Norm GG
Max Norm LL
By Cosine CC
By Cosine HH
By Cosine MM
By Correlation DD
By Correlation II
By Correlation NN
Figura 13-22: Modelos de prediccin evaluados en el estudio experimental de O. HerreraAlcntara et. al.
estn codificados por etiquetas (letras maysculas) obsrvese que nuevamente se verifica la
afirmacin de que no hay modelos capaces de predecir todas las series de tiempo.
13.6
Los teoremas de No Free Lunch (NFL) imponen lmites al rendimiento de los algoritmos para
bsqueda y optimizacin. Si un algoritmo es eficiente para una clase particular de problemas
entonces su rendimiento para las clases de problemas restantes ser pobre. Los teoremas se
aplican tanto a algoritmos deterministas como a algoritmos estocsticos y fueron construidos
en forma general sin particularizar en algn algoritmo especifico, aunque fueron publicados
originalmente en revistas del rea de computacin evolutiva [55, 56], eso no limita su uso
a problemticas similares de otras reas. En el caso del problema de prediccin de series
de tiempo, por ejemplo, la bsqueda de los parmetros ptimos para modelar y predecir la
dinmica de una serie de tiempo por parte de una red neuronal, cae dentro de la problemtica
planteada por dichos teoremas. Y en general el problema de prediccin de series de tiempo puede
verse como un problema de optimizacin multiobjetivo, en el cul se buscan los parmetros
309
min(En)
0.000000
#Serie-Serie
26 - Sine
Tipo
artificial
0.000000
29 -Vanderpol
artificial
0.000469
0.002099
0.003361
0.038376
0.166785
0.233121
0.258252
0.455643
0.617193
0.684171
0.833612
0.864338
0.890679
17 - Lorenz
24 - Rossler
22 - Qperiodic2
19 Mackey-Glass
28 - Tent
23 - Qperiodic3
1- A1
15 - Laser
18 - Lovaina
6 - Dow Jones
5 - D1
20 - Plasma
14 - Kobe
artificial
artificial
natural
artificial
artificial
natural
natural
natural
artificial
natural
artificial
natural
natural
Experimento
H,P,Q,R,Z,AA,BB,CC, EE
FF, GG, HH, JJ, KK, LL
MM, I, JJ, KK, LL, MM
H,P,Q,R,Z,AA,BB,CC,
EE,FF,GG,HH,JJ,KK,LL
MM,I,JJ,KK,LL,MM
KK
A
LL
U
HH
G
A
V
M
AA
BB
F
II
310
Bibliografa
[1] P. E. Rapp, T. I. Schmah y A. I. Mees, "Models of Knowing and the Investigation of
Dynamical Systems", Physica D, vol. 132, 1999, pg. 133-149.
[2] C. K. R. T. Jones, "Whiter Applied Nonlinear Dynamics?", Mathematics Unlimited-2001
and Beyond, B. Engquist y W. Schmid (Editores), Springer-Verlag, Berlin, 2001, pg.
631-645.
[3] H. Kantz y T. Schreiber, Nonlinear Time Series Analysis, Cambridge University Press,
Cambridge, 2000.
[4] A. Espinosa-Romero, E. Vargas-Medina y J. Figueroa-Nazuno, "Anlisis de Seales Ape
ridicas por Mtodos Gramaticales y Caticos ", Memorias del Congreso Internacional
de Ingeniera Elctrica, Electrnica y Computacin MEXICON-94, UDLA, Puebla, 1994.
[5] J. Figueroa Nazuno, E. Vargas Medina, W. W. Mayol Cuevas y A. Espinosa Romero, "The
Analysis and Representation of Complex Aperiodic and Chaotic Signals with Ultrametri
city Techniques", Proceedings of Third SIAM Conference on Applications of Dinamical
Systems, SIAM Society for Industrial and Applied Mathematics, Philadelphia, 1995.
[6] J. Kurths, U. Schwarz, A. Witt, R. Th. Krampe y M. Abel, "Measures of Complexity in
Signal Analysis" Proceedings of the Third Technical Conference on Nonlinear Dynamics
(Chaos) and Full Spectrum Processing, Naval Undersea Warfare Center, Mystic, 1995.
[7] M. Palus, "Coarse-Grained Entropy Rates for Characterization of Complex Time Series",
Physica D, vol. 93, 1996, pg. 64-77.
311
[8] A. Espinosa-Contreras y J. Figueroa-Nazuno, "Anlisis del Comportamiento de la Prdida de Paquetes en la Red Internet con Tcnicas de la Dinmica No-Lineal", Memorias
del Congreso Internacional de Computacin CIC 2000, Centro de Investigacin en Computacin IPN, Mxico D. F., 2000, pg. 529-535.
[9] E. Bautista-Thompson y J. Figueroa-Nazuno, "Anlisis de Parmetros que Caracterizan
la Dificultad de Prediccin en Series de Tiempo", Memorias del XLV Congreso Nacional
de Fsica, Sociedad Mxicana de Fsica, Len, 2002, pg. 59.
[10] E. Bautista-Thompson y J. Figueroa-Nazuno, "Matriz de Conocimiento sobre la Complejidad de Prediccin en Series de Tiempo", Reconocimiento de Patrones Avances y
Perspectivas, Research on Computing Science Vol. 1, J. L. Daz de Len-Santiago y C.
Ynez-Mrquez (Editores), VII Congreso Iberoamericano en Reconocimiento de Patrones,
Centro de Investigacin en Computacin IPN, Mxico D. F., 2002, pg. 337-348.
[11] F. X. Dielbold, Elements of Forecasting, South-Western Thomson Learning, Cincinnati,
2001.
[12] S. A. DeLurgio, Forecasting Principles and Applications, McGraw-Hill, Boston, 1998.
[13] M. Casdagli y S. Eubank (Editores), Nonlinear Modeling and Forecasting, SFI Studies in
the Sciences of Complexity, Adisson-Wesley Longman, Reading, 1992.
[14] A. Weigend y N. Gershenfeld (Editores), Time Series Prediction. Forecasting the Future
and Understanding the Past, SFI Studies in the Sciences of Complexity, Proc. Vol. XVII,
Addison-Wesley, Reading, 1994.
[15] D. P. Mandic y J. A. Chambers, Recurrent Neural Networks for Prediction Learning
Algorithms, Architecture and Stability, John Wiley & Sons, New York, 2001.
[16] T. Masters, Neural Novel & Hybrid Algorithms for Time Series Prediction, John Wiley
& Sons, New York, 1995.
[17] E. A. Wan, Finite Impulse Response Neural Networks with Applications in Time Series
Prediction, Ph. D. Thesis, Department of Electrical Engineering, Stanford University,
1993.
312
313
[26] B. Schoner, Probabilistic Characterization and Synthesis of Complex Driven Systems, Ph.
D. Thesis, Program in Media, Arts and Sciences, School of Architecture and Planning,
MIT, 2000.
[27] J. A. K. Suykens y J. Vandewalle (Editores), Nonlinear Modeling Advanced Black-Box
Techniques, Kluwer Academic Press, Amsterdam, 1998.
[28] S. Makridakis y M. Hibon, "The M3-Competition: Results, Conclusions and Implications", International Journal of Forecasting, vol. 16, nm. 4, 2000, pg. 451-476.
[29] P. Newbold y C. W. J. Granger, "Experience with Forecasting Univariate Time-Series
and the Combination of Forecasts (with Discussion)", J. Roy. Statist. Soc. A, vol. 137,
1974, pg. 131-165.
[30] D. J. Reid, "A Review of Short-Term Projection Techniques", Practical Aspects of Forecasting, Editor H. A. Gordon, Op. Res. Soc., London, 1975, pg. 8-25.
[31] S. Makridakis, A. Anderson, R. Carbone, R. Fildes, M. Hibon, R. Lewandowski, J. Newton, E. Parzen y R. Winkler, "The Accuracy of Extrapolation (Time Series) Methods:
Results of a Forecasting Competition", Journal of Forecasting, vol. 1, 1982, pg. 111-153.
[32] S. Makridakis, A. Anderson, R. Carbone, R. Fildes, M. Hibon, R. Lewandowski, J. Newton, E. Parzen y R. Winkler, The Forecasting Accuracy of Major Time Series Methods,
John Wiley & Sons, New York, 1984.
[33] D. H. R. Price y J. A. Sharp, "A Comparison of the Performance of Dierent Univariate Forecasting Methods in a Model of Capacity Acquisition in UK Electricity Supply",
International Journal of Forecasting, vol. 2, nm. 3, 1986, pg. 333-348.
[34] M. Casdagli, "Nonlinear Prediction of Chaotic Time Series", Physica D, vol. 35, 1989,
pp. 212-233.
[35] A. Garca-Ferrer, J. Del Hoyo y A. S. Martn-Arroyo, " On Univariate Forecasting Comparisons: The Case of the Spanish Automobile Industry", Journal of Forecasting, vol. 16,
nm. 1, 1997, pg. 1-17.
314
[36] M. Guo y Y. K. Tseng, "A Comparison Between Linear and Nonlinear Forecasts for
Nonlinear AR Models", Journal of Forecasting, vol. 16, nm. 7, 1997, pg. 491-508.
[37] M. Adya y F. Collopy, "How Eective are Neural Networks at Forecasting and Prediction?
A Review and Evaluation", Journal of Forecasting, vol. 17, nm. 5-6, 1998, pg. 481-495.
[38] S. Moshiri y N. Cameron, "Neural Networks Versus Econometric Models in Forecasting
Inflation", Journal of Forecasting, vol. 19, nm. 3, 2000, pg. 201-217.
[39] S. Gokcan, "Forecasting Volatility of Emerging Stock Markets: Linear Versus Non-Linear
GARCH Models", Journal of Forecasting, vol. 19, nm. 6, 2000, pg. 499-504.
[40] G. A. Darbellay y M. Slama, "Forecasting the Short-Term Demand for Electricity, Do
Neural Networks Stand a Better Chance?", International Journal of Forecasting, vol. 16,
nm. 1, 2000, pg. 71-83.
[41] N. Meade, "A Comparison of the Accuracy of Short Term Foreign Exchange Forecasting
Methods", International Journal of Forecasting, vol. 18, nm. 1, 2002, pg. 67-83.
[42] L. R. Weatherford y S. E. Kimes, "A Comparison of Forecasting Methods for Hotel
Revenue Management", International Journal of Forecasting, vol. 19, nm. 3, 2003, pg.
401-415.
[43] P. Newbold, J. K. Zumwalt y S. Kannan, "Combining Forecasts to Improve Earnings
Per Share Prediction. An Examination of Electric Utilities", International Journal of
Forecasting , vol. 3, nm. 2, 1987, pg. 229-238.
[44] D. K. Fan, K-N. Lau y P-L. Leung, "Combining Ordinal Forecasts with an Application
in a Financial Market", Journal of Forecasting, vol. 15, nm. 1, 1996, pg. 37-48.
[45] R. G. Donaldson y M. Kamstra, "Forecast Combining with Neural Networks", Journal
of Forecasting, vol. 15, nm. 1, 1996, pg. 49-61.
[46] C. T. West, "System-Based Weights Versus Series-Specific Weights in the Combination
of Forecasts", Journal of Forecasting, vol. 15, nm. 5, 1996, pg. 369-383.
315
[47] S. I. Gunter y C. Aksu, "The Usefulness of Heuristic N(E)RLS Algorithms for Combining
Forecasts", Journal of Forecasting, vol. 16, nm. 6, 1997, pg. 439-462.
[48] A. Fiordaliso,"A Nonlinear Forecasts Combination Method Based on Takagi-Sugeno
Fuzzy Systems", International Journal of Forecasting, vol. 14, nm. 3, 1998, pg. 367-379.
[49] L. M. de Menezes y D. W. Bunn, "The Persistence of Specification Problems in the
Distribution of Combined Forecasts Errors", International Journal of Forecasting , vol.
14, nm. 3, 1998, pg. 415-426.
[50] I. Fischer y N. Harvey, "Combining Forecasts: What Information Do Judges Need to
Outperform the Simple Average?", International Journal of Forecasting, vol. 15, nm. 3,
1999, pg. 227-246.
[51] J. V. Hansen, Combining Predictors Meta Machine Learning Methods and Bias-Variance
& Ambiguity Decompositions, Ph. D. Thesis, Department of Computer Science, University
of Aarhus, 2000.
[52] N. R. Swanson y T. Zeng, "Choosing Among Competing Econometric Forecasts:
Regression-Based Forecast Combination Using Model Selection", Journal of Forecasting,
vol. 20, nm. 6, 2001, pg. 425-440.
[53] J. Shadbolt y J. G. Taylor (Editores), Neural Networks and the Financial Markets. Predicting, Combining and Portfolio Optimisation, Springer-Verlag, London, 2002.
[54] N. Terui y H. K. van Dijk, "Combined Forecasts from Linear and Nonlinear Time Series
Models", International Journal of Forecasting, vol. 18, nm. 3, 2002, pg. 421-438.
[55] D. H. Wolpert y W. G. Macready, "No Free Lunch Theorems for Search", Santa Fe
Technical Report Number SFI-TR-95-02-010, Santa Fe Institute, Santa Fe, 1995.
[56] D. H. Wolpert y W. G. Macready, "No Free Lunch Theorems for Optimization", IEEE
Transactions on Evolutionary Computation, vol. 1, nm. 1, 1997, pg. 67-82.
[57] Y. Bar-Yam, Dynamics of Complex Systems, Perseus Books, Reading, 1997.
[58] S. Wolfram, Cellular Automata and Complexity, Westview Press, Reading, 1994.
316
[59] Edward Ott, Chaos in Dynamical Systems, Cambridge University Press, Cambridge, 2000.
[60] C. A. Pickover, Computers, Pattern, Chaos, and Beauty, Dover Publications, Mineola,
2001.
[61] E. Bautista-Thompson, A. Villanueva-Becerril y J. Figueroa-Nazuno,"Anlisis de Patrones Aplicado a Problemas de Teora de Nmeros: El Problema de Collatz", Reconocimiento de Patrones Avances y Perspectivas, Research on Computing Science Vol.
1, J. L. Daz de Len-Santiago y C. Ynez-Mrquez (Editores), VII Congreso Iberoame
ricano en Reconocimiento de Patrones, Centro de Investigacin en Computacin IPN,
Mxico D. F., 2002, pg. 349-358.
[62] H. Whitney, "Dierentiable Manifolds", Annals of Mathematics, vol. 37, nm. 03, 1934,
pg. 645-680.
[63] F. Takens, "Detecting Strange Attractors in Turbulence", Lecture Notes in Mathematics,
vol. 898, 1981, pg. 366-381.
[64] J. M. Medina-Apodaca, Herramienta para la Extraccin de Redes Bayesianas Predictivas
a partir de Bases de Datos Temporales, Tesis de Maestra en Ciencias de la Computacin,
Centro de Investigacin en Computacin, Instituto Politcnico Nacional, Mxico D. F.,
2005.
[65] D. C. Baird, Experimentacin: Una Introduccin a la Teora de Mediciones y al Diseo
de Experimentos, Prentice-Hall Hispanoamericana, Mxico, 1991.
[66] E. Bautista-Thompson, A. Snchez-Fernndez y J. Figueroa-Nazuno, "Reduccin de
Ruido y Clculo de la Dimensin de Informacin en Series de Tiempo", Memorias del
XLIV Congreso Nacional de Fsica, Sociedad Mexicana de Fsica, Morelia, 2001, pg. 99.
[67] H. Jimnez-Hernndez, E. Bautista-Thompson y J. Figueroa-Nazuno, "Anlisis de la
Tolerancia al Ruido en el Modelado de Series de Tiempo con la Red Neuronal RNAP",
Memorias del XLVI Congreso Nacional de Fsica, Sociedad Mexicana de Fsica, Mrida,
2003, pg. 173.
317
318
[80] G. Box y G. Jenkins, Time-series Analysis, Forecasting and Control, Prentice Hall, Englewood Clis, 1976.
[81] P. Holmes, "Poincar, Celestial Mechanics, Dynamical-Systems Theory and Chaos",
Physics Reports, vol. 193, pg. 137-163, 1990.
[82] F. X. Diebold y L. Kilian, "Measuring Predictability: Theory and Macroeconomic Applications", Working Papers Series Number 97-23, Federal Reserve Bank of Philadelphia,
Philadelphia, 1997.
[83] C. Brooks, "Linear and Non-Linear (Non-)Forecastability of High-Frequency Exchange
Rates", Journal of Forecasting, vol. 16, nm. 2, 1997, pg. 125-145.
[84] L. A. Smith, "Disentangling Uncertainty and Error: On the Predictability of Nonlinear
Systems", Nonlinear Dynamics and Statistics, A. Mees (Editor), Birkhuser, Boston,
2000.
[85] D. Avramov, "Stock-Return Predictability and Model Uncertainty", Rodney L. White
Center for Financial Research Working Papers Number 12-00, The Wharton School University of Pennsylvania, Philadelphia, 2000.
[86] M. Brisson, B. Campbell y J. W. Galbraith, "Forecasting Some Low-Predictability Time
Series Using Diusion Indices", CIRANO Working Papers Number 2001 s-46, CIRANO:
Centre for Interuniversity Research and Analysis on Organizations, Quebec, 2001.
[87] U. Feldmann y J. Bhattacharya, "Mixed Predictability as an Asymmetrical Measure of
Interdependence in Multivariate Time Series", 6th Experimental Chaos Conference, M.
Spano (Editor), American Institute of Physics, USA, 2002.
[88] U. Feldmann y J. Bhattacharya, "Predictability Improvement as an Asymmetrical Measure of Interdependence in Bivariate Time Series", Int. J. Bifurcation and Chaos, vol. 14,
nm. 2, 2004.
[89] W. Ferson y C. Harvey, "The Risk and Predictability of International Equity Returns",
Review of Financial Studies, vol. 6, 1993, pg. 527-566.
319
[90] W. Ferson y R. Korajczyk, "Do Arbitrage Pricing Models Explain the Predictability of
Asset Returns?, Journal of Business, vol. 68, 1995, pg. 309-349.
[91] M. Pesaran y A. Timmermann, "Predictability of Stock Returns: Robustness and Economic Significance", Journal of Finance, vol. 50, 1995, pg. 1201-1228.
[92] S. Kandel y R. Stambaugh, "On the Predictability of Stock Returns: An Asset Allocation
Perspective", Journal of Finance, vol. 51, 1996, pg. 385-424.
[93] A. Lo y A. MacKinlay, "Maximizing Predictability in the Stock and Bond Markets",
Macroeconomic Dynamics, vol. 1, 1997, pg. 102-134.
[94] M. Cooper, D. H. Downs y G. A. Patterson, "Asymmetric Information and the Predictability of Real State Returns", The Journal of Real Estate Finance and Economics,
vol. 20, nm. 2, 2000.
[95] M. Pritamani y V. Singal, "Return Predictability Following Large Price Changes and
Informational Releases", Journal of Banking and Finance, vol. 25, 2001, pg. 631-656.
[96] H. Gulen, "Learning About Out-of-Sample Predictability and Its Impact on Real-Time
Investments Decisions", Working Papers Series, Department of Finance, Pamplin College
of Business Virginia Tech, Virginia, 2001.
[97] A. Ang y G. Bekaert, "Stock Return Predictability: Is it There?, NBER Working Papers
Series Number 8207, National Bureau of Economic Research, Inc., Cambridge, 2001.
[98] M. J. Cooper, W. E. Jackson III y G. A. Patterson, "Evidence of Predictability in the
Cross-Section of Bank Stock Returns", Journal of Banking and Finance, vol. 27, 2003,
pg. 817-850.
[99] V. R. Eleswarapu y M. R. Reinganum, "The Predictability of Aggregate Stock Market
Returns: Evidence Based on Glamour Stocks", The Journal of Business, vol. 77, nm. 2,
2004.
[100] N. P. Jewell y P. Bloomfield, "Canonical Correlations of Past and Future for Time Series:
Definitions and Theory", Annals of Statistics, vol. 11, 1983, pg. 837-847.
320
[112] K. J. M. Cremers, "Stock Return Predictability: A Bayesian Model Selection Perspective", Review of Financial Studies, vol. 15, nm. 4, 2002, pg. 1223-1249.
[113] W. Ebeling, L. Molgedey, J. Kurths y U. Schwarz, "Entropy, Complexity, Predictability
and Data Analysis of Time Series and Letter Sequences", Theory of Disaster, A. Bundle
y H. J. Schellnhuber (Editores), Springer-Verlag, Berlin, 2000.
[114] L. Molgedey y W. Ebeling, "Intraday Patterns and Local Predictability of High Frequency
Financial Time Series", Physica A: Statistical Mechanics and Its Applications, vol. 287,
nm. 3-4, 2000, pg. 420-428.
[115] L. Molgedey y W. Ebeling, "Local Order, Entropy and Predictability of Financial Time
Series", Eur. Phys. J. B, vol. 15, 2000, pg. 733-737.
[116] R. Menchaca-Mndez, C. Snchez-Rodriguez., A. Espinosa-Contreras y J. FigueroaNazuno, "Modelado y Caracterizacin de Series de Tiempo por Medio de Anlisis Gramatical", Memorias del XLIII Congreso Nacional de Fsica, Sociedad Mexicana de Fsica,
Puebla, 2000.
[117] R. Menchaca-Mndez, C. Snchez-Rodrguez y J. Figueroa-Nazuno, "Prediccin de Series
de Tiempo Mediante Anlisis Gramatical", Memorias del XLIV Congreso Nacional de
Fsica, Sociedad Mexicana de Fsica, Morelia, 2001, pg. 134.
[118] J. C. Sprott, Strange Attractors: Creating Patterns in Chaos, Hungry Minds Inc.,1993.
[119] G. J. Deboeck, Trading on the Edge. Neural, Genetic, and Fuzzy Systems for Chaotic
Financial Markets, John Wiley & Sons, New York, 1994.
[120] L. W. Salvino, R. Cawley, C. Grebogi y J. Yorke, "Predictability in Time Series", Physics
Letters A, vol. 209, 1995, pg. 327-332.
[121] L. A. Smith, "The Maintenance of Uncertainty", Proc. International School of Physics
Enrico Fermi" Course CXXXIII, Societa Italiana di Fisica, Bologna, 1997, pg. 177-246.
[122] P. E. McSharry, Innovations in Consistent Nonlinear Deterministic Prediction, Ph. D.
Thesis, St. Catherines College, University of Oxford, 1999.
322
[134] J. Mandel, The Statistical Analysis of Experimental Data, Dover Publications Inc., New
York, 1964.
[135] W. Mendenhall, R. L. Scheaer y D. D. Wackerly, Estadstica Matemtica con Aplicaciones, Grupo Editorial Iberoamrica, Mxico D. F., 1986.
[136] E. E. Peters, Fractal Market Analysis: Applying Chaos Theory to Investment and Economics, John Wiley & Sons, New York, 1994.
[137] N. Golyandina, V. Nekrutkin y A. Zhigljavsky, Analysis of Time Series Structure SSA
and Related Techniques, Chapman & Hall / CRC, Boca Ratn, 2001.
[138] R. M. A. Urbach, Footprints of Chaos in the Markets, Financial Times-Prentice Hall,
London, 2000.
[139] G. P. Williams, Chaos Theory Tamed, Joseph Henry Press, Washington, 1997.
[140] R. C. Hilborn, Chaos and Nonlinear Dynamics, Oxford University Press, Oxford, 2000.
[141] J. D. Farmer, E. Ott y J. A. Yorke, "The Dimension of Chaotic Attractors", Physica D,
vol. 7, 1983, pg. 153-180.
[142] J. P. Eckmann, S. O. Kamphorst y D. Ruelle, "Recurrence Plots of Dynamical Systems",
Europhys. Lett., vol. 4, nm. 9, 1987, pg. 973-977.
[143] J. P. Zbilut y C. L. Webber, "Embeddings and Delays as Derived from Quantification of
Recurrence Plots", Physics Letters A, vol. 171, 1992, pg. 199-203.
[144] J. Gao y H. Cai, "On the Structures and Quantification of Recurrence Plots", Physics
Letters A, vol. 270, 2000, pg. 75-87.
[145] J. R. Pierce, An Introduction to Information Theory: Symbols, Signals and Noise, Dover
Publications, New York, 1980.
[146] A. Lempel y J. Ziv, "On the Complexity of Finite Sequences", IEEE Transactions on
Information Theory, vol. 22, nm. 1, 1976.
324
329