Escolar Documentos
Profissional Documentos
Cultura Documentos
Director
Juan David Velsquez H., PhD.(c)
Co-director
Ricardo Smith Q., PhD.
iii
iv
ABSTRACT
v
vi
A A,
i
ii
AGRADECIMIENTOS
Este trabajo no hubiera sido posible sin la ayuda de mi director de tesis Juan David Velsquez,
quien adems de asesora, me brindo su apoyo incondicional y su amistad, a l mi mas profundo
agradecimiento.
Gracias a mi codirector Ricardo Smith por brindarme sus valiosos aportes.
Gracias a los profesores y miembros de la escuela de Sistemas, quienes formaron parte activa
de este proceso; a los profesores del rea de inteligencia artificial, por sus constantes aportes; a
Zorelly por su ayuda; a los compaeros de la maestra que continuamente apoyaron la ejecucin
de este trabajo; y en especial al profesor Santiago Montoya al que siempre recordar.
Gracias a los miembros de la escuela de Geociencias y Medio Ambiente donde he tenido
grandes amigos durante estos aos en la universidad; y en especial, gracias a los profesores
Jaime Ignacio Vlez y Germn Poveda quienes han ayudado enormemente en mi formacin.
Gracias a mi familia por su paciencia, cario y sobre todo su apoyo incondicional. Gracias
a Jorge por su ayuda y amor. Y gracias a Alejandro por darme cada maana el impulso para
continuar.
Finalmente, gracias a todos aquellos que de una u otra forma me han acompaado durante
este proceso.
iii
iv
CONTENIDO
1 Introduccin 1
1.1 Tpico principal y problemtica abordada . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Objetivo general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Organizacin del documento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4 Difusin de resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
v
vi
5 Casos de aplicacin 47
5.1 Caracterizacin del SOI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
5.1.1 Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
5.1.2 Descripcin de la serie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
5.1.3 Caracterizacin de la serie e interpretacin de resultados . . . . . . . . . . 49
5.2 Caracterizacin de la serie de cambios relativos en los precios de cierre de las
acciones de IBM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.2.1 Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
5.2.2 Descripcin de la serie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
5.2.3 Caracterizacin de la serie e interpretacin de resultados . . . . . . . . . . 61
5.3 Conclusiones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
5.1 Valor de los criterios de informacin para el modelo AR(p) - Serie SOI. . . . . . . 59
5.2 Pruebas de no linealidad para la serie del SOI . . . . . . . . . . . . . . . . . . . . . 60
5.3 Resultados de la prueba STR - Serie SOI . . . . . . . . . . . . . . . . . . . . . . . . 60
5.4 Pruebas estadsticas para el modelo ANFIS homocedstico - Serie SOI . . . . . . 61
5.5 Parmetros del modelo ANFIS-ARCH - Serie SOI . . . . . . . . . . . . . . . . . . 62
5.6 Pruebas estadsticas para el modelo ANFIS-ARCH - Serie SOI . . . . . . . . . . . 63
5.7 Momentos de la serie real y el modelo - Serie SOI . . . . . . . . . . . . . . . . . . . 63
5.8 Estadsticos de diferentes modelos para la serie del SOI . . . . . . . . . . . . . . . 63
5.9 Valor de los criterios de informacin para el modelo AR(p) - Serie IBM . . . . . . 68
5.10 Pruebas de no linealidad para la serie del IBM . . . . . . . . . . . . . . . . . . . . 72
5.11 Resultados de la prueba STR - Serie IBM . . . . . . . . . . . . . . . . . . . . . . . 72
5.12 Pruebas estadsticas para el modelo ANFIS homocedstico - Serie IBM . . . . . . 73
5.13 Parmetros del modelo ANFIS-ARCH - Serie IBM . . . . . . . . . . . . . . . . . . 73
5.14 Pruebas estadsticas para el modelo ANFIS-ARCH - Serie IBM . . . . . . . . . . 74
5.15 Momentos de la serie real y el modelo - Serie IBM . . . . . . . . . . . . . . . . . . 74
5.16 Estadsticos de diferentes modelos para la serie del IBM . . . . . . . . . . . . . . . 74
ix
x
LISTA DE FIGURAS
2.1 (a)Particin del espacio del dominio dada por las reglas difusas. (b)Arquitectura
de ANFIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2 rbol binario - Fuente: Jang (1993) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
5.1 (a) SOI, (b) Innovaciones del modelo ANFIS-ARCH; y (c) Varianzas del modelo
ANFIS-ARCH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
5.2 Propiedades estadsticas de la serie del SOI (a) FAC; (b) FACP; (c) Espectro; (d)
Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
5.3 Propiedades estadsticas de los residuales del modelo ANFIS-ARCH - Serie SOI
(a) Residuales; (b) FAC; (c) Espectro; (d) Histograma . . . . . . . . . . . . . . . . . 56
5.4 Funcin de transicin para el modelo ANFIS-ARCH - Serie SOI (a) En el tiempo,
(b) Como funcin de la variable de transicin. . . . . . . . . . . . . . . . . . . . . 57
5.5 Pronstico determinstico para la serie del SOI . . . . . . . . . . . . . . . . . . . . 58
5.6 Convergencia de largo plazo para la serie del SOI . . . . . . . . . . . . . . . . . . 58
5.7 Funciones de transicin para los modelos ANFIS-ARCH y STR-ARCH - Serie SOI 59
5.8 (a) IBM, (b) Innovaciones del modelo ANFIS-ARCH; y (c) Varianzas del modelo
ANFIS-ARCH . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
5.9 Propiedades estadsticas de la serie del IBM (a) FAC; (b) FACP; (c) Espectro; (d)
Histograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5.10 Propiedades estadsticas de los residuales del modelo ANFIS-ARCH - Serie IBM
(a) Residuales; (b) FAC; (c) Espectro; (d) Histograma . . . . . . . . . . . . . . . . . 69
5.11 Funcin de transicin para el modelo ANFIS-ARCH - Serie IBM (a) En el tiempo,
(b) Como funcin de la variable de transicin. . . . . . . . . . . . . . . . . . . . . 70
5.12 Pronstico determinstico para la serie del IBM . . . . . . . . . . . . . . . . . . . . 71
5.13 Convergencia de largo plazo para la serie del IBM . . . . . . . . . . . . . . . . . . 71
5.14 Funciones de transicin para los modelos ANFIS-ARCH y STR-ARCH - Serie IBM 72
xi
xii
1. INTRODUCCIN
1
2
Por otro lado, se ha observado que muchas series temporales presentan una volatilidad
que puede ser cambiante en el tiempo, y que adems puede agruparse en clusters; este
comportamiento ha sido investigado principalmente en el campo financiero y sugiere la
existencia de una estructura en la volatilidad. Para explicar estos comportamientos, Engle
(1982) desarroll los modelos de heterocedasticidad condicional autorregresiva (ARCH, por
sus siglas en ingls) los cuales permiten representar la varianza de las series como una
funcin de las perturbaciones aleatorias pasadas. Otros modelos ms complejos han surgido
como generalizaciones de la propuesta de Engle (1982) tales como los modelos GARCH
(Bollerslev, 1986) e IGARCH (Nelson, 1991) entre muchos otros.
Tradicionalmente, los modelos ARCH y sus generalizaciones han sido usados para modelar
la volatilidad de las series temporales, mientras que la media esperada es representada usando
la aproximacin de Box y Jenkins (1970). As, los modelos obtenidos son lineales en media
y no lineales en varianza. No obstante, es natural pensar que los modelos de Box y Jenkins
(1970) usados en esa aproximacin podran ser reemplazados por otras tcnicas no lineales
para obtener una representacin no lineal en la media y en la varianza. Aunque esta idea fue
3
esbozada de forma general por Tong (1990), en la literatura ms relevante se han presentado pocas
aproximaciones; Chan y McAleer (2003) presentan un modelo de transicin suave combinado con
un modelo GARCH para los errores en presencia de observaciones extremas; Chen y Mike (2006)
proponen la combinacin de un modelo de transicin brusca (tipo threshold), que modela la no
linealidad en la media, con un modelo GARCH que representa la estructura de la volatilidad,
y presentan varios casos de aplicacin en que el modelo hbrido postulado brinda una mejor
representacin en relacin a otros modelos tradicionales.
De acuerdo con lo anterior, resulta natural extender la propuesta de Velsquez et al. (2004)
en donde se considera un sistema adaptable de inferencia neurodifusa homocedstico (varianza
constante en el tiempo), permitiendo que la varianza de los errores sigan un proceso ARCH.
Igualmente, este mismo enfoque puede verse como una extensin del trabajo de Chan, Marinova
y McAleer (2005) al sustituir el modelo STR por un modelo adaptable de inferencia neurodifusa.
Consecuentemente, el tpico principal de esta tesis es:
es muy sensible a pequeas variaciones en los parmetros del modelo ARCH, por lo que debe
verificarse la capacidad que tienen las tcnicas de optimizacin para converger al ptimo global
del modelo. As, otro objetivo de esta tesis es analizar, a partir de resultados empricos, qu
tcnica podra ser adecuada para la estimacin de los parmetros del modelo.
donde la funcin f representa las relaciones determinsticas entre la variable dependiente y y las
variables independientes x1 , x2 , ..., xn ; es una variable aleatoria que representa todos los efectos
de aquellas variables no medibles o que no han sido consideradas en la especificacin de f y que
tienen influencia sobre y, pero que no tienen relacin con las variables incluidas en la regresin.
En el problema genrico de regresin se desea utilizar la muestra finita de datos
{y, x1 , x2 , ..., xn }N para construir una aproximacin f(x1 , x2 , ..., xn ) a la funcin desconocida
1
5
6
El objetivo de esta investigacin est relacionado con el uso de sistemas de inferencia difusa para
construir aproximaciones a funciones no lineales que representan la dinmica de sistemas reales.
Por tal motivo, en esta seccin se profundiza en las definiciones y conceptos bsicos necesarios
para abordar los dems elementos discutidos en este captulo, y que ya fueron anunciados en la
introduccin.
En trminos generales, un sistema de inferencia difuso es una tcnica que permite modelar las
relaciones existentes entre una variable dependiente y un conjunto de variables independientes
a partir de un sistema de reglas heursticas.
Un sistema de inferencia difusa est conformado por variables de entrada que componen
los antecedentes de las reglas, una variable de salida (para el caso general de los modelos de
regresin) o variable dependiente, un conjunto de reglas difusas, y un sistema de inferencia
que permite calcular los valores de la variable de salida cuando los valores de las variables de
entrada son conocidos (Jang, 1993).
Para resolver el problema genrico de regresin presentado en la seccin anterior, es decir,
especificar f (), pueden ser utilizados diferentes tipos de sistemas de inferencia difusa, todos
los cuales se caracterizan por especificar la relacin entre la variable dependiente y las variables
independientes a partir de un modelo ecuacional.
Diversos tipos de sistemas pueden ser obtenidos cambiando las especificaciones del sistema
de inferencia difuso; entre las principales se encuentran: FALCON (Lin y Lee, 1991), GARIC
(Bherenji y Khedkar, 1992), ANFIS (Jang, 1993), FUN (Sulzberger, Tschicholg-Gurman y Vestli,
1993), FINEST (Tano, Oyama y Arnould, 1996), SONFI (Juang y Lin, 1998), NEFCON (Nauck y
Kruse, 1999), EFuNN (Kasabov y Song, 1999), HyFIS (Kim y Kasabov, 1999). Estos sistemas han
7
Jang (1993) utiliza reglas de Takagi-Sugeno para especificar un sistema de inferencia difusa que
puede ser interpretado como una red neuronal artificial. Esta arquitectura es conocida como
sistema adaptable de inferencia neurodifusa (ANFIS, por sus siglas en ingls). Este tipo de
sistema combina los mecanismos propios de los sistemas de inferencia difusa para representar
conocimiento experto y reglas heursticas, con las ventajas de los modelos de redes neuronales
para manipular informacin numrica (Jang, 1993). Estas ventajas estn relacionadas con un
alto grado de adaptabilidad, capacidad de aprendizaje, generalizacin, y tolerancia al ruido.
Jang (1993) demuestra que ANFIS puede aproximar con una precisin arbitraria cualquier
funcin no lineal definida en un dominio compacto; por esta razn se considera que ANFIS es
un aproximador universal de funciones. Esta demostracin garantiza que dado un conjunto de
datos y una relacin determinstica entre ellos ANFIS es capaz de aproximarla.
Para describir la arquitectura de ANFIS se usar por simplicidad un sistema de inferencia
difusa con dos variables de entrada cuyo dominio ha sido dividido en dos conjuntos borrosos
A1 y A2 para la variable x, y B1 y B2 para la variable y, y una variable de salida z cuya relacin
8
con x y y se describe usando reglas de Takagi y Sugeno (1985). Dicho sistema se escribe como:
Si x A1 y B1 f1 (x, y) = p1 x + q1 y + r1
Si x A1 y B2 f2 (x, y) = p2 x + q2 y + r2
Si x A2 y B1 f3 (x, y) = p3 x + q3 y + r3 (2.4)
Si x A2 y B2 f4 (x, y) = p4 x + q4 y + r4
donde la particin del espacio del dominio dada por las reglas difusas se presenta en la Figura
2.1(a) y la arquitectura de ANFIS es ilustrada en la Figura 2.1(b). Las funciones en cada nodo de
una capa son las mismas y se describen a continuacin:
1
S(xt , i , ci ) = (2.6)
1 + exp i (xt ci )
y la funcin Z():
1
Z(xt , i , ci ) = 1 (2.7)
1 + exp i (xt ci )
donde i , ci son llamados parmetros de la premisa o el antecedente, y varan dando
formas diferentes a las funciones de pertenencia en Ai . En arquitecturas con ms conjuntos
difusos usualmente se utiliza, para cada conjunto, la funcin de campana de Gauss
generalizada dada por:
1
m(xt , i , i , i ) = A (z) = (2.8)
x |2i |
1 + ti i
donde i , i , i son los parmetros del antecedente.
9
Figura 2.1: (a)Particin del espacio del dominio dada por las reglas difusas. (b)Arquitectura de
ANFIS
10
Capa 2: Los nodos de esta capa entregan como salida el producto de las seales entrantes:
Capa 3: El resultado de esta capa establece el porcentaje en que cada regla contribuye con
la solucin final y se calcula como:
wi
wi = , i = 1, 2. (2.10)
w1 + w2
O4i = wi fi = wi pi x + qi y + ri , (2.11)
donde wi es la salida de la capa 3 y pi , qi , ri constituyen una serie de parmetros llamados
parmetros del consecuente.
Capa 5: El nico nodo calcula la salida final como la suma de todas las seales entrantes:
X P
i wi fi
O5i = wi fi = P (2.12)
i wi
Cuando ANFIS es especificado usando reglas de Takagi-Sugeno, las variables de entrada del
antecedente son las mismas que las variables de entrada en el consecuente, y el dominio de cada
variable independiente es cubierto por al menos dos conjuntos difusos. Usualmente, la funcin
especificada para el consecuente es una combinacin lineal de sus variables de entrada, aunque
pueden usarse funciones ms complejas.
Jang (1993) propone un algoritmo de aprendizaje hbrido para la estimacin de los parmetros
del modelo, el que combina el uso de tcnicas de optimizacin basadas en gradientes con la
estimacin basada en mnimos cuadrados. De acuerdo con la arquitectura planteada en la
seccin anterior, para un sistema con dos variables de entrada y cuatro reglas, se puede observar
que si se consideran fijos los valores de los parmetros de los antecedentes, la salida puede ser
expresada como una combinacin lineal de los parmetros del los consecuentes; as la salida del
sistema puede calcularse como:
f = (w1 x)p1 + (w1 y)q1 + (w1 )r1 + (w2 x)p2 + (w2 y)q2 + (w2 )r2 +
(w3 x)p3 + (w3 y)q3 + (w3 )r3 + (w4 x)p4 + (w4 y)q4 + (w4 )r4 (2.13)
la cual es lineal en los parmetros de los consecuentes. Al tener una muestra de N puntos, se
obtienen N ecuaciones como la anterior, formando un sistema sobredeterminado el cual puede
ser estimado por mnimos cuadrados.
El algoritmo de optimizacin propuesto por Jang (1993) asume que previamente se han
definido la cantidad de conjuntos difusos en que se ha dividido el dominio de los conjuntos
difusos de cada variable, y se ha especificado el conjunto de reglas; el algoritmo se basa en los
siguientes pasos:
2. Asumiendo fijos los valores iniciales de los parmetros de los antecedentes, se estiman por
mnimos cuadrados los consecuentes.
3. Se calcula la funcin de error para medir el ajuste entre los datos reales y la salida producida
por ANFIS.
5. Se estima una nueva aproximacin de los parmetros de los antecedentes usando alguna
tcnica basada en gradiente, y se retorna al paso 2.
Jang(1994) propone el uso del algoritmo CART de Breiman, Friedman, Olshen y Stone (1984) el
cual permite la especificacin inicial de la estructura de ANFIS. Las reglas presentadas en (2.4)
puede interpretarse como un rbol binario de decisin como muestra la Figura 2.4.2.
Para construir el rbol de regresin, CART primero incrementa extensivamente el rbol,
basado en los datos de entrenamiento as:
1. Para el nodo raz se busca entre todas las posibles variables del espacio solucin aquella
divisin que minimice el error.
3. Se continua el proceso hasta llegar a un criterio de parada como haber alcanzado una
profundidad mxima o no obtener una mejora en el error por encima de cierto umbral.
2. CART no hace suposiciones sobre la distribucin de ningn tipo, ya sea de las variables
predictoras como de la variable criterio.
13
3. Las variables pueden ser de diferentes tipos como continuas, discretas, categricas o
nominales.
4. CART no est afectado por valores extremos, colinealidad, heterocedasticidad que afecten
otros procedimientos establecidos. Los valores extremos pueden ser aislados en un nodo
y no tienen ningn efecto en la divisin.
1. Al ser un algoritmo binario, tiende a generar rboles de muchos niveles. Por ello, el rbol
resultante puede que no presente los resultados de manera eficiente, sobre todo si la misma
variable ha sido utilizada para la divisin de varios niveles consecutivos.
2.5 CONCLUSIONES
En este captulo se ha presentado una breve descripcin de los conceptos bsicos de ANFIS y de
los algoritmos comnmente utilizados para su especificacin. Esta tcnica ha sido ampliamente
utilizada para la construccin de modelos de series temporales abordando el problema desde el
punto de vista de la regresin de funciones; sin embargo, no se han analizado completamente las
implicaciones que ello tiene desde la perspectiva del anlisis y prediccin de series temporales.
As el objetivo del prximo captulo ser presentar, desde un punto de vista crtico, las limitantes
en la construccin de modelos de series temporales cuando este problema es abordado como si
fuese una simple regresin.
3. LIMITACIONES DE LOS SISTEMAS DE INFERENCIA NEURODIFUSA EN EL
MODELADO DE SERIES TEMPORALES
Dentro del contexto de series temporales existe un vocabulario bsico comnmente usado en
la literatura estadstica, pero de poco uso en la comunidad de Inteligencia Artificial, el cual se
15
16
y1 , ..., yt , ..., yT
En general se establecen tres propsitos en el modelado de las series temporales (Kasabov, 1999)
la prediccin de corto plazo, en la cual se pretende obtener el valor ms probable para la siguiente
observacin; el modelado, que busca determinar las propiedades y la estructura subyacente de la
dinmica de la serie temporal estudiada; y la caracterizacin, en donde prima la determinacin
de las propiedades fundamentales de la serie temporal. La importancia del anlisis de las series
temporales radica en que su estudio puede ayudar a representar la dinmica del fenmeno
observado y por lo tanto a entenderlo; adems, muchos problemas pueden ser asimilados a series
temporales en muchas reas; en economa, por ejemplo, la prediccin de demandas y precios a
nivel macro y micro econmico es una importante rea de estudio; en cuando a variables fsicas,
existen muchos trabajos sobre la caracterizacin y prediccin de series como los fenmenos
macroclimticos (el fenmeno de El Nio, el ndice de Oscilacin del Sur), y las variables
climticas e hidrolgicas (precipitacin, caudal); en las reas sociales, las series temporales han
sido utilizadas para el mejor entendimiento de muchos comportamientos; algunas de las series
analizadas son nacimientos, homicidios, muertes a causa de enfermedades especficas, entre
otras.
Muchas de las propiedades de las series temporales estn relacionadas con los patrones
visuales que pueden distinguirse a partir de su inspeccin. As por ejemplo, para la serie
presentada en la Figura 3.1a se puede observar que existen: la tendencia, que representa los
movimientos de largo plazo de la serie (vase la Figura 3.1b), una componente estacional
mostrada en la Figura 3.1c, que corresponde a aquellos movimientos que poseen un patrn
peridico asociado usualmente a algn tipo de efecto calendario; una componente cclica
asociada a ciclos de largo plazo que intervienen sobre la serie, vase la Figura 3.1d; y una
componente irregular, presentada en la Figura 3.1e, que refleja los movimientos no sistemticos
de la serie (Harvey, 1989). De esta forma, un modelo que represente el comportamiento de la
serie yt debe ser especificado como:
(a)
(b) (c)
(d) (e)
Las componentes de tendencia, estacionales y los ciclos de largo plazo pueden ser representadas
como una funcin g() de la informacin disponible, tal que:
donde It1 representa la informacin disponible hasta el instante t1 y t es una variable aleatoria
normal estndar. Se dice que la dinmica de yt es lineal si la funcin g() es una funcin lineal de
las variables disponibles, y si la funcin h() es especificada como una constante. yt es no lineal
en media cuando g() es especificada como una funcin no lineal y h() es una constante. yt es
lineal en media y no lineal en varianza cuando g() es lineal y h() es diferente de una constante.
Y finalmente, yt es no lineal en media y en varianza cuando g() es una funcin no lineal y h() es
diferente de una constante.
Q
X
h2t = 0 + q a2tq + t (3.2)
q=1
P
1. Estimar SSR0 = y t w 2 , donde w es la media de la serie.
P
3. Calcular SSR1 = 2t
19
Para la estimacin de los modelos de series temporales se parte de que las realizaciones
de la variable aleatoria t son incorrelacionadas e idnticamente distribuidas, siguiendo una
distribucin normal con media cero y varianza desconocida. Una vez que se han estimado los
parmetros del modelo se procede a verificar el cumplimiento de estos supuestos; cuando uno
o ms de ellos han sido violados, el modelo debe ser re-especificado y sus parmetros deben ser
nuevamente estimados. El proceso de verificacin de estos supuesto se conoce como diagnstico
del modelo.
El mtodo de mxima verosimilitud es un procedimiento para la estimacin de parmetros
de modelos probabilsticas (Mills, 1993). Dado un modelo de series temporales de la forma:
yt = f () + t (3.4)
El objetivo que se pretende alcanzar con el mtodo de estimacin es encontrar aquellos valores de
los parmetros de la funcin de distribucin de probabilidades que maximicen la probabilidad
de que efectivamente t viene de la distribucin postulada . Al despejar t se obtiene que
t = yt f () (3.6)
Por lo tanto, para encontrar los estimativos se debe derivar la funcin de verosimilitud con
respecto a cada uno de los parmetros a estimar, igualar a cero y despejar el respectivo valor.
Debido a que la funcin f () en (3.5) es inestable numricamente, y dado que existe una
relacin biunvoca entre una funcin y su logaritmo, entonces se prefiere encontrar la derivada
del logaritmo de la funcin de verosimilitud.
De una muestra extrada de una distribucin normal con media y varianza h2 , el logaritmo
20
Los modelos de regresin, como se describi anteriormente, intentan aproximar una funcin de
acuerdo a un conjunto de valores del espacio solucin. La prediccin en el contexto de series
temporales intenta, a su vez, encontrar una funcin que permita predecir valores futuros de un
fenmeno de acuerdo a los valores ya observados. Aunque ambos objetivos suenen similares, la
prediccin de series temporales y la regresin deben considerarse como dos problemas distintos.
En primer lugar, porque los modelos de regresin no consideran relevante el orden de los datos
para el desempeo del modelo; sin embargo, para las series temporales los modelos deben
reflejar una transicin probabilstica de un valor al siguiente. Y en segundo lugar, porque la
problemtica de las series temporales est enmarcada en un contexto estadstico que desconocen
los modelos de regresin, es decir, los modelos de regresin ignoran algunas caractersticas
estadsticas de la serie.
En la modelacin usando tcnicas tradicionales de regresin se tienen en cuenta los siguientes
aspectos:
1. La distribucin de probabilidad de yt
2. Las propiedades dinmicas del modelo, tales como la convergencia a puntos de equilibrio,
la presencia de ciclos lmite y la divergencia.
Desde el punto de vista de la modelacin con ANFIS no existe diferencia entre un modelo de
regresin tradicional y un modelo de series temporales. Velsquez et al. (2004) han analizado este
problema demostrando que ANFIS tiene un claro vnculo con algunos modelos economtricos
tradicionales, y que bajo algunas simplificaciones ANFIS puede ser considerado como una
generalizacin de los modelos STR (Smooth Transition Regression). En esta seccin se presenta
el desarrollo propuesto por Velsquez et al. (2004), y se analizan algunas limitantes que presenta
esta aproximacin cuando se modelan series financieras y econmicas.
X
P
yt = 0 + p ytp + ht (3.8)
p=1
Este modelo puede extenderse al caso no lineal al considerar que la serie se encuentra dividida
en varias regiones, en cada una de las cuales su dinmica puede ser aproximada por un modelo
AR:
X
P
XP
(1) (1)
(2) (2)
yt = 0 + p ytp + F(zt )
0
+ y
p tp
+ t (3.9)
p=1 p=1
donde F() es una funcin continua acotada entre cero y la unidad, y zt es la variable de transicin
que permite determinar en que rgimen se encuentra la serie temporal. Estos modelos son
llamados STR y su proceso de especificacin es discutido por Granger y Terasvirta (1993). En
(3.9) pueden distinguirse entonces dos regiones: la primera, cuando F() = 0, se rige por el
modelo lineal:
X
P
(1) (1)
yt = 0 + p ytp + t (3.10)
p=1
22
1
F(yt ) = (3.12)
exp((yt c))
2. Se realiza un contraste cuya hiptesis nula es que los residuales del modelo AR son
independientes e idnticamente distribuidos; y cuya hiptesis alternativa considera que
existe una estructura remanente en los residuales que el modelo AR no pudo capturar.
Cuando se rechaza la hiptesis nula, este contraste permite determinar el tipo de funcin
de transicin usado para especificar F(), as como la variable de transicin zt (esta prueba
es detallada en el prximo captulo).
4. Se evala que los residuales estimados para el modelo especificado son independientes,
incorrelacionados e idnticamente distribuidos.
Tal como lo indican Velsquez et al. (2004) ANFIS puede ser interpretado como una
generalizacin de los modelos STR especificados en (3.9) de la siguiente forma: se permite
que las regiones definidas por la funcin de transicin se traslapen usando conjuntos difusos.
De esta forma se obtiene un modelo de mayor complejidad que el modelo STR original.
La funcin de pertenencia a cada regin puede ser especificada, en el caso ms general, como
una funcin de campana generalizada, presentada en la ecuacin (2.8), dada por:
1
m(z; i , i , i ) = A (z) =
z |2i |
1 + i i
El proceso de clculo de yt en (3.14), permite que dicho sistema sea transformado a la ecuacin
paramtrica lineal, tal que los coeficientes p son calculados como
(i) (i)
m(xt ; 1 , 1 , 1 ) (1) m(xt ; 2 , 2 , 2 ) (2)
j = (i) (i)
j + (i) (i)
j (3.15)
m(xt ; 1 , 1 , 1 ) + m(xt ; 2 , 2 , 2 ) m(xt ; 1 , 1 , 1 ) + m(xt ; 2 , 2 , 2 )
Velsquez et al. (2004) indican que, en el caso general, los antecedentes de (3.14) pueden
contener ms de una variable, incluyendo diferentes particiones del dominio. Esta aproximacin
permite usar diferentes conjuntos de variables tanto en el antecedente como en las reglas del
consecuente.
3.4 DISCUSIN
En la Seccin 2.3 del captulo anterior se discuti la propuesta de Jang (1993) que introduce a
ANFIS como una tcnica de regresin capaz de aproximar todo tipo de funciones no lineales; sin
embargo, hablar de una tcnica de regresin tiene fuertes implicaciones en el contexto de series
temporales, como se vio en la Seccin 3.2, debido a que el modelado de series temporales
considera propiedades que desconocen las tcnicas de regresin, dichas propiedades estn
relacionadas con las estructuras y dinmicas de la serie. Esta marcada diferencia entre una
tcnica y otra, hizo necesario el establecimiento de ANFIS como un modelo en el contexto de
series temporales; en este sentido, Velsquez et al. (2004) analizan este problema demostrando el
vnculo entre ANFIS y algunos modelos economtricos, este anlisis es resumido en la Seccin
3.3. Trabajos posteriores mostraron buenos resultados de dicha metodologa cuando es aplicada
a casos reales, vase Zapata et al. (2004). Adems, este planteamiento dejo abierta la posibilidad
de establecer otro tipo de modelos ANFIS que son especficos para series temporales con
caractersticas especficas, como por ejemplo, la volatilidad cambiante en el tiempo y los cluster
de volatilidad presentados en la Seccin 3.1.2, cuya problemtica ya ha sido objeto de estudio
desde los trabajos de Engle (1982) que sugieren la presencia de una estructura determinstica en
la volatilidad. Aunque en teora, la ampliacin del modelo propuesto por Velsquez et al. (2004)
para considerar estructura en la volatilidad de la serie puede ser realizada de forma directa, no
es posible realizar esto en la prctica ya que es necesario disear un proceso de especificacin
que permita obtener esta nueva clase de modelos.
Respecto a la especificacin de los modelos ANFIS, Jang (1994) propone el uso de los
algoritmos CART de Breiman et al. (1984) tal como se muestra en la Seccin 2.4.2, donde se
exponen las ventajas de esta tcnica para establecer modelos de regresin, no obstante, hay claras
desventajas que tienen implicaciones desfavorables directas en el contexto de series temporales.
El principal problema para los modelos ANFIS en el contexto de series temporales es el nmero
de variables que este algoritmo puede llegar a considerar tanto en el antecedente como en el
consecuente de la regla, que puede ocasionar que el nmero de parmetros crezca de forma
exponencial generando una dificultad adicional en la estimacin del modelo y yendo contra el
principio de parsimonia. Adems, Jang (1996) propone la validacin cruzada como otra tcnica
para la seleccin de regresores en el modelo; sin embargo, esta tcnica requiere un alto costo
computacional. Por lo tanto es necesario el planteamiento de otro tipo de algoritmo o estrategia
para la especificacin de los modelos ANFIS y sus posibles ampliaciones, que podra estar
relacionada con las metodologas propuestas para los modelos economtricos relacionados con
ANFIS de la Seccin 3.3.
25
3.5 CONCLUSIONES
Hasta los trabajos de Velsquez et al. (2004), ANFIS slo haba sido usado como modelo de
regresin dejando de lado las caractersticas estadsticas y probabilsticas de las series temporales,
se ignora as la relacin que tienen en las series temporales los valores presentes con los futuros
y se incurre en problemas metodolgicos para la especificacin de modelos. A partir de dicho
trabajo, se estableci una relacin entre ANFIS y los modelos tradicionales de series temporales
y se dej abierta la posibilidad de extender este tipo de modelos de acuerdo a estructuras
especficas que se deseen capturar en una serie.
Por otro lado se ha observado, en especial en el sector financiero, la presencia de estructuras en
la volatilidad de las series temporales, manifestada como cambios de la volatilidad en el tiempo
y el agrupamiento en clusters; estas caractersticas han sido analizadas a partir de los trabajos
de Engle (1982) por medio de modelos con varianza condicional autorregresiva. Sera posible
entonces pensar en una extensin de los modelos ANFIS para considerar esta caracterstica de
manera que los nuevos modelos capturaran la no linealidad en la media y la no linealidad en la
varianza de las series temporales.
Como se discuti en el captulo anterior, llegar a este tipo de modelos puede ser fcil en la
teora pero no en la prctica, ya que por la complejidad del modelo es necesario establecer
una estrategia de especificacin sistemtica y robusta. Estas caractersticas se encuentran
fcilmente en las metodologas del modelado tradicional de series temporales que hace uso
de un universo de pruebas estadsticas para la formulacin de modelos. La relacin puede
hacerse entonces gracias al planteamiento que hacen Velsquez et al. (2004) donde consideran
los modelos economtricos no lineales de transicin suave STR como un caso particular de los
modelos ANFIS bajo algunas restricciones en su arquitectura
El objeto de este captulo se centra en formular un modelo que capture la dinmica de
series no lineales en la media y con estructura en la varianza. Para conseguirlo, se propone un
modelo ANFIS con heterocedasticidad condicional autorregresiva denominado ANFIS-ARCH,
partiendo del modelo planteado por Velsquez et al. (2004); igualmente, debe establecerse
tambin una estrategia de especificacin con las caractersticas ya mencionadas y un algoritmo
27
28
4.2 OBJETIVOS
Desarrollar estrategias para la formulacin de modelos ANFIS para series temporales que
permitan considerar errores heterocedsticos; y aplicar dichas estrategias a series comnmente
usadas en la literatura para determinar las limitaciones y bondades de los modelos formulados.
1. Formular un modelo ANFIS que permita considerar dentro del modelo desarrollado por
Velsquez et al. (2004) errores heterocedsticos.
3. Determinar las propiedades del modelo formulado para muestras pequeas, con el fin
de determinar si el modelo puede ser recuperado a partir de muestras pequeas, y si la
estrategia propuesta para la seleccin de modelos es adecuada.
yt = g(It1 ) + h(It1 )t
donde las funciones g() y h() estaban relacionadas con la media y la varianza de la serie
respectivamente. Si se considera para g() un modelo ANFIS de acuerdo a la arquitectura
planteada en la seccin 2.3.1, con una variable de transicin particionada en dos conjuntos
difusos dados por las funciones F() y G() ; y para h() se considera la ecuacin (3.2) que
representa los modelos ARCH, se obtiene un modelo ANFIS-ARCH de la forma:
F(zt )
XP XM
(1) (1) (1)
yt =
0
+ y
p tp + m mx +
F(zt ) + G(zt )
p=1 m=1
G(zt )
XP XM
(2) (2) (2)
0
+ y
p tp + m mx + at (4.1)
F(zt ) + G(zt )
p=1 m=1
donde xm son variables exgenas que pueden ser incluidas dentro del modelo; y at = ht t con
PQ
h2t = 0 + q=1 q a2tq + t .
La forma de las funciones F() y G() depende del tipo de funcin de transicin equivalente del
modelo ANFIS-ARCH. As, si la transicin del modelo sigue una funcin logstica equivalente,
F() esta dada por ecuacin sigmidea (2.6), S(), de la forma:
1
S=
1 + exp 1 (zt c1 )
1
Z=1
1 + exp 2 (zt c2 )
donde 1 , 2 , c1 y c2 son los parmetros de los antecedentes del modelo. Cuando se especifica
una funcin de transicin exponencial equivalente para el modelo, F() corresponde a la ecuacin
30
Los parmetros del modelo ANFIS-ARCH se pueden especificar como un vector de la forma:
n (1) (1) (2) (2) (1) (1) (2) (2)
o
= c1 , c2 , 1 , 2 , 0 , ..., P , 0 , ..., P , 1 , ..., M , 1 , ..., M , 0 , ..., Q
expresada en (3.7). Este algoritmo propone para cada parmetro i , y dada una medida de
error arbitraria log L, que la direccin de actualizacin de los pesos est basada en el signo de la
derivada parcial log L/i , con un tamao de paso i que se adapta para cada parmetro.
Cada iteracin del algoritmo se divide en dos pasos, en el primero se calcula el tamao de
paso para cada parmetro de acuerdo a la regla
log L log L
(t) > 0
+ (t1) , Si (t1)
i i
i
(t)
i :=
log L log L (4.4)
(t1) (t1) (t) < 0
i , Si
i i
(t1) , de lo contrario
i
donde 0 < < 1 < + . El segundo paso consiste en determinar la actualizacin del parmetro
i as:
log L log L log L
(t) (t)
(t)
Si (t1) (t) 0, i := signo
i i i i
(4.5)
log L log L (t) (t0 1)
E
Si (t1) (t) < 0 y log Lt > log Lt1 i : = i (t) := 0
i i i
1. Seleccin de regresores
2. Pruebas de no linealidad
4. Pruebas de diagnstico
X
P
yt = 0 + i yti + t (4.7)
i=1
Para seleccionar el orden P del modelo AR se pueden usar diferentes criterios reportados en la
literatura. La estrategia propuesta considera los siguientes criterios, para un tamao de muestra
T:
P
T
2t
t=1
CIA = exp(2k/T) (4.8)
T
2. Criterio de Schwartz (CIS): Es una alternativa del criterio de Akaike y tiene su misma
interpretacin, pero penaliza an ms los grados de libertad. Su frmula esta dada por:
P
T
2t
CIS = T( )
k i=1
T (4.9)
T
3. Criterio de Hannan y Quinn (1979): Es un criterio similar a los dos anteriores cuya frmula
es:
P
T
2t
2k i=1
CIHQ = ln(T) (4.10)
T T
Una vez determinado el orden ptimo del modelo, se procede a comprobar la no linealidad de la
serie. En la literatura se encuentran reportadas diferentes pruebas de no linealidad, sustentadas
en el hecho de que la no linealidad en una serie temporal puede ocurrir en muchas formas
(Tsay, 2002).
Este trabajo se concentra en el uso de la prueba STR que permite, adems de establecer la no
linealidad de la serie, definir la funcin y la variable de transicin para el modelo ANFIS-ARCH.
Para facilitar la notacin de la prueba STR, propuesta por Terasvirta, Tjostheim y Granger
(1994), la ecuacin (4.7) se reescribe como
yt = 1 0xt 1 G(st ; , c) + 2 0xt G(st ; , c) + t (4.11)
Se considera un modelo ANFIS con un conjunto de reglas que considera los regresores del
AR(p) del numeral 1 como parmetros del consecuente, y asumiendo que los errores son
homocedsticos se estima el modelo. Este es el mismo proceso considerado por Velsquez
et al. (2004).
34
1. Box y Pierce (1970) proponen una prueba denominada tambin prueba Pormanteau, cuyo
estadstico est dado por
X
n
Q(m) = T 2l (4.12)
l=1
2. Ljung y Box (1978) proponen una modificacin al estadstico Q para incrementar su poder
en muestras finitas, estableciendo un nuevo estadstico dado por:
X
n 2l
Q (n) = T(T + 2) (4.14)
Tl
l=1
Para probar que los residuales no son lineales se realiza la prueba de McLeod y Li (1983),
35
1. La prueba de normalidad propuesta por Bera y Jarque (1980) est basada en los conceptos
de curtosis, K, y asimetra ,S, definidos como
1 P
T i=1 T( 3
)
S= P (4.15)
( T1 i=1 T( 2 )3 /2
)
1 P
T 4
i=1 T( )
K= P (4.16)
( T1 i=1 T( ) 2 )2
El estadstico J-B esta dado por
1 (K 3)2
J-B = (S2 + ) (4.17)
6 4
con i = 1, ..., T, y
T 1/2
X
T X X
T
R= (i )(
y i y)/ 2
(i ) 2
( y i y) (4.19)
i=1 i=1 i=1
1
L-M = (T/3)1/2 ln [(1 + R)/(1 R)] (4.20)
2
bajo la hiptesis nula de una distribucin gausiana para , contra la hiptesis alterna de
una distribucin gausiana asinttica con media cero y varianza uno.
36
1. Para cada variable del modelo, tanto de los consecuentes como del modelo ARCH, se
estiman modelos restringidos donde dicha variable es eliminada y se calcula LR para cada
uno.
Antes de realizar aplicaciones del modelo ANFIS-ARCH, es necesario evaluar sus propiedades
para muestras pequeas, considerando si el modelo efectivamente se puede recuperar a partir
de los datos. El procedimiento realizado es similar a los trabajos de van Dijk et al. (1999).
La simulacin de Monte Carlo consiste en repetir un proceso, con una muestra de soluciones
cada una correspondiente a un conjunto diferente de muestras aleatorias, para luego obtener
resultado que permitan hacer anlisis estadsticos. En este caso la simulacin de Monte Carlo
ser usada para validar los mtodos de solucin propuestos para la estimacin de parmetros,
la seleccin de entradas del modelo y la especificacin de la funcin y variable de transicin.
37
(b) Para cada serie sinttica se estima un modelo ANFIS-ARCH y se almacenan los
parmetros obtenidos.
(c) Al final del proceso de simulacin se obtiene una muestra de tamao N para cada
uno de los parmetros del modelo, y se determinan las propiedades para la muestra
correspondiente a cada parmetro.
La Tabla 4.1 presenta los resultados de la simulacin para un modelo ANFIS-ARCH sin
variables exgenas en las entradas de los consecuentes, que se puede escribir de la forma:
En ambos casos, para 1000 series sintticas de tamaos T = 100, 200 y 500, se reportan la
media, mediana y desviacin estndar de cada uno de los parmetros del modelo. Se puede
observar que la media y la desviacin estndar no son instrumentos concluyentes porque
se ven fcilmente afectados por resultados extremos; sin embargo, la mediana permite
analizar el comportamiento del modelo. Adems, a medida que aumenta el tamao de
la muestra, los parmetros ajustados son ms cercanos a los parmetros reales. A pesar
de esto, los parmetros de los antecedentes, es decir, c y , presentan dificultades para
ser recuperados; pero al conservar su signo, estos parmetros permiten aproximar los
conjuntos difusos de una manera similar a la de los reales.
Tambin, puede observarse que los parmetros relacionados con el modelo ARCH son los
que ms fcil captura el modelo, incluso para un tamao de muestra pequeo.
Finalmente, se puede anotar que el modelo con variables exgenas present desviaciones
estndar menores, razn por la cual la media estuvo ms cerca de la mediana en ese
modelo.
(a) Para un modelo ANFIS-ARCH predefinido de antemano se genera una serie sinttica
de tamao T.
(b) Se construyen un modelo completo, () y un modelo restringido, ( ) con una variable
explicativa menos que el modelo completo.
(c) Se realiza el proceso de seleccin de variables basada en la prueba del radio de
verosimilitud presentada.
(d) Se determina si en el proceso de inferencia se descartaron variables explicativas.
39
La Tabla 4.3 presenta los resultados para la simulacin que permite verificar si el modelo
efectivamente selecciona las variables relevantes de los consecuentes para aproximar la
serie. Se realizaron 4 pruebas con diferentes modelos, para 1000 series sintticas de tamaos
de muestra T = 100, 200 y 500.
donde at = ht t con h2t = 0 + 1 a2t1 . Contra el modelo real como modelo restringido,
. Todo esto con el objeto de determinar si el modelo descartaba o no la variable
irrelevante. Los resultados obtenidos muestran como para los tres tamaos de
muestra se descart la variable irrelevante en al menos el 82% de las veces.
una muestra muy pequea de 100 datos, el modelo fue capaz de rechazar el modelo
restringido.
(c) Al final del proceso de simulacin se obtiene una muestra de tamao N que indica,
si la serie es no-lineal, el tipo de funcin de transicin (logstica o exponencial) y la
variable de transicin para el modelo.
donde at = ht t con h2t = 0 + 1 a2t1 . El primer modelo considera una funcin de transicin
logstica equivalente, por lo tanto F() corresponde a la funcin S() de la ecuacin (2.6) y
G() a la funcin Z() de la ecuacin (2.7). Mientras que el segundo modelo considera una
funcin de transicin exponencial equivalente, el la cual F() corresponde a la funcin E()
de la ecuacin (4.2) y G() a la funcin U() de la ecuacin (4.3).
Para tamaos de muestra, T = 100, 200 y 500 datos y un total de 1000 series sintticas, se
obtuvieron los resultados reportados en la Tabla 4.4, en los cuales se puede observar que:
Para el caso de la funcin de transicin logstica equivalente, an en muestras pequeas, la
prueba fue capaz de encontrar la variable de transicin real al menos en el 91% de los casos,
e indic correctamente que el modelo tena una funcin de transicin logstica al menos
el 92% de las veces. Por su parte para el caso de la funcin de transicin exponencial, los
resultados son igualmente buenos para el caso de la variable de transicin, sin embargo, la
funcin de transicin no fue indicada correctamente. Una inspeccin visual de la grfica
de la funcin de transicin como funcin de la variable de transicin, indic que las series
en las cuales la prueba no detectaba correctamente la funcin de transicin correspondan
a grficas donde no se observaba claramente cual era la funcin de transicin que seguan.
Tabla 4.4: Simulacin para determinar la funcin y la variable de transicin del modelo
4.7 CONCLUSIONES
Aunque se han cumplido parcialmente los objetivos planteados en esta tesis, es necesario
confrontar el modelo propuesto contra otros modelos alternativos en casos reales de aplicacin.
Esto ser hecho en el prximo captulo.
46
5. CASOS DE APLICACIN
En el captulo anterior se plante un modelo para el anlisis de series temporales no lineales con
heterocedasticidad condicional autorregresiva y se propuso una estrategia para la especificacin
de estos modelos basada en la prueba STR de no linealidad y la prueba del radio de verosimilitud.
Para establecer la validez del modelo es necesario realizar casos de aplicacin con series reales
que permitan determinar sus bondades o limitantes. En este captulo se evaluarn dos casos de
aplicacin en los cuales se representarn series temporales comnmente usadas en la literatura.
En la seccin 5.1. se modela la serie del ndice de Oscilacin del Sur (SOI), una serie
macroclimtica usada para medir la fuerza y la fase de la Oscilacin del Sur la cual permite
determinar la presencia de los eventos extremos de El Nio y La Nia (Hall, Skalin y Tersvirta,
1998). Por un lado, la no linealidad de las variables macroclimticas ha sido reconocida en
diferentes estudios explicada en la naturaleza catica del clima (Mesa, Poveda y Carvajal, 1997).
La heterocedasticidad por su parte, no ha sido un tema formalmente abordado, sin embargo en
la literatura se encuentran trabajos que lo han planteado como Hall et al. (1998).
A nivel mundial el estudio de las series financieras ha desencadenado un sin nmero de
propuestas para representar los movimientos del mercado financiero. ndices macroeconmicos,
tasas de cambio y precios de acciones, entre muchas otras series, se han abordado desde diversos
enfoques para tratar de representar su dinmica e incluso pronosticar su comportamiento
futuro. Se ha encontrado en dichos estudios que, en su mayora, las series financieras son
no lineales en la media, y adems que su volatilidad puede ser cambiante en el tiempo y puede
agruparse en clusters, este comportamiento sugiere la existencia de correlaciones seriales y de
heterocedasticidad. Diversos estudios se han enfocado en capturar una o ambas propiedades
entre ellos (Engle, 1982) (Taylor, 2004) (Chen y Mike, 2006) (Chang, 2006) (Chan et al., 2005).
Siguiendo ese mismo enfoque se presenta como caso de aplicacin en la seccin 5.2 la serie de
los cambios relativos en los precios de cierre de las acciones de IBM.
Finalmente, la seccin 5.3 presenta las conclusiones de los casos de aplicacin planteados
para este trabajo.
47
48
5.1.1 Introduccin
El fenmeno climtico de El Nio - Oscilacin del Sur (ENSO) se presenta como el resultado de
la interaccin ocano-atmsfera en el Ocano Pacfico ecuatorial, afectando de forma importante
las condiciones climatolgicas de las regiones comprometidas durante sus fases clida y fra,
conocidas como periodos de El Nio y La Nia respectivamente (Philander, 1990). Diversos
estudios han determinado que El Nio es un evento recurrente y aperidico que se presenta con
una recurrencia aproximada de entre 2 y 7 aos, y que tiene una duracin aproximada de 12
meses (Glantz, 1996); su intensidad depende de la magnitud de las anomalas y del rea cubierta
por las mismas. Ambas fases del ENSO producen eventos extremos hidrometeorolgicos, que
tienen importantes impactos ambientales, sociales y econmicos que han sido documentados
en diversas investigaciones (Glantz, 1996). Dichos impactos han confirmado la necesidad de
entender y predecir este fenmeno con el fin de emprender tareas de planificacin para la
mitigacin de sus efectos (IDEAM, 2002).
Debido a la naturaleza catica del clima, la interaccin de fenmenos atmosfricos que actan
en distintos lugares y momentos, y su aperiodicidad, el pronstico del ENSO representa un
problema complejo (Wittenberg, 2002) que ha sido abordado por dos enfoques fundamentales.
Por un lado se encuentran los modelos fsicos que consideran los sistemas ocano-atmosfricos;
mientras que por el otro, se encuentran los modelos estadsticos Hall et al. (1998) en que se
pretende encontrar representaciones matemticas de la dinmica que siguen las variables que
pueden ser usadas para medir el fenmeno.
El SOI es un ndice para medir la fuerza y la fase de la Oscilacin del Sur, el cual permite
determinar la presencia de los eventos de El Nio y La Nia; los valores extremos negativos
corresponden al fenmeno de El Nio, mientras que los valores extremos positivos corresponden
a La Nia. Las caractersticas ya mencionadas del ENSO se ven reflejadas precisamente en
la dinmica que sigue el SOI, lo que ha llevado a abordar su modelado a partir de tcnicas
estadsticas no lineales. Particularmente, en Hall et al. (1998) se ha realizado el modelado de
esta serie usando un modelo LSTAR; los resultados del diagnstico del modelo obtenido por
Hall et al. (1998) muestran que los residuales no presentan correlaciones residuales remanentes,
pero su volatilidad es cambiante en el tiempo, por lo que el modelo podra ser rechazado, y
consecuentemente se requerira considerar otras especificaciones alternativas u otras clases de
modelos.
49
El Nio consiste en un calentamiento anmalo de las aguas superficiales del centro y este del
Pacfico tropical, lo que produce una profundizacin de la termoclima; est asociado a un
debilitamiento de los vientos alisios del este y al desplazamiento del centro de conveccin del
oeste al centro del Pacfico.
La Oscilacin del Sur es una onda estacionaria de masa atmosfrica que produce un
diferencial de presiones entre el oeste y el este del Pacfico ecuatorial. El centro de alta presin
se encuentra en la isla de Tahit, mientras que el de baja presin se halla en Darwin, Australia.
El SOI (ndice de Oscilacin del Sur), determina el gradiente de presiones, y se establece como la
diferencia entre las presiones de los centros de presin dividida por la desviacin estndar. De
esta manera, valores extremos positivos del SOI denotan el evento La Nia y valores extremos
negativos del SOI sugieren el evento El Nio.
La Figura 5.1(a) presenta la serie del SOI, en ella se visualizan periodos de El Nio y La Nia.
As, por ejemplo, los fenmenos El Nio de 1982- 1983 y 1997- 1998 se consideran muy fuertes
en intensidad, los de 1957-1958, 1965-1966, 1972-1973 y 1991-1992, fuertes y los de 1976-1978 y
1986-1987, moderados. No obstante, el efecto climtico y el impacto socioeconmico de estos
fenmenos dependen de otros factores como la vulnerabilidad de las regiones (IDEAM, 2002).
La informacin usada en este estudio corresponde a las mediciones mensuales del SOI, desde
Enero de 1876 hasta Marzo de 1997 para un total de 1455 observaciones, al igual que Hall et al.
(1998).
La Figura 5.2 resume las propiedades estadsticas del SOI. La funcin de autocorrelacin simple
y la funcin de autocorrelacin parcial o FACP son presentadas en las Figuras 5.2.a y 5.2.b
respectivamente, e indican que la serie se podra aproximar con un modelo AR(P)de orden
3. Sin embargo, hay presencia de rezagos importantes alrededor de P = 14. En el espectro
de potencias (Figura 5.2.c) se muestra una concentracin de energa de frecuencias muy bajas,
debidas posiblemente a que el periodo de ocurrencia de El Nio es amplio y de largo plazo. El
histograma (Figura 5.2.d), adems, muestra que los datos de la serie siguen una distribucin
aproximadamente normal.
A continuacin se presentarn los pasos de la metodologa propuesta para el modelo
desarrollado.
Paso 1: En la Tabla 5.1 se reportan los valores de los diferentes criterios de informacin
50
50
50
1/1876 1/1896 1/1916 1/1936 1/1956 1/1976 1/1996
(a) SOI
50
50
1/1876 1/1896 1/1916 1/1936 1/1956 1/1976 1/1996
(b) Innovaciones
150
100
50
1/1876 1/1896 1/1916 1/1936 1/1956 1/1976 1/1996
(c) Varianzas
Figura 5.1: (a) SOI, (b) Innovaciones del modelo ANFIS-ARCH; y (c) Varianzas del modelo
ANFIS-ARCH
51
(a)
1
1
0 10 20 30 40 50 60 70
(b)
1
1
0 10 20 30 40 50 60 70
(c) (d)
2 0.1
1 0.05
0 0
0 0.1 0.2 0.3 0.4 50 0 50
Figura 5.2: Propiedades estadsticas de la serie del SOI (a) FAC; (b) FACP; (c) Espectro; (d)
Histograma
52
estimados para modelos autoregresivos de orden P = 1, , 18. Con negrilla son resaltados aquellos
valores mnimos para cada criterio, de acuerdo a ello el orden ptimo P del modelo AR(p) para
las reglas de los consecuentes es 16, teniendo como criterio de eleccin el valor ms alto de P.
Los resultados de las pruebas STR para especificar el tipo de modelo son reportados en
la Tabla 5.3. El valor reportado en la primera columna de cada LM es el estadstico de dicha
prueba, mientras que la cantidad entre parntesis corresponde a su valor crtico. Cuando se
rechaza la hiptesis nula de linealidad para el LM1, se calculan los estadsticos LM2, LM3 y
LM4. De acuerdo con los resultados obtenidos, se selecciona a yt3 como variable de decisin, y
a la funcin logstica para realizar la transicin.
Pasos 3, 4 y 5: La Tabla 5.4 presenta los resultados obtenidos al estimar un modelo ANFIS
homocedstico. El log L es el logaritmo de la funcin de verosimilitud de los residuales,
Box-Pierce y Ljung-Box son los estadsticos para determinar correlaciones residuales remanentes,
McLeod-Lee es un estadstico para determinar si existen relaciones no lineales remanentes en los
residuales y ARCH es la prueba de Engle para determinar si los residuales son heterocedsticos.
Las pruebas de normalidad realizadas rechazan la hiptesis nula de normalidad de los residuales,
lo cual es consistente con el resultado de la prueba ARCH, el cual indica que ellos son
heterocedsticos. Adems, existen autocorrelaciones remanentes en los residuales. Este anlisis
indica que el modelo ANFIS propuesto no captura completamente la dinmica de la serie, y se
debe proceder a incluir una componente heterocedstica a travs de un modelo ARCH de de
orden 1. La presencia de una estructura ARCH en los residuales indica una persistencia en el
cambio mes a mes de la serie, esto es, que una variacin mensual grande en el SOI tiende a ser
seguida por otra variacin grande y que variaciones pequeas tienden a ser seguidas por nuevas
variaciones pequeas.
donde at = ht t con h2t = 0 + 1 a2t1 . Los parmetros para este modelo son presentados en la
Tabla 5.5.
La Figura 5.3 resume las principales propiedades estadsticas para los residuales
normalizados; la FAC y el espectro indican que los residuales parecen ser incorrelacionados;
adems el histograma indica que son aproximadamente normales. Las pruebas estadsticas
para este modelo se encuentran reportadas en la Tabla 5.6; aunque los residuales no siguen una
distribucin normal, los contrastes aplicados a ellos, indican que son homocedsticos, y que no
existen correlaciones remanentes.
Las Figuras 5.1(b) y 5.1(c) presentan las innovaciones y varianzas del modelo propuesto.
Aunque la serie presenta una componente importante en su volatilidad, es importante resaltar
la presencia de un nmero significativo de cambios extremos en el SOI de un mes a otro. Estos
se evidencian en la Figura 5.1(c) como varianzas puntuales extremadamente altas en relacin al
resto de la serie.
La Figura 5.4 muestra la funcin de transicin del modelo en el tiempo y como funcin
de la variable de transicin. En dicha figura se muestra como la funcin de transicin flucta
rpidamente de un rgimen al otro, ello claramente confirma que la dinmica de la serie es no
lineal.
La Figura 5.5 presenta el pronstico determinstico para la serie; yT+1 se calcul utilizando
los datos histricos. Para calcular yT+2 se utilizaron los datos reales hasta yT , y el pronstico
para yT+1 ; los restantes valores se calcularon de forma similar; en todos los casos se asume que
los residuales son cero. Se observa como la serie pronosticada converge a un punto de equilibrio
donde las entradas y la salida del modelo son iguales numricamente.
La Figura 5.6 muestra la convergencia a largo plazo del modelo; ella se obtiene al realizar
el pronstico determinstico utilizando diferentes puntos de arranque obtenidos de los datos
histricos. En general, los modelos no lineales pueden presentar procesos de convergencia a uno
o ms puntos estables; procesos cclicos, y procesos divergentes; es comn, que dependiendo
del punto de inicio, un mismo modelo presente distintos comportamientos. Para el modelo
54
1. Los primeros estadsticos presentados en la tabla corresponden a los reportados por Hall
et al. (1998) para un modelo LSTAR que intenta capturar la dinmica de la serie del SOI. El
modelo LSTAR presenta un menor valor para el criterio de informacin de Akaike, adems
su R2 es mayor. Si se considera la relacin establecida por Velsquez et al. (2004) entre
ANFIS y los modelos STR, y adems que los modelos LSTAR son formulados a partir de los
modelos STR, entonces se podra pensar en que el criterio de Akaike, que es dependiente de
la estructura de los modelos, pueda ser usado para propsitos de comparar, y de acuerdo
a ellos el mejor modelo es el LSTAR. Adems el estadstico R2 , que es independiente
de la estructura de los modelos, tambin indica que es el LSTAR el modelo que mejor
representa la serie. Sin embargo, el modelo LSTAR reportado no cumple con el supuesto
de homocedasticidad en los residuales de acuerdo al valor crtico del estadstico LMARCH,
lo cual es suficiente evidencia para afirmar que el modelo ANFIS-ARCH captura mejora
la dinmica de la serie.
La Figura 5.7 presenta las funciones de transicin para los modelo ANFIS-ARCH y
55
Para este modelo tambin se realiz la prueba del radio de verosimilitud, cuyo estadstico
fue LR = 58.448 y su valor crtico p = 0, lo cual es suficiente evidencia de que el modelo
ANFIS-ARCH es mejor que el modelo ARX-ARCH.
En resumen, a pesar de que los modelos LSTAR de Hall et al. (1998) presentan unos mejores
estadsticos de ajuste que el modelo ANFIS-ARCH, se deben descartar debido a la presencia
de heterocedasticidad en sus residuales. De esta forma los modelos ANFIS-ARCH son los que
mejor capturan la dinmica de la serie.
5.2.1 Introduccin
(a)
5
5
1/1876 1/1896 1/1916 1/1936 1/1956 1/1976 1/1996
0.4
0.5 0.15
0.3
0 0.1
0.2
0.5 0.05
0.1
1 0 0
0 10 20 0 0.5 10 0 10
Figura 5.3: Propiedades estadsticas de los residuales del modelo ANFIS-ARCH - Serie SOI (a)
Residuales; (b) FAC; (c) Espectro; (d) Histograma
57
(a)
0.5
0.4
0.3
0.2
0.1
0
0 500 1000 1500
(b)
1
0.8
0.6
0.4
0.2
0
50 40 30 20 10 0 10 20 30 40
U
Figura 5.4: Funcin de transicin para el modelo ANFIS-ARCH - Serie SOI (a) En el tiempo, (b)
Como funcin de la variable de transicin.
58
40
20
20
40
30
20
10
10
20
30
0 20 40 60 80 100
0.8
0.6
0.4
0.2 ANFISARCH
STRARCH
0
50 40 30 20 10 0 10 20 30 40
Figura 5.7: Funciones de transicin para los modelos ANFIS-ARCH y STR-ARCH - Serie SOI
Tabla 5.1: Valor de los criterios de informacin para el modelo AR(p) - Serie SOI.
Tabla 5.4: Pruebas estadsticas para el modelo ANFIS homocedstico - Serie SOI
Box y Jenkins (1970) presentan la serie de precios diarios de I.B.M. para plantear la especificacin
de sus modelos clsicos. Desde entonces, esta serie se ha usado en la literatura analizando, entre
otras, sus caractersticas de no linealidad y heterocedasticidad (Tong, 1990)(Tsay, 2002). Muchos
enfoques han sido usados para representar la dinmica de esta serie; sin embargo, el modelo
de Inteligencia Computacional ms citado en la literatura para modelar esta serie es redes
neuronales, el cual fue propuesto por White (1993) y sirvi como precedente para el uso de las
redes neuronales en el anlisis de otras series financieras.
La serie de precios de IBM utilizada en este trabajo, corresponde a la misma utilizada por
Tong (1990), quien demuestra su comportamiento no lineal; en el periodo comprendido entre el
18 de mayo de 1961 y el 30 de marzo de 1962, con un total de 118 observaciones.
La Figura 5.8(a), presenta la serie temporal. La media de la serie es 0.07 y su varianza es de
0.9239.
5
0 50 100 150 200
(a) IBM
5
5
0 50 100 150 200
(b) Innovaciones
4
0
0 50 100 150 200
(c) Varianzas
Figura 5.8: (a) IBM, (b) Innovaciones del modelo ANFIS-ARCH; y (c) Varianzas del modelo
ANFIS-ARCH
65
(a)
1
1
0 5 10 15 20 25
(b)
1
1
0 5 10 15 20 25
(c) (d)
1 0.4
0.5 0.2
0 0
0 0.1 0.2 0.3 0.4 5 0 5
Figura 5.9: Propiedades estadsticas de la serie del IBM (a) FAC; (b) FACP; (c) Espectro; (d)
Histograma
respectivamente, e indican que la serie se podra aproximar con un modelo de medias mviles
MA(P)de orden 2. En el espectro de potencias (Figura 5.9.c) no se observa una concentracin de
energa de frecuencias muy altas. El histograma (Figura 5.9.d), adems, muestra que los datos
de la serie siguen una distribucin aproximadamente normal.
Paso 1: En la Tabla 5.9 se reportan los valores de los diferentes criterios de informacin
estimados para modelos autoregresivos de orden P = 1, , 12. El orden ptimo P del modelo
AR(p) para las reglas de los consecuentes es 4, teniendo como criterio de eleccin el mayor orden
de P.
Paso 2: Las diferentes pruebas de no linealidad se presentan en la Tabla 5.10 y se detallan en
el ANEXO A de este trabajo. En ellas se observa claramente la no linealidad de la serie, ya que
todas las pruebas, al menos hasta el rezago uno dieron indicios de no linealidad.
66
Los resultados de las pruebas STR para especificar el tipo de modelo son reportados en
la Tabla 5.11. De acuerdo con los resultados obtenidos, se selecciona a yt1 como variable de
decisin y a la funcin logstica equivalente para la transicin.
Pasos 3, 4 y 5: La Tabla 5.12 presenta los resultados obtenidos al estimar un modelo ANFIS
homocedstico; log L es el logaritmo de la funcin de verosimilitud de los residuales igual a
-278; Las pruebas de normalidad realizadas rechazan la hiptesis nula de normalidad de los
residuales, lo cual es consistente con el resultado de la prueba ARCH, el cual indica que ellos
son heterocedsticos. Se puede concluir entonces que no existen autocorrelaciones remanentes
en los residuales y que es necesario incorporar una componente ARCH de orden uno al modelo
ANFIS.
Paso 6: El proceso de eliminacin de regresores irrelevantes se llev a cabo, obteniendo como
relevantes en el modelo los rezagos del 1 al 3 de la serie.
El modelo final elegido corresponde a un modelo ANFIS-ARCH de la forma:
donde at = ht t con h2t = 0 + 1 a2t1 . Los parmetros para este modelo son presentados en la
Tabla 5.13.
La Figura 5.10 resume las principales propiedades estadsticas para los residuales
normalizados; la FAC y el espectro indican que los residuales parecen ser incorrelacionados,
adems, el histograma indica que son aproximadamente normales. Las pruebas estadsticas para
este modelo reportadas en la Tabla 5.14 confirman que los residuales siguen una distribucin
normal, los contrastes aplicados a ellos, indican que son homocedsticos, y que no existen
correlaciones remanentes.
Las Figuras 5.8(b) y 5.8(c) presentan las innovaciones y varianzas del modelo propuesto. Se
puede observar como los picos en la figura de la varianza tienen una relacin directa con los
cambios bruscos en la serie.
La Figura 5.11 muestra la funcin de transicin en el tiempo, Figura (a), y como funcin de
la variable de transicin, Figura (b). La Figura (a) muestra fluctuaciones rpidas de un rgimen
a otro, lo que evidencia la no linealidad de la serie.
La Figura 5.12 presenta el pronstico determinstico para la serie; yT+1 se calcul utilizando
los datos histricos. Para calcular yT+2 se utilizaron los datos reales hasta yT , y el pronstico
67
para yT+1 ; los restantes valores se calcularon de forma similar; en todos los casos se asume que
los residuales son cero. Se observa como la serie pronosticada converge rpidamente a un punto
de equilibrio donde las entradas y la salida del modelo son iguales numricamente.
La Figura 5.13 muestra la convergencia a largo plazo del modelo; ella se obtiene al realizar
el pronstico determinstico utilizando diferentes puntos de arranque obtenidos de los datos
histricos. En general, los modelos no lineales pueden presentar procesos de convergencia a uno
o ms puntos estables; procesos cclicos, y procesos divergentes; es comn, que dependiendo
del punto de inicio, un mismo modelo presente distintos comportamientos. Para el modelo
obtenido, se presenta un proceso de convergencia a un nico punto de equilibrio, y la velocidad
con que el modelo converge a l es aproximadamente constante e independiente del tipo de
fenmeno extremo.
Las propiedades estadsticas de los datos son reportadas en la Tabla 5.15 contrastadas con las
propiedades para una serie sinttica simulada de 10000 observaciones. Esta tabla nos permite
analizar que tan bien son reproducidas las propiedades estadsticas de los datos; en general,
puede concluirse que el modelo reproduce bastante bien las propiedades de la serie original.
La Tabla 5.16 presenta los estadsticos de diferentes modelos con los que se desea comparar
el modelo ANFIS-ARCH propuesto.
De acuerdo al relacin que establecen Velsquez et al. (2004) entre los modelos ANFIS y
STR, los modelos STR-ARCH y ARX-ARCH se puede afirmar que dichos modelos poseen la
misma estructura de los modelos ANFIS-ARCH para efectos de comparar el ajuste de la serie.
La comparacin con cada uno de los modelos presentados es descrita a continuacin:
La Figura 5.14 presenta las funciones de transicin para los modelo ANFIS-ARCH y
STR-ARCH, en ellas se observa una transicin ms suave en el modelo ANFIS-ARCH y
un solo rgimen para el modelo STR lo que puede indicar problemas en su especificacin.
Se realiz adems, la prueba del radio de verosimilitud para determinar cual modelo
representaba mejor la dinmica de la serie. Se consider el modelo ANFIS-ARCH como el
68
2. El otro modelo usado para comparar es el ARX-ARCH contra el cual los estadsticos
tambin indicaron que el modelo ANFIS-ARCH capturaba mejor la dinmica de la serie;
el criterio de informacin de Akaike fue mayor para el modelo ARX-ARCH, y tanto el
estadstico R2 como el log L fueron mayores para el modelo ANFIS-ARCH.
Adems, la prueba del radio de verosimilitud, cuyo estadstico fue LR = 23.914 y su valor
crtico p = 0.008 indic que efectivamente los modelos ANFIS-ARCH se comportaban mejor
que los modelos ARX-ARCH.
Tabla 5.9: Valor de los criterios de informacin para el modelo AR(p) - Serie IBM
5.3 CONCLUSIONES
Al modelar las series del SOI y de los cambios relativos en los precios de las acciones de IBM se
pudieron hacer varias observaciones respecto a los modelos ANFIS-ARCH:
(a)
4
4
0 50 100 150 200
0 0.2 0.2
1 0 0
0 10 20 0 0.5 5 0 5
Figura 5.10: Propiedades estadsticas de los residuales del modelo ANFIS-ARCH - Serie IBM (a)
Residuales; (b) FAC; (c) Espectro; (d) Histograma
70
(a)
0.5
0.4
0.3
0.2
0.1
0
0 50 100 150 200 250
0.8
0.6
0.4
0.2
0
3 2 1 0 1 2 3 4
Figura 5.11: Funcin de transicin para el modelo ANFIS-ARCH - Serie IBM (a) En el tiempo,
(b) Como funcin de la variable de transicin.
71
0.5
0.5
1.5
2
0 10 20 30 40 50
1.5
0.5
0.5
1
0 5 10 15 20
0.8
0.6
0.4
0.2
0
3 2 1 0 1 2 3 4
Figura 5.14: Funciones de transicin para los modelos ANFIS-ARCH y STR-ARCH - Serie IBM
Tabla 5.12: Pruebas estadsticas para el modelo ANFIS homocedstico - Serie IBM
En segundo lugar, al simular series sintticas con ambos modelos se encontr que las
propiedades estadsticas de las dos series se lograban reproducir bastante bien. Adems,
las grficas del pronstico determinstico y la convergencia a largo plazo indicaron que
los modelos lograban converger rpidamente, en ambos casos, a un mismo punto de
equilibrio.
Finalmente, al comparar el modelo propuesto para la serie del SOI con el propuesto por Hall
et al. (1998), se puede anotar que las medidas de ajuste que se poda usar para comparar
los modelos eran el estadstico R2 y el criterio de Akaike, que mostraron el modelo LSTAR
como mejor; sin embargo, el hecho de que ese modelo tuviera residuales heterocedsticos
era evidencia suficiente para determinar que el modelo ANFIS-ARCH ajustaba mejor la
serie.
76
6. CONCLUSIONES Y TRABAJO FUTURO
Demostrar las limitantes de la aproximacin de ANFIS hecha por Jang (1993), encontrando
que: el planteamiento est hecho para ANFIS como un modelo de regresin; el proceso
de estimacin de parmetros no aplica para los modelos que intentan capturar cambios
en la varianza; finalmente, el procedimiento para la especificacin de los modelos no es
adecuado para modelos de series temporales.
Determinar si las estrategias planteadas para la formulacin de los modelos eran adecuadas
y si el modelo era capaz de recuperarse a si mismo. Con este fin, se realizaron
unas simulaciones en muestras pequeas que permitieron determinar que el modelo
efectivamente es capaz de recuperarse a si mismo, pero presenta dificultades para
establecer exactamente los parmetros de los antecedentes. Adems, a pesar de que
durante el planteamiento del modelo solo se hizo referencia a modelos univariados, la
especificacin de modelos con variables exgenas arroj buenos resultados. Por ltimo,
la simulacin mostr que los procesos de especificacin del modelo funcionan de forma
adecuada.
77
78
Realizar dos casos de aplicacin, el primero con la serie macroclimtica del SOI y el segundo
con la serie de los cambios relativos en los precios de cierre de las acciones de IBM.
En ambos casos, la estrategia planteada para la formulacin de modelos ANFIS-ARCH
permiti caracterizar adecuadamente la serie, lo que se manifest en que sus residuales
no presentaron correlaciones residuales remanentes, fueron aproximadamente normales y
homocedsticos.
El modelado de series temporales ha sido utilizado en diferentes reas como un medio para
entender fenmenos de los cuales se tiene un registro en el tiempo. Con este propsito se
han desarrollado mltiples mtodos de anlisis encaminados a explicar la dinmica de dichos
fenmenos. Este trabajo se concentr en la necesidad de representar las dinmicas de no
linealidad en media y en varianza que poseen algunas series temporales. A pesar de que
esta problemtica ya ha sido abordada en la literatura, no se han agotado todas las posibilidades
de investigacin en esta rea, y por tanto es vlido el planteamiento de nuevos modelos que
potencialmente puedan explicar mejor el comportamiento de fenmenos complejos.
Este trabajo complement el enfoque de series temporales con una tcnica de inteligencia
artificial para la solucin de los objetivos planteados formulando un modelo ANFIS-ARCH.
Este tipo de modelos hbridos constituye un conjunto de aportes tanto para el anlisis de series
temporales como para la inteligencia artificial, y potencialmente puede aportar al entendimiento
de fenmenos altamente complejos.
Finalmente, la formulacin exitosa de este tipo de modelos indica que es posible construir
otros modelos donde las componentes reflejen mayor complejidad, en este caso concreto, los
modelos ARCH podran ser reemplazados por otros modelos que representen estructuras ms
complejas en la varianza de la serie.
En el anlisis de series temporales los fenmenos complejos suelen ser abordados desde
diferentes enfoques y recientemente se han usado modelos hbridos con los que se intenta
capturar la mayor cantidad de caractersticas conocidas para una serie especfica. En esta
diversidad de enfoques, la inteligencia artificial a jugado un papel importante con el uso de
redes neuronales y otra clase de tcnicas para el modelado de series temporales. Sin embargo,
79
los aportes de la lgica difusa han sido ms recientes y limitados, concentrados nicamente en
formular la aproximacin como un problema general de regresin.
El modelo propuesto constituye entonces una nueva tcnica para el anlisis de series
temporales no lineales en media y en varianza, y como tal un aporte para el anlisis de series
temporales, ya que consigue vincular una tcnica de la inteligencia artificial como los modelos
adaptables de inferencia neurodifusa con las herramientas del anlisis de series temporales como
los modelos de heterocedasticidad condicional autorregresiva.
Por otra lado, la relacin planteada por Velsquez et al. (2004) en la que los modelos STR
corresponden a una simplificacin de los modelos ANFIS bajo algunas restricciones, implica
que los modelos ANFIS-ARCH pueden representar series temporales ms complejas que los
modelos economtricos STR-ARCH, lo cual establece otra contribucin en el anlisis de series
temporales.
Finalmente, es vlido preguntarse si los modelos ANFIS podran complementar otros
modelos economtricos para explicar mejor algunos fenmenos especficos.
Una de las tareas de los modelos de inteligencia artificial ha sido construir modelos de regresin.
Para resolver este problema se han usado diversos enfoques que han conseguido establecerse
en la literatura como tcnicas de regresin de uso comn. Sin embargo, la formulacin,
especificacin y estimacin de este tipo de modelos ha sido de alguna manera informal y muchos
de esos procesos se han realizado mediante tcnicas ad hoc.
Los modelos adaptables de inferencia neurodifusa ANFIS se han relacionado recientemente
con la econometra, considerndolos ms como modelos de series temporales que como simples
modelos de regresin. El principal aporte de esta tesis a la inteligencia artificial lo constituye el
planteamiento metodolgico por medio del cual se pueden especificar modelos ANFIS-ARCH
de forma sistemtica y robusta, apoyado en pruebas estadsticas y matemticas que le dan un
carcter ms formal a este tipo de modelos. Este proceso de especificacin va ms all de los
procedimientos comnmente usados en la inteligencia artificial.
Los modelos formulados fueron aplicados a dos series de uso comn en la literatura, la serie del
ndice de Oscilacin del Sur (SOI) y la serie de los cambios relativos en los precios de cierre de
las acciones de IBM.
80
Respecto a la representacin del SOI, el modelo propuesto ayud a complementar los trabajos
de Hall et al. (1998) mostrando que la heterocedasticidad reportada en los residuales de su
modelo se eliminaba al representar la varianza de la serie por medio de la componente ARCH del
modelo propuesto en este trabajo. Los dems estadsticos del modelo ANFIS-ARCH propuesto
mostraron tambin residuales incorrelacionados y aproximadamente normales, lo que indica
que el modelo caracteriza tanto la no linealidad de esta serie como su volatilidad.
El modelo para la serie de IBM, por su parte, captur adecuadamente la dinmica de la
serie de acuerdo al anlisis de sus residuales que resultaron incorrelacionados, homocedsticos
y aproximadamente normales. Estos resultados confirman que la serie es no lineal y sugiere la
existencia de una estructura determinstica en su volatilidad que puede ser representada como
una funcin de las perturbaciones aleatorias pasadas.
Los modelos propuestos fueron comparados con otros modelos economtricos (STR-ARCH
y ARX-ARCH) que tambin representaban no linealidades en la media y la varianza de las series,
por lo tanto tienen caractersticas similares a los modelos ANFIS-ARCH. Estas comparaciones
permitieron encontrar para las series especficas del caso de aplicacin, de acuerdo a los
estadsticos de ajuste, que el modelo ANFIS-ARCH presenta mejores resultados que los dems
modelos analizados.
Este captulo ha resumido algunas de las contribuciones hechas dentro de esta tesis en el anlisis
de series temporales y la inteligencia artificial indicando aspectos que deberan ser considerados
en investigaciones futuras.
Respecto a los puntos que deben ser tratados y que no se han resuelto en este trabajo se
encuentran:
Aplicar la metodologa planteada en la formulacin de modelos para series reales que
puedan ser explicadas por variables exgenas.
Reemplazar el modelo ARCH con otros modelos no lineales para considerar estructuras
ms complejas en la varianza de la serie.
Akaike, H. (1973), Information theory and an extension of the maximum likelihood principle, in
B. Petrov y F. Csaki, eds, 2nd International Symposium on Information Theory, Akademia
Kiado, p. 267U281.
Anders, U. y Korn, O. (1999), Model selection in neural networks, Neural Networks 12, 309U323.
Bera, A. y Jarque, C. (1980), Efficient tests for normality, homoscedasticity and serial
independence of regression residuals, Economics Letters (3).
Bherenji, H. y Khedkar, P. (1992), Learning and tuning fuzzy logic controllers through
reinforcements, IEEE Transactions on Neural Networks (3), 724740.
Box, G. y Jenkins, G. M. (1970), Time Series Analysis: Forescasting and Control, Holden-Day, Inc.
Breiman, L., Friedman, J. H., Olshen, R. A. y Stone, C. J. (1984), Classification and Regression Trees,
Wadsworth y Brooks/Cole Advanced Books y Software.
Chan, F., Marinova, D. y McAleer, M. (2005), Modelling thresholds and volatility in us ecological
patents, Environmental Modelling & Software 20, 13691378.
Chan, F. y McAleer, M. (2003), Estimating smooth transition autoregressive models with garch
errors in the presence of extreme observations and outliers, Applied Financial Economics
13(8), 581592.
Chatfield, J. F. C. (1998), Time series forecasting with neural networks: a comparative study
using the airline data, Journal of Applied Statistics 47, 231U250.
83
84
Darbellay, G. y Slama, M. (2000), Forecasting the short-term demand for electricity. do neural
networks stand a better chance?, International Journal of Forecasting 16, 71U83.
Engle, R. (1982), Autoregressive conditional heterocedasticity with estimates of the variance of
united kingdom inflations, Econometrica 50, 9871007.
Friedman, J. H. (1990), Multivariate adaptive regression splines, Tech. Report Dept. of Statitstics
Stanfor University .
Fukumizu, K. (2003), Likelihood ratio of unidentifiable models and multilayer neural networks,
Annals of Statistics 31(3), 833851.
Glantz, M. H. (1996), Currents of Change El Nios impacts on climate and society, Cambridge
University Press.
Granger, C. y Terasvirta, T. (1993), Modelling Nonlinear Economic Relationships, Oxford University
Press.
Hall, A. D., Skalin, J. y Tersvirta, T. (1998), A nonlinear time series model of el nio, Working
Paper Series in Economics and Finance 263, Stockholm School of Economics.
Hannan, E. y Quinn, B. (1979), The determination of the order of an autoregression, Journal of
Royal Statistical Society Series B 41, 190U195.
Harvey, A. C. (1989), Forecasting, Structural Time Series Models and the Kalman Filter, Cambridge
University Press.
Heravi, S., Osborn, D. y Birchenhall, C. (2004), Linear versus neural network forecasts for
european industrial production series, International Journal of Forecasting 20, 435U446.
IDEAM (2002), Efectos naturales y socioeconmicos del fenmeno el nio en colombia, Technical
report, Ministerio del Medio Ambiente, Instituto de Hidrologa Meteorologa y Estudios
Ambientales,Repblica de Colombia.
Igel, C. y Hsken, M. (2000), Improving the Rprop learning algorithm, in H. Bothe y R. Rojas,
eds, Proceedings of the Second International ICSC Symposium on Neural Computation
(NC 2000), ICSC Academic Press, pp. 115121.
Jang, R. (1993), Anfis: Adaptive-network-based fuzzy inference system, IEEE Transactions (3).
Jang, R. (1994), Structure determination in fuzzy modeling: a fuzzy cart approach, in IEEE
international conference on fuzzy systems.
Jang, R. (1996), Input selection for anfis learning, in 5th IEEE International Conference on Fuzzy
System.
Juang, C. y Lin, C. (1998), An online self-constructing neural fuzzy inference network and its
applications, IEEE Trans. on Fuzzy Systems (6).
85
Kasabov, N. (1999), Foundations of Neural Networks, Fuzzy Systems, and Knowledge Engineering,
MIT Press.
Kennan, D. M. (1985), A tukey non-additivity-type test for times series nonlinearity, Biometrika
(75).
Kim, J. y Kasabov, N. (1999), Hyfis: adaptive neuro-fuzzy inference systems and their application
to nonlinear dynamical systems, Neural Networks (12).
Kuan, C. y Liu, T. (1995), Forecasting exchange rates using feedforwad and recurrent neural
networks, Journal of Applied Econometrics 10, 347U364.
Lewis, R. (2000), An introduction to classification and regression tree (cart) analysis, in Annual
Meeting of the Society for Academy Emergency Medicine, p. 267U281.
Lin, C. y Mudholkar, G. (1980), A simple test for normality against asymmetric alternatives,
Biometrika (67).
Lin, C.-T. y Lee, C. S. G. (1991), Neural-network-based fuzzy logic control and decision system,
IEEE Trans. Comput. 12(40), 13201336.
Ljung, G. y Box, G. (1978), On a measure of lack of fit in time series models, Biometrika (65).
Luukkonen, R., Saikkonen, P. y Terasvirta, T. (1988), Testing linearity agains smooth transition
autoregressive models, Biometrika .
McLeod, A. y Li, W. (1983), Diagnostic checking arma time series models using squared residual
correlations, Journal of Time Series Analysis .
Mesa, O., Poveda, G. y Carvajal, L. (1997), Introduccin al clima de Colombia, Universidad Nacional
de Colombia.
Mills, T. (1993), The econometric modelling of financial time series, Cambridge Press University.
Nauck, D. y Kruse, R. (1999), Neuro-fuzzy systems for function approximation, Fuzzy Sets and
Systems (101).
Philander, S. (1990), El Nio, La Nia and The Southern Oscillation, Academic Press Inc.
Poveda, G., Mesa, O., Carvajal, L., Hoyos, C., Meja, J., Cuartas, A. y Pulgarn, A. (2002),
Prediccin de caudales medios mensuales en ros colombianos usando mtodos no
lineales, Meteorologa Colombiana (6).
86
Ramsey, J. B. (1969), Test for specification errors in classical linear least squares regression
analysis, Journal of the Royal Statistical Society, Series B (31).
Salazar, J., Mesa, . J., Poveda, G. y Carvajal, L. F. (1994), Aplicacin de un modelo continuo no
lineal al estudio de series hidrolgicas, in XVI Congreso Latinoamericano de Hidrulica e
Hidrologa, IAHR, number 4.
Sulzberger, S., Tschicholg-Gurman, N. y Vestli, S. (1993), Fun: Optimization of fuzzy rule based
systems using neural networks, in IEEE Conference on Neural Networks.
Swanson, N. y White, H. (1997a), Forecasting economic time series using adaptive versus
nonadaptive and linear versus non-linear econometric models, International Journal of
Forecasting 13, 439U461.
Takagi, T. y Sugeno, M. (1985), Fuzzy identification of systems and its applications to modeling
and control, IEEE Transactions on Sistems, Man and Cybernetics (15).
Tano, S., Oyama, T. y Arnould, T. (1996), Deep combination of fuzzy inference and neural
network in fuzzy inference, Fuzzy Sets and Systems (82(2)).
Terasvirta, T., Tjostheim, D. y Granger, C. (1994), Aspects of modelling nonlinear time series,
4, 29172957.
Tong, H. (1990), Non-linear time series a dynamical system approach, Claredon Press Oxford.
Tsay, R. (2002), Analysis of Financial Time Series: Financial Econometrics, John Wiley & Sons.
van Dijk, D. y Franses, P. (1999), Modeling multiple regimes in the business cycle, Macroeconomic
Dynamics 3(3), 31140.
van Dijk, D., Franses, P. y Lucas, A. (1999), Testing for smooth transition nonlinearity in the
presence of outliers, Journal of Business & Economic Statistics 2(17), 21735.
Velsquez, J., Dyner, I. y Souza, R. (2004), Statistical modelling of the brazilian electricity spot
price using anfis, in 24th International Symposium of Forecasting.
Velsquez, J. y Gonzlez, L. (2006), Modelado del indice de tipo de cambio real colombiano
usando redes neuronales artificiales, Cuadernos de Administracin 19(32).
87
Vuong, Q. H. (1989), Likelihood ratio test for model selection and non-nested hypotheses,
Econometrica (57).
White, H. (1989), Son asymtotic results for learning in single hidden layer feedforward network
models, Journal of the American Statistical Association (84).
White, H. (1993), Economic prediction using neural networks: the case of ibm daily stock
returns, Neural networks in finance and investing .
Wittenberg, A. T. (2002), ENSO Response to Altered Climates, PhD thesis, Princeton University.
Zapata, E., Velsquez, J. y Smith, R. (2004), Modelamiento de series de caudal usando anfis,
(11).
Zhang, G., Patuwo, B. y Hu, M. (1998), Forecasting with artificial neural networks: the state of
the art, International Journal of Forecasting 14, 3562.
88
A. ANEXO - PRUEBAS DE NO LINEALIDAD
Prueba RESET: Ramsey (1969) propone la prueba RESET estableciendo como hiptesis
nula que la serie se puede representar como un modelo AR(p), cuyos valores optimizados
son y y sus residuales .
Versus el modelo alternativo de la forma
Prueba de Kennan: Kennan (1985) propone una prueba de no linealidad similar a la prueba
RESET, considerando en el modelo alterno solo y 2t y modificando el segundo paso de la
prueba RESET para eliminar la multicolineariadad entre x(t1) y y 2t .
Prueba de Tsay: La prueba Tsay o F fue propuesta por Tsay (1986) para mejorar la prueba
Kennan, incluyendo p(p+1)/2 trminos del producto cruzado en los diferentes rezagos en la
regresin, denotados yt j ytk , k j (j, k = 1, ..., p). Basada en la hiptesis nula de linealidad.
Esta prueba sigue aproximadamente una distribucin F con p(p + 1)/2 y n [p(p + 3)/2] 1
grados de libertad.
Prueba de White: La prueba propuesta por White (1989) denominada tambin prueba de
redes neuronales, usa una red neuronal feedforward con una capa oculta con conexiones
directas entre las entradas y las salidas. De esta forma, la salida de la red neuronal est
dada por:
q
X
yt = x0t a + j (x0t j ) + ut (A.3)
j=1
89
90