Escolar Documentos
Profissional Documentos
Cultura Documentos
Cochabamba – Bolivia
Octubre, 2017
DEDICATORIA
A mis padres por haber invertido sus recursos y esfuerzos para que
pudiera estudiar y trabajar siempre de la manera más cómoda que
fuera posible.
¡Muchas Gracias!
FICHA RESUMEN
Tabla 5-1 Características de los procesos estocásticos estacionarios y patrones de identificación para la
aplicación de los modelos. ..................................................................................................................... - 35 -
Tabla 7-1 Estaciones muestreadas clasificadas por las variables en las que se aplicó el relleno de datos
faltantes y las extensiones a corto plazo. .............................................................................................. - 56 -
Tabla 7-2 Resumen de los resultados obtenidos en el relleno de distintas variables con los modelos ARIMA.
............................................................................................................................................................. - 165 -
Tabla 8-1 Estaciones muestreadas clasificadas por las variables en las que se aplicó el relleno de datos
faltantes usando los modelos ARIMA. ................................................................................................. - 175 -
Tabla 9-1 Estaciones pertenecientes a tres climas diferentes de nuestro país en las cuales se efectuó relleno
de datos faltantes con los programas computacionales HEC-4 y CHAC. ............................................. - 183 -
Tabla 10-1 Estaciones utilizadas `para el relleno de datos faltantes con los generadores estocásticos de clima.
............................................................................................................................................................. - 198 -
Tabla 11-1 Grupos de estaciones donde se aplicó el relleno de datos faltantes usando los modelos
estocásticos ARIMA, el software HEC-4 y la aplicación de relleno de datos en el código R para la variable
Magnitud de Velocidad de Viento Media............................................................................................ - 222 -
Tabla 11-2 Grupos de estaciones donde se aplicó el relleno de datos faltantes usando los modelos
estocásticos ARIMA, el software HEC-4 y la aplicación de relleno de datos en el código R para la variable
Horas de Sol por día a nivel medio. ...................................................................................................... - 223 -
Tabla 11-3 Grupos de estaciones donde se aplicó el relleno de datos faltantes usando los modelos
estocásticos ARIMA, el software HEC-4 y la aplicación de relleno de datos en el código R para la variable
Evaporacion Total. ............................................................................................................................... - 224 -
Tabla 12-1 Estaciones donde se determinó el coeficiente de variación a nivel mensual clasificadas por
variables hidrometeorológicas............................................................................................................. - 238 -
Tabla 13-1 Caracterización de la estaciones con al menos 10 años de observaciones disponibles de
precipitación total mensual que están localizadas dentro del departamento de Cochabamba. ......... - 250 -
Tabla 13-2 Grupos de estaciones de precipitación en Cochabamba determinados por el método de
agrupación Cluster para una distancia euclidiana estandarizada de 2.5. ........................................... - 252 -
Tabla 14-1 Resultados de la prueba de Raíz unitaria para la determinación de la estacionaridad de la serie.
............................................................................................................................................................. - 257 -
Tabla 14-2 Valores de los Índices Estaciones para cada mes de la serie. ............................................ - 259 -
Tabla 14-3 Valores de los estadísticos para cada coeficiente del modelo que ajusta a la componente cíclica de
la serie con sus respectivos estadísticos y niveles de significancia. .................................................... - 261 -
Tabla 14-4 Valores de los estadísticos para cada coeficiente del modelo que ajusta a la componente
estacional de la serie con sus respectivos estadísticos y niveles de significancia. .............................. - 263 -
Índice de Figuras
Figura 1-1 Criterios para la adopción de una metodología para el relleno de datos faltantes. .............. - 2 -
Figura 1-2 Software utilizado en función de la metodología y los intervalos temporales de relleno…...-2 -
Figura 1-3 Experimentos o pruebas realizadas y su finalidad. ................................................................... -3-
Figura 1-4 Variables trabajadas en cada experimento. ............................................................................. -5-
Figura 5-1 Distribuciones de probabilidad, discreta y continua (Webster, 2001, pág. 133). ................. - 18 -
Figura 5-2 Tipos de tendencias determinísticas de una variable, el recuadro a) nos muestra una relación
lineal positiva, el b) una relación lineal negativa; el c) una relación curvilínea positiva y el d) una relación
curvilínea negativa (Webster, 2001, pág. 326). ..................................................................................... - 20 -
Figura 5-3 Diagrama de dispersión de variables independientes (Webster, 2001, pág. 346). .............. - 21 -
Figura 5-4 Gráfica de los errores o residuales entre los modelos de regresión y los datos observados
(Webster, 2001, pág. 339). .................................................................................................................... - 24 -
Figura 5-5 Límites para d que establecen la condición de autorrelación para una variable. ................ - 25 -
Figura 5-6 Proceso de separación de una serie temporal en sus componentes. .................................... - 28 -
Figura 5-7 Tres realizaciones posibles para un mismo proceso estocástico (Mauricio, 2007, pág. 10). - 29 -
Figura 5-8 PANEL A, representación de un proceso estocástico antes y después de la simulación, PANEL B,
representación de las componentes de un proceso estocástico antes y después de su simulación
independiente (Mauricio, 2007, pág. 41) . ............................................................................................. - 30 -
Figura 5-9 Distinción del tipo de modelos a aplicar sobre algunos procesos estocásticos, se muestra las
funciones de auto correlación simple y parcial para los distintos procesos y como estas nos ayudan a
identificar el tipo de modelo a seleccionar (Mauricio, 2007, pág. 73). .................................................. - 33 -
Figura 5-10 Representación de un proceso estocástico con más de una volatilidad (Mauricio, 2007, pág. 84).
............................................................................................................................................................... - 36 -
Figura 5-11 Diferencia entre una serie de datos y su posterior aplicación de una transformación para
conseguir estacionarizarla (Mauricio, 2007, pág. 85). ........................................................................... - 37 -
Figura 5-12 Trasformaciones sobre la serie volátil, panel A (trasformación Box Cox), panel B (trasformación
Box Cox + primera diferencia) (Mauricio, 2007, pág. 94). ..................................................................... - 38 -
Figura 6-1 Esquema del proceso de relleno de datos con el software CHAC.. ....................................... - 46 -
Figura 6-2 Esquema del proceso de relleno de datos con el software CLIGEN. ..................................... - 49 -
Figura 6-3 Enfoque de la metodológica BOX JENKINS para la generación de valores sintéticos a partir de
series temporales. .................................................................................................................................. - 54 -
Figura 7-1 Mapa con la ubicación geográfica de las estaciones, la variable de relleno y el código de cada
estación. ................................................................................................................................................. - 57 -
Figura 7-2 Procedimiento realizado para el relleno de datos con los modelos ARIMA para diferentes variables
hidrometeorológicas. ............................................................................................................................. - 59 -
Figura 7-3 Humedad Relativa a nivel mensual en Collana en [%], a) Original, Serie de datos medida, b) serie
de datos Completada y Extendida. ........................................................................................................ - 60 -
Figura 7-4 Humedad Relativa a nivel mensual en Independencia en [%], a) Original, Serie de datos medida, b)
Completada, Serie de datos completada. .............................................................................................. - 63 -
Figura 7-5 Humedad Relativa a nivel mensual en Culpina en [%], a) Original, Serie de datos medida, b)
Completada y Extendida, Serie de datos completada y extendida. ....................................................... - 68 -
Figura 7-6 Humedad Relativa a nivel mensual en Achiri en [%], a) Original, Serie de datos medida, b)
Completada y Extendida, Serie de datos completada y extendida. ....................................................... - 69 -
Figura 7-7 Humedad Relativa a nivel mensual en Cobija en [%], a) Original, Serie de datos medida, b)
Corregida, Serie de datos corregida usando el criterio de Grubbs & Beck, c) Completada, Serie de datos
rellenada. ............................................................................................................................................... - 74 -
Figura 7-8 Presión atmosférica a nivel mensual en Cochabamba Aeropuerto en [HPA], a) Original, Serie de
datos medida, b) Corregida, Serie de datos corregida usando el criterio de Grubbs & Beck, c) Completada y
Extendida, Serie de datos rellenada y extendida. .................................................................................. - 82 -
Figura 7-9 Presión atmosférica a nivel mensual en Trinidad en [HPA], a) Original, Serie de datos medida, b)
Corregida, Serie de datos corregida usando el criterio de Grubbs & Beck c) Completada y Extendida, Serie de
datos rellenada y extendida................................................................................................................... - 85 -
Figura 7-10 Presión atmosférica a nivel mensual en Sucre en [HPA], a) Original, Serie de datos medida, b)
Completada, Serie de datos rellenada y extendida. ............................................................................... - 87 -
Figura 7-11 Presión atmosférica a nivel mensual en Concepción en [HPA], a) Original, Serie de datos medida,
b) Extendida, Serie de datos extendida. ................................................................................................. - 88 -
Figura 7-12 Presión atmosférica a nivel mensual en Rurrenabaque en [HPA], a) Original, Serie de datos
medida, b) Corregida, Serie de datos corregida usando el criterio de Grubbs & Beck, c) Completada, Serie de
datos rellenada y extendida................................................................................................................... - 91 -
Figura 7-13 Temperatura a nivel mensual en La Tamborada en [ºC], a) Original, Serie de datos medida, b)
Completada y Extendida, Serie de datos completada y extendida. ....................................................... - 99 -
Figura 7-14 Temperatura a nivel mensual en Entre Ríos en [ºC], a) Original, Serie de datos medida, b)
Completada y Extendida, Serie de datos rellenada y extendida. ......................................................... - 102 -
Figura 7-15 Temperatura a nivel diario en Mizque en [ºC], a) Original, Serie de datos medida, b) Completada,
Serie de datos rellenada....................................................................................................................... - 107 -
Figura 7-16 Temperatura a nivel mensual en Irupana en [ºC], a) Original, Serie de datos medida, b)
Completada y Extendida, Serie de datos rellenada.............................................................................. - 113 -
Figura 7-17 Temperatura a nivel mensual en Anzaldo en [ºC], a) Original, Serie de datos medida, b)
Completada, Serie de datos rellenada. ................................................................................................ - 117 -
Figura 7-18 Evaporación a nivel mensual en Chipiri en [mm], a) Original, Serie de datos medida, b)
Completada. Serie de datos rellenada. ................................................................................................ - 122 -
Figura 7-19 Evaporación a nivel diario en Chipiri en [mm], a) Original, Serie de datos medida, b) Completada,
Serie de datos completada................................................................................................................... - 126 -
Figura 7-20 Evaporación a nivel mensual en Harina Cota Cota en [mm], a) Original, Serie de datos medida, b)
Completada, Serie de datos rellenada y extendida. ............................................................................. - 131 -
Figura 7-21 Evaporación a nivel mensual en Belén en [mm], a) Original, Serie de datos medida, b) Corregida,
Serie de datos corregida usando el criterio de Grubbs & Beck, c) Completada y Extendida, Serie de datos
rellenada y extendida........................................................................................................................... - 134 -
Figura 7-22 Evaporación a nivel mensual en Hichucota en [mm], a) Original, Serie de datos medida, b)
Completada y Extendida, Serie de datos rellenada y extendida. ......................................................... - 143 -
Figura 7-23 Precipitación a nivel mensual en Kallutaca en [mm], a) Original, Serie de datos medida, b)
Completada y Extendida, Serie de datos rellenada y extendida. ......................................................... - 147 -
Figura 7-24 Precipitación a nivel mensual en San Juan en [mm], a) Original, Serie de datos medida, b)
Completada y Extendida, Serie de datos rellenada y extendida. ......................................................... - 149 -
Figura 7-25 Precipitación a nivel mensual en Chinoli en [mm], a) Original, Serie de datos medida, b)
Completada y Extendida, Serie de datos rellenada y extendida. ......................................................... - 152 -
Figura 7-26 Precipitación a nivel mensual en Padilla en [mm], a) Original, Serie de datos medida, b)
Completada y Extendida, Serie de datos rellenada y extendida. ......................................................... - 156 -
Figura 7-27 Precipitación a nivel mensual en Aiquile en [mm], a) Original, Serie de datos medida, b)
Corregida, Serie de datos corregida usando el criterio de Grubbs & Beck, c) Completada, Serie de datos
rellenada. ............................................................................................................................................. - 159 -
Figura 7-28 Serie de temperatura media a nivel mensual en Anzaldo, a) Periodo estacionario entre 1977 y
1994, b) Periodo no estacionario. ........................................................................................................ - 167 -
Figura 7-29 Serie de evaporación total a nivel diario en Okinawa I, a) Proceso no estacionario temporal
comprendido entre marzo y noviembre de 2004, b) Proceso estacionario entre 2004 y 2005. ........... - 168 -
Figura 7-30 Estación Collana, serie de humedad relativa media mensual, a) Serie de datos observada, b) Serie
de datos completada y extendida. ....................................................................................................... - 169 -
Figura 7-31 Estación Chipiri, serie de evaporación total diaria a) Serie de datos observados, b) Serie de datos
completada y extendida....................................................................................................................... - 171 -
Figura 7-32 Estación de Belén, serie de evaporación total mensual a) Serie de datos observados, b) Serie de
datos completada y extendida. ............................................................................................................ - 172 -
Figura 8-1 Localización geográfica de las estaciones hidrometeorológicas utilizadas para la evaluación del
desempeño durante el relleno las distintitas variables utilizadas. ...................................................... - 176 -
Figura 8-2 Algoritmo para la aplicación de la metodología BOX JENKINGS para el relleno de datos faltantes y
la realización de predicciones. ............................................................................................................. - 178 -
Figura 8-3 Evaluación del error relativo a la observación de los modelos estocásticos ARIMA a nivel mensual
para la variable evaporación total en tres estaciones hidrometeorológicas muestreadas aleatoriamente
dentro el territorio boliviano, para el relleno de huecos de datos de distinta extensión. .................... - 178 -
Figura 8-4 Evaluación del error relativo a la observación de los modelos estocásticos ARIMA a nivel mensual
para la variable humedad relativa media en tres estaciones hidrometeorológicas muestreadas
aleatoriamente dentro el territorio boliviano, para el relleno de huecos de datos de distinta extensión.- 179 -
Figura 8-5 Evaluación del error relativo a la observación de los modelos estocásticos ARIMA a nivel mensual
para la variable precipitación total en tres estaciones hidrometeorológicas muestreadas aleatoriamente
dentro el territorio boliviano, para el relleno de huecos de datos de distinta extensión. .................... - 179 -
Figura 8-6 Evaluación del error relativo a la observación de los modelos estocásticos ARIMA a nivel mensual
para la variable presión media en tres estaciones hidrometeorológicas muestreadas aleatoriamente dentro
el territorio boliviano, para el relleno de huecos de distinta extensión. .............................................. - 180 -
Figura 8-7 Evaluación del error relativo a la observación de los modelos estocásticos ARIMA a nivel mensual
para la variable temperatura media en tres estaciones hidrometeorológicas muestreadas aleatoriamente
dentro el territorio boliviano, para el relleno de huecos de distinta extensión.................................... - 181 -
Figura 9-1 Grupo de estaciones seleccionado para el relleno de datos diarios a partir de la desagregación
mensual-diaria con datos de estaciones vecinas a la estación de Lambate. ...................................... - 184 -
Figura 9-2 Grupo de estaciones seleccionado para el relleno de datos diarios a partir de la desagregación
mensual-diaria con datos de estaciones vecinas a la estación de Pocona.......................................... - 185 -
Figura 9-3 Grupo de estaciones seleccionado para el relleno de datos diarios a partir de la desagregación
mensual-diaria con datos de estaciones vecinas a la estación de Montero. ...................................... - 186 -
Figura 9-4 Comparación del Error Relativo obtenido entre los valores observados de precipitación total
diaria y los valores rellenados con el método de Mensual-Diaria. Estación Lambate durante la época húmeda
del año hidrológico entre los software HEC-4 y CHAC. ........................................................................ - 189 -
Figura 9-5 Comparación del Error Relativo obtenido entre los valores observados de precipitación total
diaria y los valores rellenados con el método de desagregación Mensual-Diaria. Estación Lambate durante la
época seca del año hidrológico entre los software HEC-4 y CHAC. ...................................................... - 190 -
Figura 9-6 Comparación del Error Relativo obtenido entre los valores observados de precipitación total
diaria y los valores rellenados con el método de desagregación Mensual-Diaria. Estación Pocona durante la
época húmeda del año hidrológico entre los software HEC-4 y CHAC. ................................................ - 190 -
Figura 9-7 Comparación del Error Relativo obtenido entre los valores observados de precipitación total
diaria y los valores rellenados con el método de desagregación Mensual-Diaria. Estación Pocona durante la
época seca del año hidrológico entre los software HEC-4 y CHAC. ...................................................... - 191 -
Figura 9-8 Comparación del Error Relativo obtenido entre los valores observados de precipitación total
diaria y los valores rellenados con el método de desagregación Mensual-Diaria. Estación Montero durante la
época húmeda del año hidrológico entre los software HEC-4 y CHAC. ................................................ - 192 -
Figura 9-9 Comparación del Error Relativo obtenido entre los valores observados de precipitación total
diaria y los valores rellenados con el método de desagregación Mensual-Diaria. Estación Montero durante la
época seca del año hidrológico entre los software HEC-4 y CHAC. ...................................................... - 192 -
Figura 9-10 Comparación del Error Relativo obtenido entre los valores observados de precipitación total
diaria y los valores rellenados con el método de desagregación Mensual-Diaria para cada escenario climático
usando el programa HEC-4 durante la época húmeda del año. .......................................................... - 193 -
Figura 9-11 Comparación del Error Relativo obtenido entre los valores observados de precipitación total
diaria y los valores rellenados con el método de desagregación Mensual-Diaria para cada escenario climático
usando el programa HEC-4 durante la época seca del año. ................................................................ - 194 -
Figura 9-12 Comparación del Error Relativo obtenido entre los valores observados de precipitación total
diaria y los valores rellenados con el método de desagregación Mensual-Diaria para cada escenario climático
usando el programa CHAC durante la época húmeda del año. ........................................................... - 195 -
Figura 9-13 Comparación del Error Relativo obtenido entre los valores observados de precipitación total
diaria y los valores rellenados con el método de desagregación Mensual-Diaria para cada escenario climático
usando el programa HEC-4 durante la época seca del año. ................................................................ - 196 -
Figura 10-1 Localización geográfica de las estaciones utilizadas para evaluar la eficiencia de los rellenos de
datos de variables climáticas con los distintitos generadores estocásticos de clima. ........................ - 199 -
Figura 10-2 Comparación del Error Relativo para la variable precipitación diaria, entre los valores medidos y
estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos
faltantes durante la época húmeda del año en la estación Laykacota. ............................................... - 204 -
Figura 10-3 Comparación del Error Relativo para la variable precipitación diaria, entre los valores medidos y
estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos
faltantes durante la época húmeda del año en la estación La Tamborada. ........................................ - 205 -
Figura 10-4 Comparación del Error Relativo para la variable precipitación diaria, entre los valores medidos y
estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos
faltantes durante la época húmeda del año en la estación Vallecito. ................................................. - 205 -
Figura 10-5 Comparación del Error Relativo para la variable precipitación diaria, entre los valores medidos y
estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos
faltantes durante la época seca del año en la estación Laykacota. ..................................................... - 206 -
Figura 10-6 Comparación del Error Relativo para la variable precipitación diaria, entre los valores medidos y
estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos
faltantes durante la época seca del año en la estación La Tamborada. .............................................. - 207 -
Figura 10-7 Comparación del Error Relativo para la variable precipitación diaria, entre los valores medidos y
estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos
faltantes durante la época seca del año en la estacion Vallecito. ....................................................... - 207 -
Figura 10-8 Comparación del Error Relativo para la variable temperatura máxima diaria, entre los valores
medidos y estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número
de datos faltantes durante la época húmeda del año en la estación Laykacota. ................................ - 208 -
Figura 10-9 Comparación del Error Relativo para la variable temperatura máxima diaria, entre los valores
medidos y estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número
de datos faltantes durante la época húmeda del año en la estación La Tamborada .......................... - 209 -
Figura 10-10 Comparación del Error Relativo para la variable temperatura máxima diaria, entre los valores
medidos y estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número
de datos faltantes durante la época húmeda del año en la estación Vallecito. .................................. - 209 -
Figura 10-11 Comparación del Error Relativo para la variable temperatura máxima diaria, entre los valores
medidos y estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número
de datos faltantes durante la época seca del año en la estación Laykacota. ...................................... - 210 -
Figura 10-12 Comparación del Error Relativo para la variable temperatura máxima diaria, entre los valores
medidos y estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número
de datos faltantes durante la época seca del año en la estación La Tamborada. ............................... - 211 -
Figura 10-13 Comparación del Error Relativo para la variable temperatura máxima diaria, entre los valores
medidos y estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número
de datos faltantes durante la época seca del año en la estación Vallecito. ........................................ - 211 -
Figura 10-14 Comparación del Error Relativo para la variable temperatura mínima diaria, entre los valores
medidos y estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número
de datos faltantes durante la época húmeda del año en la estación Laykacota. ................................ - 212 -
Figura 10-15 Comparación del Error Relativo para la variable temperatura mínima diaria, entre los valores
medidos y estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número
de datos faltantes durante la época húmeda del año en la estación La Tamborada. ......................... - 213 -
Figura 10-16 Comparación del Error Relativo para la variable temperatura mínima diaria, entre los valores
medidos y estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número
de datos faltantes durante la época húmeda del año en la estación Vallecito. .................................. - 213 -
Figura 10-17 Comparación del Error Relativo para la variable temperatura mínima diaria, entre los valores
medidos y estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número
de datos faltantes durante la época seca del año en la estación Laykacota. ...................................... - 214 -
Figura 10-18 Comparación del Error Relativo para la variable temperatura mínima diaria, entre los valores
medidos y estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número
de datos faltantes durante la época seca del año en la estación La Tamborada. ............................... - 215 -
Figura 10-19 Comparación del Error Relativo para la variable temperatura mínima diaria, entre los valores
medidos y estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número
de datos faltantes durante la época seca del año en la estación Vallecito. ........................................ - 215 -
Figura 10-20 Error relativo medio obtenido con las distitntas metodologias de relleno de datos para la
variable precipitacion total mensual en disferetes estaciones. ........................................................... - 216 -
Figura 10-21 Media del error relativo en el relleno de datos de precipitación diaria con los distintos
programas utilizados y para los escenarios representados en la abscisa, para la época húmeda del año.- 217 -
Figura 10-22 Media del error relativo en el relleno de datos de precipitación diaria con los distintos
programas utilizados y para los escenarios representados en la abscisa, para la época seca del año.- 217 -
Figura 10-23 Media del error relativo en el relleno de datos de temperatura máxima diaria con los distintos
programas utilizados y para los escenarios representados en la abscisa, para la época húmeda del año.- 218 -
Figura 10-24 Media del error relativo en el relleno de datos de temperatura máxima diaria con los distintos
programas utilizados y para los escenarios representados en la abscisa, para la época seca del año.- 218 -
Figura 10-25 Media del error relativo en el relleno de datos de temperatura mínima diaria con los distintos
programas utilizados y para los escenarios representados en la abscisa, para la época húmeda del año.- 219 -
Figura 10-26 Media del error relativo en el relleno de datos de temperatura mínima diaria con los distintos
programas utilizados y para los escenarios representados en la abscisa, para la época seca del año.- 219 -
Figura 11-1 Localización de estaciones de medición por grupos para el relleno de datos faltantes de
Magnitud de Velocidad de viento Media para la comparación entre la eficiencia de las 3 metodologias
utilizadas. ............................................................................................................................................. - 223 -
Figura 11-2 Localización de estaciones de medición por grupos para el relleno de datos faltantes de Horas
de Sol por Día para la comparación entre la eficiencia de las 3 metodologias utilizadas. .................. - 224 -
Figura 11-3 Localización de estaciones de medición por grupos para el relleno de datos faltantes de
Evaporación Total para la comparación entre la eficiencia de las 3 metodologías utilizadas. ............ - 225 -
Figura 11-4 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel
mensual para la variable velocidad del viento con los datos de la estación Arani entre las 3 metodologías
empleadas............................................................................................................................................ - 227 -
Figura 11-5 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel
mensual para la variable velocidad del viento con los datos de la estación Ayo Ayo entre las 3 metodologías
empleadas............................................................................................................................................ - 228 -
Figura 11-6 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel
mensual para la variable velocidad del viento con los datos de la estación Riberalta entre las 3 metodologías
empleadas............................................................................................................................................ - 228 -
Figura 11-7 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel
mensual para la variable Cantidad media de horas sol por día con los datos de la estación Sucre entre las 3
metodologías empleadas. .................................................................................................................... - 229 -
Figura 11-8 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel
mensual para la variable Cantidad media de horas sol por día con los datos de la estación Ayo Ayo entre las
3 metodologías empleadas. ................................................................................................................. - 229 -
Figura 11-9 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel
mensual para la variable Cantidad media de horas sol por día con los datos de la estación Los Pinos entre las
3 metodologías empleadas. ................................................................................................................. - 230 -
Figura 11-10 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel
mensual para la variable Evaporación total con los datos de la estación Talula Tako Tako entre las 3
metodologías empleadas. .................................................................................................................... - 231 -
Figura 11-11 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel
mensual para la variable Evaporación total con los datos de la estación Tarapacaya entre las 3 metodologías
empleadas............................................................................................................................................ - 231 -
Figura 11-12 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel
mensual para la variable Evaporación total con los datos de la estación Santa Cruz entre las 3 metodologías
empleadas............................................................................................................................................ - 232 -
Figura 11-13 Relación entre el número de datos de entrada usados para el relleno de datos y la magnitud del
error relativo obtenido para cada metodología en las distintas pruebas efectuadas para la inferencia de la
magnitud de la velocidad del viento. ................................................................................................... - 235 -
Figura 11-14 Relación entre el número de datos de entrada usados para el relleno de datos y la magnitud del
error relativo obtenido para cada metodología en las distintas pruebas efectuadas para la inferencia de la
media mensual de horas sol por día. ................................................................................................... - 235 -
Figura 11-15 Relación entre el número de datos de entrada usados para el relleno de datos y la magnitud del
error relativo obtenido para cada metodología en las distintas pruebas efectuadas para la inferencia de la
evaporación total mensual. ................................................................................................................. - 236 -
Figura 12-1 Localización de estaciones empleadas para calcular el coeficiente de variación de las distintas
variables a nivel mensual e identificar en que variables podría ser viable el relleno de datos faltantes a partir
de la media de los datos mensuales observados. ................................................................................ - 240 -
Figura 12-2 Coeficiente de Variación a nivel mensual para la evaporación total en Laykacota. ......... - 241 -
Figura 12-3 Coeficiente de Variación a nivel mensual para la evaporación total en Comarapa. ........ - 241 -
Figura 12-4 Coeficiente de Variación a nivel mensual para la evaporación total en Coimata. ........... - 242 -
Figura 12-5 Coeficiente de Variación a nivel mensual para la humedad relativa media en Magdalena.- 242 -
Figura 12-6 Coeficiente de Variación a nivel mensual para la humedad relativa media en Potosí Aeropuerto.
............................................................................................................................................................. - 243 -
Figura 12-7 Coeficiente de Variación a nivel mensual para la humedad relativa media en Yesera Norte.- 243 -
Figura 12-8 Coeficiente de Variación a nivel mensual para precipitación total en Ballivian. ............. - 244 -
Figura 12-9 Coeficiente de Variación a nivel mensual para precipitación total en Potolo.................. - 244 -
Figura 12-10 Coeficiente de Variación a nivel mensual para precipitación total en Irpa Chico. ......... - 245 -
Figura 12-11 Coeficiente de Variación a nivel mensual para presión media en San Matias. ............. - 245 -
Figura 12-12 Coeficiente de Variación a nivel mensual para presión media en Bermejo Aeropuerto. - 246 -
Figura 12-13 Coeficiente de Variación a nivel mensual para presión media en San Ramón. ............. - 246 -
Figura 12-14 Coeficiente de Variación a nivel mensual para temperatura media en Tinguipaya. ..... - 247 -
Figura 12-15 Coeficiente de Variación a nivel mensual para temperatura media en Cristal Mayu. ... - 247 -
Figura 12-16 Coeficiente de Variación a nivel mensual para temperatura media en Guayaramerín
Aeropuerto. .......................................................................................................................................... - 248 -
Figura 13-1 Localización de todas las estaciones de medición en el departamento de Cochabamba con más
de 10 años de registros de precipitación. ............................................................................................ - 251 -
Figura 13-2 Resultados de la Agrupación Cluster estandarizada que nos sugiere distintas agrupaciones de
estaciones para distintos niveles de tolerancia. .................................................................................. - 252 -
Figura 13-3 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel
mensual para la variable Precipitación total mensual con los distintos modelos después de haber generado
un grupo a partir del método Cluster. .................................................................................................. - 253 -
Figura 14-1 Índice de Oscilación Sur entre 1950 y 2017. ..................................................................... - 257 -
Figura 14-2 Funciones de autocorrelación simple y parcial con sus valores y niveles de significancia para el
IOS. ....................................................................................................................................................... - 258 -
Figura 14-3 Gráfico 14.2.3: Componente cíclica del Índice de Oscilación Sur entre 1950 y 2017. ....... - 260 -
Figura 14-4 Logarítmico de la componente cíclica del Índice de Oscilación Sur entre 1950 y 2017. .. - 260 -
Figura 14-5 Serie resultante de la extracción de la componente cíclica del Índice de Oscilación Sur entre 1950
y 2017, presenta la componente estacional y aleatoria para el mismo periodo. ............................... - 262 -
Figura 14-6 Componente estacional del Índice de Oscilación Sur entre 1950 y 2017. ......................... - 262 -
Figura 14-7 Componente aleatoria del Índice de Oscilación Sur entre 1950 y 2017. ........................... - 264 -
Figura 14-8 Relación entre la componente cíclica y aleatoria del Índice de Oscilación Sur entre 1950 y 2017.
............................................................................................................................................................. - 265 -
Figura 14-9 Extensión de la componente cíclica del Índice de Oscilación Sur entre 1950 y 2017 hasta 2060.
............................................................................................................................................................. - 265 -
Figura 14-10 Extensión de la componente estacional del Índice de Oscilación Sur entre 1950 y 2017 hasta
2060. .................................................................................................................................................... - 266 -
Figura 14-11 Extensión de la componente aleatoria del Índice de Oscilación Sur entre 1950 y 2017 hasta
2060. .................................................................................................................................................... - 266 -
Figura 14-12 Reconstitución del Índice de Oscilación Sur entre 1950 y 2017 hasta 2060, Componente Cíclica +
Componente Estacional. ...................................................................................................................... - 267 -
Figura 14-13 Reconstitución del Índice de Oscilación Sur entre 1950 y 2017 hasta 2060, Componente Cíclica +
Componente Estacional + Componente Aleatoria. .............................................................................. - 268 -
Figura 14-14 Contraste Empírico para el periodo comprendido entre Enero de 2007 y Diciembre de 2017.- 269
-
Figura 14-15 Componente cíclica de los datos medidos del IOS. ......................................................... - 269 -
Figura 15-1 Resumen de aplicaciones posibles para el relleno de datos a nivel diario. ....................... - 273 -
Figura 15-2 Resumen de aplicaciones posibles para el relleno de datos a nivel mensual. .................. - 275 -
1 INTRODUCCION A LA TESIS.
Este trabajo se ha realizado con el propósito de identificar los métodos más convenientes
para el completado de series temporales de variables climáticas, tarea habitualmente
requerida, cuando se usan datos climatológicos, como base para la ejecución de estudios
hidrológicos.
Las variables tratados son: Temperatura, velocidad de viento, humedad relativa, horas sol
por día, precipitación, presión atmosférica y evaporación. Los intervalos de medición
considerados son diarios y mensuales. Las variables e intervalos de medición analizados
están en concordancia con los datos requeridos para proyectos de: operación de embalses,
control de inundaciones, aprovechamiento del potencial hídrico y otras aplicaciones en el
ámbito hidrológico e hidráulico.
Primeramente para poder continuar con la investigación se tuvo que determinar de manera
sistemática el tipo de software utilizado para poder efectuar los rellenos en los diferentes
niveles diarios y mensuales en función de aspectos determinantes como la cantidad de datos
disponibles, la extensión total de las series medidas y la proximidad entre estaciones
hidrometeorológicas, el resultados de esa esquematización de los rellenos en relación con
las necesidades de nuestro medio se presenta en la Figura 1-1.
-1-
Figura 1-1 Criterios para la adopción de una metodología para el relleno de datos faltantes.
Habiendo determinado cada uno de los programas empleados y el tipo de rellenos para los
cuales estos eran de utilidad se procedió a plantear experimentos cuyos resultados serían de
referencia para poder comparar programas o modelos con fines similares y distinguir cual
rinde mejor en términos de error relativo producido por cada programa o modelo, los
experimentos y su finalidad se encuentran clasificados en la Figura 1-2.
-2-
Figura 1-2 Experimentos o pruebas realizadas y su finalidad.
En cada uno de los experimentos se trabajó con un cierto número de variables, la Figura 1-2
es una clasificación de las variables utilizadas en cada uno de los experimentos citados en
la Figura 1-3.
-3-
-4-
Figura 1-3 Variables trabajadas en cada experimento.
-5-
2 ASPECTOS PRELIMINARES
2.1 ANTECEDENTES
2.2 PROBLEMA
Bajo esta situación es imprescindible contar con métodos confiables que permitan rellenar
las series incompletas de datos meteorológicos en distintos intervalos de medición (Franzke
C. , O’Kane, Berner, Williams, & Lucarini, 2014, pág. 3), para este cometido el presente
trabajo recurre a la aplicación y evaluación del desempeño de una diversidad de métodos
estadísticos y estocásticos que pueden ayudar a completar datos de series de variables
climatológicas y realizar predicciones de dichos fenómenos, aplicándolos sobre estaciones
de medición situadas dentro del territorio boliviano, previo muestreo de las mismas.
2.3 JUSTIFICACIÓN
-6-
La información escasa o de mala calidad influye directamente en la eficacia de las técnicas
aplicadas para la solución de problemas en el ámbito de la Ingeniería de los Recursos
Hídricos, por lo que es necesario evaluar la eficiencia de distintos métodos que permitan
inferir los datos básicos, que serán usados en el diseño hidrológico e hidráulico, a fin de
que los resultados que se obtengan sean confiables y representen la realidad de manera
práctica.
El muestreo se ve afectado por la poca información disponible, por lo tanto se usó 2 formas
distintas de muestreo para la evaluación de los modelos, una por regiones climáticas, y otra
por variables para el completado de datos a nivel diario y mensual.
-7-
3 OBJETIVOS
-8-
4 METODOLOGÍA GENERAL
4.1 Muestras
Se diseñaron distintos experimentos para determinar la diferencia en la exactitud de cada
método o modelo de relleno y en base a ello determinar que método es más eficiente para
cada variable.
El criterio de evaluación del desempeño de los distintos modelos y métodos aplicados fue
el error relativo (para un conjunto de observaciones el indicador es la Media del cuadrado
de los errores relativos a la observación), que nos permitió observar su eficiencia para
distintas variables en los diferentes escenarios hipotéticos, garantizando previamente que
durante la generación de nuevas observaciones las series mantenían sus propiedades
estadísticas.
√(𝐼 − 𝑂)2
𝑝𝑎𝑟𝑎 𝑂 ≠ 0
𝑂
𝑀𝐶𝐸𝑅𝑂 =
√((𝐼 + 1) − (𝑂 + 1))2
𝑝𝑎𝑟𝑎 𝑂 = 0 𝐸𝑐. 4.3.1
{ (𝑂 + 1)
La eliminación de datos para luego generarlos y su cantidad, dependió del tipo de variable
de estudio y de cómo se podría llegar a un criterio coherente para poder evaluar los
-9-
distintos modelos aplicados, sin que se favorezca en el proceso a alguno de ellos,
garantizando que todos trabajen en las mejores condiciones posibles, de manera que no
contradigan sus principios de aplicación.
En los capítulos siguientes, se realiza una descripción más detallada de cada una de las
metodológicas particularmente usadas, explicando los detalles a tomar en consideración, la
descripción actual es más bien un acercamiento a todo aquello que las pruebas realizadas
tenían en común.
- 10 -
5 CONSIDERACIONES TEORICAS PRELIMINARES
Los fenómenos meteorológicos, son la forma en la que se nos presentan las condiciones
climáticas, en las cuales se va a efectuar cualquier tipo de diseño hidráulico o hidrológico.
Si bien estaríamos tratando con un fenómeno natural, se tienen evidencias de que se está
produciendo una interferencia humana en el sistema climático, y el cambio climático
plantea riesgos para los sistemas humanos y naturales (Grupo Intergubernamental de
expertos sobre el cambio climático, 2014, pág. 18).
Los factores citados son de difícil control, y se constituyen en características propias del
mundo en que vivimos; resultado de nuestro asentamiento y “realización” que inciden en la
naturaleza al menos desde el siglo XIX; esto nubla toda posibilidad de integración de los
factores ya que muchos de estos siguen en desarrollo y transformación; causas y efectos se
entremezclan, entonces el análisis de las variable meteorológicas a partir de la observación
y experimentación quizá sea la mejor manera para la obtención de información limpia libre
de sesgo, para la inferencia de estos fenómenos.
5.2.2 Temperatura
Las Variaciones de temperatura y la temperatura en si de una región, tiene un fuerte
impacto sobre la gestión de recursos hídricos; elevadas temperaturas pueden deberse a
periodos de sequía; es de influencia también en otros factores como el contenido de
humedad del suelo, la humedad relativa del ambiente y también es una condicionante del
flujo base de trasporte durante los inicios del periodo de lluvias; representa también un
factor importante en el proceso de evaporación.
5.2.3 Evaporación
Una variable que si bien puede depender de la temperatura y de la presión del medio; es
fundamental de manera aislada; por ser la única perdida de agua que se puede medir con
relativa certeza y que de todas formas ocurre en cualquier ambiente, debe determinarse
durante cualquier gestión de recursos hídricos; su contraste con las pérdidas totales del
sistema en estudio nos puede llevar a estimar de manera indirecta la cantidad de líquido
que se infiltra o que escurre de manera subterránea.
- 12 -
de evaporación en una región determinada, que serán de utilidad en los procedimientos de
balance hídrico que se apliquen en los proyectos de aprovechamiento de recursos hídricos.
Es pertinente ir desarrollando los distintos conceptos que se han utilizado para realizar este
estudio.
5.3.1 Población
Es el espacio total de observaciones posibles de una determinada característica de un
fenómeno, en nuestro caso las observaciones son de tipo cuantitativo y a dicha
característica se la denomina también variable aleatoria, en el caso de variables
hidrometeorológicas se estaría trabajando en todos los casos con una población infinita.
5.3.2 Parámetro
El parámetro es una característica, una medida descriptiva de la población total de estudio,
los distintos parámetros que presenta una población nos brindan información sobre la
naturaleza del conjunto de datos (Webster, Estadística aplicada a los negocios y la
economía, 2001, pág. 8) y sirven como una representación compacta de la misma, son
ideales para poder trabajar sin tomar en cuenta todas las observaciones tomadas.
5.3.3 Muestras
Tomando en cuenta lo desarrollado previamente, muestra se define como un subconjunto
del espacio de observaciones posibles, usada para representar de manera aproximada
aquello que llamamos población, esto ocurre por varias razones: existe incertidumbre
respecto a la precisión de los instrumentos de medición, a las condiciones de medición, a
si realmente podemos percibir el fenómeno en sus cualidades y cantidades reales, si
- 13 -
tenemos los recursos para medirlos, son distintas las razones porque se toma una cierta
cantidad de datos que al final conforman una o varias muestras.
5.3.4 Estadístico
Comparando con la relación que existe entre población y muestra, el estadístico seria
simplemente un estimador, mas no el parámetro poblacional, el estadístico puede inferir
directamente el parámetro, ser escogido de una o de otra muestra o ser generado a partir de
varias muestras tomadas del mismo fenómeno.
5.3.5 Estimador
El estimador es una inferencia de un parámetro, se denota con un techito encima de la
notación común de los parámetros, un estimador se define como insesgado cuando se ha
comprobado que este tiene la menor variación de entre todos los estimadores respecto el
parámetro poblacional.
5.3.6 Variable
Es la forma en la que representamos una característica del fenómeno, para que pueda ser
trabajada de manera adecuada, con los métodos que utilizamos durante este, y en general de
cualquier estudio científico en el cual logramos cualificar o cuantificar las características de
cada fenómeno, en el presente trabajo se empleó variables cuantitativas, que pueden
presentar o no relaciones de dependencia con otras.
5.3.7 Error
El error es la diferencia entre lo observado y lo real en sí, el error se da a partir de que
existen distintos factores que no podemos controlar durante la observación, la medición, el
tratamiento y la modelación, es la diferencia entre lo representado y lo real, la exactitud a
pesar de ser un concepto importantísimo, es inalcanzable por el error.
5.3.9 Serie
Es un conjunto de datos con un orden definido, u ordenados bajo un criterio pre
establecido ya sea según su tamaño ocurrencia temporal o cualquier otra característica, los
cuales pueden ser o no muéstrales, como es el caso de los ruidos aleatorios necesarios para
generar observaciones sintéticas en los modelos ARIMA que solo se generan a partir de
principios matemáticos y no existen en la realidad.
- 14 -
5.3.10 Distribución de Frecuencia
Es un método de representación de la ocurrencia de ciertos eventos, los cuales se ordenan
según un criterio, por ejemplo de menor a mayor, o por clases, las cuales agrupan valores
en intervalos definidos (Suay, 2007, pág. 12), esto es importante porque algunas pruebas
estadísticos han sido diseñadas para trabajar con datos agrupados, este tratamiento de los
datos es mucho más útil cuando no existen relaciones evidentes entre variables, o cuando
las variables no presentan autocorrelación, está claro que el ordenamiento de datos bajo
cierto criterio significaría que asumimos que la posición temporal entre un dato u otro no es
significativa, hablando desde el aspecto informacional, esto representa siempre una pérdida
de información en cuanto al fenómeno de estudio, por lo tanto el análisis de frecuencia
asume previamente que la información que existe en el orden de ocurrencia de los eventos
que describen al fenómeno no es relevante.
a) Media Poblacional
Es una medida que representa la centralidad de las observaciones, partiendo de la
proposición de que la mayoría de los eventos de un fenómeno tienden a ser parecidos, y en
consecuencia ese evento medio que los representa mucho mejor que cualquier otro
parámetro. Es bastante útil cuando se reconoce que la tendencia central es simétrica.
Media Poblacional:
(∑𝑁
𝑖 𝑥𝑖 )
𝜇= 𝐸𝑐. 5.4.1
𝑁
Media Muestral:
(∑𝑛𝑖 𝑥𝑖 )
𝑋= 𝐸𝑐. 5.4.2
𝑛
- 15 -
b) Mediana
Observación que se encuentra en la mitad de una serie de datos que han sido previamente
ordenados de menor a mayor, juega un rol más importante y representativo en fenómenos
que no presentan una tendencia central simétrica.
𝑛+1
𝑝𝑎𝑟𝑎 𝑠𝑒𝑟𝑖𝑒𝑠 𝑖𝑚𝑝𝑎𝑟𝑒𝑠.
𝑃={ 2
𝑛 𝐸𝑐. 5.4.3
𝑝𝑎𝑟𝑎 𝑠𝑒𝑟𝑖𝑒𝑠 𝑝𝑎𝑟𝑒𝑠.
2
c) Media Geométrica
Es una medida capaz de representar el cambio porcentual promedio de una serie de valores.
a) El Rango
Diferencia entre la observación más alta y la más baja, es particularmente útil para conocer
la amplitud de la totalidad de los datos observados:
b) Varianza
Es el promedio del cuadrado de la diferencia de las observaciones entre cada una de las
observaciones y la media, se define como parámetro poblacional y como estadístico
muestral.
∑𝑁
𝑖 (𝑥𝑖 −𝜇)
2
𝜎2 = 𝑝𝑎𝑟𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑒𝑠. 𝐸𝑐. 5.4.6
𝑁
2
2
∑𝑛𝑖(𝑥𝑖 − 𝑋)
𝑠 = 𝑝𝑎𝑟𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠. 𝐸𝑐. 5.4.7
𝑛−1
El denominador (n – 1) indica el número de grados de libertad del estadístico, que en
general se define como el tamaño de la muestra menos el número total de estadísticos
previamente calculados y empleados en la inferencia del nuevo estadístico actual, en esta
medida previamente se ha inferido la media muestra, otra forma de definir los grados de
libertad seria, el número de observaciones menos el número de restricciones sobre tales
observaciones, interpretando este concepto con el anterior se podría decir que los distintos
estadísticos calculados representan una restricción sustraída del total de las observaciones.
- 16 -
c) Desviación Estándar
Es la medida del grado de dispersión de los datos en la misma unidad en la que han sido
tomados, se calcula con las siguientes formulas, distinguiendo si el caso es poblacional o
muestral:
∑𝑁
𝑖 (𝑥𝑖 −𝜇)
2
𝜎=√ 𝑝𝑎𝑟𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑒𝑠. 𝐸𝑐. 5.4.8
𝑁
2
√ ∑𝑛𝑖(𝑥𝑖 − 𝑋)
𝑠= 𝑝𝑎𝑟𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠. 𝐸𝑐. 5.4.9
𝑛−1
2𝑐 ≥ 𝑛 𝐸𝑐. 5.4.10
El cálculo del tamaño del intervalo de clase se realiza con la siguiente ecuación:
𝑅𝑔
𝐼𝑐 = 𝐸𝑐. 5.4.11
𝑐
5.4.3 Probabilidad
Es la posibilidad cuantificada numéricamente de que un evento ocurra en una escala
absoluta entre 0 y 1 o porcentual entre 0 y 100%.
- 17 -
presente estudio trabaja con distribuciones continuas, con funciones de probabilidad
teóricas que, se busca ajustar a la distribución empírica de los datos muéstrales.
Figura 5-1 Distribuciones de probabilidad, discreta y continua (Webster, 2001, pág. 133).
5.5.3.1 Asimetría
Es un parámetro, que indica como los datos están distribuidos respecto de la media, en
cuanto la asimetría tiende a 0 se puede afirmar que la distribución es normal, solo en este
caso particular, la media, mediana y la moda se confunden en sí mismas, si la asimetría es
distante de cero, esto sugiere que la tendencia no está centralizada cerca de la media, y a
medida que se aleja esta pierde su valor representativo e inferencial, a medida que se aleja
si la asimetría es positiva entonces la centralidad está a la izquierda de los datos, si es
negativa se encuentra a la derecha, en casos prácticos se suele tomar decisiones usando el
coeficiente de asimetría, la formulación de ambos es la siguiente:
Asimetría
∑𝑛𝑖(𝑥𝑖 − 𝑥)3
𝐴= 𝐸𝑐. 5.5.1
𝑛
Coeficiente de asimetría adimencional:
𝑛 ∗ ∑𝑛𝑖(𝑥𝑖 − 𝑥)3
𝐶𝑎 = 𝐸𝑐. 5.5.2
(𝑛 − 1) ∗ (𝑛 − 2) ∗ 𝑠 3
5.5.3.2 Curtosis
Cuantifica el grado de achatamiento de la distribución, una especie de aproximación a la
curvatura de la misma, se calcula con la formulación siguiente:
Curtosis
∑𝑛𝑖(𝑥𝑖 − 𝑥)4
𝐶𝑢 = −3 𝐸𝑐. 5.5.3
𝑛 ∗ 𝑠4
- 18 -
Si la curtosis es menor a cero se denomina Platicúrtica, si es mayor a 0 es Leptocúrtica, si
es igual a 0 o tiende a 0 se la conoce como Mesocúrtica, esta es una categorización
importante respecto a la distribución y dispersión de los datos de los datos.
𝐷𝑜𝑛𝑑𝑒:
- 19 -
La identificación de qué relación presenta una variable respecto de otra se puede verificar
gráficamente a partir del gráfico de dispersión o realizando las respectivas regresiones y
comparando la precisión de los estadísticos encontrados, las diferencias entre un tipo de
relación se muestran de manera clara la Figura 5-2.
Figura 5-2 Tipos de tendencias determinísticas de una variable, el recuadro a) nos muestra una relación lineal
positiva, el b) una relación lineal negativa; el c) una relación curvilínea positiva y el d) una relación curvilínea negativa
(Webster, 2001, pág. 326).
Las diferencias de ajuste son bastante claras, pero en el caso curvilíneal, puede que más de
una función sea capaz de representar de manera eficiente la relación.
Por otro lado existen también variables que no muestran ninguna correlación en la Figura
5-3 de la dispersión de los datos, las variables se consideran independientes, y los
tratamientos regresivos a 2 variables no son aplicables por que no se encuentra ninguna
relación determinística entre las variables que pueda ser simulada.
- 20 -
Figura 5-3 Diagrama de dispersión de variables independientes (Webster, 2001, pág. 346).
Su ecuación es:
𝑌 = 𝑏𝑜 + 𝑏1 ∗ 𝑥 𝐸𝑐. 4.5.7
𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑣𝑒𝑟𝑡𝑖𝑐𝑎𝑙
𝑏1 = 𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑎 𝑟𝑒𝑐𝑡𝑎 =
𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 ℎ𝑜𝑟𝑖𝑧𝑜𝑛𝑡𝑎𝑙
Dependiendo el signo que toma la pendiente, la relación será positiva o negativa, de ser 0,
la función seria simplemente un valor constante.
Existe también un tipo de relación de carácter mucho más general, ampliando los límites de
la estadística descriptiva e inferencial.
𝐷𝑒𝑡𝑒𝑟𝑚í𝑛𝑖𝑠𝑡𝑖𝑐𝑎
La relación entre Variables puede ser: {
𝐸𝑠𝑡𝑜𝑐á𝑠𝑡𝑖𝑐𝑎
Modelo de regresión lineal estocástico: es una forma más general de modelación lineal, el
cual contempla la parte aleatoria de y pretende representar todo el fenómeno real.
𝑌 = 𝛽𝑜 + 𝛽1 ∗ 𝑥 + 𝜀 𝐸𝑐. 5.5.8
- 21 -
𝛽𝑜 y 𝛽1 son 2 parámetros poblacionales, que aunque sean inferidos permanecen siempre
desconocidos, el modelo de regresión lineal además es un modelo más ideal que el
estocástico.
𝑌 = 𝑏𝑜 + 𝑏1 ∗ 𝑥 + 𝑒 𝐸𝑐. 5.5.9
Aun así, e permanece siendo aleatorio y otra vez este solo podría estimarse, para ello
entonces se logra formar la siguiente estimación:
𝑌̂ = 𝑏𝑜 + 𝑏1 ∗ 𝑥 𝐸𝑐. 5.5.10
El término del error se calcula usando los valores observados, y los posibles de estimar:
Debido a que los errores pueden ser positivos y negativos, el método MCO producirá una
recta tal que la suma de los errores sea 0 y la magnitud de los errores sea mínima.
𝑛
2
∑(𝑌𝑖 − 𝑌̂𝑖 ) = 𝑚í𝑛𝑖𝑚𝑜 𝐸𝑐. 5.5.13
𝑖
Se obtiene el mejor ajuste aplicando cálculo infinitesimal para minimizar el error, pero
también se tiene formulaciones prácticas a partir de la suma de cuadrados y los productos
cruzados, listas para inferir los parámetros muéstrales:
𝑛 𝑛
∑𝑛𝑖 𝑥𝑖 2
𝑆𝐶𝑥 = ∑(𝑥𝑖 − 𝑋) = ∑ 𝑥𝑖 2 −
2
𝐸𝑐. 5.5.14
𝑛
𝑖 𝑖
- 22 -
𝑛 𝑛
∑𝑛𝑖 𝑦𝑖 2
𝑆𝐶𝑦 = ∑(𝑦𝑖 − 𝑌) = ∑ 𝑦𝑖 2 −
2
𝐸𝑐. 5.5.15
𝑛
𝑖 𝑖
𝑛 𝑛
∑𝑛𝑖(𝑥𝑖 ∗ 𝑦𝑖 )
𝑆𝐶𝑥𝑦 = ∑[(𝑥𝑖 − 𝑋)(𝑦𝑖 − 𝑌)] = ∑(𝑥 ∗ 𝑦) − 𝐸𝑐. 5.5.16
𝑛
𝑖 𝑖
𝑆𝐶𝑥𝑦
𝑏1 = 𝐸𝑐. 5.5.17
𝑆𝐶𝑥
𝑏0 = 𝑌 − 𝑏1 ∗ 𝑋 𝐸𝑐. 5.5.18
Estos valores calculados son muy sensibles, y si se exige mayor precisión es necesario
calcular con 5 o 6 cifras significativas.
- 23 -
Figura 5-4 Gráfica de los errores o residuales entre los modelos de regresión y los datos observados (Webster, 2001,
pág. 339).
5.6 Autocorrelación
La autocorrelación es un parámetro estadístico que representa la dependencia del valor de
una variable respecto sus observaciones previas, el concepto también se puede
particularizar a la variable error.
Alternativas:
Un criterio informal pero muy preciso es que el estadístico d, tienda a 2, con esto se
garantiza que no hay autocorrelación, las alterativas descritas se encuentran representadas
en la Figura 5-5.
Figura 5-5 Límites para d que establecen la condición de autorrelación para una variable.
- 25 -
𝑛
𝑈𝑛𝑖𝑣𝑎𝑟𝑖𝑎𝑛𝑡𝑒 𝑜 𝑒𝑠𝑐𝑎𝑙𝑎𝑟
𝑆𝑒𝑟𝑖𝑒𝑠 𝑡𝑒𝑚𝑝𝑜𝑟𝑎𝑙𝑒𝑠 {
𝑀𝑢𝑙𝑡𝑖𝑣𝑎𝑟𝑖𝑎𝑛𝑡𝑒 𝑜 𝑣𝑒𝑐𝑡𝑜𝑟𝑖𝑎𝑙
5.10.1 Componentes de las series temporales
Una serie temporal en muchos casos se puede simular con los modelos ARIMA sin
necesidad de recurrir a una separación de la serie en componentes, pero si no se pueden
garantizar las condiciones de estacionariedad en media y en varianza de una serie temporal,
pues entonces si es preciso separa la serie en componentes ya sea por un método aditivo o
multiplicativo (Webster, Estadística aplicada a los negocios y la economía, 2001, págs.
- 26 -
428-433), las diferentes componentes en las que una serie temporal se puede separar se
representan en la Figura 5-6 y son las siguientes:
- 27 -
Figura 5-6 Proceso de separación de una serie temporal en sus componentes.
- 28 -
temporales de la realidad, partiendo de la premisa de que los eventos pasados tienen
contenida información a partir de la cual es posible proyectar los eventos futuros, se
realizan a partir de combinaciones lineales de eventos previos, ruidos aleatorios y sus
estadísticos, a partir de esta definición el proceso estocástico no da una sola salida sino más
bien un conjunto de salidas, se observa las distintas salidas de un mismo modelo en la
Figura 5-7 , las tres salidas mantiene las propiedades estadísticas del proceso original, por lo
tanto no habría un criterio objetivo para asegura que una es mejor que las otras, por lo tanto
éticamente durante la evaluación de los mismos se restringe esta posibilidad de aplicación
de las infinidades de alternativas, de otra forma los métodos estocásticos llegarían a ser
inconmensurables respecto de los determinísticos (Mauricio, 2007, pág. 10).
Variable
Horizonte Temporal
Figura 5-7 Tres realizaciones posibles para un mismo proceso estocástico (Mauricio, 2007, pág. 10).
- 29 -
Variable
Variable
Horizonte Temporal Horizonte Temporal
Figura 5-8 PANEL A, representación de un proceso estocástico antes y después de la simulación, PANEL B,
representación de las componentes de un proceso estocástico antes y después de su simulación independiente
(Mauricio, 2007, pág. 41) .
El proceso para trabajar con series no estacionarias es reducirlas a una forma estacionaria,
usando una transformación por medio de una función que reduzca la volatilidad de las
- 30 -
observaciones o una ecuación en diferencias de orden n para suprimir tendencias o ambas,
procedimientos que reducen el modelo a la condición de estacionariedad pero manteniendo
sus propiedades estadísticas.
1
Varianza: 𝜎𝑌 2 = 𝑉𝑎𝑟[𝑌𝑡 ]= 𝐸[(𝑌𝑡 − 𝜇𝑌 )2 ]= 𝑁 ∗ ∑𝑁 2
𝑖 [(𝑌𝑡 − 𝜇𝑌 ) ] 𝐸𝑐. 5.11.2
- 31 -
𝛾𝑘 = 𝑐𝑜𝑣[𝑌𝑡 , 𝑌𝑡+1 ] = [(𝑌𝑡 − 𝜇𝑌 )(𝑌𝑡+1 − 𝜇𝑌 )] 𝐸𝑐. 5.11.3
𝑐𝑜𝑣[𝑌𝑡 , 𝑌𝑡+1 ]
𝜌𝑘 = 𝐸𝑐. 5.11.4
(𝑉𝑎𝑟[𝑌𝑡 ])1/2 ∗ (𝑉𝑎𝑟[𝑌𝑡+1 ])1/2
Para 𝑘 = 0; entonces 𝜌0 = 1
1 𝜌1 𝜌2 ⋯ 𝜌𝑘−2 𝜌1
𝜌 1 𝜌1 ⋯ 𝜌𝑘−3 𝜌2
| 𝜌1 𝜌1 ⋯ 𝜌𝑘−4 𝜌3 |
| 2 1 |
⋮ ⋮ ⋮ ⋮ ⋮
𝜌𝑘−1 𝜌𝑘−2 𝜌𝑘−3 ⋯ 𝜌1 𝜌𝑘
𝜑𝑘𝑘 = 𝐸𝑐. 5.11.5
1 𝜌1 𝜌2 ⋯ 𝜌𝑘−2 𝜌𝑘−1
𝜌 1 𝜌1 ⋯ 𝜌𝑘−3 𝜌𝑘−2
| 𝜌1 𝜌 ⋯ 𝜌𝑘−4 𝜌𝑘−3 |
1
| 2 1
|
⋮ ⋮ ⋮ ⋮ ⋮
𝜌𝑘−1 𝜌𝑘−2 𝜌𝑘−3 ⋯ 𝜌1 1
Para ajustar a un buen modelo teóricamente el número de observaciones N tiene que ser
bastante más grande que 𝑘, para que las funciones de autocorrelación no se encuentren
indeterminadas, normalmente se sugiere que sea un valor menor a ¼ del registro total, pero
si evaluar las funciones en más rezagos permite identificar un modelo más adecuado se
debe hacerlo.
- 32 -
planteamiento para establecer el modelo estocástico que ajusta mejor a una serie temporal
(NCSS Statistical Software, 2016, pág. 5).
Modelo AR(1) Con parámetro regresor Modelo AR(1) Con parámetro regresor
positivo negativo
Modelo Ar(2) Con parámetro positivo Modelo Ar(2) Con parámetro negativo
predominante predominante
Figura 5-9 Distinción del tipo de modelos a aplicar sobre algunos procesos estocásticos, se muestra las funciones de
auto correlación simple y parcial para los distintos procesos y como estas nos ayudan a identificar el tipo de modelo a
seleccionar (Mauricio, 2007, pág. 73).
- 33 -
5.12.2 Modelos De Medias móviles MA(q)
Son modelos, que describen procesos en los cuales la base de la inferencia es la media de
las observaciones más una combinación lineal de ruidos anteriores al evento que se desea
predecir.
Para realizar la correcta estimación de parámetros, se debe tener en cuenta que las raíces
correspondientes a las siguientes ecuaciones definidas en las siguientes condiciones, están
fuera del círculo unitario o sea son menores a 1 (IHS Global Inc., 2015, pág. 131):
Condición de estacionariedad: Todas las raíces de la siguiente ecuación están fuera del
círculo unitario.
1 − 𝜑1 ∗ 𝑥 − 𝜑2 ∗ 𝑥 2 − 𝜑3 ∗ 𝑥 3 −. . . … − 𝜑𝑝 𝑥 𝑝 = 0 𝐸𝑐. 5.12.4
Condición de invertibilidad: Todas las raíces de la siguiente ecuación están fuera del
círculo unitario.
1 − 𝜃1 ∗ 𝑥 − 𝜃2 ∗ 𝑥 2 − 𝜃3 ∗ 𝑥 3 −. . . … − 𝜃𝑝 𝑥 𝑝 = 0 𝐸𝑐. 5.12.5
Esas tres clases de procesos pueden describir el comportamiento de una serie temporal en
tanto que estas sean series estacionarias.
- 34 -
Tabla 5-1 Características de los procesos estocásticos estacionarios y patrones de identificación para la aplicación de
los modelos (Mauricio, 2007, pág. 77).
- 35 -
Fluctuación elevada
Horizonte Temporal
Figura 5-10 Representación de un proceso estocástico con más de una volatilidad (Mauricio, 2007, pág. 84).
(𝑌𝑡 + 𝑚)𝜆−1
𝑝𝑎𝑟𝑎 𝜆 ≠ 0 𝐸𝑐. 5.12.1
𝜆
𝑌´𝑡 =
ln( 𝑌 𝑡 ) 𝑝𝑎𝑟𝑎 𝜆 = 0 𝐸𝑐. 5.12.2
{
No es la única trasformación posible, pero si una de las más eficientes cuando el objeto es
generar una estacionariedad en varianza y se tiene dos volatilidades claramente marcadas.
- 36 -
Variable
Horizonte Temporal
Variable
Horizonte Temporal
Figura 5-11 Diferencia entre una serie de datos y su posterior aplicación de una transformación para conseguir
estacionarizarla (Mauricio, 2007, pág. 85).
El operador diferencia regular de orden d, (d>1) operador que solo puede tomar valores
enteros, se simboliza como ∇d = (1 − 𝐵)𝑑 , donde B es el operador de retardo, el proceso
resultante es un proceso integrado de orden d.
- 37 -
∇𝑥𝑡 = 𝑥𝑡 − 𝑥𝑡−1 𝐸𝑐. 4.12.3
Figura 5-12 Trasformaciones sobre la serie volátil, panel A (trasformación Box Cox), panel B (trasformación Box Cox +
primera diferencia) (Mauricio, 2007, pág. 94).
5.13.6 Diagnosis
Para poder definir qué modelo es mejor, las funciones de auto correlación y auto
correlación parcial de los residuos entre el modelo aplicado y la serie en su mayoría no
deben superar la franja de confianza, de esta forma se garantiza que los residuos tiendan a
un ruido blanco, y no continúen teniendo información que no se haya aprovechado en el
modelo estimador, cumplida esta condición sigue la optimización que se obtendría
minimizando los estadísticos AIC (Criterio de información de Akaike) y BIC (criterio de
información Bayeciano de Schawarz), existen otras pruebas pero son demasiado limitadas
- 38 -
así que en este estudio nos enfocamos solo en esos aspectos para la obtención de nuestros
modelos.
Todos los valores que superan el umbral siguiente se consideran valores anómalos y se
debe proceder con cierta cautela a su inclusión o exclusión durante el proceso de
simulación de datos faltantes, a falta de un criterio estrictamente establecido se recupera
de la Guía de prácticas hidrológicas (Water Resource Council, 1981):
𝑥 = 𝑥̅ ± 𝑘𝑛 ∗ 𝑠 𝐸𝑐. 5.13.1
Este umbral se puede aplicar tanto a la serie corriente como al logaritmo de los datos.
𝑘𝑛
1 1 3
−3.6221 + 6.2844 ∗ 𝑛4 − 2.49835 ∗ 𝑛2 + 0.491436 ∗ 𝑛4 − 0.037911 ∗ 𝑛 𝑝𝑎 𝑟𝑎 𝑛 > 150
={
−0.9043 + 3.345 ∗ √log ( 𝑛 ) + 0.4046 ∗ log( 𝑛) 𝑝𝑎𝑟𝑎 𝑛 ≤ 150
𝐸𝑐. 5.13.2
De encontrarse datos anómalos, el umbral debe recalcularse sin ellos hasta que no se
determinen más datos anómalos.
Se realiza un procedimiento de normalización entre las variables para que sus magnitudes
estén entre 0 y 1 y de esa forma el tamaño y las unidades de cada característica no influyan
en el proceso de agrupación, esto permite que la agrupación de datos sea más coherente y
objetiva.
- 39 -
Con los vectores generados y normalizados se procede al cálculo de las distancias
euclidianas de los valores entre las estaciones.
- 40 -
6 DESCRIPCIÓN RESUMIDA DE LOS PROGRAMAS
COMPUTACIONALES UTILIZADOS
6.1 HEC-4
Este software fue desarrollado por los ingenieros y científicos de la armada de los Estados
Unidos, para contribuir en los proyectos de gestión de recursos hídricos, específicamente
para esa región del mundo aunque por la eficiencia de los resultados obtenidos se usa en la
actualidad para inferir observaciones de series de datos climáticos en otras regiones
geográficas.
El software es bastante versátil porque puede trabajar con muchos datos faltantes,
simplemente ajustando el intervalo temporal de relleno para que genere observaciones de
manera automática.
HEC-4 capaz de rellenar datos mensuales que se encuentran en el interior de las series, y
cada vez que rellena un valor reajusta las ecuaciones de generación, además el valor
generado se enriquece con un componente aleatorio introducido al final de la inferencia,
por lo tanto a pesar de haber aplicado un procedimiento determinístico, esta introducción
del valor aleatorio no genera nunca un mismo resultado.
- 41 -
mensuales sean siempre superiores o iguales a 0 para garantizar que los valores generados
no sean carentes de sentido.
Para trabajar con los datos de manera que se ajusten coherentemente con los postulados de
la estadística inferencial, la regla empírica y el teorema central del límite, el software
agrupa series mes a mes y las normaliza usando la distribución Pearson Tipo III (US Army
Corps of Engineers, 1971, pág. 3).
EL software usa distintas cartas para que le mostremos la información y la forma en que
este va trabajar la información:
La carta A corresponde al título del proyecto y datos cualitativos que lo caractericen, uno
puede describir en ella todas las consideraciones pertinentes y necesarias.
- 42 -
1 Corresponde al año más antiguo de datos disponibles de entre todo el conjunto de
estaciones, y a partir del cual se va iniciar el relleno.
3 Cuando está indicado el programa asumirá todos los valores positivos como datos
5 En el caso de querer extender ciclos de medición, permite definir el número total de años
que hipotéticamente se pretende extender a partir de la serie original de más larga
duración.
6 Número de años que se puede obtener par aun límite de valores máximos y mínimos que
el programa va a poder generar es una característica que puede ayudar a que los estadísticos
de la serie rellenada no se vea afectada por los nuevos valores extremos generados en el
modelo.
8 Habilita los valores positivos que sean utilizados en la reconstitución de las series,
puede ser bastante útil a la hora de rellenar series de datos con la totalidad de valores
negativos, o también para generar un nuevo escenario hipotético completamente nuevo pero
con las mismas probabilidades de ocurrencia que el anterior.
9 Indica que los datos positivos se tomaran en cuenta a la hora de calcular los estadísticos
que se usaran para el relleno, a diferencia de los negativos que serán ignorados.
10 Número de estaciones para las cuales se va generar un nuevo flujo, pueden llegar a ser
hasta 10.
1 Número de series correlacionadas entre estaciones, solo puede llegar a ser 2 por lo tanto
el programa trabajaría con correlación entre solamente pares de estaciones, y escogería para
cada mes la que sea más elevada para efectuar el relleno.
2 Número de pares a comparar entre los valores acumulados de la variable para cada mes y
a partir de ellos priorizar el relleno entre un par de estaciones.
- 43 -
4 Indica la lectura de estadísticos definidos previamente para la simulación.
2 permite establecer coeficientes para realizar cada correlación, es útil para priorizar la
influencia de una cierta estación en cada combinación.
Las demás cartas permiten desarrollar otros aspectos más particulares y son aplicables a los
rellenos de caudal por lo tanto su desarrollo no parece ser pertinente en el presente trabajo.
6.2 CHAC
Es una aplicación producida por el Centro de Estudios Hidrológicos del CEDEX con
metodologías desarrolladas por el mismo, que es de sencillo manejo y con una interfaz
gráfica, de distribución libre concordando con su ideal de transmitir tecnología a la
sociedad.
El programa cuenta con varios módulos para satisfacer distintas necesidades en los trabajos
hidráulicos e hidrológicos, particularmente aprovecharemos de él su capacidad para rellenar
series de precipitación en intervalos mensuales, aunque debemos aclarar que su capacidad
no se limita solo al relleno de datos faltantes.
- 44 -
Para realizar esta operación de completado de datos el software tiene implementado el
modelo CORMUL destinado a completar datos de series de fenómenos que se extienden en
escalas temporales.
Medias aritméticas.
Medias móviles.
Medias relativas a la altitud o posición geográfica.
El método de Thiessen y Thiessen modificado.
Media aritmética ponderada según la altitud del terreno
Interpolación en función de la distancia.
Método de isoyetas.
Interpolación polinómica.
Técnicas estocásticas de interpolación.
Para estacionarizar las series, el software extrae la media en cada observación y la divide
entre la desviación estándar de la serie tratada.
- 45 -
Figura 6-1 Esquema del proceso de relleno de datos con el software CHAC.
- 46 -
El primer paquete denominado Zoo, cuenta con métodos de indexación de observaciones,
aplicable en series de tiempo discretas que presentan datos faltantes, el software es
ventajoso porque es capaz de manejar series irregulares de distintas escalas de medición y
permite trabajar con los datos de distintas estaciones meteorológicas, como vectores de un
cierto número de componentes, para cada intervalo de medición.
De entre los que se elige el más adecuado para cada serie por rellenar.
Cuando las correlaciones son altas se aplica de manera directa el método de correlación por
coeficientes ponderados, asignando un peso a cada estación en relación a los coeficientes de
las demás estaciones, por otro lado si las correlaciones son bajas se realiza un relleno
también usando los coeficientes pero ponderando con mayor peso a las estaciones más
cercanas.
Se exige también que se ingrese un archivo con las coordenadas de cada una de las
estaciones en el sistema UTM y además de ello la altura sobre el nivel del mar de cada una
de las estaciones.
6.4 CLIGEN
Es un generador de clima estocástico desarrollado por el laboratorio nacional de erosión de
los Estados Unidos, permite poder estimar diariamente valores de precipitación,
temperatura máxima, temperatura mínima, temperatura de punto de roció, radiación solar
- 47 -
para una posición geográfica, velocidad y dirección del viento (Nicks, Jane, & Gander,
1995, págs. 3-7).
Su generador de valores aleatorios, obtiene los mismos resultados si los datos de entrada y
el ordenador en que se trabaja son los mismos, de manera similar a HEC-4 se lo diseño
para aplicaciones de la ingeniería hidráulica en la región de américa del norte pero por su
utilidad se extendió su aplicación en diversas partes del mundo.
Los números aleatorios generados por el software permanecen siendo aleatorios después de
300000 valores, pero que necesariamente mantienen su condición de estacionalidad en
media y varianza, los valores además se generan dentro de un intervalo de confianza
definido para que no se reproduzcan observaciones que sean lógicamente incoherentes en
relación a las variables de estudio.
Para Generar datos de precipitación trabaja usando probabilidad condicionada para cada
mes, separando el proceso para días con lluvia y sin lluvia.
El procedimiento empleado para la simulación del clima a partir de las variables climáticas
de la región se detalla en la Figura 6-2 presentada a continuación.
- 48 -
Figura 6-2 Esquema del proceso de relleno de datos con el software CLIGEN.
6.5 CLIMGEN
Es un software producido por la Universidad Estatal de Washington, que surge como una
alternativa al software WGEN que necesita trabajar con series que tienen al menos 30 años
de observaciones diarias, que además no necesariamente se ajusta a todos los climas ni de
Estados Unidos ni del mundo, el software puede generar datos diarios a partir de series
diarias o simplemente de resúmenes mensuales (Nelson, 2002, pág. 2).
- 49 -
6.5.1 Método de Cómputo
El esquema del proceso es bastante similar al del CLIGEN, por tener ambos la misma
finalidad, pero presenta algunas variaciones.
6.6 WGEN
El modelo tiene la capacidad de generar datos sintéticos de clima con las mismas
características estadísticas de los datos de series incompletas, estos nuevos datos generados
representan escenarios alternativos al ocurrido, pero se pretende evaluar como funcionarían
durante un proceso de relleno de datos de manera análoga a los generadores de clima antes
expuestos.
- 50 -
6.6.1 Método de Cómputo
Para determinar la ocurrencia de días secos y húmedos el modelo utiliza una cadena de
Markov de primer orden (Richardson & Wright, 1984, pág. 6), cada vez que genera un día
húmedo recalcula los parámetros de la distribución gama que es la que utiliza para generar
los distintos valores de precipitación para días húmedos, los días húmedos son todos
aquellos con una precipitación mayor a 0.01 mm, se ha aplicado la distribución gama para
la generación de los valores de precipitación porque esta distribución es la que produce
valores más representativos en comparación con otras distribuciones.
Los valores de radiación son obtenidos, multiplicando los elementos residuales de los
valores generados para temperatura mínima y máxima, y adicionándolos a la media de los
valores de radiación solar.
Precipitación:
Probabilidad condicional para cada mes de que un día llueva dado que llovió el día anterior.
Probabilidad condicional para cada mes de que un día no llueva dado que llovió el día
anterior.
Valores medios de precipitación para cada uno de los meses del año.
Valores de desviación estándar de precipitación para cada uno de los meses del año.
Temperatura Máxima:
Media de los máximos anuales de temperatura máxima para días secos y días húmedos.
Media del coeficiente de variación de la temperatura máxima anual para los días secos y
húmedos.
- 51 -
Amplitud anual del coeficiente de variación de temperatura máxima anual para los días
secos y húmedos.
Temperatura Mínima:
Radiación solar:
6.7 EVIEWS9
Es un software diseñado para poder computar una diversidad de modelos matemáticos, es
útil, porque ya viene incorporado con herramientas de cálculo de coeficientes de modelos
estocásticos aplicados a series temporales, generadores de números aleatorios para estos
coeficientes y funciones de simulación de datos sintéticos.
Es de especial relevancia en nuestro estudio porque permite usar los modelos ARIMA
(Autorregresivos Integrados de Media Móvil) de manera muy versátil, siendo capaz de
evaluar el nivel de significancia de coeficientes y los errores ligados a las inferencias en
cuestión de segundos.
- 52 -
Definir la condición de estacionariedad de la serie mediante las grafica de las
funciones de autocorrelacion simple y parcial, o mediante la prueba de la raíz
unitaria.
Si la serie no es estacionaria, determinar su condición de no estacionariedad.
Si la serie es no estacionaria en media aplicar ecuaciones en diferencias de hasta
segundo orden para poder estacionarizarla.
Si la serie es no estacionaria en varianza aplicar las trasformaciones logarítmica o
Box Cox.
Conseguida la condición de estacionariedad de la serie determinar posibles
modelos a aplicar para simular el comportamiento de la serie.
Escoger un modelo, que agote toda la información contenida en la serie original
(que no presente auto correlación en los residuales) y que tenga coeficientes
autorregresivos o de media móvil significativos (nivel de significancia menor al 15
%)
La metodología Box & Jenkins es un procemiento iterativo utilizado para poder determinar
el modelo más eficiente para simular una serie temporal a partir de modelos ARIMA, la
Figura 6-3 describe de manera clara los pasos a seguir para conseguir dicho propósito.
- 53 -
Figura 6-3 Enfoque de la metodológica BOX JENKINS para la generación de valores sintéticos a partir de series
temporales.
- 54 -
7 EVALUACIÓN PRELIMINAR DE LOS MODELOS
ARIMA
De manera rápida se realizó una serie de rellenos en cinco variables diferentes, a partir de
los gráficos de las observaciones generadas con estos modelos, se determinó si las
propiedades estadísticas de las series regeneradas, se mantenían, ya que si esto ocurre, los
modelos ARIMA se mostraban aptos para alcanzar nuestro propósito.
Se realizaron tanto rellenos como extensiones de las series en los casos que era viable
hacerlo.
Por otro lado, al ser una etapa preliminar, se aprovechó para ver la eficiencia del criterio de
Grubbs & Beck, para determinar si ciertos valores extremos reportados, se pueden
considerar como una anomalía de medición o simplemente como un valor extremo posible.
7.1 Metodología
Como punto de partida se seleccionaron 5 estaciones de medición para las siguientes
variables climáticas:
- 55 -
Los modelos se aplicaron a nivel diario y mensual, una prueba se realizó a nivel anual en la
única estación que presentaba más de 50 años de registro.
Para todas las variables el intervalo de medición de los datos es a nivel diario, pero
dependiendo de la cantidad de observaciones consecutivas disponibles se definió realizar
los rellenos a nivel diario, mensual o anual.
En la Tabla 7-1 se presentan las estaciones elegidas por muestreo aleatorio simple,
observando que el procedimiento fue aplicado haciendo una distinción por variable.
Tabla 7-1 Estaciones muestreadas clasificadas por las variables en las que se aplicó el relleno de datos faltantes y las
extensiones a corto plazo.
Presión Atmosférica[HPA]
Estación Altura msnm Intervalos temporales
2.1. Cochabamba Aeropuerto 2548 Mensuales
2.2. Trinidad 2094 Mensuales
2.3. Sucre 2570 Mensuales
2.4. Concepción 497 Anuales
2.5. Rurrenabaque 204 Mensuales
Temperatura [ºC]
Estación Altura msnm Intervalos temporales
3.1. La Tamborada 2597 Mensuales
3.2. Entre Ríos 1260 Mensuales
3.3. Mizque 2045 Diarios
3.4. Irupana 1946 Mensuales
3.5. Anzaldo 3032 Mensuales
Evaporación [mm]
Estación Altura msnm Intervalos temporales
4.1. Chipiri 260 Diarios
4.2. Okinawa I 252 Diarios
4.3. Huarina Cota Cota 385 Mensuales
4.4. Belén 3833 Mensuales
- 56 -
4.5. Hichucota 4460 Mensuales
Precipitación [mm]
Estación Altura msnm Intervalos temporales
5.1. Kallutaca 3900 Mensuales
5.2. San Juan 305 Mensuales
5.3. Chinoli 3450 Mensuales
5.4. Padilla 2102 Mensuales
5.5 Aiquile 2255 Mensuales
Figura 7-1 Mapa con la ubicación geográfica de las estaciones, la variable de relleno y el código de cada estación.
En la Figura 7-1, se encuentran localizadas todas las estaciones en las que se evaluó de
manera preliminar los modelos estocásticos aplicables a series temporales, los códigos
corresponden a las estaciones clasificadas en la Tabla 7-1.
- 57 -
7.1.2 Procedimiento
Después de haber definido la estación, la variable y el intervalo temporal de aplicación del
modelo, como ya se mencionó, se realizó una evaluación preliminar de la calidad de los
datos, usando el criterio de Grubbs & Beck.
Se grafica las series y se observa si los datos considerados anómalos por el criterio,
evidentemente no son coherentes con las demás observaciones, o con la naturaleza de la
variable en estudio.
Luego se determinó, si las series son o no estacionarias, usando al prueba de Raíz Unitaria,
en la cual su nivel de significancia debe tender a 0, para que la serie se considere
estacionaria en media, esta condición también se debe observar en base a las funciones de
autocorrelación simple y parcial, dado que si estas no decaen rápidamente se considera la
serie como no estacionaria en media.
En caso de no llegar a una serie estacionaria, se debe proceder a separar la variable en sus
componentes para que sean simuladas de manera independiente, solo si es posible.
El proceso de búsqueda del modelo más adecuado, se realiza hasta determinar uno o más
modelos que sean capaces de agotar la información de la serie, esto se consigue logrando
que los residuos sean independientes, que no guarden autocorrelacion en ningún rezago
dentro del intervalo usado para la inferencia, para ello debemos observar la función de
autocorrelacion simple y parcial de los residuos entre el modelo y la serie original.
Posteriormente se vuelve a graficar los datos generados junto con los observados para ver si
las propiedades estadísticas y las volatilidades de la serie permanecen inalteradas.
- 58 -
En el caso de haber más de un hueco por rellenar, se efectúa nuevamente el procedimiento
descrito hasta encontrar otro modelo que ajuste para el relleno del siguiente hueco y así
sucesivamente hasta terminar de rellenar por completo la serie de datos de cada variable.
La Figura 7-2 muestra en detalle el algoritmo utilizado para el relleno de datos faltantes con
los modelos ARIMA para las distintas variables seleccionadas.
Figura 7-2 Procedimiento realizado para el relleno de datos con los modelos ARIMA para diferentes variables
hidrometeorológicas.
𝑥̅ = 73.35 %
𝑠 = 15.83 %
- 59 -
𝑛 = 318
𝑘𝑛 = 3.316
𝑥𝑠 = 100 %
𝑥𝑖 = 20.854 %
Las serie no parece confiable, ya que presenta variaciones a lo largo del tiempo demasiado
exageradas, como se percibe en la Figura 7-3, pero el criterio no parece hallar datos
anómalos porque considera que la tendencia determinística que se percibe puede ser
posible, sin embargo a pesar de tener nuestras dudas sobre los datos, la serie parece ir
variando crecientemente en ciclos más o menos continuos lo que imposibilita definir qué
datos realmente son fiables y cuáles no.
Respecto al extraño comportamiento de los datos, una explicación podría ser que se haya
cambiado varias veces de equipo de medición y esta variación afecto en la precisión de las
mediciones, otra un tanto menos justificable, es que las mediciones corresponderían justo a
un periodo de variabilidad climática, ya que las variaciones estacionales en la serie si son
coherentes.
Humedad Relativa [%]
- 60 -
Tanto en el relleno de datos como en la proyección a corto plazo los modelos obtenidos
logran mantener las propiedades estadísticas de la serie sin importar que haya cambios en la
condición de estacionariedad en media o en varianza en la serie original, como podemos
observar en la Figura 7-3. Los rellenos mantienen las propiedades estadísticas de la serie
original.
Modelos Utilizados:
1)
𝑌𝑡 (1.5−1)
𝑌𝑡 ´ =
1.5
∇𝑌𝑡 ´ = 𝑌𝑡 ´ − 𝑌´𝑡−1
2)
𝑌𝑡 (1.5−1)
𝑌𝑡 ´ =
1.5
∇𝑌𝑡 ´ = 𝑌𝑡 ´ − 𝑌´𝑡−1
3)
𝑌𝑡 (1.5−1)
𝑌𝑡 ´ =
1.5
∇𝑌𝑡 ´ = 𝑌𝑡 ´ − 𝑌´𝑡−1
- 61 -
4)
𝑌𝑡 ´ = log(𝑌𝑡 )
∇𝑌𝑡 ´ = 𝑌𝑡 ´ − 𝑌´𝑡−1
5)
𝑌𝑡 ´ = log(𝑌𝑡 )
∇𝑌𝑡 ´ = 𝑌𝑡 ´ − 𝑌´𝑡−1
𝑥̅ = 71.62 %
𝑠 = 9.16 %
𝑛 = 367
𝑘𝑛 = 3.316
𝑥𝑠 = 100 %
𝑥𝑖 = 41.24 %
- 62 -
No hay datos Anómalos según la prueba.
Figura 7-4 Humedad Relativa a nivel mensual en Independencia en [%], a) Original, Serie de datos medida, b)
Completada, Serie de datos completada.
Los modelos utilizados consiguen rellenar los datos faltantes simulando la centralidad y la
volatilidad de la serie origina, se verifica que el relleno usando modelos ARIMA es igual
de efectivo al rellenar datos posteriores y anteriores a la serie original, si observamos la
Figura 7-4 podemos constatar que existe un hueco al iniciar el proceso de observación pero
que este se consigue rellenar a partir de datos posteriores manteniendo las propiedades
estadísticas de los datos observados inicialmente.
Modelos Utilizados:
1)
- 63 -
2)
𝛼𝜑5 = 0.0018; 𝛼𝜑8 = 0.0032; 𝛼𝜑10 ≅ 0; 𝛼𝜃9 = 0.0036; 𝛼𝜃12 = 0.0033; 𝛼Ѳ5
≅0
3)
𝛼𝜑5 = 0.0202; 𝛼𝜑8 = 0.0042; 𝛼𝜑10 ≅ 0; 𝛼𝜃9 = 0.0022; 𝛼𝜃12 = 0.0108; 𝛼Ѳ5
≅0
4)
5)
6)
- 64 -
7)
8)
9)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
10)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
11)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
- 65 -
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑1 ∇𝑌𝑡−1 + 𝜑5 ∇𝑌𝑡−5 + 𝜑12 ∇𝑌𝑡−12 − 𝜃11 𝐴𝑡−11 ) ∗ (𝜇∇𝑌𝑡 + 𝐴𝑡
− Ѳ2 𝐴𝑡−2 )
12)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
13)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
14)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
- 66 -
HUMEDAD RELATIVA [%]
𝑥̅ = 42.09 %
𝑠 = 10.58 %
𝑛 = 129
𝑘𝑛 = 4.809
𝑥𝑠 = 92.95 %
𝑥𝑖 = 0 %
- 67 -
Humedad Relativa [%]
Figura 7-5 Humedad Relativa a nivel mensual en Culpina en [%], a) Original, Serie de datos medida, b) Completada y
Extendida, Serie de datos completada y extendida.
Hay una leve tendencia determinística creciente que se puede observar a simple vista en la
Figura 7-5, la cual pone en evidencia que el modelo no es estacionario en media pero la
transformación realizada aplicando la primera diferencia permite que la serie se
estacionarice completamente y que los modelos ARIMA reproduzcan buenos resultados.
Modelos utilizados:
1)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
2)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
- 68 -
HUMEDAD RELATIVA [%]
𝑥̅ = 80.57 %
𝑠 = 8.87 %
𝑛 = 255
𝑘𝑛 = 3.288
𝑥𝑠 = 100 %
𝑥𝑖 = 51.39 %
Figura 7-6 Humedad Relativa a nivel mensual en Achiri en [%], a) Original, Serie de datos medida, b) Completada y
Extendida, Serie de datos completada y extendida.
- 69 -
No fue necesario aplicar ninguna transformación pero si agregar una constante en el
modelo para separar la tendencia central de la componente aleatoria, los rellenos y la
proyección a corto plazo son de buena calidad la Figura 7-6 que nos presenta los datos antes
y después de ser rellenados muestra de manera clara como el modelo reproduce las
propiedades estadísticas originales.
Modelos Utilizados:
1)
2)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
3)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
4)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
- 70 -
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.504352∇𝑌𝑡−1 − 0.374495∇𝑌𝑡−2 + 0.167262𝐴𝑡−19 )
∗ (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.160206∇𝑌𝑡−8 + 0.459758𝐴𝑡−3 )
5)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
6)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
7)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
8)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
- 71 -
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.483466∇𝑌𝑡−1 − 0.375951∇𝑌𝑡−2 + 0.466895𝐴𝑡−3
+ 0.147804𝐴𝑡−4 ) ∗ (𝐴𝑡 − 0.185828∇𝑌𝑡−8 )
𝑥̅ = 62.80 %
𝑠 = 10.65 %
𝑛 = 747
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 1º Iteración
𝑘𝑛 = 2.849
𝑥𝑠 = 93.15 %
𝑥𝑖 = 32.43 %
𝑥̅ = 63.05 %
𝑠 = 10.09
𝑛 = 743
𝑘𝑛 = 2.857
𝑥𝑠 = 91.87 %
𝑥𝑖 = 34.22 %
𝑥̅ = 63.21 %
- 72 -
𝑠 = 9.87
𝑛 = 739
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 3º Iteración
𝑘𝑛 = 2.865
𝑥𝑠 = 91.49 %
𝑥𝑖 = 34.93 %
Los datos identificados no parecen ser confiables por lo tanto es mejor prescindir de ellos y
rellenar con otros usando los modelos disponibles.
Humedad Relativa [%]
- 73 -
Humedad Relativa [%]
Figura 7-7 Humedad Relativa a nivel mensual en Cobija en [%], a) Original, Serie de datos medida, b) Corregida, Serie
de datos corregida usando el criterio de Grubbs & Beck, c) Completada, Serie de datos rellenada.
Inicialmente la serie presentaba algunas anomalías que la prueba de Grubbs & Beck detecto
y suprimió de manera efectiva, si observamos la Figura 7-7, la serie original presenta
algunos datos extremadamente bajos de humedad y al aplicar dicho criterios estos son
convenientemente removidos, al hacerlo se puede constatar que la serie presenta una leve
tendencia que luego de estacionarizarla y aplicar los modelos se reproduce coherentemente.
Modelos Utilizados:
1)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
2)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
3)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
- 74 -
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑1 ∇𝑌𝑡−1 + 𝜑29 ∇𝑌𝑡−29 − 𝜃12 𝐴𝑡−12 )
4)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
5)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
6)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
7)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
8)
- 75 -
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
9)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
10)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
11)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
12)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
- 76 -
13)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
14)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
15)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
16)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
17)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
- 77 -
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0088; 𝛼𝜃12 ≅ 0
18)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
19)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
20)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
21)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
22)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
- 78 -
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.308657∇𝑌𝑡−1 − 0.110629∇𝑌𝑡−29 − 0.241507𝐴𝑡−12 )
22)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
22)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
23)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
24)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
25)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
- 79 -
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑1 ∇𝑌𝑡−1 + 𝜑29 ∇𝑌𝑡−29 − 𝜃12 𝐴𝑡−12 )
26)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
𝑥̅ = 765.11 𝐻𝑃𝐴
𝑠 = 46.76 𝐻𝑃𝐴
𝑛 = 97
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 1º Iteración
𝑘𝑛 = 3.006
𝑥𝑠 = 902.69 𝐻𝑃𝐴
𝑥𝑖 = 627.53 𝐻𝑃𝐴
𝑥̅ = 757.33 𝐻𝑃𝐴
𝑠 = 13.49
𝑛 = 94
- 80 -
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 2 º Iteración
𝑘𝑛 = 2.996
𝑥𝑠 = 797.73 𝐻𝑃𝐴
𝑥𝑖 = 716,92 𝐻𝑃𝐴
𝑥̅ = 755.945 𝐻𝑃𝐴
𝑠 = 1.76
𝑛 = 93
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 3 º Iteración
𝑘𝑛 = 2.992
𝑥𝑠 = 761.20 𝐻𝑃𝐴
𝑥𝑖 = 750.69 𝐻𝑃𝐴
𝑥̅ = 755.88 𝐻𝑃𝐴
𝑠 = 1.64
𝑛 = 92
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 4 º Iteración
𝑘𝑛 = 2.988
𝑥𝑠 = 760.77 𝐻𝑃𝐴
𝑥𝑖 = 750.99 𝐻𝑃𝐴
Las fluctuaciones de presión no pueden ser ni aproximadamente tan elevadas, los picos que
se presentan en el registro son errores que afectan directamente la continuidad de la serie y
distorsionan sus propiedades estadísticas por lo tanto deben ser eliminados.
- 81 -
Presión Atmosférica [HPA]
Figura 7-8 Presión atmosférica a nivel mensual en Cochabamba Aeropuerto en [HPA], a) Original, Serie de datos
medida, b) Corregida, Serie de datos corregida usando el criterio de Grubbs & Beck, c) Completada y Extendida, Serie
de datos rellenada y extendida.
Observando la Figura 7-8, vemos que la eliminación de datos anómalos, permite representar
de una manera muy diferente la serie de datos, además corrige las propiedades estadísticas
media y varianza que se encontraban fuertemente desviadas y distorsionadas, el
completado de datos es satisfactorio, la proyección a corto plazo no reproduce bien valores
- 82 -
extremos pero mantiene la tendencia central y la tendencia de la serie original, no así su
volatilidad.
Modelos Utilizados:
1)
𝑥̅ = 986.06 𝐻𝑃𝐴
𝑠 = 3.60 𝐻𝑃𝐴
𝑛 = 104
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 1º Iteración
𝑘𝑛 = 3.030
𝑥𝑠 = 996.98 𝐻𝑃𝐴
𝑥𝑖 = 975.13 𝐻𝑃𝐴
𝑥̅ = 986.41 𝐻𝑃𝐴
𝑠 = 2.58
𝑛 = 102
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 2 º Iteración
𝑘𝑛 = 3.024
𝑥𝑠 = 994.20 𝐻𝑃𝐴
- 83 -
𝑥𝑖 = 978.62 𝐻𝑃𝐴
𝑥̅ = 986.50 𝐻𝑃𝐴
𝑠 = 2.44
𝑛 = 101
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 3 º Iteración
𝑘𝑛 = 3.020
𝑥𝑠 = 993.86 𝐻𝑃𝐴
𝑥𝑖 = 979.14 𝐻𝑃𝐴
Los 3 valores determinados parecen ser errores, porque no suelen haber fluctuaciones tan
elevadas de presión en condiciones naturales.
Presión Atmosférica [HPA]
- 84 -
Presión Atmosférica [HPA]
Figura 7-9 Presión atmosférica a nivel mensual en Trinidad en [HPA], a) Original, Serie de datos medida, b) Corregida,
Serie de datos corregida usando el criterio de Grubbs & Beck c) Completada y Extendida, Serie de datos rellenada y
extendida.
La eliminación de los datos anómalos como se observa en la Figura 7-9, revela la tendencia
cíclica de la serie, lo cual permite a los modelos ajustar con mucha mayor precisión, los
datos rellenados son muy buenos, en cambio la inferencia a corto plazo si bien reproduce la
tendencia y la centralidad, no reproduce la volatilidad de los datos originales.
Modelos Utilizados:
1)
2)
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜃13 ≅ 0
3)
- 85 -
𝑌𝑡 = (985.8888 + 𝐴𝑡 + 0.310696𝑌𝑡−1 − 0.282986𝑌𝑡−17 − 0.123979𝐴𝑡−5 )
∗ (𝐶 + 𝐴𝑡 + 0.260880𝑌𝑡−13 )
𝑥̅ = 719.72 𝐻𝑃𝐴
𝑠 = 0.77
𝑛 = 289
𝑘𝑛 = 3.307
𝑥𝑠 = 722.28 𝐻𝑃𝐴
𝑥𝑖 = 717.16 𝐻𝑃𝐴
- 86 -
Presión Atmosférica [HPA]
Figura 7-10 Presión atmosférica a nivel mensual en Sucre en [HPA], a) Original, Serie de datos medida, b) Completada,
Serie de datos rellenada y extendida.
Observamos en la Figura 7-10 que en la proyección a corto plazo los resultados son bastante
buenos, esto se debe a que la serie de datos es estacionaria en media y varianza las
condiciones más favorables para aplicar los modelos estocásticos.
Modelos Utilizados:
1)
𝑥̅ = 1009.954 𝐻𝑃𝐴
𝑠 = 0.61 𝐻𝑃𝐴
𝑛 = 62
𝑘𝑛 = 2.85
- 87 -
𝑥𝑠 = 1011.71 𝐻𝑃𝐴
𝑥𝑖 = 1008.20 𝐻𝑃𝐴
Figura 7-11 Presión atmosférica a nivel mensual en Concepción en [HPA], a) Original, Serie de datos medida, b)
Extendida, Serie de datos extendida.
Modelos Utilizados:
1)
𝑌𝑡 = 𝐶 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1
- 88 -
𝑌𝑡 = 979.2789 + 𝐴𝑡 + 0.970534𝑌𝑡−1
𝛼𝐶 ≅ 0; 𝛼𝜑1 = 0.0010
𝑥̅ = 986.56 𝐻𝑃𝐴
𝑠 = 36.44 𝐻𝑃𝐴
𝑛 = 688
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 1º Iteración
𝑘𝑛 = 2.967
𝑥𝑠 = 1094.67 𝐻𝑃𝐴
𝑥𝑖 = 878.46 𝐻𝑃𝐴
𝑥̅ = 984.08 𝐻𝑃𝐴
𝑠 = 18.25
𝑛 = 683
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 2 º Iteración
𝑘𝑛 = 2.976
𝑥𝑠 = 1038.39 𝐻𝑃𝐴
𝑥𝑖 = 929.77 𝐻𝑃𝐴
𝑥̅ = 987.04 𝐻𝑃𝐴
𝑠 = 4.21
𝑛 = 645
- 89 -
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 3 º Iteración
𝑘𝑛 = 3.043
𝑥𝑠 = 999.85 𝐻𝑃𝐴
𝑥𝑖 = 974.24 𝐻𝑃𝐴
𝑥̅ = 987.25 𝐻𝑃𝐴
𝑠 = 2.86
𝑛 = 637
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 4 º Iteración
𝑘𝑛 = 3.057
𝑥𝑠 = 995.98 𝐻𝑃𝐴
𝑥𝑖 = 978.51 𝐻𝑃𝐴
𝑥̅ = 987.31 𝐻𝑃𝐴
𝑠 = 2.75
𝑛 = 633
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 5 º Iteración
𝑘𝑛 = 3.060
𝑥𝑠 = 995.73 𝐻𝑃𝐴
𝑥𝑖 = 978.89 𝐻𝑃𝐴
Se encontró una gran cantidad de mediciones que distorsionan exageradamente la serie, son
errores de medición que deben ser eliminados para así poder conocer las propiedades
estadísticas reales de la serie.
- 90 -
Presión Atmosférica [HPA]
Figura 7-12 Presión atmosférica a nivel mensual en Rurrenabaque en [HPA], a) Original, Serie de datos medida, b)
Corregida, Serie de datos corregida usando el criterio de Grubbs & Beck, c) Completada, Serie de datos rellenada y
extendida.
Modelos Utilizados:
1)
- 91 -
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
2)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
3)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
4)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
5)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
- 92 -
6)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
7)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
8)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
9)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑2 𝑌𝑡−2
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0
10)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑2 𝑌𝑡−2
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0
11)
12)
13)
14)
15)
16)
- 94 -
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 ≅ 0; 𝛼𝜑6 ≅ 0; 𝛼𝜑7 ≅ 0
17)
18)
19)
20)
21)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑3 𝑌𝑡−3 + 𝜑4 𝑌𝑡−4 + 𝜑5 𝑌𝑡−5 + 𝜑6 𝑌𝑡−6 + 𝜑7 𝑌𝑡−7 +𝜑8 𝑌𝑡−8 + 𝜑10 𝑌𝑡−10
- 95 -
𝛼𝜑7 = 0.0015; 𝛼𝜑8 = 0.0001; 𝛼𝜑10 ≅ 0
22)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑3 𝑌𝑡−3 + 𝜑4 𝑌𝑡−4 + 𝜑5 𝑌𝑡−5 + 𝜑6 𝑌𝑡−6 + 𝜑7 𝑌𝑡−7 +𝜑8 𝑌𝑡−8 + 𝜑10 𝑌𝑡−10
23)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑3 𝑌𝑡−3 + 𝜑4 𝑌𝑡−4 + 𝜑5 𝑌𝑡−5 + 𝜑6 𝑌𝑡−6 + 𝜑7 𝑌𝑡−7 +𝜑8 𝑌𝑡−8 + 𝜑10 𝑌𝑡−10
24)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑3 𝑌𝑡−3 + 𝜑4 𝑌𝑡−4 + 𝜑5 𝑌𝑡−5 + 𝜑6 𝑌𝑡−6 + 𝜑7 𝑌𝑡−7 +𝜑8 𝑌𝑡−8 + 𝜑10 𝑌𝑡−10
25)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑3 𝑌𝑡−3 + 𝜑4 𝑌𝑡−4 + 𝜑5 𝑌𝑡−5 + 𝜑6 𝑌𝑡−6 + 𝜑7 𝑌𝑡−7 +𝜑8 𝑌𝑡−8 + 𝜑10 𝑌𝑡−10
- 96 -
25)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑3 𝑌𝑡−3 + 𝜑4 𝑌𝑡−4 + 𝜑5 𝑌𝑡−5 + 𝜑6 𝑌𝑡−6 + 𝜑7 𝑌𝑡−7 +𝜑8 𝑌𝑡−8 + 𝜑10 𝑌𝑡−10
26)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑3 𝑌𝑡−3 + 𝜑4 𝑌𝑡−4 + 𝜑5 𝑌𝑡−5 + 𝜑6 𝑌𝑡−6 + 𝜑7 𝑌𝑡−7 +𝜑8 𝑌𝑡−8 + 𝜑10 𝑌𝑡−10
27)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑3 𝑌𝑡−3 + 𝜑4 𝑌𝑡−4 + 𝜑5 𝑌𝑡−5 + 𝜑6 𝑌𝑡−6 + 𝜑7 𝑌𝑡−7 +𝜑8 𝑌𝑡−8 + 𝜑10 𝑌𝑡−10
28)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑3 𝑌𝑡−3 + 𝜑4 𝑌𝑡−4 + 𝜑5 𝑌𝑡−5 + 𝜑6 𝑌𝑡−6 + 𝜑7 𝑌𝑡−7 +𝜑8 𝑌𝑡−8 + 𝜑10 𝑌𝑡−10
29)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑3 𝑌𝑡−3 + 𝜑4 𝑌𝑡−4 + 𝜑5 𝑌𝑡−5 + 𝜑6 𝑌𝑡−6 + 𝜑7 𝑌𝑡−7 +𝜑8 𝑌𝑡−8 + 𝜑10 𝑌𝑡−10
- 97 -
𝑌𝑡 = 𝐴𝑡 + 0.156879𝑌𝑡−1 + 0.136151𝑌𝑡−3 + 0.165823𝑌𝑡−4 + 0.115985𝑌𝑡−5
+ 0.111388𝑌𝑡−6 + 0.094809𝑌𝑡−7 + 0.108902𝑌𝑡−8 + 0.109961𝑌𝑡−10
30)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑3 𝑌𝑡−3 + 𝜑4 𝑌𝑡−4 + 𝜑5 𝑌𝑡−5 + 𝜑6 𝑌𝑡−6 + 𝜑7 𝑌𝑡−7 +𝜑8 𝑌𝑡−8 + 𝜑10 𝑌𝑡−10
𝑥̅ = 29.77 º𝐶
𝑠 = 1.93 º𝐶
𝑛 = 312
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 1 º Iteración
𝑘𝑛 = 3.314
𝑥𝑠 = 36.18 º𝐶
𝑥𝑖 = 23.36 º𝐶
𝑥̅ = 29.79 º𝐶
𝑠 = 1.89
- 98 -
𝑛 = 311
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 2 º Iteración
𝑘𝑛 = 3.314
𝑥𝑠 = 36.07 º𝐶
𝑥𝑖 = 23.52 º𝐶
El valor considerado anómalo este bastante cerca del umbral no se lo debe eliminar por que
corresponde a una observación que en magnitud satisface el criterio de precisión, las
medidas fueron tomadas en intervalos de 0,5 ºC por lo tanto el error de precisión aceptable
seria de +1º C, la observación anómala difiere del límite del umbral en exactamente 1,02
ºC, 0.02 ºC no es una variación medible así que se acepta la observación.
Temperatura [ ºC]
Figura 7-13 Temperatura a nivel mensual en La Tamborada en [ºC], a) Original, Serie de datos medida, b) Completada
y Extendida, Serie de datos completada y extendida.
- 99 -
En los rellenos no hay nada particular, los modelos logran rellenar la serie eficientemente, y
en la predicción a corto plazo, si bien parecería que la volatilidad no se mantiene, pues esto
es propio de la serie, se observa en la serie original que esta presenta una tendencia cíclica y
determinística decreciente que se refleja en los resultados de la proyección, si observamos
los datos originales y los rellenos en la Figura 7-13 hay una continuidad del proceso
estudiado.
Modelos Utilizados:
1)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
∇𝑌𝑡 = 𝐴𝑡 + 0.360663∇𝑌𝑡−12
𝛼𝜑1 ≅ 0
2)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
∇𝑌𝑡 = 𝐴𝑡 + 0.375516∇𝑌𝑡−12
𝛼𝜑1 ≅ 0
3)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
4)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
- 100 -
∇𝑌𝑡 = 𝐴𝑡 + 𝜑1 ∇𝑌𝑡−1 + 𝜑2 ∇𝑌𝑡−2 + 𝜑12 ∇𝑌𝑡−12 + 𝜑23 ∇𝑌𝑡−23 + 𝜑60 ∇𝑌𝑡−60
5)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
TEMPERATURA [ºC]
𝑥̅ = 6.15 º𝐶
𝑠 = 5.74 º𝐶
𝑛 = 350
𝑘𝑛 = 3.178
𝑥𝑠 = 25.20 º𝐶
𝑥𝑖 = −12.90 º𝐶
- 101 -
Temperatura [ ºC]
Figura 7-14 Temperatura a nivel mensual en Entre Ríos en [ºC], a) Original, Serie de datos medida, b) Completada y
Extendida, Serie de datos rellenada y extendida.
Se identifica una leve tendencia determinística, apesar que la serie parece estacionaria, la
aplicación de diferencias de segundo orden en la serie permite determinar modelos que
reproducen las propiedades estadistas de la serie original tanto en inferencia de datos
faltantes como en las proyecciones a corto plazo los huecos se han rellenado
convenienteemtne como se observa en la Figura 7-14.
Modelos Utilizados:
1)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
- 102 -
2)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
3)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
4)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
5)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
6)
- 103 -
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
7)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
8)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
9)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
10)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
- 104 -
∇2 𝑌𝑡 = 𝜇∇2 𝑌𝑡 + 𝐴𝑡 + 𝜑6 ∇2 𝑌𝑡−6 + 𝜑44 ∇2 𝑌𝑡−44 + 𝜑59 ∇2 𝑌𝑡−59 − 𝜃1 A𝑡−1 − 𝜃3 A𝑡−3
11)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
12)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
13)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
14)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
- 105 -
∇2 𝑌𝑡 = 𝜇∇2 𝑌𝑡 + 𝐴𝑡 − 0.406109∇2 𝑌𝑡−6 − 0.188413∇2 𝑌𝑡−44 + 0. 368205∇2 𝑌𝑡−59
+ 1.432636A𝑡−1 − 0.433365A𝑡−3
15)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
16)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
TEMPERATURA [ºC]
𝑥̅ = 6.15 º𝐶
𝑠 = 5.74 º𝐶
𝑛 = 5694
𝑘𝑛 = 3.178
𝑥𝑠 = 28.27 º𝐶
- 106 -
𝑥𝑖 = −10.13 º𝐶
Figura 7-15 Temperatura a nivel diario en Mizque en [ºC], a) Original, Serie de datos medida, b) Completada, Serie de
datos rellenada.
Si observamos el hueco que hay entre 1997 y 1998 en la Figura 7-15, vemos que se generan
malos resultados en intervalos de series diarias de temperatura como esta, solo se consigue
reproducir la centralidad del modelo pero la variabilidad no es reproducida por los modelos
por lo tanto es muy malo el ajuste y es desaconsejable.
Modelos Utilizados
1)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
- 107 -
𝛼𝜑2 = 0.0001; 𝛼𝜑36 = 0.0024; 𝛼𝜑47 = 0.0017; 𝛼𝜃23 = 0.0007
2)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑2 ∇𝑌𝑡−2 + 𝜑36 ∇𝑌𝑡−36 + 𝜑47 ∇𝑌𝑡−47 + 𝜃11 𝐴𝑡−11 + 𝜃23 𝐴𝑡−23
+ 𝜃63 𝐴𝑡−63
3)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑2 ∇𝑌𝑡−2 + 𝜑36 ∇𝑌𝑡−36 + 𝜑47 ∇𝑌𝑡−47 + 𝜃11 𝐴𝑡−11 + 𝜃23 𝐴𝑡−23
+ 𝜃63 𝐴𝑡−63
4)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑2 ∇𝑌𝑡−2 + 𝜑36 ∇𝑌𝑡−36 + 𝜑47 ∇𝑌𝑡−47 + 𝜃11 𝐴𝑡−11 + 𝜃23 𝐴𝑡−23
5)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑2 ∇𝑌𝑡−2 + 𝜑36 ∇𝑌𝑡−36 + 𝜑47 ∇𝑌𝑡−47 + 𝜃11 𝐴𝑡−11 + 𝜃23 𝐴𝑡−23
- 108 -
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.105704∇𝑌𝑡−2 + 0.042352∇𝑌𝑡−36 + 0.038962∇𝑌𝑡−47
+ 0.032560𝐴𝑡−11 + 0.048777𝐴𝑡−23
6)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑2 ∇𝑌𝑡−2 + 𝜑36 ∇𝑌𝑡−36 + 𝜑47 ∇𝑌𝑡−47 + 𝜃10 𝐴𝑡−10 + 𝜃23 𝐴𝑡−23
7)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑2 ∇𝑌𝑡−2 + 𝜑36 ∇𝑌𝑡−36 + 𝜑47 ∇𝑌𝑡−47 + 𝜃10 𝐴𝑡−10 + 𝜃23 𝐴𝑡−23
8)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑2 ∇𝑌𝑡−2 + 𝜑3 ∇𝑌𝑡−3 + 𝜑4 ∇𝑌𝑡−4 + 𝜑5 ∇𝑌𝑡−5 + 𝜑36 ∇𝑌𝑡−36 + 𝜑47 ∇𝑌𝑡−47
9)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
- 109 -
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.109833∇𝑌𝑡−2 − 0.079182∇𝑌𝑡−3 − 0.064088∇𝑌𝑡−4
− 0.050808∇𝑌𝑡−47
10)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
11)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
12)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
13)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
- 110 -
𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 = 0.0001; 𝛼𝜑47 = 0.0061
14)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
15)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
16)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
17)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
18)
- 111 -
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
19)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
TEMPERATURA [ºC]
𝑥̅ = 10.37 º𝐶
𝑠 = 2.89 º𝐶
𝑛 = 670
𝑘𝑛 = 3.310
𝑥𝑠 = 20 º𝐶
𝑥𝑖 = 0.82 º𝐶
- 112 -
Temperatura [ ºC]
Figura 7-16 Temperatura a nivel mensual en Irupana en [ºC], a) Original, Serie de datos medida, b) Completada
y Extendida, Serie de datos rellenada.
Los datos iniciales se encuentran desfasados, pero esto no afecta en nada a la capacidad
inferencial del modelo en tanto que este reproduce bien la centralidad y la volatilidad de la
serie original como se observa en el relleno representado en la Figura 7-16, los datos
generados entre 1960 y 1961 son bastante naturales.
Modelos Utilizados:
1)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
- 113 -
𝛼𝜑7 ≅ 0; 𝛼𝜃13 = 0.0498
2)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
3)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
4)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
5)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
6)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
- 114 -
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.318599∇𝑌𝑡−7 + 0.408214𝐴𝑡−15
7)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
8)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
9)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
10)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
11)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
- 115 -
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑7 ∇𝑌𝑡−7 + 𝜃15 𝐴𝑡−15
12)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
13)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
15)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
16)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
TEMPERATURA [ºC]
- 116 -
7.2.3.5 Estación: Anzaldo
𝑥̅ = 22.16 º𝐶
𝑠 = 3.24 º𝐶
𝑛 = 530
𝑘𝑛 = 3.206
𝑥𝑠 = 32.55 º𝐶
𝑥𝑖 = 11.76 º𝐶
Figura 7-17 Temperatura a nivel mensual en Anzaldo en [ºC], a) Original, Serie de datos medida, b) Completada, Serie
de datos rellenada.
- 117 -
Observado los huecos entre 1980 y 1982 y entre 1993 y 194 de la Figura 7-17, los rellenos
parecen ser menos fiables en tanto el hueco es más grande, esto se genera por que la serie
no presenta una volatilidad constante a lo largo del tiempo, hay al menos 3 cambios en la
volatilidad de la serie original los cuales no se reproducen de la mejor manera con los
modelos encontrados.
Modelos Utilizados:
1)
2)
3)
4)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
5)
- 118 -
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
6)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
7)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
8)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
9)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
- 119 -
10)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
11)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
12)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
13)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
14)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
- 120 -
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼Ѳ11 ≅ 0
15)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
16)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
𝑥̅ = 3.13 𝑚𝑚
𝑠 = 1.6 𝑚𝑚
𝑛 = 1670
𝑘𝑛 = 3.312
𝑥𝑠 = 8.43 𝑚𝑚
𝑥𝑖 = 0 𝑚𝑚
- 121 -
Evaporación [mm]
Figura 7-18 Evaporación a nivel mensual en Chipiri en [mm], a) Original, Serie de datos medida, b) Completada. Serie
de datos rellenada.
Modelos Utilizados:
1)
2)
- 122 -
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑7 𝑌𝑡−7 + 𝜑33 𝑌𝑡−33
3)
4)
5)
6)
7)
8)
9)
10)
11)
12)
13)
14)
15)
16)
17)
18)
18)
EVAPORACIÓN [mm]
- 125 -
𝑥̅ = 4.65 𝑚𝑚
𝑠 = 1.77 𝑚𝑚
𝑛 = 681
𝑘𝑛 = 3.31
𝑥𝑠 = 10.51 𝑚𝑚
𝑥𝑖 = 0 𝑚𝑚
Figura 7-19 Evaporación a nivel diario en Chipiri en [mm], a) Original, Serie de datos medida, b) Completada, Serie de
datos completada.
Una componente cíclica que los modelos no puede reproducir parece afectar a la volatilidad
de las inferencias al menos cuando los huecos son demasiados extensos como el que se
presenta en el mes de agosto de 2004 cuyos rellenos son representados en la Figura 7-19,
- 126 -
los rellenos generados son similares a otros periodos previos de la serie pero en la posición
donde se encuentran no mantienen la continuidad de la serie, de la misma manera a otros
rellenos diarios las inferencias parecen desaconsejables.
Modelos Utilizados:
1)
𝑌´𝑡 = 𝑙𝑜𝑔(𝑌𝑡 )
2)
𝑌´𝑡 = 𝑙𝑜𝑔(𝑌𝑡 )
3)
𝑌´𝑡 = 𝑙𝑜𝑔(𝑌𝑡 )
4)
𝑌´𝑡 = 𝑙𝑜𝑔(𝑌𝑡 )
5)
- 127 -
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑2 𝑌𝑡−2 + 𝜑3 𝑌𝑡−3
6)
𝑌´𝑡 = 𝑙𝑜𝑔(𝑌𝑡 )
7)
8)
9)
𝑌´𝑡 = 𝑙𝑜𝑔(𝑌𝑡 )
10)
𝑌´𝑡 = 𝑙𝑜𝑔(𝑌𝑡 )
11)
𝑌´𝑡 = 𝑙𝑜𝑔(𝑌𝑡 )
12)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
13)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
14)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
15)
- 129 -
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑2 𝑌𝑡−2 + 𝜑10 𝑌𝑡−10 − 𝜃10 𝐴𝑡−10
16)
17)
18)
EVAPORACIÓN [mm]
𝑥̅ = 135.38 𝑚𝑚
𝑠 = 27.94 𝑚𝑚
𝑛 = 350
- 130 -
𝑘𝑛 = 3.318
𝑥𝑠 = 228.10 𝑚𝑚
𝑥𝑖 = 42.65 𝑚𝑚
Figura 7-20 Evaporación a nivel mensual en Harina Cota Cota en [mm], a) Original, Serie de datos medida, b)
Completada, Serie de datos rellenada y extendida.
Modelos Utilizados:
1)
2)
3)
4)
5)
6)
- 132 -
EVAPORACIÓN [mm]
𝑥̅ = 116.37 𝑚𝑚
𝑠 = 25.90 𝑚𝑚
𝑛 = 511
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 1º Iteración
𝑘𝑛 = 3.318
𝑥𝑠 = 202.32 𝑚𝑚
𝑥𝑖 = 30.43 𝑚𝑚
𝑥̅ = 116.60 𝑚𝑚
𝑠 = 24.87
𝑛 = 508
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 2 º Iteración
𝑘𝑛 = 3.318
𝑥𝑠 = 199.11 𝑚𝑚
𝑥𝑖 = 34.08 𝑚𝑚
Los valores encontrados por la prueba son distantes a los umbrales definidos por lo tanto su
aceptación como observaciones no es un tema de precisión, pero los primeros 2 están
demasiado alejados, sus valores respectivamente de 15.9 mm y 14.4 mm y deben ser
retirados, por otro lado el tercero es 206.2 mm que está por encima del límite superior del
umbral, pero hay bastantes valores similares por debajo del umbral por lo tanto esta puede
ser una observación atípica más que errónea y no se sugiere eliminarla.
- 133 -
Evaporación [mm]
Figura 7-21 Evaporación a nivel mensual en Belén en [mm], a) Original, Serie de datos medida, b) Corregida, Serie de
datos corregida usando el criterio de Grubbs & Beck, c) Completada y Extendida, Serie de datos rellenada y
extendida.
Los resultados no parecen ser muy naturales, como observamos en la Figura 7-21, los picos
de la serie no son bien reproducidos durante los rellenos, esto es porque los modelos
tuvieron que reproducir varios huecos grandes sucesivos con observaciones entre ellos.
Modelos Utilizados:
- 134 -
1)
2)
3)
4)
5)
6)
- 135 -
𝑌𝑡 = 114.3174 + 𝐴𝑡 + 0.565077𝑌𝑡−1 − 0.191214𝑌𝑡−27 + 0.404344𝐴𝑡−3
+ 0.177414𝐴𝑡−8
7)
8)
9)
10)
11)
- 136 -
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0223; 𝛼𝜑27 = 0.0055; 𝛼𝜃3 ≅ 0
12)
13)
14)
15)
16)
- 137 -
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0022; 𝛼𝜑27 = 0.0032; 𝛼𝜃3 = 0.0010
17)
18)
19)
20)
21)
- 138 -
22)
23)
24)
25)
26)
27)
- 139 -
𝑌𝑡 = 𝐶 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑23 𝑌𝑡−23 + 𝜑27 𝑌𝑡−27 − 𝜃3 𝐴𝑡−3
28)
29)
30)
31)
32)
- 140 -
𝑌𝑡 = 117.5758 + 𝐴𝑡 + 0.556480𝑌𝑡−1 + 0.168086𝑌𝑡−23 − 0.139205𝑌𝑡−27
+ 0.154607𝐴𝑡−3
33)
34)
35)
36)
37)
- 141 -
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 ≅ 0; 𝛼𝜑27 = 0.0001; 𝛼𝜃3 = 0.0036
38)
39)
40)
41)
EVAPORACIÓN [mm]
𝑥̅ = 115.91 𝑚𝑚
- 142 -
𝑠 = 19.27 𝑚𝑚
𝑛 = 405
𝑘𝑛 = 3.318
𝑥𝑠 = 179.84 𝑚𝑚
𝑥𝑖 = 51.98 𝑚𝑚
Figura 7-22 Evaporación a nivel mensual en Hichucota en [mm], a) Original, Serie de datos medida, b) Completada y
Extendida, Serie de datos rellenada y extendida.
Se ve en la serie distintas volatilidades a medida que transcurren los periodos, como vemos
en la Figura 7-22, hay bastantes variaciones en la volatilidad de la serie, y esto no permite
que los modelos ajusten a un modelo que reproduzca la volatilidad particular que tienen los
huecos de gran tamaño.
- 143 -
Modelos Utilizados:
1)
2)
3)
4)
5)
6)
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑2 𝑌𝑡−2 − 𝜑3 𝑌𝑡−3 − 𝜃4 𝐴𝑡−4
- 144 -
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜃8 ≅ 0
7)
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑2 𝑌𝑡−2 − 𝜑3 𝑌𝑡−3 − 𝜃4 𝐴𝑡−4
8)
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑2 𝑌𝑡−2 − 𝜑3 𝑌𝑡−3 − 𝜃4 𝐴𝑡−4
9)
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑2 𝑌𝑡−2 − 𝜑3 𝑌𝑡−3 − 𝜃4 𝐴𝑡−4
10)
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑2 𝑌𝑡−2 − 𝜑3 𝑌𝑡−3 − 𝜃4 𝐴𝑡−4
𝑥̅ = 47.62 𝑚𝑚
𝑠 = 51.40 𝑚𝑚
𝑛 = 109
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 1º Iteración
- 145 -
𝑘𝑛 = 3.046
𝑥𝑠 = 204.17 𝑚𝑚
𝑥𝑖 = 0 𝑚𝑚
𝑥̅ = 45.99 𝑚𝑚
𝑠 = 48.52
𝑛 = 108
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 2 º Iteración
𝑘𝑛 = 3.043
𝑥𝑠 = 194.22 𝑚𝑚
𝑥𝑖 = 0 𝑚𝑚
Los picos de las observaciones tienen magnitudes del mismo orden por lo tanto la
observación pasa simplemente siendo un dato atípico y no se sugiere prescindir de ella para
las inferencias posteriores.
Precipitación [mm]
- 146 -
Precipitación [mm]
Figura 7-23 Precipitación a nivel mensual en Kallutaca en [mm], a) Original, Serie de datos medida, b) Completada y
Extendida, Serie de datos rellenada y extendida.
A pesar de tener pocos datos el relleno y la proyección a corto plazo son muy buenos, en
cambio a largo plazo se ve que produce resultados que solo reflejan la tendencia de una
serie que inicialmente tenía pocos datos como podemos observar en la Figura 7-23, de todas
formas para extender la serie tanto tiempo los modelos tienen un desempeño regular.
Modelos Utilizados:
1)
𝑌𝑡 = 𝐶 + 𝐴𝑡 + 𝜑13 𝑌𝑡−13 − 𝜃12 𝐴𝑡−12
𝛼𝐶 ≅ 0; 𝛼𝜑13 ≅ 0; 𝛼𝜃12 ≅ 0
2)
𝑌𝑡 = (𝜇 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑12 𝑌𝑡−12 − 𝜃37 𝐴𝑡−37 ) ∗ (𝜇 + 𝐴𝑡 − 𝜃12 𝐴𝑡−12 )
3)
𝑌𝑡 = (𝜇 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 − 𝜃37 𝐴𝑡−37 ) ∗ (𝜇 + 𝐴𝑡 − 𝜃12 𝐴𝑡−12 )
4)
- 147 -
𝑌𝑡 = (𝐶 + 𝐴𝑡 + 𝜑11 𝑌𝑡−11 + 𝜑12 𝑌𝑡−12 + 𝜑25 𝑌𝑡−25 − 𝜃48 𝐴𝑡−48 ) ∗ (𝐶 + 𝐴𝑡 − 𝜃12 𝐴𝑡−12 )
𝛼𝜃12 = 0.0003
PRECIPITACIÓN [mm]
𝑥̅ = 57.30 𝑚𝑚
𝑠 = 64.33 𝑚𝑚
𝑛 = 384
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 1º Iteración
𝑘𝑛 = 3.318
𝑥𝑠 = 270.74 𝑚𝑚
𝑥𝑖 = 0 𝑚𝑚
𝑥̅ = 54.87 𝑚𝑚
𝑠 = 60.09
𝑛 = 380
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 2 º Iteración
𝑘𝑛 = 3.318
𝑥𝑠 = 254.22 𝑚𝑚
𝑥𝑖 = 0 𝑚𝑚
𝑠 = 59.15
𝑛 = 379
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 3 º Iteración
𝑘𝑛 = 3.318
𝑥𝑠 = 250.56 𝑚𝑚
𝑥𝑖 = 0 𝑚𝑚
Se identificaron 5 datos anómalos pero para un registro de 37 años y observando los otros
valores extremos, estos parecen ser solamente precipitaciones atípicas que si son posibles,
por lo tanto no se aconseja prescindir de ellas.
Precipitación [mm]
Figura 7-24 Precipitación a nivel mensual en San Juan en [mm], a) Original, Serie de datos medida, b) Completada
y Extendida, Serie de datos rellenada y extendida.
- 149 -
Los resultados no son muy naturales esto parece ser una situación generada por la gran
cantidad de variaciones en la volatilidad de la serie observable en la Figura 7-24, variaciones
bastante difíciles de reproducir por los modelos.
Modelos Utilizados:
1)
𝑌𝑡 = 𝐶 + 𝐴𝑡 + 𝜑6 𝑌𝑡−6 + 𝜑7 𝑌𝑡−7
2)
3)
4)
5)
PRECIPITACIÓN [mm]
- 150 -
7.2.5.3 Estación: Chinoli
𝑥̅ = 10.53 𝑚𝑚
𝑠 = 10.32 𝑚𝑚
𝑛 = 592
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 1º Iteración
𝑘𝑛 = 3.318
𝑥𝑠 = 44.76 𝑚𝑚
𝑥𝑖 = 0 𝑚𝑚
𝑥̅ = 10.29 𝑚𝑚
𝑠 = 9.75
𝑛 = 589
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 2 º Iteración
𝑘𝑛 = 3.318
𝑥𝑠 = 42.63 𝑚𝑚
𝑥𝑖 = 0 𝑚𝑚
𝑥̅ = 10.23 𝑚𝑚
𝑠 = 9.66
𝑛 = 588
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 3 º Iteración
𝑘𝑛 = 3.318
𝑥𝑠 = 42.29 𝑚𝑚
- 151 -
𝑥𝑖 = 0 𝑚𝑚
De los datos anómalos identificados solo el primero parece ser una exageración a ser
eliminada, los otros son de un orden similar a los de la precipitación en los meses de
máxima en que esta variable es máxima y no se aconseja prescindir de ellos.
Precipitación [mm]
Figura 7-25 Precipitación a nivel mensual en Chinoli en [mm], a) Original, Serie de datos medida, b) Completada y
Extendida, Serie de datos rellenada y extendida.
A pesar de haber mantenido datos extremos que son atípicos pero posibles como se observa
el pico de1963 de la Figura 7-25, los modelos no generan valores extremos similares pero
mantiene la centralidad y la volatilidad de la serie original de datos.
Modelos Utilizados:
1)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
- 152 -
∇𝑌𝑡 = 𝜇 + 𝐴𝑡 + 𝜑1 ∇𝑌𝑡−1 + 𝜑7 ∇𝑌𝑡−7 − 𝜃4 𝐴𝑡−4 − 𝜃6 𝐴𝑡−6
2)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
3)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
4)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
5)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
6)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
- 153 -
∇𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.043829∇𝑌𝑡−1 − 0.014587∇𝑌𝑡−4 + 0.970702∇𝑌𝑡−12 + 0.967552𝐴𝑡−12
7)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
8)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
9)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
PRECIPITACIÓN [mm]
𝑥̅ = 51.99 𝑚𝑚
𝑠 = 54.32 𝑚𝑚
𝑛 = 581
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 1º Iteración
- 154 -
𝑘𝑛 = 3.318
𝑥𝑠 = 232.2 𝑚𝑚
𝑥𝑖 = 0 𝑚𝑚
𝑥̅ = 50.74 𝑚𝑚
𝑠 = 51.6
𝑛 = 578
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 2 º Iteración
𝑘𝑛 = 3.318
𝑥𝑠 = 221.95 𝑚𝑚
𝑥𝑖 = 0 𝑚𝑚
𝑥̅ = 50.26 𝑚𝑚
𝑠 = 50.84
𝑛 = 576
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 3 º Iteración
𝑘𝑛 = 3.318
𝑥𝑠 = 218.92 𝑚𝑚
𝑥𝑖 = 0 𝑚𝑚
Solo los primeros 2 valores encontrados parecen ser lo suficientemente grandes para
considerarse errores de medición por lo tanto solo se procede a prescindir de esos 2 y se
acepta los otros por ser de un orden similar al de los demás eventos observados.
- 155 -
Precipitación [mm]
Figura 7-26 Precipitación a nivel mensual en Padilla en [mm], a) Original, Serie de datos medida, b) Completada y
Extendida, Serie de datos rellenada y extendida.
Sucede algo similar a la serie anterior, se reproduce bien la volatilidad y la centralidad pero
no se generan valores extremos de la misma magnitud que los producidos en 1968 y 1984
como se observa en la Figura 7-26.
Modelos Utilizados:
1)
2)
- 156 -
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 − 𝜃11 𝐴𝑡−11
3)
4)
𝑌𝑡 = 𝐴𝑡 + 0.412320∇𝑌𝑡−1 + 0.579965∇𝑌𝑡−11
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0
5)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑25 𝑌𝑡−25 + 𝜑35 𝑌𝑡−35 + 𝜑49 𝑌𝑡−49 + +𝜑71 𝑌𝑡−71
6)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑25 𝑌𝑡−25 + 𝜑35 𝑌𝑡−35 + 𝜑49 𝑌𝑡−49 + +𝜑71 𝑌𝑡−71
PRECIPITACIÓN [mm]
𝑥̅ = 7.08 𝑚𝑚
- 157 -
𝑠 = 6.92 𝑚𝑚
𝑛 = 556
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 1º Iteración
𝑘𝑛 = 3.318
𝑥𝑠 = 30.04 𝑚𝑚
𝑥𝑖 = 0 𝑚𝑚
𝑥̅ = 6.86 𝑚𝑚
𝑠 = 6.29
𝑛 = 552
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 2 º Iteración
𝑘𝑛 = 3.318
𝑥𝑠 = 27.72 𝑚𝑚
𝑥𝑖 = 0 𝑚𝑚
𝑥̅ = 6.79 𝑚𝑚
𝑠 = 6.19
𝑛 = 550
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 3 º Iteración
𝑘𝑛 = 3.318
𝑥𝑠 = 27.33 𝑚𝑚
𝑥𝑖 = 0 𝑚𝑚
Se identificó 6 datos anómalos con la prueba que son susceptibles a ser eliminados y
rellenados.
- 158 -
Solamente 1 de los datos es tan elevado como para considerarse anómalos y solo se
procedió a eliminar ese valor para generar las inferencias, la razón es que los otros totales
mensuales que la prueba identifica como anómalos en relación a los demás observados sí
parecen posibles.
Precipitación [mm]
Figura 7-27 Precipitación a nivel mensual en Aiquile en [mm], a) Original, Serie de datos medida, b) Corregida, Serie de
datos corregida usando el criterio de Grubbs & Beck, c) Completada, Serie de datos rellenada.
No se reproduce bien la volatilidad por que la serie original tiene una gran variabilidad de
su volatilidad distinguible en la Figura 7-27, un así los datos generados son estadísticamente
aceptables.
- 159 -
Modelos Utilizados:
1)
𝑌𝑡 = 𝐴𝑡 + 0.428168𝑌𝑡−1 + 0.446784𝑌𝑡−11
2)
3)
4)
5)
6)
- 160 -
7)
8)
9)
10)
𝑌𝑡 = 𝐴𝑡 + 0.356151𝑌𝑡−1 + 0.356151𝑌𝑡−11
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0
11)
𝑌𝑡 = 𝐴𝑡 + 0.353647𝑌𝑡−1 + 0.583579𝑌𝑡−11
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0
12)
𝑌𝑡 = 𝐴𝑡 + 0.370982𝑌𝑡−1 + 0.547439𝑌𝑡−11
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0
13)
- 161 -
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27
14)
15)
16)
17)
18)
19)
20)
21)
22)
23)
24)
25)
26)
27)
28)
- 165 -
7.4 Conclusiones Preliminares
La transformación Box Cox, es bastanteaste adecuada para poder alcanzar la condición de
estacionariedad en varianza en las series de datos a nivel mensual cuando las series
presentan dos volatilidades claramente distinguibles.
- 166 -
Estación: Anzaldo
a)
Proceso Estacionario
b)
Proceso No Estacionario
Figura 7-28 Serie de temperatura media a nivel mensual en Anzaldo, a) Periodo estacionario entre 1977 y 1994, b)
Periodo no estacionario.
Observando la Figura 7-28, se distingue que en el periodo comprendido entre los años 1977
y 1999 la serie se comporta de forma estacionaria, pero si se toma en cuenta la serie en su
totalidad desde 1966 hasta 2013 se percibe claramente que existe una tendencia
decreciente que no puede ser ignorada durante la simulación.
- 167 -
Estación: Okinawa I
a)
Proceso No Estacionario
b)
Proceso Estacionario
Figura 7-29 Serie de evaporación total a nivel diario en Okinawa I, a) Proceso no estacionario temporal comprendido
entre marzo y noviembre de 2004, b) Proceso estacionario entre 2004 y 2005.
En la Figura 7-29, entre marzo y noviembre de 2004, existe una tendencia determinística
entonces afirmamos a partir de esas observaciones que la serie es un proceso no
estacionario, pero si se concibe la seria a lo largo de los 2 años de estudio, la serie es de
tipo estacionaria porque sus propiedades estadísticas permanecen invariantes en a lo largo
de la totalidad del periodo observado.
A partir de observaciones de este tipo se llega a dos conclusiones que no suelen estar
definidas de manera clara en La bibliografía consultada, en este sentido la condición de
estacionariedad de una serie temporal depende de la longitud del registro y solo podemos
tener certeza de ella mientras más extenso se hace el registro de datos medidos.
- 168 -
El proceso de generación de valores sintéticos si bien es muy coherente tiende a estar
demasiado centralizado y los valores extremos generados mantienen la frecuencia
correspondiente a la de las series de datos observadas.
Los modelos estocásticos parecen reproducir bien las propiedades estadísticas de variables
que no tengan gran variabilidad en su volatilidad como es el caso de la presión atmosférica
y la humedad relativa.
La prueba de Grubbs & Beck genera umbrales que permiten distinguir entre observaciones
atípicas y datos anómalos, es un criterio que también es utilizado y validado por el Water
Resource Council y viene incorporado a un software estadístico de uso general como
MiniTab para la censura de datos.
Estación: Collana
a)
b)
Figura 7-30 Estación Collana, serie de humedad relativa media mensual, a) Serie de datos observada, b) Serie de datos
completada y extendida.
- 169 -
Como se puede observar en la Figura 7-30, no un criterio claro para definir que intervalo de
medición es el que se ha medido de manera adecuada, el criterio de Grubbs & Beck
tampoco parece ser de utilidad, ya que valida todos los datos independientemente de su
calidad porque ninguno de ellos se aleja de la centralidad de la serie considerablemente.
Las predicciones a periodo corto son bastante aceptables como se observa en la serie de
datos rellenada y extendida de la Figura 7-30, a periodos largos solo parece haber garantía si
la serie es enteramente estacionaria en media y en varianza, ya que esta condición
permanecería constante a lo largo del tiempo garantizando que todos los eventos posibles a
largo plazo sean similares a los ocurridos en el pasado.
Se concluye por una parte que la prueba de eliminación de datos anómalos de Grubbs &
Beck no es eficiente en series de datos con más de una tendencia central, que en la realidad
son muy poco comunes y su existencia puede sugerir que la serie enteramente fue medida
de manera deficiente.
Por otro lado la efectiva de las inferencias de los modelos ARIMA no es muy sensible a la
calidad de las observaciones así que si se tiene datos de mala calidad pero que tiene
tendencias reproducibles los modelos las simulan sin problemas.
De las pruebas realizadas en la distinta variable climática, parece que los modelos
aprovechan la información preliminar en intervalos mensuales y anuales, no así en los
diarios donde se ve las características estadísticas quedan fuertemente distorsionadas por
las inferencias obtenidas que si bien son valores posibles no parecen reproducir las
propiedades estadísticas de las series originales.
- 170 -
Serie de Evaporación Total Diaria
Estación: Chipiri
Figura 7-31 Estación Chipiri, serie de evaporación total diaria a) Serie de datos observados, b) Serie de datos
completada y extendida.
Como se observa en la Figura 7-31, la serie no mantiene sus propiedades estadísticas durante
el relleno, la causa son los fuertes cambios en la volatilidad a nivel diario para la variable
de evaporación total de la serie a lo largo del tiempo.
- 171 -
Serie de Evaporación Total Mensual
Estación: Belén
Figura 7-32 Estación de Belén, serie de evaporación total mensual a) Serie de datos observados, b) Serie de datos
completada y extendida.
Los modelos ARIMA se muestran aptos para rellenar series mensuales de variables
hidrometeorológicas e inclusive diarias si es que la condición de estacionariedad se
encuentra garantizada, cuando esta condición no se cumple el desempeño de los modelos es
muy baja principalmente si el intervalo de observación de la variable disminuye.
7.5 Recomendaciones
Se aconseja que se sea más riguroso a la hora de realizar mediciones de presión atmosférica
y de la temperatura de punto de roció para inferir valores de humedad relativa por que los
- 172 -
datos de la base de datos como los que trabajamos eran de baja calidad y con evidentes
errores durante el proceso de medición.
- 173 -
8 COMPARACIÓN ENTRE LA EFICIENCIA DE
INFERENCIA USANDO LOS MODELOS ARIMA
ENTRE DISTINTAS VARIABLES EN INTERVALOS
MENSUALES USANDO EL SOFTWARE EVIEWS9.
Los modelos estocásticos aplicados a las series temporales eran modelos de una muy
difícil aplicación en la ingeniería en general, por el problema que planteaba determinar el
valor de los estadísticos necesarios para determinar la ecuación del estimador de las
variables en estudio, ante esta desventaja se tuvo que seguir trabajando y se ignoró la
posibilidad de usar estos modelos hasta la aparición de las computadoras digitales que
consiguieron realizar procesos iterativos en cuestión de segundos, resolver operaciones de
matrices de gran tamaño y resolver sistemas de ecuaciones, la viabilidad de aplicación de
los procesos a fenómenos temporales se comprobó en la econometría y de a poco fue
también contribuyendo en otras ramas que trabajan con este tipo de variables que
presentan evoluciones a lo largo del tiempo, ahora de entero nos proponemos evaluar cuál
es la eficiencia de las inferencias obtenidas con ellas.
8.1 Metodología
Se plantea analizar el efecto de los modelos estocásticos aplicados a series temporales sobre
series de distintas variables climatológicas usando como guía la metodología Box-Jenkings
aconsejada en todas las aplicaciones de modelos estocásticos de series temporales, se
selección aleatoriamente de la base de datos de SENAMHI series que tengan una buena
cantidad de datos para cada variable ya que en general la información que presenta su base
de datos no es de la mejor calidad.
8.1.1 Muestreo
Se realizó un muestreo de tres series para cada variable de estudio, esto para poder
evaluar las diferencias entre aplicar un modelo en una u otra variable, se presenta en la
Tabla 8-1 las variables trabajadas y las estaciones con las que se trabajó:
- 174 -
Tabla 8-1 Estaciones muestreadas clasificadas por las variables en las que se aplicó el relleno de datos faltantes
usando los modelos ARIMA.
- 175 -
Figura 8-1 Localización geográfica de las estaciones hidrometeorológicas utilizadas para la evaluación del desempeño
durante el relleno las distintitas variables utilizadas.
Las estaciones en las que se efectuó los rellenos están localizadas en distintas posiciones
del territorio boliviano como se ven representadas en la Figura 8-1, el código de cada
estación corresponde a los determinados en la Tabla 8-1.
Datos Faltantes:
1 Mes
3 Meses
- 176 -
6 Meses
12 Meses
Pasos:
- 177 -
Figura 8-2 Algorítmo para la aplicación de la metodología BOX JENKINGS para el relleno de datos faltantes y
la realización de predicciones.
De manera similar a las pruebas realizadas en los capítulos anteriores el indicador a evaluar
será el error relativo a la observación.
8.2 Resultados
Hasta 10% de
observaciones
rellenadas
Error
Relativo
Medio
Número de
observaciones
rellenadas
Figura 8-3 Evaluación del error relativo a la observación de los modelos estocásticos ARIMA a nivel mensual para la
variable evaporación total en tres estaciones hidrometeorológicas muestreadas aleatoriamente dentro el territorio
boliviano, para el relleno de huecos de datos de distinta extensión.
Las 3 estaciones corresponden a un clima frío, el completado parece ser mejor en aquella
que tiene una altitud más considerable: Hichucota ubicada a 4460 msnm, en relación a
Belén ubicada a 3822 msnm y Huarina Cota Cota a 3838 msnm.
- 178 -
Si observamos la Figura 8-3 no encontramos diferencias en la incidencia del error en el
número de meses faltantes rellenados, y la magnitud del error de los rellenos está dentro de
rangos tolerables.
Hasta 10% de
observaciones
rellenadas
Error
Relativo
Medio
Número de
observaciones
rellenadas
Figura 8-4 Evaluación del error relativo a la observación de los modelos estocásticos ARIMA a nivel mensual para la
variable humedad relativa media en tres estaciones hidrometeorológicas muestreadas aleatoriamente dentro el
territorio boliviano, para el relleno de huecos de datos de distinta extensión.
En la Figura 8-4 se percibe que Achiri y Collana son de Clima frío y están a mayor altura
que Independencia con clima templado, por lo tanto el resultado del relleno no parece
depender ni del clima, ni de la altura, ni del número de meses faltantes, pero si observamos
la magnitud de los errores estos están dentro de rangos tolerables.
Hasta 10% de
observaciones
rellenadas
Error
Relativo
Medio
Número de
observaciones
rellenadas
Figura 8-5 Evaluación del error relativo a la observación de los modelos estocásticos ARIMA a nivel mensual para la
variable precipitación total en tres estaciones hidrometeorológicas muestreadas aleatoriamente dentro el territorio
boliviano, para el relleno de huecos de datos de distinta extensión.
- 179 -
Observando la Figura 8-5 encontramos que el error del relleno parece ser menor en los
climas frío (San Juan) y cálido (San Julián) que en el clima templado (Padilla), la
inexactitud para esta última estación es demasiado elevada, los errores elevados durante el
relleno se deben a que las condiciones de estacionalidad en media y en varianza no
pudieron satisfacerse durante el proceso de relleno, se observa también que el error se
incrementa, cuando el número de meses faltantes es mayor.
Hasta 10% de
observaciones
rellenadas
Error
Relativo
Medio
Número de
observaciones
rellenadas
Figura 8-6 Evaluación del error relativo a la observación de los modelos estocásticos ARIMA a nivel mensual para la
variable presión media en tres estaciones hidrometeorológicas muestreadas aleatoriamente dentro el territorio
boliviano, para el relleno de huecos de distinta extensión.
A partir de los resultados presentados en la Figura 8-6, se observa que el número de valores
rellenados incide en la magnitud del error pero que está en todos los casos es bastante baja
y se encuentra en rangos tolerables.
- 180 -
Hasta 10% de
observaciones
rellenadas
Error
Relativo
Medio
Número de
observaciones
rellenadas
Figura 8-7 Evaluación del error relativo a la observación de los modelos estocásticos ARIMA a nivel mensual para la
variable temperatura media en tres estaciones hidrometeorológicas muestreadas aleatoriamente dentro el territorio
boliviano, para el relleno de huecos de distinta extensión.
A partir de los resultados presentados en la Figura 8-7, se observa que el número de valores
rellenados no incide en la magnitud del error pero estos son demasiado elevados para la
estación (Entre Ríos) en comparación con las otras dos estaciones que si producen errores
de magnitudes tolerables durante los rellenos, esto se puede explicar por qué durante el
relleno no se consiguió mantener la condición de estacionalidad en varianza del modelo lo
que determinó que las volatilidades de la simulación sean imprecisas en relación a los datos
observados.
Para la variable temperatura media mensual las tres estaciones se encuentran en clima
similar (templado) pero parece haber una relación entre la altura a la que se encuentra y la
magnitud del error así el error va decreciendo a medida que la altura aumenta: Entre Ríos a
1260 msnm, Irupana a 1946 msnm y La Tamborada a 2597 msnm.
- 181 -
Hasta 10% de
observaciones
rellenadas
Error
Relativo
Medio
Figura 8-8 Resultados Obtenidos por variables y escenarios el Eje vertical representa la media de los errores relativos
a las observaciones suprimidas.
8.4 Conclusiones
En concordancia con el estudio preliminar hemos comprobado que los modelos estocásticos
aplicados a las series temporales son bastante exactos en la inferencia de datos faltantes
para las siguientes variables a nivel mensual: evaporación total, humedad relativa, presión
atmosférica y temperatura media mensual, de esta manera confirmamos que los modelos
autorregresivos y de media móvil no solo son capaces de mantener las propiedades
estadísticas en sus inferencias sino que también producen observaciones sintéticas con un
buen nivel de exactitud y sin necesitar de la información de otras estaciones de medición
cercanas.
8.5 Recomendaciones
Se propone seguir investigando la aplicación de los modelos ARIMA para otras variables
que influyan en el proceso hidrológico y en los diseños hidráulicos, además de ello se exige
comparar su desempeño con el de otro software destinados a realizar relleno de datos
faltantes.
- 182 -
9 COMPARACIÓN DE LA EFICIENCIA DE
DESAGREGACIÓN MENSUAL-DIARIA A PARTIR DE
LA INFORMACIÓN DE ESTACIONES VECINAS ENTRE
LOS SOFTWARE DE MODELACIÓN ESTADÍSTICA
HEC-4 Y CHAC PARA LA VARIABLE PRECIPITACIÓN
DIARIA.
Para aplicaciones hidrológicas que requieran de datos diarios y tienen una serie incompleta
de observaciones de precipitación, surge una metodología que en primera instancia realiza
el relleno a nivel mensual, en base a la mayor correlación encontrada entre estaciones
próximas mes a mes.
Una vez realizado el relleno mensual, se realiza una desagregación de los datos mensuales
a diarios usando para el efecto la proporcionalidad de los datos diarios con relación al
acumulado mensual observado en la estación con datos medidos y serie completa.
9.1 Metodología
9.1.1 Selección de Estaciones
Las muestras tomadas son 3 grupos de estaciones con datos de precipitación diaria, cada
uno se encuentra en un clima diferente y a una elevación sobre el nivel del mar distinta, los
distintos climas, también se encuentran a niveles altimétricos diferenciados, las estaciones
seleccionadas para la desagregación mensual a diaria, usando como referencia estaciones
vecinas, las estaciones rellenadas son las que se encuentran en la Tabla 9-1:
Tabla 9-1 Estaciones pertenecientes a tres climas diferentes de nuestro país en las cuales se efectuó relleno de datos
faltantes con los programas computacionales HEC-4 y CHAC.
Chulumani
Coroico
Irupana
- 183 -
Palca
Figura 9-1 Grupo de estaciones seleccionado para el relleno de datos diarios a partir de la desagregación mensual-
diaria con datos de estaciones vecinas a la estación de Lambate.
Arani
Mizque
Monte Puncu
Totora
- 184 -
Figura 9-2 Grupo de estaciones seleccionado para el relleno de datos diarios a partir de la desagregación mensual-
diaria con datos de estaciones vecinas a la estación de Pocona.
La Bélgica
Okinawa I
Portachuelo
Viru Viru
- 185 -
Figura 9-3 Grupo de estaciones seleccionado para el relleno de datos diarios a partir de la desagregación mensual-
diaria con datos de estaciones vecinas a la estación de Montero.
Las Figuras: Figura 9-1, Figura 9-2 y Figura 9-3, son una representación gráfica de los grupos
de estaciones vecinas que fueron asumidos para los experimentos de relleno de datos por
desagregación mensual-diaria tomando en consideración la correlación mensual de las
estaciones vecinas con la estación seleccionada para el relleno.
Para el conjunto de estaciones y sus datos se determina los periodos en los cuales todas las
estaciones constan de datos medidos a nivel mensual y diario.
A partir de los periodos medidos se selecciona aleatoriamente tres meses de cada época de
3 años diferentes para estudiar su comportamiento.
- 186 -
Para cada uno de los meses seleccionados se define un escenario en el cual se suprimirá y
se rellenara datos correspondientes a la estación de referencia.
Época Húmeda:
5 días Seguidos
15 Días Seguidos
5 Días Aleatorios
15 Días Aleatorios
Época Seca:
5 Días Aleatorios
15 Días Aleatorios
No se ha considerado trabajar con supresión de datos consecutivos para la época seca del
año porque en estos casos, existe una gran cantidad de días consecutivos en los que no
llueve.
Se procede a rellenar los datos a nivel mensual con HEC-4 para el mes que carece de un
total de precipitación mensual en la estación incompleta.
El valor encontrado representa la precipitación total para el mes con huecos que se pretende
rellenar.
Se determina el porcentaje que representa cada uno de los días faltantes pero en la estación
con la serie completa en relación al total de observaciones faltantes, esos porcentajes sirven
como coeficientes que multiplican a la diferencia entre el total de observaciones antes del
relleno y el valor generado por HEC-4 para la estación con datos faltantes.
- 187 -
9.1.4 Aplicación del Software CHAC
Se introduce las series de precipitación total mensual para poder generar los valores
mensuales a partir de las estaciones de referencia, se considera que el año hidrológico
inicia en agosto, se plantea que el completado cubra todos los valores mensuales faltantes,
para ello CHAC discrimina las estaciones que no tengan la suficiente correlación y solo
trabaja con las que considera guardan correlación mensual, luego de manera similar a lo
procedido en HEC-4, se guarda los valores generados y la matriz de correlación mensual.
Se procede a rellenar los datos a nivel mensual con CHAC para el mes que carece de un
total de precipitación mensual en la estación incompleta.
El valor encontrado representa la precipitación total para el mes con huecos que se pretende
rellenar.
Se determina el porcentaje que representa cada uno de los días faltantes pero en la estación
con la serie completa en relación al total de observaciones faltantes, esos porcentajes sirven
como coeficientes que multiplican a la diferencia entre el total de observaciones antes del
relleno y el valor generado por CHAC para la estación con datos faltantes.
9.1.5 Evaluación
A partir de los datos desagregados de la precipitación total mensual a diaria con cada uno
de los programas, se efectúa un contraste empírico entre las observaciones suprimidas y
los valores generados por los ellos.
- 188 -
9.2 Resultados Obtenidos
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 9-4 Comparación del Error Relativo obtenido entre los valores observados de precipitación total diaria y los
valores rellenados con el método de Mensual-Diaria. Estación Lambate durante la época húmeda del año hidrológico
entre los software HEC-4 y CHAC.
Si observamos los resultados de la Figura 9-4, encontramos que el software HEC-4 tiene en
todos los escenarios un desempeño superior al software CHAC para la época húmeda del
año en la estación de Lambate, también se distingue que los rellenos efectuados de manera
consecutiva tienen mayor error que aquellos que ese efectuaron en días aleatoriamente
seleccionados a lo largo del mes, otra característica adicional que se percibe es que a
medida que el número de datos faltantes se incrementa la magnitud de la media de los
errores también se hace más grande.
- 189 -
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 9-5 Comparación del Error Relativo obtenido entre los valores observados de precipitación total diaria y los
valores rellenados con el método de desagregación Mensual-Diaria. Estación Lambate durante la época seca del año
hidrológico entre los software HEC-4 y CHAC.
Se percibe a partir de los resultados de la Figura 9-5 que el software HEC-4 tiene en ambos
escenarios un desempeño superior al software CHAC para la época seca del año, en la
estación de Lámbete, otra característica adicional es que a medida que el número de datos
faltantes se incrementa, la magnitud de la media de los errores también se hace más grande.
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 9-6 Comparación del Error Relativo obtenido entre los valores observados de precipitación total diaria y los
valores rellenados con el método de desagregación Mensual-Diaria. Estación Pocona durante la época húmeda del
año hidrológico entre los software HEC-4 y CHAC.
- 190 -
En los resultados mostrados en la Figura 9-6 los valores del error relativo medio, nos indican
que el software HEC-4 tiene un mejor desempeño que el software CHAC en el relleno
mensual, aspecto que repercute en la desagregación a valores diarios, que corresponde a la
época húmeda del año en la estación de Pocona, además se percibe que el orden de
aparición de los datos faltantes es determinante, ya que cuando la aparición de datos
faltantes es consecutiva, se produce un error de mayor magnitud, por ultimo también se
observa que cuando el número de valores faltantes es mayor, la media de los errores
también se incrementa.
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 9-7 Comparación del Error Relativo obtenido entre los valores observados de precipitación total diaria y los
valores rellenados con el método de desagregación Mensual-Diaria. Estación Pocona durante la época seca del año
hidrológico entre los software HEC-4 y CHAC.
- 191 -
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 9-8 Comparación del Error Relativo obtenido entre los valores observados de precipitación total diaria y los
valores rellenados con el método de desagregación Mensual-Diaria. Estación Montero durante la época húmeda del
año hidrológico entre los software HEC-4 y CHAC.
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 9-9 Comparación del Error Relativo obtenido entre los valores observados de precipitación total diaria y los
valores rellenados con el método de desagregación Mensual-Diaria. Estación Montero durante la época seca del año
hidrológico entre los software HEC-4 y CHAC.
- 192 -
Durante la época seca del año, en la estación de Montero, los resultados representados en la
Figura 9-9 muestran que el rendimiento del software CHAC es levemente superior al del
software HEC-4 y que el número de observaciones faltantes no es determinante para esta
época del año.
Para la época húmeda el software HEC-4, tiene un error relativo más reducido que CHAC,
por otro lado para la época seca parece haber mayor error usando HEC-4 para clima frío y
con CHAC mejores resultados para clima templado y cálido.
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 9-10 Comparación del Error Relativo obtenido entre los valores observados de precipitación total diaria y los
valores rellenados con el método de desagregación Mensual-Diaria para cada escenario climático usando el programa
HEC-4 durante la época húmeda del año.
Los resultados de la desagregación usando el software HEC-4, para la época húmeda en las
estaciones de referencia localizadas en tres climas distintos, que se encuentran
representados en la Figura 9-10 con Lambate (Clima frio) Pocona (Clima templado) y
Montero (Clima cálido), nos muestran que el valor de la media de los errores relativos, para
cada escenario es menor en las regiones de clima frio y templado, en comparación con las
de clima cálido, esto puede ser por que la distancia entre estaciones de medición en el
altiplano y los valles es menor que en los llanos.
- 193 -
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 9-11 Comparación del Error Relativo obtenido entre los valores observados de precipitación total diaria y los
valores rellenados con el método de desagregación Mensual-Diaria para cada escenario climático usando el programa
HEC-4 durante la época seca del año.
Los resultados de la desagregación usando el software HEC-4, para la época seca, en las
estaciones de referencia localizadas en tres climas distintos, que se encuentran
representados en la Figura 9-11 con Lambate (Clima frio) Pocona (Clima templado) y
Montero (Clima cálido), nos muestran que el valor de la media de los errores relativos a la
observación para cada escenario es bastante menor en las regiones de clima frio y templado
en comparación con las de clima cálido esto puede ser por que la distancia entre estaciones
de medición en el altiplano y los valles es menor que en los llanos.
- 194 -
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 9-12 Comparación del Error Relativo obtenido entre los valores observados de precipitación total diaria y los
valores rellenados con el método de desagregación Mensual-Diaria para cada escenario climático usando el programa
CHAC durante la época húmeda del año.
- 195 -
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 9-13 Comparación del Error Relativo obtenido entre los valores observados de precipitación total diaria y los
valores rellenados con el método de desagregación Mensual-Diaria para cada escenario climático usando el programa
HEC-4 durante la época seca del año.
Observando las gráficas para ambos programas en época húmeda y diferenciando los
climas, podemos constatar que en ambos casos el método de desagregación es más eficiente
en el clima frío, luego en el templado, y con mayor error en el clima cálido.
9.3 Conclusiones
Viendo los resultados en su conjunto podemos ver que hay una cierta superioridad en la
exactitud de las inferencias obtenidas con el Software HEC- 4 en comparación con el
software CHAC, para ambos programas los rellenos tienen mejores resultados cuando no
tienen que rellenar series de datos faltantes de varios días consecutivos durante la época
húmeda del año, en la época seca esto no es determinante, también se observa que en la
época seca el programa CHAC parece ser igual de aconsejable para realizar la
desagregación a nivel diario.
La desagregación con ambos programas es mucho más eficiente para ambas épocas, seca y
húmeda en los climas frio y templando, las inferencias son más inexactas para el clima
cálido de la estación en los llanos que se encuentra mucho más distanciada de las estaciones
vecinas que las estaciones del valle y del altiplano.
- 196 -
En la mayoría de las pruebas realizadas se percibe que la magnitud de la media de los
errores se incrementa conforme el número de datos faltantes se hace también más grande.
9.4 Recomendaciones
Se recomienda, antes de realizar los procesos de desagregación, identificar grupos de
estaciones vecinas que estén lo más cerca posible de la estación que se desea rellenar.
Para realizar la desagregación mensual a nivel diario, durante la época húmeda del año para
la precipitación total diaria se aconseja trabajar con el software HEC-4, para la época seca
se podría usar cualquiera de los dos HEC-4 o CHAC.
- 197 -
10 COMPARACIÓN DE LA EFICIENCIA EN EL RELLENO
DE DATOS DIARIO USANDO LOS GENERADORES
ESTOCÁSTICOS DE CLIMA CLIGEN, CLIMGEN Y
WGEN
Las muestras están conformadas por tres estaciones, cada una se encuentra en un clima
diferente, con elevaciones sobre el nivel del mar distintas, debido a que en nuestro territorio
los climas diferenciados también se encuentran en niveles altimétricos diferenciados, las
variables están constituidas por series de valores diarios de precipitación, temperatura
máxima y temperatura mínima, la localización de las estaciones se encuentra representada
en la Figura 10-1 y sus características están tabuladas en la Tabla 10-1.
10.1 Metodología
10.1.1 Selección de los datos
Tabla 10-1 Estaciones utilizadas `para el relleno de datos faltantes con los generadores estocásticos de clima.
- 198 -
Figura 10-1 Localización geográfica de las estaciones utilizadas para evaluar la eficiencia de los rellenos de datos de
variables climáticas con los distintitos generadores estocásticos de clima.
Los datos que se eliminan para que puedan ser rellenados, corresponden a los siguientes
escenarios:
Época Húmeda:
- 199 -
5 días Seguidos
15 Días Seguidos
5 Días Aleatorios
15 Días Aleatorios
Época Seca:
5 días Seguidos
15 Días Seguidos
5 Días Aleatorios
15 Días Aleatorios
Para generar las observaciones sintéticas, es necesario cargar las observaciones medidas en
un formato establecido de texto que puede ser leído por el programa computacional.
- 200 -
Posteriormente se debe definir el intervalo temporal de generación de clima en años
determinando el año de inicio de la simulación y el año final de la situación.
Con todos eso datos el software procede con la generación sintética de variables
climáticas.
Para que el programa pueda generar un número determinado de días secos y lluviosos, el
programa aplica un modelo de cadenas de Markov de segundo orden, para cada mes se
determina la frecuencia de días que llueven dado que llovió un día anterior y de días no
llueven dado que no llovió un día anterior; los días lluviosos son representados con la letra
W y los secos con la letra D.
Las formulas usadas para determinar esas frecuencias son las siguientes:
P(W/D)=α Ec.10.1
P(D/D)=(1-α) Ec.10.2
P(D/W)=β Ec.10.3
P(W/W)=(1-β) Ec.10.4
P(W/D)= Probabilidad de que ocurra un evento de precipitación, dado que el día anterior
no ocurrió ningún evento de precipitación.
P(W/W)= Probabilidad de que ocurra un evento de precipitación, dado que el día anterior
ocurrió ningún evento de precipitación.
Los valores de temperatura máxima y mínima son más sencillos de modelar por que no
suelen haber muchos valores nulos en condiciones normales, el programa asume que la
temperatura es un proceso estacionario, a partir de esta suposición se establece que los
- 201 -
valores de temperatura máxima y mínima se pueden simular a través de un modelo
estocástico multivariado con medias y desviaciones estándar condicionadas por la
condición de día seco y húmedo establecida en el paso anterior.
Para generar las observaciones sintéticas, es necesario cargar las observaciones medidas en
un formato establecido de texto que puede ser leído por el programa computacional.
El programa antes de hacer el relleno indica de manera cualitativa la calidad de los datos
medidos parar poder realizar alas inferencias.
Con todos eso datos el software procede con la generación sintética de variables
climáticas.
Los valores de radiación solar dependen directamente de si el día ha sido lluvioso o seco,
por lo tanto se generan a partir de los estadísticos para esta variable obtenidos a partir de
los datos de entrada y de los valores generados de precipitación.
- 202 -
matriz de correlaciones va variando a medida que se van generando nuevos valores y por lo
tanto el programa se encarga de ir evaluándola constantemente.
El modelo está diseñado para preservar las dependencias temporales que puedan tener las
variables, así como las características estacionales en cada zona de estudio.
Para generar las observaciones sintéticas, es necesario cargar las observaciones medidas en
un formato establecido de texto que puede ser leído por el programa computacional.
Frecuencia de precipitación para cada día que llovió de cada mes dado que no
llovió el día anterior.
Frecuencia de precipitación para cada día que no llovió de cada mes dado que no
llovió el día anterior.
Precipitación máxima en un día obtenida a partir de todos los datos observados.
Temperatura media anual máxima para los días lluviosos.
Temperatura media anual máxima para los días secos.
Amplitud térmica anual para los días lluviosos.
Amplitud térmica anual para los días secos.
Temperatura media anula minina.
Coeficiente de variación anual para la temperatura máxima.
Coeficiente de variación anual para la temperatura mínima.
Radiación solar media.
Con todos eso datos el software procede con la generación sintética de variables
climáticas.
10.1.6 Evaluación
A partir de los datos generados con cada software de precipitación total diaria, temperatura
máxima diaria y temperatura mínima diaria, se hace un contraste empírico con las
observaciones existentes y suprimidas intencionalmente.
- 203 -
10.2 Resultados
10.2.1 Precipitación Total Diaria
Época Húmeda:
Estación: Laykacota
Departamento: La Paz
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-2 Comparación del Error Relativo para la variable precipitación diaria, entre los valores medidos y estimados
con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos faltantes durante la
época húmeda del año en la estación Laykacota.
Observando la Figura 10-2 se percibe que si el número de huecos es reducido a lo largo del
mes, el software WGEN parece tener un desempeño mejor en relación a CLIGEN Y
CLIMGEN, además en todos los resultados la magnitud de los errores relativos indica que
el relleno es más eficiente para días con datos faltantes no consecutivos.
Estación: La Tamborada
Departamento: Cochabamba
- 204 -
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-3 Comparación del Error Relativo para la variable precipitación diaria, entre los valores medidos y estimados
con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos faltantes durante la
época húmeda del año en la estación La Tamborada.
A partir de la Figura 10-3 deducimos que en todos los casos el mejor desempeño para la
inferencia de datos faltantes lo tiene el software WGEN; CLIMGEN tienen menor
magnitud de error cuando los datos faltantes son consecutivos, al contrario del desempeño
de WGEN que no acusa gran diferencia.
Estación: Vallecito
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-4 Comparación del Error Relativo para la variable precipitación diaria, entre los valores medidos y estimados
con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos faltantes durante la
época húmeda del año en la estación Vallecito.
- 205 -
Si observamos la Figura 10-4, los errores relativos de los valores rellenados en los distintos
escenarios por el programa computacional WGEN son menores, además no se ven
influenciados por la posición de los huecos en la serie algo que hace más simple el proceso
de relleno, para CLIMGEN la magnitud del error es mayor si los datos faltantes son
consecutivos.
A partir de los resultados presentados de las tres estaciones, en las que se efectuó el relleno
de datos, se concluye que el programa computacional WGEN produce mejores resultados
en dos de las estaciones estudiadas, para la variable precipitación diaria, durante la época
húmeda del año.
Época Seca:
Estación: Laykacota
Departamento: La Paz
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-5 Comparación del Error Relativo para la variable precipitación diaria, entre los valores medidos y estimados
con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos faltantes durante la
época seca del año en la estación Laykacota.
Estación: La Tamborada
Departamento: Cochabamba
- 206 -
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-6 Comparación del Error Relativo para la variable precipitación diaria, entre los valores medidos y estimados
con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos faltantes durante la
época seca del año en la estación La Tamborada.
Observando la Figura 10-6 deducimos que CLIMGEN tiene mejor desempeño en relación a
los otros dos software y otra vez de manera similar al experimento anterior no parece ser
determínate si los datos faltantes son o no consecutivos.
Estación: Vallecito
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-7 Comparación del Error Relativo para la variable precipitación diaria, entre los valores medidos y estimados
con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos faltantes durante la
época seca del año en la estacion Vallecito.
- 207 -
En términos generales el programa CLIMGEN, produce mejores resultados que los
restantes para la variable precipitación diaria, durante la época seca del año, también se
puede concluir que para esta época del año, no es determínate en la eficiencia de los
rellenos si los datos faltantes son o no consecutivos, esto se debe a la frecuente presencia
de valores nulos en la serie de precipitación diaria durante la época seca del año.
Época Húmeda:
Estación: Laykacota
Departamento: La Paz
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-8 Comparación del Error Relativo para la variable temperatura máxima diaria, entre los valores medidos y
estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos faltantes
durante la época húmeda del año en la estación Laykacota.
En la Figura 10-8 distinguimos que CLIGEN y CLIMGEN parecen ser mejores que WGEN
durante el relleno de datos de temperatura máxima a nivel diario, en la estación de
Laykacota para la época húmeda del año, no parece haber gran diferencia entre rellenar
valores consecutivos o aleatorios para ninguno de los programas .
Estación: La Tamborada
Departamento: Cochabamba
- 208 -
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-9 Comparación del Error Relativo para la variable temperatura máxima diaria, entre los valores medidos y
estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos
faltantes durante la época húmeda del año en la estación La Tamborada.
Si vemos la Figura 10-9, los resultados obtenidos por los software CLIGEN y CLIMGEN
son superiores a los de WGEN, y no parece haber gran diferencia entre rellenar valores
consecutivos o aleatorios.
Estación: Vallecito
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-10 Comparación del Error Relativo para la variable temperatura máxima diaria, entre los valores medidos y
estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos faltantes
durante la época húmeda del año en la estación Vallecito.
- 209 -
Observando la Figura 10-10 se percibe que los tres programas tiene un desempeño similar
en el caso de un clima cálido durante la época húmeda del año y de nuevo no parece haber
diferencia entre rellenar datos seguidos o aleatorios.
CLIGEN es la mejor alternativa para inferir datos faltantes de temperatura máxima diaria y
los resultados son independientementes del número de datos faltantes o de si estos son
consecutivos o no.
Época Seca:
Estación: Laykacota
Departamento: La Paz
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-11 Comparación del Error Relativo para la variable temperatura máxima diaria, entre los valores medidos y
estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos faltantes
durante la época seca del año en la estación Laykacota.
- 210 -
Estación: La Tamborada
Departamento: Cochabamba
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-12 Comparación del Error Relativo para la variable temperatura máxima diaria, entre los valores medidos y
estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos faltantes
durante la época seca del año en la estación La Tamborada.
Estación: Vallecito
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-13 Comparación del Error Relativo para la variable temperatura máxima diaria, entre los valores medidos y
estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos faltantes
durante la época seca del año en la estación Vallecito.
- 211 -
Observando la Figura 10-13 se deduce que para el clima cálido, los tres programas parecen
tener un desempeño similar para la época seca del año.
CLIGEN Y CLIMGEM tienen un mejor desempeño que WGEN en los climas frio y
templado para la variable temperatura máxima diaria en la época seca.
Época Húmeda:
Estación: Laykacota
Departamento: La Paz
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-14 Comparación del Error Relativo para la variable temperatura mínima diaria, entre los valores medidos y
estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos faltantes
durante la época húmeda del año en la estación Laykacota.
- 212 -
Estación: La Tamborada
Departamento: Cochabamba
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-15 Comparación del Error Relativo para la variable temperatura mínima diaria, entre los valores medidos y
estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos faltantes
durante la época húmeda del año en la estación La Tamborada.
Estación: Vallecito
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-16 Comparación del Error Relativo para la variable temperatura mínima diaria, entre los valores medidos y
estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos faltantes
durante la época húmeda del año en la estación Vallecito.
- 213 -
De manera similar a los dos experimentos anteriores si observamos los resultados
representados en la Figura 10-16, los errores producidos durante la inferencia de datos
faltantes usando los programas CLIGEN y CLIMGEN son muy inferiores en comparación
con los producidos con WGEN y el desempeño de los software no parece ser influenciado
por que los datos a rellenar sean o no consecutivos.
CLIGEN y CLIMGEN son las mejores alternativas para inferir datos faltantes de
temperatura mínima diaria durante la época húmeda independientemente del número de
datos faltantes o de si estos son consecutivos o no.
Época Seca:
Estación: Laykacota
Departamento: La Paz
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-17 Comparación del Error Relativo para la variable temperatura mínima diaria, entre los valores medidos y
estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos faltantes
durante la época seca del año en la estación Laykacota.
Observando la Figura 10-17 los resultados obtenidos con los software CLIGEN y
CLIMGEN claramente son superiores a WGEN, no parece afectar si los datos a rellenar son
consecutivos o distribuidos aleatoriamente.
- 214 -
Estación: La Tamborada
Departamento: Cochabamba
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-18 Comparación del Error Relativo para la variable temperatura mínima diaria, entre los valores medidos y
estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos faltantes
durante la época seca del año en la estación La Tamborada.
Observando la Figura 10-18 los resultados obtenidos con los software CLIGEN y
CLIMGEN claramente son superiores a WGEN, no parece afectar si los datos a rellenar son
consecutivos o distribuidos aleatoriamente.
Estación: Vallecito
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-19 Comparación del Error Relativo para la variable temperatura mínima diaria, entre los valores medidos y
estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos faltantes
durante la época seca del año en la estación Vallecito.
- 215 -
En la representación de los resultados presentados en la Figura 10-19, se observa que
CLIGEN y CLIMGEN tienen un mejor desempeño que WGEN y no parece afectar si los
datos a rellenar son consecutivos o distribuidos aleatoriamente.
CLIGEN Y CLIMGEM tienen un mejor desempeño que WGEN en los climas frio y
templado para la variable temperatura mínima diaria en la época seca.
Cochabamba – Aeropuerto
Laykacota
Montero
Los resultados obtenidos se presenta en la Figura 10-20; y cómo podemos observar los
generadores estocásticos de clima tienen un desempeño bastante superior al generar datos
diarios de precipitación y agregarlos después a nivel mensual, se destaca que el programa
CLIGEN tiene el mejor rendimiento de entre todas la metodologías, el desempeño de los
modelos ARIMA es deficiente por que la precipitación es una variable no estacionaria y
además de eso suele tener valores nulos en sus registros que son bástate difíciles de
reproducir por los modelos autorregresivos de media móvil.
Hasta 12% de
observaciones
rellenadas
Error Medio
Relativo a la
Observación
Figura 10-20 Resultados que representan el Error Relativo Medio, obtenido con las distintas metodologías de relleno
de datos para la variable precipitación total mensual en diferentes estaciones.
- 216 -
10.2.5 Resumen de Resultados
Para poder determinar conclusiones más precisas del relleno se vio conveniente integrar
los resultados de las figuras anteriores por variables y según la época de relleno; las nuevas
figuras nos muestran un panorama más claro del comportamiento de los programas
utilizados y de la calidad de sus inferencias.
Media del
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-21 Media del error relativo en el relleno de datos de precipitación diaria con los distintos programas
utilizados y para los escenarios representados en la abscisa, para la época húmeda del año.
Los resultados presentados en la Figura 10-21 indican que para la época húmeda del año, el
programa WGEN se desenvuelve mejor que los otros dos al inferir datos faltantes de
precipitación diaria.
Media del
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-22 Media del error relativo en el relleno de datos de precipitación diaria con los distintos programas
utilizados y para los escenarios representados en la abscisa, para la época seca del año.
- 217 -
Los resultados presentados en la Figura 10-22, indican que para la época seca del año, el
programa CLIMGEN se desenvuelve mejor que los otros dos al inferir datos faltantes de
precipitación diaria.
Media del
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-23 Media del error relativo en el relleno de datos de temperatura máxima diaria con los distintos programas
utilizados y para los escenarios representados en la abscisa, para la época húmeda del año.
Los resultados presentados en la Figura 10-23, indican que para la época húmeda del año, los
programas CLIGEN y CLIMGEN se desenvuelve mejor que WGEN al inferir datos
faltantes de temperatura máxima diaria.
Media del
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-24 Media del error relativo en el relleno de datos de temperatura máxima diaria con los distintos programas
utilizados y para los escenarios representados en la abscisa, para la época seca del año.
- 218 -
Los resultados presentados en la Figura 10-24, indican que para la época seca del año, los
programas CLIGEN y CLIMGEN se desenvuelve mejor que WGEN al inferir datos
faltantes de temperatura máxima diaria.
Media del
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-25 Media del error relativo en el relleno de datos de temperatura mínima diaria con los distintos programas
utilizados y para los escenarios representados en la abscisa, para la época húmeda del año.
Los resultados presentados en la Figura 10-25, indican que para la época húmeda del año, los
programas CLIGEN y CLIMGEN se desenvuelve mejor que WGEN al inferir datos
faltantes de temperatura mínima diaria.
Media del
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-26 Media del error relativo en el relleno de datos de temperatura mínima diaria con los distintos programas
utilizados y para los escenarios representados en la abscisa, para la época seca del año.
- 219 -
Los resultados presentados en la Figura 10-26, indican que para la época seca del año, los
programas CLIGEN y CLIMGEN se desenvuelve mejor que WGEN al inferir datos
faltantes de temperatura mínima diaria.
10.3 Conclusiones
Los resultados de generación de observaciones diarias para la variable precipitación total
diaria tiene errores relativos demasiado elevados, después de haber realizado
comparaciones entre los modelos y determinar cuál rellena datos mejor, ninguno de ellos
parece generar observaciones sintéticas dentro las tolerancias de error admisibles, por lo
tanto los generadores estocásticos de clima no parecen ser convenientes para el relleno de
datos de precipitación total diaria, más aun tomando en cuenta los resultados obtenidos en
el capítulo anterior obteniendo inferencias mucho mejores mediante la desagregación
mensual-diaria usando los software HEC-4 y CHAC.
Por otro lado para las inferencias realizadas para las variables temperatura máxima diaria y
temperatura mínima diaria si son bastante aceptables, para este fin los programas CLIGEN
y CLIMGEN tienen un buen desempeño, el software WGEN sigue produciendo valores
demasiado inexactos para estas variables.
Los rellenos mantienen su calidad sin importar si las observaciones generadas pertenecen a
datos faltantes consecutivos o aleatoriamente distribuidos.
10.4 Recomendaciones
Si se desea rellenar datos diarios de precipitación total no se aconseja utilizar generadores
estocásticos de clima, se sugiere utilizar la desagregación mensual-diaria desarrollada en
el capítulo anterior ya que en escenarios y condiciones semejantes produce mejores
resultados.
- 220 -
11 COMPARACIÓN ENTRE EL RELLENO MENSUAL
ENTRE LOS MODELOS ARIMA, HEC – 4 Y LA
APLICACIÓN DE RELLENO DE DATOS EN EL CÓDIGO
R
En este caso se trabajó solamente con las variables en las cuales se realizaron rellenos de
datos faltantes en el laboratorio de hidráulica, los rellenos se efectuaron a nivel mensual
para las variables velocidad del viento, cantidad de horas de sol por día y evaporación
total.
Es una aplicación que se utilizó para preparar los datos de entrada del modelo WEAP, el
cual procede a rellenar datos de estaciones con vacíos a partir de estaciones vecinas, con la
cual se obtuvo buenos resultados durante las simulaciones efectuadas (Kaenel & Depsky,
2016, pág. 1), el código desarrollado realiza las siguientes acciones:
- 221 -
distancia entre estaciones, el programa determina el método en relación a la
cantidad de datos que presenta cada estación y la distancia que existe entre
estaciones, una estación con muchos datos pero alejada es favorecida para realizar
el relleno con el primer método, por otra parte una estación con pocos datos pero
cercana es favorecida para rellenar con el segundo método.
Relleno de datos usando el método seleccionado.
Calculo de índices de error entre lo simulado y observado, nosotros preferimos
evaluar este error de manera independiente entre los valores suprimidos
intencionalmente y los nuevos valores generados.
11.1 Metodología
11.1.1 Muestreo
Como los grupos para la inferencia fueron determinados previamente siguiendo el criterio
de afinidad y cantidad de datos en las estaciones para realizar el relleno de datos usando el
software Hec-4, nos limitamos a trabajar con estos grupos y verificar la inferencia
realizando pruebas también con las otras 2 metodologías restantes.
Los Grupos de estaciones meteorológicas que se utilizaron para a efectuar los rellenos están
tabulados en las Tabla 11-1,
Tabla 11-1 Grupos de estaciones donde se aplicó el relleno de datos faltantes usando los modelos estocásticos
ARIMA, el software HEC-4 y la aplicación de relleno de datos en el código R para la variable Magnitud de Velocidad
de Viento Media.
- 222 -
Figura 11-1 Localización de estaciones de medición por grupos para el relleno de datos faltantes de Magnitud de
Velocidad de viento Media para la comparación entre la eficiencia de las 3 metodologías utilizadas.
Tabla 11-2 Grupos de estaciones donde se aplicó el relleno de datos faltantes usando los modelos estocásticos
ARIMA, el software HEC-4 y la aplicación de relleno de datos en el código R para la variable Horas de Sol por día a
nivel medio.
- 223 -
Figura 11-2 Localización de estaciones de medición por grupos para el relleno de datos faltantes de Horas de Sol por
Día para la comparación entre la eficiencia de las 3 metodologías utilizadas.
Tabla 11-3 Grupos de estaciones donde se aplicó el relleno de datos faltantes usando los modelos estocásticos
ARIMA, el software HEC-4 y la aplicación de relleno de datos en el código R para la variable Evaporación Total.
- 224 -
Figura 11-3 Localización de estaciones de medición por grupos para el relleno de datos faltantes de Evaporación
Total para la comparación entre la eficiencia de las 3 metodologías utilizadas.
Tabla 11-4 Grupos de estaciones donde se aplicó el relleno de datos faltantes usando los modelos estocásticos
ARIMA, el software HEC-4 y la aplicación de relleno de datos en el código R para la variable Precipitación Total.
- 225 -
Figura 11-4 Localización de estaciones de medición por grupos para el relleno de datos faltantes de Precipitación
Total para la comparación entre la eficiencia de las 3 metodologías utilizadas.
Los números que identifican a las estaciones en las Figuras: Figura 11-1; Figura 11-2; Figura
11-3 y Figura 11-4, corresponden a las estaciones numeradas en las Tablas: Tabla 11-1;
Tabla 11-2; Tabla 11-3 y Tabla 11-4 respectivamente para que estas puedan ser identificadas
en cada mapa.
11.1.2 Procedimiento
Para que los modelos sean conmensurables se tuvo que ajustar el experimento a las
características inferenciales mínimas necesarias que necesitaría la metodología Box
Jenkings para poder trabajar eficientemente que lógicamente son menos exigentes que para
los demás métodos empleados, así que los datos extraídos corresponden a los últimos
valores del final de la serie sin huecos de una de las estaciones de medición en la cual el
número de datos consecutivos sea máximo, es la condición límite de trabajo para hacer que
los modelos ARIMA trabajen de manera adecuada y por lo tanto pueda ser conmensurable
con el relleno generado por los demás software.
- 226 -
La eliminación de datos se realizó en varios intervalos mensuales de 1, 3, 6 y 12 meses y
de esa forma rellenar y comparar el error producido por los modelos.
11.1.3 Evaluación
El indicador de la eficiencia durante los rellenos fue el error medio relativo a la
observación, adicionalmente se podría también incluir una relación entre este error y el
número de datos empleados e identificar qué modelo es superior en relación a la
información de entrada empleada, que naturalmente nos indicara que modelo es más útil en
condiciones más desfavorables y mucho más corrientes propias del medio en el que se
realizan trabajos de diseño hidrológico donde las condiciones políticas no favorezcan la
obtención de información.
11.2 Resultados
11.2.1 Magnitud de Velocidad de Viento Media Mensual
Estación: Arani
Error Medio
Hasta 10% de
Relativo a la
observaciones
Observación
rellenadas
1.4
1.2
1
ARIMA
0.8
HEC - 4
0.4
0.2
Número de
0 observaciones
Quitando 1 Mes Quitando 3 Mes Quitando 6 Mes Quitando 12 Mes rellenadas
Figura 11-5 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel mensual
para la variable velocidad del viento con los datos de la estación Arani entre las 3 metodologías empleadas.
- 227 -
Estación: Ayo Ayo
Error Medio
Hasta 10% de
Relativo a la
observaciones
Observación
rellenadas
1.4
1.2
1
ARIMA
0.8
HEC - 4
0.6 APP R-CODE
0.4
0.2
Número de
0
observaciones
Quitando 1 Mes Quitando 3 Mes Quitando 6 Mes Quitando 12 Mes rellenadas
Figura 11-6 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel mensual
para la variable velocidad del viento con los datos de la estación Ayo Ayo entre las 3 metodologías empleadas.
Estación: Riberalta
Error Medio
Relativo a la Hasta 10% de
Observación observaciones
rellenadas
1.8
1.6
1.4
1.2 ARIMA
1
HEC - 4
0.8
APP R-CODE
0.6
0.4
0.2
0 Número de
Quitando 1 Mes Quitando 3 Mes Quitando 6 Mes Quitando 12 Mes observaciones
rellenadas
Figura 11-7 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel mensual
para la variable velocidad del viento con los datos de la estación Riberalta entre las 3 metodologías empleadas.
- 228 -
Observando en conjunto los resultados representados en las Figuras Figura 11-5; Figura 11-6
y Figura 11-7; al rellenar observaciones faltantes de la magnitud de la velocidad de viento
los modelos ARIMA ofrecen mejores resultados que los producidos en HEC-4 y la
aplicación en el código R.
Estación: Sucre
Error Medio
Hasta 10% de
Relativo a la
observaciones
Observación
rellenadas
0.9
0.8
0.7 ARIMA
0.6
0.5 HEC - 4
0.4
0.3 APP R-CODE
0.2
0.1
0 Número de
1 Observación 3 Observaciones 6 Observaciones 12 Observaciones observaciones
Faltante Faltantes Faltantes Faltantes rellenadas
Figura 11-8 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel mensual
para la variable Cantidad media de horas sol por día con los datos de la estación Sucre entre las 3 metodologías
empleadas.
Error Medio
Hasta 10% de
Relativo a la
observaciones
Observación
rellenadas
0.8
0.7
0.6 ARIMA
0.5
HEC - 4
0.4
0.3 APP R-CODE
0.2
0.1
0.0 Número de
1 Observación 3 Observaciones 6 Observaciones 12 Observaciones observaciones
Faltante Faltantes Faltantes Faltantes rellenadas
Figura 11-9 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel mensual
para la variable Cantidad media de horas sol por día con los datos de la estación Ayo Ayo entre las 3 metodologías
empleadas.
- 229 -
Estación: Los Pinos
0.12
0.1
ARIMA
0.08
HEC - 4
0.06
APP R-CODE
0.04
0.02
0
1 Observación 3 Observaciones 6 Observaciones 12 Observaciones Número de
observaciones
Faltante Faltantes Faltantes Faltantes
rellenadas
Figura 11-10 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel mensual
para la variable Cantidad media de horas sol por día con los datos de la estación Los Pinos entre las 3 metodologías
empleadas.
Observando las Figuras: Figura 11-8;Figura 11-9 y Figura 11-10; encontramos que el software
HEC-4 produce resultados levemente superiores a los de los modelos ARIMA, por otro
lado la aplicación en R realiza inferencias con errores demasiado elevados en relación a las
otras dos metodologías.
- 230 -
11.2.3 Evaporación Total Mensual
Estación: Talula Tako Tako
Figura 11-11 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel mensual
para la variable Evaporación total con los datos de la estación Talula Tako Tako entre las 3 metodologías empleadas.
Estación: Tarapacaya
Figura 11-12 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel mensual
para la variable Evaporación total con los datos de la estación Tarapacaya entre las 3 metodologías empleadas.
- 231 -
Estación: Santa Cruz
Error Medio
Hasta 10% de
Relativo a la
observaciones
Observación
0.6 rellenadas
0.5
0.4
ARIMA
0.3 HEC - 4
0.1
0.0
Número de
1 Observación 3 Observaciones 6 Observaciones 12 observaciones
Faltante Faltantes Faltantes Observaciones rellenadas
Faltantes
Figura 11-13 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel mensual
para la variable Evaporación total con los datos de la estación Santa Cruz entre las 3 metodologías empleadas.
De manera similar a la variable anterior los resultados de las Figuras Figura 11-10Figura
11-11;Figura 11-12 y Figura 11-13; sugieren que el software HEC-4 parece tener resultados
levemente superiores a los de los modelos ARIMA y la aplicación en el código R parece
quedarse bastante atrás en relación a las otras dos metodologías.
- 232 -
11.2.4 Precipitación Total Mensual
Estación: Cochabamba
Error Medio
Hasta 10% de
Relativo a la
observaciones
Observación
0.6 rellenadas
0.5
0.4
ARIMA
0.3 HEC-4
APP R-CODE
0.2
0.1
0
1 Observación 3 observaciones 6 Observaciones 12 Observaciones Número de
observaciones
Faltante Faltante Faltante Faltante
rellenadas
Figura 11-14 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel mensual
para la variable Precipitación total con los datos de la estación Cochabamba entre las 3 metodologías empleadas.
Estación: Laykacota
Error Medio
Relativo a la Hasta 10% de
Observación observaciones
0.7 rellenadas
0.6
0.5
ARIMA
0.4
HEC-4
0.3
APP R-CODE
0.2
0.1
0 Número de
observaciones
1 Observación 3 observaciones 6 Observaciones 12 Observaciones
rellenadas
Faltante Faltante Faltante Faltante
Figura 11-15 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel mensual
para la variable Precipitación total con los datos de la estación Laykacota entre las 3 metodologías empleadas.
- 233 -
Estación: Montero
Error Medio
Relativo a la Hasta 10% de
Observación observaciones
rellenadas
2.5
1.5 ARIMA
HEC-4
1 APP R-CODE
0.5
0 Número de
1 Observación 3 observaciones 6 Observaciones 12 Observaciones observaciones
Faltante Faltante Faltante Faltante rellenadas
Figura 11-16 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel
mensual para la variable Precipitación total con los datos de la estación Montero entre las 3 metodologías
empleadas .
Observando las Figuras Figura 11-14; Figura 11-15; Figura 11-16; se puede concluir que la
metodología más eficiente en el relleno de datos faltantes de la precipitación total mensual
es el programa HEC-4; la aplicación desarrollada en el código R también presenta buenos
resultados, los modelos ARIMA quedan un poco atrás pero esto es razonable en relación a
la pequeña cantidad de datos que estos requieren para poder emplearse.
- 234 -
11.2.5 Relación entre el Error y el Número de datos de entrada para los distintos
Modelos por variables
Error Medio
Relativo a la
Observación
Figura 11-17 Relación entre el número de datos de entrada usados para el relleno de datos y la magnitud del error
relativo obtenido para cada metodología en las distintas pruebas efectuadas para la inferencia de la magnitud de la
velocidad del viento.
La Figura 11-17 muestra claramente que con mucho menos datos los modelos ARIMA
pueden realizar inferencias mucho más eficientes que HEC-4 y la aplicación en el código
para la variable magnitud de la velocidad media del viento a nivel mensual.
Error Medio
Relativo a la
Observación
Figura 11-18 Relación entre el número de datos de entrada usados para el relleno de datos y la magnitud del error
relativo obtenido para cada metodología en las distintas pruebas efectuadas para la inferencia de la media mensual
de horas sol por día.
- 235 -
Observando la Figura 11-18 encontramos que a pesar de entre un desempeño mejor HEC-4 y
el código R e n relación a los modelos ARIMA, requieren una cantidad inmensamente
mayor de datos para conseguir rellenara los datos faltantes para la variable media mensual
de horas sol por día .
Error Medio
Relativo a la
Observación
Figura 11-19 Relación entre el número de datos de entrada usados para el relleno de datos y la magnitud del error
relativo obtenido para cada metodología en las distintas pruebas efectuadas para la inferencia de la evaporación
total mensual.
Observando la Figura 11-19 encontramos que a pesar de entre un desempeño mejor HEC-4 y
el código R en relación a los modelos ARIMA, requieren una cantidad inmensamente
mayor de datos para conseguir rellenara los datos faltantes para la variable evaporación
total mensual.
Error Medio
Relativo a la
Observación
Figura 11-20 Relación entre el número de datos de entrada usados para el relleno de datos y la magnitud del error
relativo obtenido para cada metodología en las distintas pruebas efectuadas para la inferencia de la precipitación
total mensual.
- 236 -
La Figura 11-20 muestra claramente que con mucho menos datos, los modelos ARIMA
pueden realizar inferencias mucho más eficientes que HEC-4, pero no superiores a las
hechas por la aplicación en el código para la variable precipitación total mensual.
11.3 Conclusiones
Para todas las variables de estudio en la mayoría de los casos el error incrementa un poco a
medida que el número de observaciones faltantes se va incrementando.
En el caso de las inferencias de la velocidad media del viento a nivel mensual sus errores
son bastante elevados, pero dada la naturaleza de la variable se sabe que es bástate difícil de
inferirla, por lo tanto los resultados obtenidos se pueden considerar bastante satisfactorios
tanto para las inferencias producidas por los modelos ARIMA como para las hechas por el
software HEC-4 quedando por encima de los resultados de la aplicación de relleno de datos
en el código R.
Considerando que los modelos ARIMA trabajan con mucho menos observaciones para
realizar sus inferencias parece ser que es el que se desempeñaría mejor ante la condición
crítica que siempre puede estar presente la cual es la carencia de observaciones, y dado que
la calidad de los resultados de estos modelos es bástate similar a la de los producidos por el
software HEC-4, sí se dan estas condiciones de carencia de datos los modelos
autorregresivos de media móvil podrán generan inferencias útiles para los diseños
hidráulicos e hidrológicos.
11.4 Recomendaciones
Siempre que sea posible se debería realizar los rellenos trabajando con grupos de
estaciones vecinas que se encuentran cerca, que tenga una cantidad considerable de
observaciones y mantengan una correlación a nivel mensual elevada entre ellas como para
poder aplicar el software HEC-4.
Si se da el caso de que se tenga que trabajar con estaciones con pocas o ninguna estación
vecina o que las correlaciones entre estaciones sean demasiado bajas se habilitan los
modelos arrima como medio de inferencia de datos faltantes ya que estos son bastante
exactos trabajando con estaciones con pocos datos observados y gran cantidad de huecos en
su registro.
- 237 -
12 RELLENO DE OBSERVACIONES FALTANTES USANDO
LA MEDIA DE LOS DATOS FALTANTES EN
INTERVALOS MENSUALES DE VARIABLES
CLIMÁTICAS
Medir el grado de representatividad de la media para cada variable es una interrogante que
debemos resolver, pensamos al iniciar estas pruebas que la media podía ser un buen valor
para hacer rellenos en series que tengan pocos datos faltantes, lógicamente entendido el
proceso estacional que se presenta en las variables climáticas, las medias que pretendíamos
usar para el relleno de datos era medias mensuales, para poder conmensurar la viabilidad
de aplicación de las medias para distintos meses y distintas variables se usó el coeficiente
de variación cuya formulación fue determinada precisamente para estudios de este tipo.
El rango tolerable que puede tener el coeficiente de variación para establecer que dos
muestras tienen características similares es entre 0 y 100 porciento, valores por encima
ponen en manifiesto que una dispersión excepcional en los datos (Molina & Rodrigo,
2010, pág. 13), en esos casos la media perdería su valor inferencial.
12.1 Metodología
12.1.1 Muestreo
Se realizó un muestreo de tres series para cada variable de estudio, esto para poder
evaluar las diferencias entre aplicar un modelo en una u otra variable, se presenta a
continuación las variables trabajadas y las estaciones con las que se trabajó en la Tabla
12-1, la numeración de las estaciones en la tabla sirve de guía para identificar su
localización en la Figura 12-1:
Tabla 12-1 Estaciones donde se determinó el coeficiente de variación a nivel mensual clasificadas por variables
hidrometeorológicas.
- 238 -
2.2. Potosí Aero. Potosí 4100 Frío
2.3. Yesera Norte Tarija 2200 Templado
- 239 -
Figura 12-1 Localización de estaciones empleadas para calcular el coeficiente de variación de las distintas variables a
nivel mensual e identificar en que variables podría ser viable el relleno de datos faltantes a partir de la media de los
datos mensuales observados.
12.1.2 Evaluación
Se calcula el coeficiente de variación mensual, para determinar si la variación respecto la
media de las observaciones es significativa como para afectar a la serie que se pretende
rellenar.
Para finalizar se pretende luego de haber terminado de evaluar los resultados obtenidos con
los distintos métodos aplicados, establecer una estructura más o menos general para
afrontar el problema del relleno de datos o la predicción de datos faltantes.
12.2 Resultados
- 240 -
Estación: Laykacota
% CV
120
100
80
60
40
20
0
ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
Figura 12-2 Coeficiente de Variación a nivel mensual para la evaporación total en Laykacota.
Estación: Comarapa
% CV
20
15
10
0
ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
Figura 12-3 Coeficiente de Variación a nivel mensual para la evaporación total en Comarapa.
Estación: Coimata
- 241 -
% CV
25
20
15
10
0
ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
Figura 12-4 Coeficiente de Variación a nivel mensual para la evaporación total en Coimata.
Observando las Figuras Figura 12-2; Figura 12-3 y Figura 12-4; encontramos que la magnitud
del coeficiente de variación, para la variable Evaporación a nivel mensual es demasiado
elevada para inferir datos faltantes con un parámetro estadístico puntual como la media
mensual de los datos observados.
Estación: Magdalena
% CV
12
10
8
6
4
2
0
ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
Figura 12-5 Coeficiente de Variación a nivel mensual para la humedad relativa media en Magdalena.
- 242 -
Estación: Potosí Aeropuerto
% CV
35
30
25
20
15
10
5
0
ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
Figura 12-6 Coeficiente de Variación a nivel mensual para la humedad relativa media en Potosí Aeropuerto.
% CV
20
15
10
0
ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
Figura 12-7 Coeficiente de Variación a nivel mensual para la humedad relativa media en Yesera Norte.
Observando las Figuras Figura 12-5; Figura 12-6 y Figura 12-7; encontramos que la magnitud
de coeficiente de variación para la variable humedad relativa media a nivel mensual, es
demasiado elevada para inferir datos faltantes con un parámetro estadístico puntual como la
media mensual de los datos observados.
- 243 -
12.2.3 Precipitación Total Mensual
Estación: Ballivian
% CV
300
250
200
150
100
50
0
ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
Figura 12-8 Coeficiente de Variación a nivel mensual para precipitación total en Ballivian.
Estación: Potolo
% CV
300
250
200
150
100
50
0
ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
Figura 12-9 Coeficiente de Variación a nivel mensual para precipitación total en Potolo.
- 244 -
Estación: Irpa Chico
% CV
200
150
100
50
0
ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
Figura 12-10 Coeficiente de Variación a nivel mensual para precipitación total en Irpa Chico.
Observando las Figuras Figura 12-8; Figura 12-9 y Figura 12-10; encontramos que la magnitud
del coeficiente de variación para la variable precipitación total a nivel mensual es
demasiado elevada para inferir datos faltantes con un parámetro estadístico puntual como la
media mensual de los datos observados.
% CV
0.3
0.25
0.2
0.15
0.1
0.05
0
ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
Figura 12-11 Coeficiente de Variación a nivel mensual para presión media en San Matias.
- 245 -
Estación: Bermejo Aeropuerto
% CV
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
Figura 12-12 Coeficiente de Variación a nivel mensual para presión media en Bermejo Aeropuerto.
% CV
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
Figura 12-13 Coeficiente de Variación a nivel mensual para presión media en San Ramón.
Observando las Figuras Figura 10-11; Figura 10-12 y Figura 10-13; encontramos que la
magnitud de coeficiente de variación para la variable presión atmosférica media a nivel
mensual es bajo y por lo tanto es posible inferir datos faltantes con un parámetro estadístico
puntual como la media mensual de los datos observados.
- 246 -
12.2.5 Temperatura Media Mensual
Estación: Tinguipaya
% CV
120
100
80
60
40
20
0
ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
Figura 12-14 Coeficiente de Variación a nivel mensual para temperatura media en Tinguipaya.
% CV
7
6
5
4
3
2
1
0
ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
Figura 12-15 Coeficiente de Variación a nivel mensual para temperatura media en Cristal Mayu.
- 247 -
Estación: Guayaramerín Aeropuerto
% CV
200
150
100
50
0
ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
Figura 12-16 Coeficiente de Variación a nivel mensual para temperatura media en Guayaramerín Aeropuerto.
Observando las Figuras Figura 12-14; Figura 12-15 y Figura 12-16; encontramos que la
magnitud del coeficiente de variación para la variable Temperatura media a nivel mensual,
es demasiado elevada para inferir datos faltantes con un parámetro estadístico puntual como
la media mensual de los datos observados.
12.3 Conclusión
Observando las Figuras desde Figura 12-2 hasta Figura 12-16; se percibe que el relleno de
datos a partir de media para algunos meses es posible, pero que entre abril y septiembre la
desviación en los datos es demasiado elevada e inhabilita completamente el criterio, para
los otros meses disminuye de manera considerable, pero aun así la inferencia por media
solo parece ser viable para la presión media mensual, para los meses en los que el
coeficiente de variación es menor, entre octubre y marzo, se podría generar estimadores que
dependen de la media y un ruido con las mismas características de la desviación de la serie,
es probable que esto nos brinde mejores resultados.
- 248 -
13 AGRUPACIÓN DE ESTACIONES DE MEDICIÓN
USANDO EL MÉTODO DE CLÚSTER JERÁRQUICO.
Durante todo el proceso de investigación hasta este capítulo asumimos dos criterios para
agrupar estaciones meteorológicas, uno de ellos era la cercanía espacial y otro el
parentesco entre el clima de las regiones donde se situaban las estaciones meteorológicas,
pero en un país de tan grande superficie con estaciones de medición de variables
hidrometeorológicas dispersas se hace necesario trabajar con un criterio más objetivo.
Por esta razón proponemos la aplicación de un método que es muy utilizado para la
agrupación de vectores de datos que presentan características similares, el método Cluster
estandarizado nos permitió determinar grupos de estaciones meteorológicas en lo extenso
de todo el departamento de Cochabamba, posteriormente escogiendo uno de los grupos se
realizó el relleno de datos con los software HEC-4, CHAC y la aplicación del código R en
huecos de series de datos.
La variable que consideramos para los rellenos fue la precipitación total mensual y la
caracterización de las estaciones fue en relación de su posición geográfica, altitud y
precipitación media anual, todas estas características son estandarizadas por el modelo para
que se determine los grupos óptimos a partir del cálculo de la distancia euclidiana mínima.
13.1 Metodología
13.1.1 Muestreo
Se determinó que se debería partir de estaciones que tuvieran al menos diez años de
medición para que así se tenga una base confiable para realizar los rellenos, los software
utilizados obtienen sus generadores a partir de series de datos mensuales de medición y
para que puedan realizar inferencias coherentes y confiables requieren un mínimo de
insumos que debería ser mayor al de los diez años, lamentablemente en el territorio
cochabambino una gran mayoría de las estaciones no cuenta con esa cantidad mínima y
tuvieron que ser descartadas, la localización de las estaciones utilizadas está representada
en la Figura 13-1, y la numeración de las estaciones corresponde al código de identificación
asignado en la Tabla 13-1.
- 249 -
Tabla 13-1 Caracterización de la estaciones con al menos 10 años de observaciones disponibles de precipitación total
mensual que están localizadas dentro del departamento de Cochabamba.
COD E LS LO A MPTA
E Latitud Sud Longitud Oeste Altura Media Precipitación Total
Estación [º] [º] [msnm] Anual [mm]
1 Anzaldo 17.68 65.93 3032.00 607.8
2 Arani 17.57 65.75 2767.00 455.7
3 Capinota 17.70 66.26 2406.00 602.4
4 Chipiriri 16.87 65.48 260.00 4886.3
Cochabamba
5 Aeropuerto 17.42 66.34 2548.00 546.9
6 Colomi 17.34 65.87 3309.00 685.1
7 Cristal Mayu 17.01 65.64 517.00 4313.1
8 La Jota (Chimore) 17.00 65.17 254.00 4218.4
9 La Tamborada 17.45 66.14 2597.00 583.8
10 Misicuni 17.09 66.33 3793.00 712.8
11 Mizque 17.94 65.34 2045.00 565.9
12 Pairumani 17.37 66.32 2600.00 670.9
13 Parotani 17.57 66.34 2493.00 710.1
14 Puerto Villarroel 16.84 64.79 195.00 2319.0
15 Sacabamba 17.80 65.80 3174.00 8667.0
16 Santivañez 17.57 66.25 2554.00 558.3
17 Tarata 17.61 66.02 2775.00 687.7
18 Tiraque 17.43 65.72 3304.00 614.7
- 250 -
Figura 13-1 Localización de todas las estaciones de medición en el departamento de Cochabamba con más de 10 años
de registros de precipitación.
Latitud.
Longitud.
Altura sobre el nivel del mar.
Media del total de precipitación anual.
- 251 -
13.1.3 Evaluación
Se realizó la evaluación seleccionando uno de los grupos generados y aplicando 3 software
usados para el relleno de datos de precipitación: HEC-4, CHAC y la aplicación de relleno
de datos en el código R, se determinó si la agrupación de datos por Clúster jerárquico era
efectiva en base a los errores relativos a la observación obtenidos eliminado datos en
intervalos diferentes de tiempo y si su influencia determinaba la eficiencia en el relleno de
cada software.
13.2 Resultados
Agrupación de estaciones
seleccionada para la
evaluación
Estación seleccionada
para el relleno.
Figura 13-2 Resultados de la Agrupación Cluster estandarizada que nos sugiere distintas agrupaciones de estaciones
para distintos niveles de tolerancia.
Tabla 13-2 Grupos de estaciones de precipitación en Cochabamba determinados por el método de agrupación Cluster
para una distancia euclidiana estandarizada de 2.5.
- 252 -
13.2.1 Evaluación del error relativo a la observación estación Sacabamba
Hasta 10% de
observaciones
rellenadas
0.6
0.5
0.4 CHAC
HEC - 4
0.3
App R Code
0.2
0.1
0
Quitando 1 Mes Quitando 3 Mes Quitando 6 Mes Quitando 12 Mes
Figura 13-3 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel mensual
para la variable Precipitación total mensual con los distintos modelos después de haber generado un grupo a partir
del método Cluster.
El grupo obtenido a partir de la agrupación Cluster, permite que el programa HEC-4 y la aplicación
en R tengan resultados satisfactorios para todos los distintos escenarios de relleno, por otra parte el
desempeño con CHAC no ha mejorado, además se observa que la magnitud de los errores se
incrementa a medida que el número de datos faltantes se incrementa.
13.3 Conclusión
Después de haber realizado el relleno podemos observar en los resultados presentados en la
Figura 13-3, que el software CHAC no mejora su desempeño en el relleno de huecos de
series de precipitación, por otro lado la aplicación de relleno de datos en el código R
cuando se ha generado grupos con la técnica del Clúster Jerárquico nos da resultados muy
buenos y de una exactitud similar obtenida por el software HEC-4 que parece funcionar
bastante bien a pesar de no trabajar con las mejores agrupaciones de datos como se observó
en las pruebas anteriores.
Las agrupaciones generadas por el Método Clúster optimizan los procesos de relleno de
datos para dos de las metodologías estudiadas, el método se puede considerar como un
criterio objetivo para la agrupación de datos por que genera los grupos a partir de las
variables cualitativas.
- 253 -
13.3.1 Recomendaciones
Si se consigue tener estaciones cercanas con un buen número de datos medidos (al menos
mayores a diez años) se sugiere utilizar la agrupación Clúster que optimizan los procesos
de relleno desarrollados con los distintos programas para la variable precipitación total
mensual.
- 254 -
14 ANÁLISIS PARA LA SIMULACIÓN ESTOCÁSTICA DEL
ÍNDICE DE OSCILACIÓN DEL SUR
Los datos de esta variable fueron medidos desde el año 1951, aunque se tiene registros
previos de su afección, sobre distintas regiones de la tierra en términos cualitativos, de
todas formas el presente trabajo usa solo la información cuantitativa que se encuentra
disponible.
La Oscilación del Sur consiste en una fluctuación anual irregular a gran escala que refleja
un proceso de intercambio de masas en la atmosfera que se da entre Indonesia y la región
subtropical del Pacífico Sur, describe la variación de intensidad de los vientos alisios que
influyen directamente en los cambios de temperatura en el océano Pacífico.
El índice de Oscilación Sur es el índice operacional más usado para identificar las fases de
la Oscilación Sur, se determina a partir de la diferencia estandarizada entre las presiones
medias mensuales entre la región baja de Darwin (Pacífico Occidental) y la región alta de
Tahití (Pacífico Oriental-Central) y se suelen considerar como anomalías representativas
valores mayores a 0.5 ya sea negativos o positivos.
Cabe aclarar que no existe un solo IOS, sino 3 de los cuales derivan también otros índices,
los IOS varían en su formulación matemática y en el periodo de referencia para cuantificar
las anomalías (Díaz, 2008, págs. 87-89), particularmente trabajaremos con el IOS NOAA,
pero desarrollaremos conceptualmente los tres.
1. IOS NOAA: Utiliza una formula definida por el Centro de Predicción del Clima y el
Servicio Meteorológico de los Estados Unidos de América, ambos dependientes de
- 255 -
la institución NOAA (Administración Nacional del Océano y la Atmosfera) y es
usada por entidades en el Reino Unido y en Japón, variando simplemente su
periodo de referencia, el periodo de referencia con el que trabajamos es aquel
definido por el NOAA de los Estados Unidos.
El índice contiene una doble estandarización con el fin de garartizar que sea
considerado estacionario o sea que sus propiedades estadísticas se mantengan
constantes en el tiempo, tema que se discute durante el desarrollo del trabajo
posterior.
2. IOS Troup: Se calcula a partir de la fórmula de Troup, y es empleada en el Servicio
Meteorológico de Australia, para realizar la estandarización se emplea la
desviación estándar de la diferencia de las presiones.
3. IOS Trenberth: Se determina usando la fórmula que lleva el mismo nombre y es
empleada por la sección de Análisis Climático de la Universidad de Colorado en
Estados Unidos, se diferencia por que en lugar de usar la desviación estándar de las
series mensuales para la estandarización la realiza con la desviación estándar anual.
Ec. 14.1.1
Dónde:
Ec. 14.1.2
Las fases del IOS son: Una negativa caracterizada por el descenso de la presión atmosférica
en el sector oriental del océano Pacífico (IOS negativos, El niño) y otra positiva donde la
presión atmosférica del mismo sector incrementa (IOS positivo, La Niña).
Es de gran importancia estudiar el ciclo o en su defecto el índice por que las consecuencias
socioeconómicas de las perturbaciones climáticas asociadas con la variabilidad del ciclo
ENOS tienen la posibilidad de ser catastróficas para algunas regiones del mundo.
- 256 -
14.2 Procedimiento y Resultados
La serie temporal de IOS desde 1951 hasta 2016 es la presentada en la Figura 14-1, se trata
de los valores suavizados de las observaciones mensuales de la variación de precipitación
entre dos estaciones una en Darwin y la otra en Tahití.
En el presente trabajo se buscara pronosticar el IOS para los 45 años posteriores al 2016,
siempre y cuando se consiga representar esta variable de manera adecuada.
La prueba de raíz unitaria indica que el proceso es estacionario en media, y un valor del
estadístico de Durbin-Watson cercano a 2 nos indica que el proceso es estacionario en
media por ser un proceso independiente, ya que la prueba de Durbin-Watson es
originalmente la prueba de independencia de las series.
Tabla 14-1 Resultados de la prueba de Raíz unitaria para la determinación de la estacionaridad de la serie.
t-Statistic Prob.*
- 257 -
R-squared 0.259137 Mean dependent var 0.000380
Adjusted R-squared 0.256309 S.D. dependent var 0.807984
S.E. of regression 0.696786 Akaike info criterion 2.120372
Sum squared resid 381.6110 Schwarz criterion 2.144028
Log likelihood -833.5471 Hannan-Quinn criter. 2.129465
F-statistic 91.64168 Durbin-Watson stat 1.999659
Prob(F-statistic) 0.000000
Observado las funciones de auto correlación simple y parcial en la Figura 14-2 encontramos
que el proceso se considera estacionario en media porque ambas decaen rápidamente.
Figura 14-2 Funciones de autocorrelación simple y parcial con sus valores y niveles de significancia para el IOS.
- 258 -
No se puede aplicar un método estocástico de inferencia a un proceso no estacionario, por
otro lado se puede aplicar a las componentes del proceso si estas se consiguen
estacionarizar.
Los índices estacionales superan en creces el 10% de variación estacional y esto indica que
la descomposición multiplicativa es la más pertinente para descomponer la serie en estudio,
por otro lado los índices muestran también que la variación en la volatilidad de la serie es
enorme, y siendo un proceso estacionario en media esto fue un problema difícil de afrontar
durante la modelación, ya que la fuerte tendencia central de la serie, no permitió modelar
esas volatilidades tan elevadas solamente usando modelos estocásticos.
Tabla 14-2 Valores de los Índices Estaciones para cada mes de la serie.
Índice
Periodo Estacional
Enero 497.16
Febrero 448.38
Marzo 151.57
Abril 316.41
Mayo -124.51
Junio -172.58
Julio -189.35
Agosto -116.05
Septiembre 60.06
Octubre -113.81
Noviembre 127.01
Diciembre 315.72
Las componentes resultantes que quedan luego de la descomposición multiplicativa son las
siguientes:
- 259 -
Figura 14-3 Gráfico 14.2.3: Componente cíclica del Índice de Oscilación Sur entre 1950 y 2017.
Figura 14-4 Logarítmico de la componente cíclica del Índice de Oscilación Sur entre 1950 y 2017.
𝑌´𝑡 = log(𝑌𝑡 + 1)
- 260 -
30 años, el modelo encontrado como se observa en la Figura 14-4 es capaz de reproducir las
propiedades estadísticas de la componente cíclica, sus coeficientes y estadísticos están
detallados en la Tabla 14.2.3, los coeficientes adquieren valores representativos y los
niveles de significancia son tolerables.
Tabla 14-3 Valores de los estadísticos para cada coeficiente del modelo que ajusta a la componente cíclica de la serie
con sus respectivos estadísticos y niveles de significancia.
Un modelo autorregresivo de media móvil de memoria larga, donde todos los rezagos son
múltiplos de 12, esto significa que la correlación es elevada entre el pares de meses
distantes entre años, es curioso que un componente SAR(autorregresivo estacional), ajusta
de buena manera, esto quiere decir que a pesar de haber realizado la descomposición
estacional, esta no ha podido separar completamente la estacionalidad de la componente
cíclica, los niveles de significancia de los coeficientes autor regresivos, indican bondad de
ajuste, y el criterio de información de Akaike tabulado en la Tabla 14-3, es bastante bajo
corrobora el agotamiento de la información en la serie.
La Serie que nos queda luego de haber extraído la componente cíclica se encuentra
representada en la Figura 14-5 y esta debería tener al menos una componente estacional y
una aleatoria, esta serie es también conocida como razón media por medio móvil:
- 261 -
Figura 14-5 Serie resultante de la extracción de la componente cíclica del Índice de Oscilación Sur entre 1950 y 2017,
presenta la componente estacional y aleatoria para el mismo periodo.
Figura 14-6 Componente estacional del Índice de Oscilación Sur entre 1950 y 2017.
- 262 -
Efectivamente se consigue separar la componente estacional la cual se encuentra
representada en la Figura 14-6 del proceso, y viendo su amplitud confirmamos que la
volatilidad de la serie entre intervalos anuales es bástate elevada, este es un proceso que
rápidamente se consiguió simular con un proceso autor regresivo de media móvil, los
coeficientes, estadísticos y niveles de significancia se encuentran en la Tabla 14-3.
Tabla 14-4 Valores de los estadísticos para cada coeficiente del modelo que ajusta a la componente estacional de la
serie con sus respectivos estadísticos y niveles de significancia.
- 263 -
Figura 14-7 Componente aleatoria del Índice de Oscilación Sur entre 1950 y 2017.
Ante la dificultad de encontrar un modelo que simule la componente aleatoria del proceso
nos vimos obligados a recurrir al concepto de regresión para poder simular el ruido.
- 264 -
Figura 14-8 Relación entre la componente cíclica y aleatoria del Índice de Oscilación Sur entre 1950 y 2017.
Los resultados del modelo, obtenidos para la componente cíclica se presentan en la Figura
14-9 y como se puede observar los ciclos con extensiones de varios años se reproducen de
manera bastante eficaz:
Figura 14-9 Extensión de la componente cíclica del Índice de Oscilación Sur entre 1950 y 2017 hasta 2060.
- 265 -
Figura 14-10 Extensión de la componente estacional del Índice de Oscilación Sur entre 1950 y 2017 hasta 2060.
Los resultados del modelo obtenido para la componente aleatoria se presentan en la Figura
14-11, como se observa el ruido era bástate difícil de simular por que presentaba diferentes
tipos de volatilidad pero la relación entre las componentes aleatoria y cíclica permitió
generar un ruido que mantenga esas volatilidades en la serie generada:
Figura 14-11 Extensión de la componente aleatoria del Índice de Oscilación Sur entre 1950 y 2017 hasta 2060.
Los resultados son claros los modelos generados reproducen las propiedades estadísticas de
las componentes originales, para verificar de otra manera regeneraremos la serie
componente a componente, este proceso de regeneración se encuentra representado en las
Figuras Figura 14-12 y Figura 14-13.
- 266 -
14.3 Resultados de la simulación de las componentes Cíclica y Estacional
Se procede posteriormente a reconstituir al serie componente a componente, al observar la
Figura 14-12, encontramos que la combinación entre la componente cálcica y estacional
generadas por la simulación tiene características similares a esta componente de los datos
observados y por lo tanto se procede con la reconstitución.
Figura 14-12 Reconstitución del Índice de Oscilación Sur entre 1950 y 2017 hasta 2060, Componente Cíclica +
Componente Estacional.
- 267 -
Figura 14-13 Reconstitución del Índice de Oscilación Sur entre 1950 y 2017 hasta 2060, Componente Cíclica +
Componente Estacional + Componente Aleatoria.
Se logró valores sintéticos del Índice de Oscilación Sur, usando técnicas de tratamiento de
series temporales y estadística inferencial de manera que las predicciones mantienen las
propiedades estadísticas de la serie original, aspecto que se observa en la Figura 14-13.
Independientemente de cual sea la serie temporal parece que los modelos autorregresivos
de media móvil son buenos para simular las componentes cíclica y estacional como se
observa en las Figuras Figura 14-9 y Figura 14-10, por otro lado se encontró una tendencia
determinística entre la componente aleatoria y la cíclica que de no haber sido tan compleja
se podría haber simulado con algún método regresivo, aunque el procedimiento usado no
dista mucho de ello, este trabajo puede servir de ejemplo, para quienes desean simular
series no estacionarias, usando todos los modelos que tengan a su disposición y
combinándolos de manera coherente.
- 268 -
Figura 14-14 Contraste Empírico para el periodo comprendido entre Enero de 2007 y Diciembre de 2017.
14.5 Conclusión
El modelo reproduce los eventos niño y niña pero no con exactamente las mismas
intensidades de las mediciones, esto puede ser debido a que durante el contraste excluimos
10 años de datos de los 65 que se tenía registrados, y un solo ciclo de IOS es de casi 50
años por lo tanto se perdió bástate información para realizar dicha comprobación empírica.
Como se observa en la Figura 14-15, eso 10 años quitados para evaluar el desempeño del modelo
parecen determinantes a la hora de generar inferencias a corto o largo plazo del índice mencionado.
- 269 -
15 CONCLUSIONES GENERALES
15.1 Respecto al relleno de datos a nivel diario
Los resultados mostrados por CLIGEN nos muestran una relación entre la magnitud del
error cometido durante el relleno y el clima de la región para la época húmeda, mostrando
mayor error a medida que el clima se hace más frígido, en CLIMGEN no se observa de
manera clara ninguna relación, para la época seca, los programas rellenan mejor los valores
diarios de temperatura máxima y minina en el caso del clima templado.
Si una gran parte de los datos observados, presentan fallas durante el proceso de
medición afectaran, directamente a las propiedades estadísticas de la serie, por lo
que un control de calidad del proceso de medición es imprescindible.
La prueba de Grubbs & Beck es bastante buena construyendo umbrales que separan
datos anómalos de una serie temporal, siempre y cuando esta tenga una tendencia
central definida.
- 270 -
El método Cluster de agrupación de conjuntos de datos es un método objetivo, que
trabaja con variables cuantitativas que permite definir grupos óptimos para
posteriormente aplicar métodos para el relleno de datos faltantes.
El software de relleno de datos HEC-4, produce resultados mejores que CHAC para
la época húmeda del año, durante el relleno de datos a través de la desagregación
mensual diaria a partir de estaciones vecinas con elevada correlación a nivel
- 271 -
mensual para la época húmeda del año, para la época seca el desempeño de ambos
es similar y no existe discrepancias entre usar uno u otro.
El desempeño de los software HEC-4 y CHAC, se ve afectado por la cantidad de
datos que se pretende rellenar, para la variable precipitación total mensual, mientras
más datos se rellena se produce un incremento de la media de los errores.
Si se rellena dos series con la misma cantidad de datos faltantes, en una con datos
consecutivos y en otra de datos aleatoriamente distribuidos se produce mayor error
cuando los datos son consecutivos, para ambos software HEC-4 y CHAC, esta
característica no se percibe para el relleno de datos durante la época seca ya que
existe una gran cantidad de valores nulos.
Los software de relleno de datos HEC-4 y CHAC durante el proceso de
desagregación mensual –diaria tienen mejores resultados con estaciones de las
regiones del altiplano y los valles, porque las estaciones vecinas a la estación que se
desea rellenar son más próximas y con mayor correlación.
Los generadores estocásticos de clima producen rellenos de datos diarios de
precipitación deficientes, en contraste con la metodología de desagregación
mensual diaria, a partir de estaciones vecinas con correlación elevada a nivel
mensual.
Los generadores estocásticos de clima CLIGEN y CLIMGEN son bastante
eficientes, para inferir y rellenar vacíos correspondientes a las variables temperatura
máxima y mínima a nivel diario.
El resultado de los rellenos a nivel diario de los generadores estocásticos de clima
para las variables temperatura máxima y mínima no depende del orden o
aleatoriedad de los datos faltantes, pero sí de la cantidad de datos por rellenar.
Los modelos estocásticos ARIMA son bastante eficientes en el relleno de datos de
series de variables de corta extensión, produciendo errores relativos mínimos en
relación a la poca cantidad de datos que necesitan para realizar sus inferencias.
Comparando los rellenos generados entre los modelos ARIMA, el software HEC-4
y la aplicación de relleno de datos en el código R se determinó que el más eficiente
es HEC-4 pero que los modelos ARIMA generan resultados similares con una
cantidad de datos menor.
La inferencia de datos faltantes, a través de la media de las observaciones mensuales
de las variables hidrometeorológicas, parece ser deficiente excepto, para una
variable con muy poca volatilidad como la presión atmosférica.
Para la variable Precipitación Total a nivel mensual los resultados obtenidos con los
generadores estocásticos de clima también ese encuentra dentro de rangos tolerables de
error relativo y parecen ser una buena alternativa a los programas que trabajan a partir de la
correlación entre estaciones vecinas, si es que no se cuenta con estaciones cercanas a
aquella que se desea rellenar y se cuenta con suficientes datos.
- 272 -
15.6 Esquema Conclusivo
Esquematizamos las conclusiones anteriores para poder aplicar rellenos de datos y mensual
a partir de las diferentes herramientas computacionales estudiadas:
Metodología
Variable HEC-4 CHAC CLIGEN CLIMGEN WGEN ARIMA
Buen
desempeño Desempeño Desempeño
Desempeño
cuando los limitado, deficiente debido
Errores relativos regular,
datos presenta a que las series de
demasiado elevados, los errores
faltantes no resultados precipitación a
Precipitación rellenos no dependen de relativos
son similares a nivel diario tienen
Total la cantidad de datos menores a
consecutivos los de HEC- demasiados
faltantes consecutivos los de
durante la 4 durante la valores nulos y no
que exista. CLIGEN Y
época seca y época seca son procesos
CLIMGEN.
húmeda del del año. estacionarios.
año.
Buen desempeño, errores
Deficiente,
relativos bajos, la
magnitud
magnitud de los errores
Temperatura de errores
no depende ni de la
Máxima relativos
cantidad de datos
demasiado
faltantes ni de si estos
elevada.
son o no consecutivos.
No Evaluado. No Evaluado.
Buen desempeño, errores
Deficiente,
relativos bajos, la
magnitud
magnitud de los errores
Temperatura de errores
no depende ni de la
Mínima relativos
cantidad de datos
demasiado
faltantes ni de si estos
elevada.
son o no consecutivos.
Figura 15-1 Resumen de aplicaciones posibles para el relleno de datos a nivel diario.
- 273 -
Metodología
Variable
HEC-4 APP R-CODE ARIMA
Bajo Buen
desempeño, desempeño,
Desempeño óptimo, la errores errores
distancia entre estaciones relativos relativos
no parece influir, es obtenidos bajos, es
Evaporación determinante solo la durante el aconsejable
Total correlación a nivel relleno de cuando se
mensual. magnitud tiene poca
demasiado información
elevada. disponible.
Desempeño
superior, las
series aunque
no sean
procesos
Errores
Buen desempeño, errores estacionarios,
relativos
relativos bajos a pesar de pero
demasiado
que ciertas estaciones se reducibles a
elevados, no es
encuentren bastante series
aconsejable su
Magnitud de alejadas. estacionarias
aplicación.
Velocidad de por los
Viento Media métodos
propuestos
en al
metodología.
Buen
desempeño,
Desempeño óptimo, la Desempeño errores
distancia entre estaciones regular, se ve relativos
Cantidad de no parece influir, es afectado por la bajos, es
Horas de Sol determinante solo la distancia entre aconsejable
por día correlación a nivel estaciones cuando se
mensual. vecinas. tiene poca
información
disponible.
Buen
desempeño,
errores
relativos
bajos, es
No Evaluado.
Temperatura aconsejable
Media cuando se
tiene poca
información
disponible.
- 274 -
Buen
desempeño,
debido a que
Presión el proceso ese
Atmosférica estacionario,
Media o reducible a
un proceso
estacionario.
Buen
desempeño,
debido a que
Humedad el proceso ese
Relativa estacionario,
o reducible a
un proceso
estacionario.
Figura 15-2 Resumen de aplicaciones posibles para el relleno de datos a nivel mensual.
- 275 -
16 RECOMENDACIONES
- 276 -
17 BIBLIOGRAFIA
Esquivel, G., Cerrano, J., Sánchez, I., Lopez, A., & Gutierrez, O. (2015). Validación del
Modelo CLIMGEN en las estaciones de variables de clima ante escenarios de datos
faltantes con fines de modelación de procesos.
Franzke, C. L., O’Kane, T. J., Berner, J., Williams, P. D., & Lucarini, V. (2014). Stochastic
Climate Theory and Modelling.
Franzke, C., O’Kane, T., Berner, J., Williams, P., & Lucarini, V. (2014). Stochastic
Climate Theory and Modelling.
Kaenel, M., & Depsky, N. (2016). Filling Missing Data in Climatological Time-Series. 2.
Kirkut, A. C., Muños, E., & CarlosQuirós, J. (2002). Aspectos Conceptuales sobre Series
Temporales.
Liu, L.-M., & Hadak, G. B. (1992). Forecasting and Time Series Analysis using SCA
STATISTICAL SYSTEM.
Nicks, A., Jane, L., & Gander, G. (1995). WEPP Model Documentation Chapter 2
WEATHER GENERATOR.
Programa de las Naciones Unidas para el Desarrollo. (2013). Tras las huellas del Cambio
Climático.
Richardson, C., & Wright, D. (1984). Variables WGEN: A Model for Generating Daily
Weather.
Valverde, K., Salas, M., & Solano, Q. (2002). Aspectos Conceptuales sobre Series de
Tiempo.
Villazón, & Vallejos. (n.d.). Application of the WetSpa model to the Taquiña catchment
with low quality data, Cochabamba, Bolivia. 2007.
Villazón, M., & Medrano, S. C. (2015). Relleno de datos faltantes de precipitación para su
aplicación en modelos de simulación hidroloógica. Caso de Estudio: pilcomayo-
Bolivia.