Análisis de Modelos Estadísticos y Estocásticos Aplicados A La Predicción y Completado de Datos Faltantes de Series Hidrometeorológicas Relevantes para El Diseño Hidráulico e Hidrológico.

UNIVERSIDAD MAYOR DE SAN SIMÓN
FACULTAD DE CIENCIAS Y TECNOLOGÍA

CARRERA DE LICENCIATURA EN INGENIERIA CIVIL
ANÁLISIS DE MODELOS ESTADÍSTICOS Y ESTOCÁSTICOS

APLICADOS A LA PREDICCIÓN Y COMPLETADO DE DATOS
FALTANTES DE SERIES HIDROMETEOROLÓGICAS
RELEVANTES PARA EL DISEÑO HIDRÁULICO E HIDROLÓGICO.
Proyecto de grado, Presentado para optar al Diploma académico de
Licenciatura en Ingeniería Civil.
Presentado por: MARTÍN IGNACIO ESCOBAR CABRERA.
Tutor: Ing. Msc. Roberto Méndez Torrico.
Cochabamba – Bolivia
Octubre, 2017
DEDICATORIA
A mis padres Hernán Antonio Escobar Gómez Y Elva Ruth Cabrera

Flores, por haber establecido las condiciones para que yo pudiera
realizar este trabajo, sin su motivación no hubiera podido realizarse.
De manera más racional y menos sentimentalmente, debo dedicar

este trabajo a todos los profesionales que de una o de otra manera
trabajan en proyectos relacionados con los recursos hídricos, y
también a todos aquellos que creen en el valor de la experiencia para
el conocimiento.
AGRADECIMIENTOS
A mis padres por haber invertido sus recursos y esfuerzos para que
pudiera estudiar y trabajar siempre de la manera más cómoda que
fuera posible.
A los docentes que contribuyeron en la construcción de este trabajo,

a Roberto Méndez y a Galo Muñoz, por haberme dado la libertad de
plantearlo como yo quisiera, a Mauricio Villazón por mostrarme las
diferencias que hay entre los trabajos en diferentes niveles
académicos, y especialmente a Luis Edgar Montenegro, cuyas
observaciones y sugerencias durante el proceso de revisión de este
trabajo, produjeron incontables cambios en un sentido positivo para
que este pueda efectuarse dirigido bajo el ideal científico.
¡Muchas Gracias!
FICHA RESUMEN
El presente trabajo pretende afrontar un tema que si bien no es

novedoso, es uno de esos temas sobre los cuales siempre habrá algo
que hacer y algo que decir, la importancia de los datos y su calidad es
algo indiscutible y por esta razón el fin de todo el estudio era
determinar la eficiencia de diferentes metodologías para el relleno de
datos faltantes de series hidrometeorológicas, con ese propósito
estudiamos los diferentes métodos de relleno que se emplean en la
actualidad y también planteamos como alternativa otros, Modelos
Estocásticos Univariantes, Generadores Estocásticos de Clima y
programas de relleno de observaciones faltantes a partir de la
correlación existente entre estaciones vecinas, son evaluados para
determinar cuáles son más eficientes para rellenar cada una de las
variables estudiadas.
Contenido
1 INTRODUCCION A LA TESIS. ........................................................................................... - 1 -
2 ASPECTOS PRELIMINARES ............................................................................................... - 6 -
2.1 ANTECEDENTES.......................................................................................................... - 6 -
2.2 PROBLEMA ................................................................................................................... - 6 -
2.3 JUSTIFICACIÓN ........................................................................................................... - 6 -
2.4 LIMITACIONES DEL ESTUDIO ................................................................................. - 7 -
3 OBJETIVOS ........................................................................................................................... - 8 -
3.1 Objetivo General ............................................................................................................. - 8 -
3.2 Objetivos Específicos ...................................................................................................... - 8 -
4 METODOLOGÍA GENERAL................................................................................................ - 9 -
4.1 Muestras .......................................................................................................................... - 9 -
4.2 Determinación previa de anomalías en los datos ............................................................ - 9 -
4.3 Proceso experimental ...................................................................................................... - 9 -
5 CONSIDERACIONES TEORICAS PRELIMINARES ....................................................... - 11 -
5.1 Fenómenos Meteorológicos .......................................................................................... - 11 -
5.2 Variables básicas y relevantes para el Diseño Hidrológico e Hidráulico ...................... - 11 -
5.2.1 Precipitación.......................................................................................................... - 11 -
5.2.2 Temperatura .......................................................................................................... - 12 -
5.2.3 Evaporación........................................................................................................... - 12 -
5.2.4 Presión atmosférica ............................................................................................... - 12 -
5.2.5 Humedad Relativa ................................................................................................. - 12 -
5.2.6 Velocidad del Viento............................................................................................. - 12 -
5.2.7 Horas de Sol por día .............................................................................................. - 13 -
5.3 Términos y Conceptos básicos usados en el estudio ..................................................... - 13 -
5.3.1 Población ............................................................................................................... - 13 -
5.3.2 Parámetro .............................................................................................................. - 13 -
5.3.3 Muestras ................................................................................................................ - 13 -
5.3.4 Estadístico ............................................................................................................. - 14 -
5.3.5 Estimador .............................................................................................................. - 14 -
5.3.6 Variable ................................................................................................................. - 14 -
5.3.7 Error ...................................................................................................................... - 14 -
5.3.8 Error Muestral ....................................................................................................... - 14 -
5.3.9 Serie ...................................................................................................................... - 14 -
5.3.10 Distribución de Frecuencia ................................................................................... - 15 -
5.4 Descripción y formulación de los parámetros y estadísticos muéstrales ..................... - 15 -
5.4.2 Definición de Clase ............................................................................................... - 17 -
5.4.3 Probabilidad .......................................................................................................... - 17 -
5.5 Modelos Probabilísticos ................................................................................................ - 17 -
5.5.1 Representación de los datos muéstrales ................................................................ - 17 -
5.5.2 Distribución de Probabilidad................................................................................. - 17 -
5.5.3 Otros Parámetros Estadísticos de Relevancia ....................................................... - 18 -
5.5.4 Modelos Regresivos: Regresión Lineal Y Regresión No Lineal .......................... - 19 -
5.6 Autocorrelación ............................................................................................................. - 24 -
5.7 Prueba Durbin-Watson .................................................................................................. - 24 -
5.8 Análisis de Correlación ................................................................................................. - 25 -
5.9 Coeficiente de Determinación ....................................................................................... - 26 -
5.10 Análisis de series temporales ........................................................................................ - 26 -
5.10.1 Componentes de las series temporales .................................................................. - 26 -
5.10.2 Proceso estocástico temporal ................................................................................ - 28 -
5.10.3 Proceso Estacionario ............................................................................................. - 30 -
5.10.4 Procesos No Estacionarios .................................................................................... - 30 -
5.11 Modelos Univariantes ................................................................................................... - 31 -
5.11.1 Construcción de un Modelo Univariante .............................................................. - 31 -
5.11.2 Proceso Estocástico Estacionario en Media .......................................................... - 31 -
5.11.3 Proceso Estacionario en Autocovarianza .............................................................. - 31 -
5.11.4 Función de Autocorrelación Simple ...................................................................... - 32 -
5.11.5 Función de Autocorrelación Parcial ...................................................................... - 32 -
5.11.6 Ruido Blanco......................................................................................................... - 33 -
5.12 Modelos aplicados a Series Estacionarias ..................................................................... - 33 -
5.12.1 Modelos Autorregresivos AR(p) ........................................................................... - 33 -
5.12.2 Modelos De Medias móviles MA(q) ..................................................................... - 34 -
5.12.3 Modelos Autorregresivos de Media Movil ARMA(p,q) ....................................... - 34 -
5.13 Modelos Aplicados a series No Estacionarias............................................................... - 35 -
5.13.1 Estacionariedad en Varianza ................................................................................. - 35 -
5.13.2 Transformación Box Cox ...................................................................................... - 36 -
5.13.3 Estacionariedad en Media ..................................................................................... - 37 -
5.13.4 Modelo Autoregresivo Integrado de Media Móvil ARIMA (p,d,q)...................... - 38 -
5.13.5 Selección del Modelo ............................................................................................ - 38 -
5.13.6 Diagnosis ............................................................................................................... - 38 -
5.14 Identificación de valores anómalos en las series temporales Prueba de Grubbs & Beck
para la detección de datos anómalos ......................................................................................... - 39 -
5.15 Método Aglomerativo de agrupación de datos: Clúster Jerárquico .............................. - 39 -
6 DESCRIPCIÓN RESUMIDA DE LOS PROGRAMAS COMPUTACIONALES
UTILIZADOS ............................................................................................................................... - 41 -
6.1 HEC-4 ........................................................................................................................... - 41 -
6.1.1 Método de Cómputo.............................................................................................. - 41 -
6.1.2 Entrada de Datos ................................................................................................... - 42 -
6.1.3 Datos de Salida...................................................................................................... - 44 -
6.2 CHAC............................................................................................................................ - 44 -
6.2.2 Datos de Entrada ................................................................................................... - 46 -
6.2.3 Salida de Datos...................................................................................................... - 46 -
6.3 Aplicación de relleno de Datos Faltantes en el Código R ............................................. - 46 -
6.3.2 Datos de entrada .................................................................................................... - 47 -
6.3.3 Salida de Datos...................................................................................................... - 47 -
6.4 CLIGEN ........................................................................................................................ - 47 -
6.4.2 Datos de entrada .................................................................................................... - 49 -
6.4.3 Salida de Datos...................................................................................................... - 49 -
6.5 CLIMGEN .................................................................................................................... - 49 -
6.5.2 Datos de Entrada ................................................................................................... - 50 -
6.5.3 Salida de Datos...................................................................................................... - 50 -
6.6 WGEN........................................................................................................................... - 50 -
6.6.2 Datos de Entrada ................................................................................................... - 51 -
6.6.3 Salida de Datos...................................................................................................... - 52 -
6.7 EVIEWS9...................................................................................................................... - 52 -
6.7.2 Datos de entrada .................................................................................................... - 54 -
6.7.3 Salida de Datos...................................................................................................... - 54 -
7 EVALUACIÓN PRELIMINAR DE LOS MODELOS ARIMA .......................................... - 55 -
7.1 Metodología .................................................................................................................. - 55 -
7.1.1 Muestreo de los Datos ........................................................................................... - 55 -
7.1.2 Procedimiento ....................................................................................................... - 58 -
7.2 Resultados por Variables............................................................................................... - 59 -
7.2.1 HUMEDAD RELATIVA [%] .............................................................................. - 59 -
7.2.2 PRESIÓN ATMOSFÉRICA [HPA] ..................................................................... - 80 -
7.2.3 TEMPERATURA [ºC] .......................................................................................... - 98 -
7.2.4 EVAPORACIÓN [mm] ...................................................................................... - 121 -
7.2.5 PRECIPITACIÓN [mm] ..................................................................................... - 145 -
7.3 Resumen de Resultados............................................................................................... - 164 -
7.4 Conclusiones Preliminares .......................................................................................... - 166 -
7.5 Recomendaciones........................................................................................................ - 172 -
8 COMPARACIÓN ENTRE LA EFICIENCIA DE INFERENCIA USANDO LOS MODELOS
ARIMA ENTRE DISTINTAS VARIABLES EN INTERVALOS MENSUALES USANDO EL
SOFTWARE EVIEWS9. ............................................................................................................ - 174 -
8.1 Metodología ................................................................................................................ - 174 -
8.1.1 Muestreo.............................................................................................................. - 174 -
8.1.2 Supresión de datos mensuales para el relleno de datos ....................................... - 176 -
8.1.3 Metodología Box-Jenkings ................................................................................. - 177 -
8.2 Resultados ................................................................................................................... - 178 -
8.3 Resultados por Variables............................................................................................. - 181 -
8.4 Conclusiones ............................................................................................................... - 182 -
9 COMPARACIÓN DE LA EFICIENCIA DE DESAGREGACIÓN MENSUAL-DIARIA A
PARTIR DE LA INFORMACIÓN DE ESTACIONES VECINAS ENTRE LOS SOFTWARE DE
MODELACIÓN ESTADÍSTICA HEC-4 Y CHAC PARA LA VARIABLE PRECIPITACIÓN
DIARIA. ...................................................................................................................................... - 183 -
9.1 Metodología ................................................................................................................ - 183 -
9.1.1 Selección de Estaciones ...................................................................................... - 183 -
9.1.2 Supresión Intencional de observaciones para evaluar empíricamente los resultados de
la desagregación .................................................................................................................. - 186 -
9.1.3 Aplicación del Software HEC-4 .......................................................................... - 187 -
9.1.4 Aplicación del Software CHAC .......................................................................... - 188 -
9.1.5 Evaluación ........................................................................................................... - 188 -
9.2 RESULTADOS OBTENIDOS ................................................................................... - 189 -
9.3 Conclusiones ............................................................................................................... - 196 -
10 COMPARACIÓN DE LA EFICIENCIA EN EL RELLENO DE DATOS DIARIO
USANDO LOS GENERADORES ESTOCÁSTICOS DE CLIMA CLIGEN, CLIMGEN Y WGEN -
198 -
10.1 Metodología ................................................................................................................ - 198 -
10.1.1 Selección de los datos ......................................................................................... - 198 -
10.1.2 Supresión Intencional de observaciones para evaluar el relleno de datos .......... - 199 -
10.1.3 Aplicación del programa computacional CLIGEN ............................................. - 200 -
10.1.4 Aplicación del programa computacional CLIMGEN ......................................... - 201 -
10.1.5 Aplicación programa computacional WGEN ..................................................... - 202 -
10.1.6 Evaluación ........................................................................................................... - 203 -
10.2 Resultados ................................................................................................................... - 204 -
10.2.1 Precipitación Total Diaria ................................................................................... - 204 -
10.2.2 Temperatura Máxima .......................................................................................... - 208 -
10.2.3 Temperatura Mínima ........................................................................................... - 212 -
10.2.4 Prueba adicional .................................................................................................. - 216 -
10.2.5 Resumen de Resultados....................................................................................... - 217 -
10.3 Conclusiones ............................................................................................................... - 220 -
11 COMPARACIÓN ENTRE EL RELLENO MENSUAL ENTRE LOS MODELOS ARIMA,
HEC – 4 Y LA APLICACIÓN DE RELLENO DE DATOS EN EL CÓDIGO R ..................... - 221 -
11.1 Metodología ................................................................................................................ - 222 -
11.1.1 Muestreo.............................................................................................................. - 222 -
11.1.2 Procedimiento ..................................................................................................... - 226 -
11.1.3 Evaluación ........................................................................................................... - 227 -
11.2 Resultados ................................................................................................................... - 227 -
11.2.1 Magnitud de Velocidad de Viento Media Mensual............................................ - 227 -
11.2.2 Media Mensual de la cantidad Horas de sol por día........................................... - 229 -
11.2.3 Evaporación Total Mensual ................................................................................ - 231 -
11.2.4 Precipitación Total Mensual................................................................................ - 233 -
11.2.5 Relación entre el Error y el Número de datos de entrada para los distintos Modelos
por variables ........................................................................................................................ - 235 -
11.3 Conclusiones ............................................................................................................... - 237 -
12 RELLENO DE OBSERVACIONES FALTANTES USANDO LA MEDIA DE LOS
DATOS FALTANTES EN INTERVALOS MENSUALES DE VARIABLES CLIMÁTICAS - 238
-
12.1 Metodología ................................................................................................................ - 238 -
12.1.1 Muestreo.............................................................................................................. - 238 -
12.1.2 Evaluación ........................................................................................................... - 240 -
12.2 Resultados ................................................................................................................... - 240 -
12.2.1 Evaporación Total Mensual ................................................................................ - 240 -
12.2.2 Humedad Relativa Media Mensual ..................................................................... - 242 -
12.2.3 Precipitación Total Mensual................................................................................ - 244 -
12.2.4 Presión Atmosférica Media Mensual .................................................................. - 245 -
12.2.5 Temperatura Media Mensual .............................................................................. - 247 -
12.3 Conclusión .................................................................................................................. - 248 -
13 AGRUPACIÓN DE ESTACIONES DE MEDICIÓN USANDO EL MÉTODO DE
CLÚSTER JERÁRQUICO. ........................................................................................................ - 249 -
13.1 Metodología ................................................................................................................ - 249 -
13.1.1 Muestreo.............................................................................................................. - 249 -
13.1.2 Forma de Implementación................................................................................... - 251 -
13.1.3 Evaluación ........................................................................................................... - 252 -
13.2 Resultados ................................................................................................................... - 252 -
13.2.1 Evaluación del error relativo a la observación estación Sacabamba ................... - 253 -
13.3 Conclusión .................................................................................................................. - 253 -
13.3.1 Recomendaciones ................................................................................................ - 254 -
14 ANÁLISIS PARA LA SIMULACIÓN ESTOCÁSTICA DEL ÍNDICE DE OSCILACIÓN
DEL SUR .................................................................................................................................... - 255 -
14.1 Descripción del Fenómeno .......................................................................................... - 255 -
14.2 Procedimiento y Resultados ........................................................................................ - 257 -
14.3 Resultados de la simulación de las componentes Cíclica y Estacional ....................... - 267 -
14.4 Resultados de la simulación de la Serie IOS = Componente Cíclica, Estacional y Aleatoria
- 267 -
14.5 Conclusión .................................................................................................................. - 269 -
15 CONCLUSIONES GENERALES .................................................................................. - 270 -
15.1 Respecto al relleno de datos a nivel diario .................................................................. - 270 -
15.2 Control de calidad de datos durante los rellenos ......................................................... - 270 -
15.3 Agrupación de estaciones para efectuar rellenos de datos ......................................... - 270 -
15.4 Rellenos e inferencias utilizando los modelos ARIMA .............................................. - 271 -
15.5 Rellenos e inferencias utilizando programas computacionales especializados ........... - 271 -
15.6 Esquema Conclusivo ................................................................................................... - 273 -
16 RECOMENDACIONES ................................................................................................. - 276 -
Índice de Tablas
Tabla 5-1 Características de los procesos estocásticos estacionarios y patrones de identificación para la
aplicación de los modelos. ..................................................................................................................... - 35 -
Tabla 7-1 Estaciones muestreadas clasificadas por las variables en las que se aplicó el relleno de datos
faltantes y las extensiones a corto plazo. .............................................................................................. - 56 -
Tabla 7-2 Resumen de los resultados obtenidos en el relleno de distintas variables con los modelos ARIMA.
............................................................................................................................................................. - 165 -
Tabla 8-1 Estaciones muestreadas clasificadas por las variables en las que se aplicó el relleno de datos
faltantes usando los modelos ARIMA. ................................................................................................. - 175 -
Tabla 9-1 Estaciones pertenecientes a tres climas diferentes de nuestro país en las cuales se efectuó relleno
de datos faltantes con los programas computacionales HEC-4 y CHAC. ............................................. - 183 -
Tabla 10-1 Estaciones utilizadas `para el relleno de datos faltantes con los generadores estocásticos de clima.
............................................................................................................................................................. - 198 -
Tabla 11-1 Grupos de estaciones donde se aplicó el relleno de datos faltantes usando los modelos
estocásticos ARIMA, el software HEC-4 y la aplicación de relleno de datos en el código R para la variable
Magnitud de Velocidad de Viento Media............................................................................................ - 222 -
Horas de Sol por día a nivel medio. ...................................................................................................... - 223 -
Evaporacion Total. ............................................................................................................................... - 224 -
Tabla 12-1 Estaciones donde se determinó el coeficiente de variación a nivel mensual clasificadas por
variables hidrometeorológicas............................................................................................................. - 238 -
Tabla 13-1 Caracterización de la estaciones con al menos 10 años de observaciones disponibles de
precipitación total mensual que están localizadas dentro del departamento de Cochabamba. ......... - 250 -
Tabla 13-2 Grupos de estaciones de precipitación en Cochabamba determinados por el método de
agrupación Cluster para una distancia euclidiana estandarizada de 2.5. ........................................... - 252 -
Tabla 14-1 Resultados de la prueba de Raíz unitaria para la determinación de la estacionaridad de la serie.
............................................................................................................................................................. - 257 -
Tabla 14-2 Valores de los Índices Estaciones para cada mes de la serie. ............................................ - 259 -
Tabla 14-3 Valores de los estadísticos para cada coeficiente del modelo que ajusta a la componente cíclica de
la serie con sus respectivos estadísticos y niveles de significancia. .................................................... - 261 -
Tabla 14-4 Valores de los estadísticos para cada coeficiente del modelo que ajusta a la componente
estacional de la serie con sus respectivos estadísticos y niveles de significancia. .............................. - 263 -
Índice de Figuras
Figura 1-1 Criterios para la adopción de una metodología para el relleno de datos faltantes. .............. - 2 -
Figura 1-2 Software utilizado en función de la metodología y los intervalos temporales de relleno…...-2 -
Figura 1-3 Experimentos o pruebas realizadas y su finalidad. ................................................................... -3-
Figura 1-4 Variables trabajadas en cada experimento. ............................................................................. -5-
Figura 5-1 Distribuciones de probabilidad, discreta y continua (Webster, 2001, pág. 133). ................. - 18 -
Figura 5-2 Tipos de tendencias determinísticas de una variable, el recuadro a) nos muestra una relación
lineal positiva, el b) una relación lineal negativa; el c) una relación curvilínea positiva y el d) una relación
curvilínea negativa (Webster, 2001, pág. 326). ..................................................................................... - 20 -
Figura 5-3 Diagrama de dispersión de variables independientes (Webster, 2001, pág. 346). .............. - 21 -
Figura 5-4 Gráfica de los errores o residuales entre los modelos de regresión y los datos observados
(Webster, 2001, pág. 339). .................................................................................................................... - 24 -
Figura 5-5 Límites para d que establecen la condición de autorrelación para una variable. ................ - 25 -
Figura 5-6 Proceso de separación de una serie temporal en sus componentes. .................................... - 28 -
Figura 5-7 Tres realizaciones posibles para un mismo proceso estocástico (Mauricio, 2007, pág. 10). - 29 -
Figura 5-8 PANEL A, representación de un proceso estocástico antes y después de la simulación, PANEL B,
representación de las componentes de un proceso estocástico antes y después de su simulación
independiente (Mauricio, 2007, pág. 41) . ............................................................................................. - 30 -
Figura 5-9 Distinción del tipo de modelos a aplicar sobre algunos procesos estocásticos, se muestra las
funciones de auto correlación simple y parcial para los distintos procesos y como estas nos ayudan a
identificar el tipo de modelo a seleccionar (Mauricio, 2007, pág. 73). .................................................. - 33 -
Figura 5-10 Representación de un proceso estocástico con más de una volatilidad (Mauricio, 2007, pág. 84).
............................................................................................................................................................... - 36 -
Figura 5-11 Diferencia entre una serie de datos y su posterior aplicación de una transformación para
conseguir estacionarizarla (Mauricio, 2007, pág. 85). ........................................................................... - 37 -
Figura 5-12 Trasformaciones sobre la serie volátil, panel A (trasformación Box Cox), panel B (trasformación
Box Cox + primera diferencia) (Mauricio, 2007, pág. 94). ..................................................................... - 38 -
Figura 6-1 Esquema del proceso de relleno de datos con el software CHAC.. ....................................... - 46 -
Figura 6-2 Esquema del proceso de relleno de datos con el software CLIGEN. ..................................... - 49 -
Figura 6-3 Enfoque de la metodológica BOX JENKINS para la generación de valores sintéticos a partir de
series temporales. .................................................................................................................................. - 54 -
Figura 7-1 Mapa con la ubicación geográfica de las estaciones, la variable de relleno y el código de cada
estación. ................................................................................................................................................. - 57 -
Figura 7-2 Procedimiento realizado para el relleno de datos con los modelos ARIMA para diferentes variables
hidrometeorológicas. ............................................................................................................................. - 59 -
Figura 7-3 Humedad Relativa a nivel mensual en Collana en [%], a) Original, Serie de datos medida, b) serie
de datos Completada y Extendida. ........................................................................................................ - 60 -
Figura 7-4 Humedad Relativa a nivel mensual en Independencia en [%], a) Original, Serie de datos medida, b)
Completada, Serie de datos completada. .............................................................................................. - 63 -
Figura 7-5 Humedad Relativa a nivel mensual en Culpina en [%], a) Original, Serie de datos medida, b)
Completada y Extendida, Serie de datos completada y extendida. ....................................................... - 68 -
Figura 7-6 Humedad Relativa a nivel mensual en Achiri en [%], a) Original, Serie de datos medida, b)
Figura 7-7 Humedad Relativa a nivel mensual en Cobija en [%], a) Original, Serie de datos medida, b)
Corregida, Serie de datos corregida usando el criterio de Grubbs & Beck, c) Completada, Serie de datos
rellenada. ............................................................................................................................................... - 74 -
Figura 7-8 Presión atmosférica a nivel mensual en Cochabamba Aeropuerto en [HPA], a) Original, Serie de
datos medida, b) Corregida, Serie de datos corregida usando el criterio de Grubbs & Beck, c) Completada y
Extendida, Serie de datos rellenada y extendida. .................................................................................. - 82 -
Figura 7-9 Presión atmosférica a nivel mensual en Trinidad en [HPA], a) Original, Serie de datos medida, b)
Corregida, Serie de datos corregida usando el criterio de Grubbs & Beck c) Completada y Extendida, Serie de
datos rellenada y extendida................................................................................................................... - 85 -
Figura 7-10 Presión atmosférica a nivel mensual en Sucre en [HPA], a) Original, Serie de datos medida, b)
Completada, Serie de datos rellenada y extendida. ............................................................................... - 87 -
Figura 7-11 Presión atmosférica a nivel mensual en Concepción en [HPA], a) Original, Serie de datos medida,
b) Extendida, Serie de datos extendida. ................................................................................................. - 88 -
Figura 7-12 Presión atmosférica a nivel mensual en Rurrenabaque en [HPA], a) Original, Serie de datos
medida, b) Corregida, Serie de datos corregida usando el criterio de Grubbs & Beck, c) Completada, Serie de
datos rellenada y extendida................................................................................................................... - 91 -
Figura 7-13 Temperatura a nivel mensual en La Tamborada en [ºC], a) Original, Serie de datos medida, b)
Figura 7-14 Temperatura a nivel mensual en Entre Ríos en [ºC], a) Original, Serie de datos medida, b)
Completada y Extendida, Serie de datos rellenada y extendida. ......................................................... - 102 -
Figura 7-15 Temperatura a nivel diario en Mizque en [ºC], a) Original, Serie de datos medida, b) Completada,
Serie de datos rellenada....................................................................................................................... - 107 -
Figura 7-16 Temperatura a nivel mensual en Irupana en [ºC], a) Original, Serie de datos medida, b)
Completada y Extendida, Serie de datos rellenada.............................................................................. - 113 -
Figura 7-17 Temperatura a nivel mensual en Anzaldo en [ºC], a) Original, Serie de datos medida, b)
Completada, Serie de datos rellenada. ................................................................................................ - 117 -
Figura 7-18 Evaporación a nivel mensual en Chipiri en [mm], a) Original, Serie de datos medida, b)
Completada. Serie de datos rellenada. ................................................................................................ - 122 -
Figura 7-19 Evaporación a nivel diario en Chipiri en [mm], a) Original, Serie de datos medida, b) Completada,
Serie de datos completada................................................................................................................... - 126 -
Figura 7-20 Evaporación a nivel mensual en Harina Cota Cota en [mm], a) Original, Serie de datos medida, b)
Completada, Serie de datos rellenada y extendida. ............................................................................. - 131 -
Figura 7-21 Evaporación a nivel mensual en Belén en [mm], a) Original, Serie de datos medida, b) Corregida,
Serie de datos corregida usando el criterio de Grubbs & Beck, c) Completada y Extendida, Serie de datos
rellenada y extendida........................................................................................................................... - 134 -
Figura 7-22 Evaporación a nivel mensual en Hichucota en [mm], a) Original, Serie de datos medida, b)
Figura 7-23 Precipitación a nivel mensual en Kallutaca en [mm], a) Original, Serie de datos medida, b)
Figura 7-24 Precipitación a nivel mensual en San Juan en [mm], a) Original, Serie de datos medida, b)
Figura 7-25 Precipitación a nivel mensual en Chinoli en [mm], a) Original, Serie de datos medida, b)
Figura 7-26 Precipitación a nivel mensual en Padilla en [mm], a) Original, Serie de datos medida, b)
Figura 7-27 Precipitación a nivel mensual en Aiquile en [mm], a) Original, Serie de datos medida, b)
Corregida, Serie de datos corregida usando el criterio de Grubbs & Beck, c) Completada, Serie de datos
rellenada. ............................................................................................................................................. - 159 -
Figura 7-28 Serie de temperatura media a nivel mensual en Anzaldo, a) Periodo estacionario entre 1977 y
1994, b) Periodo no estacionario. ........................................................................................................ - 167 -
Figura 7-29 Serie de evaporación total a nivel diario en Okinawa I, a) Proceso no estacionario temporal
comprendido entre marzo y noviembre de 2004, b) Proceso estacionario entre 2004 y 2005. ........... - 168 -
Figura 7-30 Estación Collana, serie de humedad relativa media mensual, a) Serie de datos observada, b) Serie
de datos completada y extendida. ....................................................................................................... - 169 -
Figura 7-31 Estación Chipiri, serie de evaporación total diaria a) Serie de datos observados, b) Serie de datos
completada y extendida....................................................................................................................... - 171 -
Figura 7-32 Estación de Belén, serie de evaporación total mensual a) Serie de datos observados, b) Serie de
datos completada y extendida. ............................................................................................................ - 172 -
Figura 8-1 Localización geográfica de las estaciones hidrometeorológicas utilizadas para la evaluación del
desempeño durante el relleno las distintitas variables utilizadas. ...................................................... - 176 -
Figura 8-2 Algoritmo para la aplicación de la metodología BOX JENKINGS para el relleno de datos faltantes y
la realización de predicciones. ............................................................................................................. - 178 -
Figura 8-3 Evaluación del error relativo a la observación de los modelos estocásticos ARIMA a nivel mensual
para la variable evaporación total en tres estaciones hidrometeorológicas muestreadas aleatoriamente
dentro el territorio boliviano, para el relleno de huecos de datos de distinta extensión. .................... - 178 -
para la variable humedad relativa media en tres estaciones hidrometeorológicas muestreadas
aleatoriamente dentro el territorio boliviano, para el relleno de huecos de datos de distinta extensión.- 179 -
para la variable precipitación total en tres estaciones hidrometeorológicas muestreadas aleatoriamente
dentro el territorio boliviano, para el relleno de huecos de datos de distinta extensión. .................... - 179 -
para la variable presión media en tres estaciones hidrometeorológicas muestreadas aleatoriamente dentro
el territorio boliviano, para el relleno de huecos de distinta extensión. .............................................. - 180 -
para la variable temperatura media en tres estaciones hidrometeorológicas muestreadas aleatoriamente
dentro el territorio boliviano, para el relleno de huecos de distinta extensión.................................... - 181 -
Figura 9-1 Grupo de estaciones seleccionado para el relleno de datos diarios a partir de la desagregación
mensual-diaria con datos de estaciones vecinas a la estación de Lambate. ...................................... - 184 -
mensual-diaria con datos de estaciones vecinas a la estación de Pocona.......................................... - 185 -
mensual-diaria con datos de estaciones vecinas a la estación de Montero. ...................................... - 186 -
Figura 9-4 Comparación del Error Relativo obtenido entre los valores observados de precipitación total
diaria y los valores rellenados con el método de Mensual-Diaria. Estación Lambate durante la época húmeda
del año hidrológico entre los software HEC-4 y CHAC. ........................................................................ - 189 -
diaria y los valores rellenados con el método de desagregación Mensual-Diaria. Estación Lambate durante la
época seca del año hidrológico entre los software HEC-4 y CHAC. ...................................................... - 190 -
diaria y los valores rellenados con el método de desagregación Mensual-Diaria. Estación Pocona durante la
época húmeda del año hidrológico entre los software HEC-4 y CHAC. ................................................ - 190 -
diaria y los valores rellenados con el método de desagregación Mensual-Diaria. Estación Pocona durante la
diaria y los valores rellenados con el método de desagregación Mensual-Diaria. Estación Montero durante la
época húmeda del año hidrológico entre los software HEC-4 y CHAC. ................................................ - 192 -
diaria y los valores rellenados con el método de desagregación Mensual-Diaria. Estación Montero durante la
diaria y los valores rellenados con el método de desagregación Mensual-Diaria para cada escenario climático
usando el programa HEC-4 durante la época húmeda del año. .......................................................... - 193 -
usando el programa HEC-4 durante la época seca del año. ................................................................ - 194 -
usando el programa CHAC durante la época húmeda del año. ........................................................... - 195 -
usando el programa HEC-4 durante la época seca del año. ................................................................ - 196 -
Figura 10-1 Localización geográfica de las estaciones utilizadas para evaluar la eficiencia de los rellenos de
datos de variables climáticas con los distintitos generadores estocásticos de clima. ........................ - 199 -
Figura 10-2 Comparación del Error Relativo para la variable precipitación diaria, entre los valores medidos y
estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos
faltantes durante la época húmeda del año en la estación Laykacota. ............................................... - 204 -
faltantes durante la época húmeda del año en la estación La Tamborada. ........................................ - 205 -
faltantes durante la época húmeda del año en la estación Vallecito. ................................................. - 205 -
faltantes durante la época seca del año en la estación Laykacota. ..................................................... - 206 -
faltantes durante la época seca del año en la estación La Tamborada. .............................................. - 207 -
faltantes durante la época seca del año en la estacion Vallecito. ....................................................... - 207 -
Figura 10-8 Comparación del Error Relativo para la variable temperatura máxima diaria, entre los valores
medidos y estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número
de datos faltantes durante la época húmeda del año en la estación Laykacota. ................................ - 208 -
de datos faltantes durante la época húmeda del año en la estación La Tamborada .......................... - 209 -
de datos faltantes durante la época húmeda del año en la estación Vallecito. .................................. - 209 -
de datos faltantes durante la época seca del año en la estación Laykacota. ...................................... - 210 -
de datos faltantes durante la época seca del año en la estación La Tamborada. ............................... - 211 -
de datos faltantes durante la época seca del año en la estación Vallecito. ........................................ - 211 -
Figura 10-14 Comparación del Error Relativo para la variable temperatura mínima diaria, entre los valores
de datos faltantes durante la época húmeda del año en la estación Laykacota. ................................ - 212 -
de datos faltantes durante la época húmeda del año en la estación La Tamborada. ......................... - 213 -
de datos faltantes durante la época húmeda del año en la estación Vallecito. .................................. - 213 -
de datos faltantes durante la época seca del año en la estación Laykacota. ...................................... - 214 -
de datos faltantes durante la época seca del año en la estación La Tamborada. ............................... - 215 -
de datos faltantes durante la época seca del año en la estación Vallecito. ........................................ - 215 -
Figura 10-20 Error relativo medio obtenido con las distitntas metodologias de relleno de datos para la
variable precipitacion total mensual en disferetes estaciones. ........................................................... - 216 -
Figura 10-21 Media del error relativo en el relleno de datos de precipitación diaria con los distintos
programas utilizados y para los escenarios representados en la abscisa, para la época húmeda del año.- 217 -
Figura 10-22 Media del error relativo en el relleno de datos de precipitación diaria con los distintos
programas utilizados y para los escenarios representados en la abscisa, para la época seca del año.- 217 -
Figura 10-23 Media del error relativo en el relleno de datos de temperatura máxima diaria con los distintos
Figura 10-24 Media del error relativo en el relleno de datos de temperatura máxima diaria con los distintos
Figura 10-25 Media del error relativo en el relleno de datos de temperatura mínima diaria con los distintos
Figura 10-26 Media del error relativo en el relleno de datos de temperatura mínima diaria con los distintos
Figura 11-1 Localización de estaciones de medición por grupos para el relleno de datos faltantes de
Magnitud de Velocidad de viento Media para la comparación entre la eficiencia de las 3 metodologias
utilizadas. ............................................................................................................................................. - 223 -
Figura 11-2 Localización de estaciones de medición por grupos para el relleno de datos faltantes de Horas
de Sol por Día para la comparación entre la eficiencia de las 3 metodologias utilizadas. .................. - 224 -
Figura 11-3 Localización de estaciones de medición por grupos para el relleno de datos faltantes de
Evaporación Total para la comparación entre la eficiencia de las 3 metodologías utilizadas. ............ - 225 -
Figura 11-4 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel
mensual para la variable velocidad del viento con los datos de la estación Arani entre las 3 metodologías
empleadas............................................................................................................................................ - 227 -
mensual para la variable velocidad del viento con los datos de la estación Ayo Ayo entre las 3 metodologías
empleadas............................................................................................................................................ - 228 -
mensual para la variable velocidad del viento con los datos de la estación Riberalta entre las 3 metodologías
empleadas............................................................................................................................................ - 228 -
mensual para la variable Cantidad media de horas sol por día con los datos de la estación Sucre entre las 3
metodologías empleadas. .................................................................................................................... - 229 -
mensual para la variable Cantidad media de horas sol por día con los datos de la estación Ayo Ayo entre las
3 metodologías empleadas. ................................................................................................................. - 229 -
mensual para la variable Cantidad media de horas sol por día con los datos de la estación Los Pinos entre las
3 metodologías empleadas. ................................................................................................................. - 230 -
mensual para la variable Evaporación total con los datos de la estación Talula Tako Tako entre las 3
metodologías empleadas. .................................................................................................................... - 231 -
mensual para la variable Evaporación total con los datos de la estación Tarapacaya entre las 3 metodologías
empleadas............................................................................................................................................ - 231 -
mensual para la variable Evaporación total con los datos de la estación Santa Cruz entre las 3 metodologías
empleadas............................................................................................................................................ - 232 -
Figura 11-13 Relación entre el número de datos de entrada usados para el relleno de datos y la magnitud del
error relativo obtenido para cada metodología en las distintas pruebas efectuadas para la inferencia de la
magnitud de la velocidad del viento. ................................................................................................... - 235 -
media mensual de horas sol por día. ................................................................................................... - 235 -
evaporación total mensual. ................................................................................................................. - 236 -
Figura 12-1 Localización de estaciones empleadas para calcular el coeficiente de variación de las distintas
variables a nivel mensual e identificar en que variables podría ser viable el relleno de datos faltantes a partir
de la media de los datos mensuales observados. ................................................................................ - 240 -
Figura 12-2 Coeficiente de Variación a nivel mensual para la evaporación total en Laykacota. ......... - 241 -
Figura 12-3 Coeficiente de Variación a nivel mensual para la evaporación total en Comarapa. ........ - 241 -
Figura 12-4 Coeficiente de Variación a nivel mensual para la evaporación total en Coimata. ........... - 242 -
Figura 12-5 Coeficiente de Variación a nivel mensual para la humedad relativa media en Magdalena.- 242 -
Figura 12-6 Coeficiente de Variación a nivel mensual para la humedad relativa media en Potosí Aeropuerto.
............................................................................................................................................................. - 243 -
Figura 12-7 Coeficiente de Variación a nivel mensual para la humedad relativa media en Yesera Norte.- 243 -
Figura 12-8 Coeficiente de Variación a nivel mensual para precipitación total en Ballivian. ............. - 244 -
Figura 12-9 Coeficiente de Variación a nivel mensual para precipitación total en Potolo.................. - 244 -
Figura 12-10 Coeficiente de Variación a nivel mensual para precipitación total en Irpa Chico. ......... - 245 -
Figura 12-11 Coeficiente de Variación a nivel mensual para presión media en San Matias. ............. - 245 -
Figura 12-12 Coeficiente de Variación a nivel mensual para presión media en Bermejo Aeropuerto. - 246 -
Figura 12-13 Coeficiente de Variación a nivel mensual para presión media en San Ramón. ............. - 246 -
Figura 12-14 Coeficiente de Variación a nivel mensual para temperatura media en Tinguipaya. ..... - 247 -
Figura 12-15 Coeficiente de Variación a nivel mensual para temperatura media en Cristal Mayu. ... - 247 -
Figura 12-16 Coeficiente de Variación a nivel mensual para temperatura media en Guayaramerín
Aeropuerto. .......................................................................................................................................... - 248 -
Figura 13-1 Localización de todas las estaciones de medición en el departamento de Cochabamba con más
de 10 años de registros de precipitación. ............................................................................................ - 251 -
Figura 13-2 Resultados de la Agrupación Cluster estandarizada que nos sugiere distintas agrupaciones de
estaciones para distintos niveles de tolerancia. .................................................................................. - 252 -
mensual para la variable Precipitación total mensual con los distintos modelos después de haber generado
un grupo a partir del método Cluster. .................................................................................................. - 253 -
Figura 14-1 Índice de Oscilación Sur entre 1950 y 2017. ..................................................................... - 257 -
Figura 14-2 Funciones de autocorrelación simple y parcial con sus valores y niveles de significancia para el
IOS. ....................................................................................................................................................... - 258 -
Figura 14-3 Gráfico 14.2.3: Componente cíclica del Índice de Oscilación Sur entre 1950 y 2017. ....... - 260 -
Figura 14-4 Logarítmico de la componente cíclica del Índice de Oscilación Sur entre 1950 y 2017. .. - 260 -
Figura 14-5 Serie resultante de la extracción de la componente cíclica del Índice de Oscilación Sur entre 1950
y 2017, presenta la componente estacional y aleatoria para el mismo periodo. ............................... - 262 -
Figura 14-6 Componente estacional del Índice de Oscilación Sur entre 1950 y 2017. ......................... - 262 -
Figura 14-7 Componente aleatoria del Índice de Oscilación Sur entre 1950 y 2017. ........................... - 264 -
Figura 14-8 Relación entre la componente cíclica y aleatoria del Índice de Oscilación Sur entre 1950 y 2017.
............................................................................................................................................................. - 265 -
Figura 14-9 Extensión de la componente cíclica del Índice de Oscilación Sur entre 1950 y 2017 hasta 2060.
............................................................................................................................................................. - 265 -
Figura 14-10 Extensión de la componente estacional del Índice de Oscilación Sur entre 1950 y 2017 hasta
2060. .................................................................................................................................................... - 266 -
Figura 14-11 Extensión de la componente aleatoria del Índice de Oscilación Sur entre 1950 y 2017 hasta
2060. .................................................................................................................................................... - 266 -
Figura 14-12 Reconstitución del Índice de Oscilación Sur entre 1950 y 2017 hasta 2060, Componente Cíclica +
Componente Estacional. ...................................................................................................................... - 267 -
Componente Estacional + Componente Aleatoria. .............................................................................. - 268 -
Figura 14-14 Contraste Empírico para el periodo comprendido entre Enero de 2007 y Diciembre de 2017.- 269
-
Figura 14-15 Componente cíclica de los datos medidos del IOS. ......................................................... - 269 -
Figura 15-1 Resumen de aplicaciones posibles para el relleno de datos a nivel diario. ....................... - 273 -
Figura 15-2 Resumen de aplicaciones posibles para el relleno de datos a nivel mensual. .................. - 275 -
1 INTRODUCCION A LA TESIS.
Este trabajo se ha realizado con el propósito de identificar los métodos más convenientes
para el completado de series temporales de variables climáticas, tarea habitualmente
requerida, cuando se usan datos climatológicos, como base para la ejecución de estudios
hidrológicos.
La búsqueda es realizada aplicando diferentes métodos estadísticos y estocásticos, al

relleno de series climatológicas medidas en Bolivia, el desempeño de los modelos es
evaluado mediante los estadísticos clásicos de bondad de ajuste y de error relativo, para
escenarios en los que se supone que en un periodo determinado no se cuenta con datos, se
obtienen los valores de relleno y se los contrasta con los valores medidos.
Las series climatológicas usadas, surgen de la red de instrumentos de medición que

dispone el Servicio Nacional de Meteorología e Hidrología (SENAMHI), entidad que en
Bolivia tiene por ley el encargo de este tipo de mediciones, estos datos son usados por que
se desea validar métodos y técnicas, por lo general desarrolladas en otros países.
Lo innovador del presente trabajo es la aplicación de modelos estocásticos en el relleno de

datos faltantes, técnica que habitualmente no es aplicada con este propósito, sin embargo
los resultados presentados en el presente documento indican que son técnicas
prometedoras, que debían ser más utilizadas.
Las variables tratados son: Temperatura, velocidad de viento, humedad relativa, horas sol
por día, precipitación, presión atmosférica y evaporación. Los intervalos de medición
considerados son diarios y mensuales. Las variables e intervalos de medición analizados
están en concordancia con los datos requeridos para proyectos de: operación de embalses,
control de inundaciones, aprovechamiento del potencial hídrico y otras aplicaciones en el
ámbito hidrológico e hidráulico.
Primeramente para poder continuar con la investigación se tuvo que determinar de manera
sistemática el tipo de software utilizado para poder efectuar los rellenos en los diferentes
niveles diarios y mensuales en función de aspectos determinantes como la cantidad de datos
disponibles, la extensión total de las series medidas y la proximidad entre estaciones
hidrometeorológicas, el resultados de esa esquematización de los rellenos en relación con
las necesidades de nuestro medio se presenta en la Figura 1-1.
-1-
Figura 1-1 Criterios para la adopción de una metodología para el relleno de datos faltantes.
Habiendo determinado cada uno de los programas empleados y el tipo de rellenos para los
cuales estos eran de utilidad se procedió a plantear experimentos cuyos resultados serían de
referencia para poder comparar programas o modelos con fines similares y distinguir cual
rinde mejor en términos de error relativo producido por cada programa o modelo, los
experimentos y su finalidad se encuentran clasificados en la Figura 1-2.
-2-
Figura 1-2 Experimentos o pruebas realizadas y su finalidad.
En cada uno de los experimentos se trabajó con un cierto número de variables, la Figura 1-2
es una clasificación de las variables utilizadas en cada uno de los experimentos citados en
la Figura 1-3.
-3-
-4-
Figura 1-3 Variables trabajadas en cada experimento.
-5-
2 ASPECTOS PRELIMINARES
2.1 ANTECEDENTES
Uno de los problemas más comunes, en el momento en el que se ejecuta un estudio

hidrológico, es que no existe la suficiente cantidad de datos climatológicos básicos (Rivera,
2008, pág. 7), cuando estos se encuentran por lo general se detectan las siguientes
situaciones:
 El periodo de registros es muy pequeño y no es representativo según los postulados

estadísticos teóricos.
 No se tienen protocolos de control de las mediciones y su tratamiento que
garanticen su calidad.
 El intervalo de medición no es adecuado para la aplicación que se desea desarrollar.
 Se han perdido datos en el trascurso de los años.
 Se tiene datos de alguna variable y de otras no.
 Las series tienen vacíos incluso de hasta de más de diez años, esto es desfavorable
para la caracterización de los fenómenos climatológicos.
Ante estas consideraciones, contar con distintas técnicas de inferencia, completado y

predicción es una necesidad primaria.
2.2 PROBLEMA
Las estaciones meteorológicas en Bolivia, presentan información climatológica escasa, en

ocasiones de mala calidad e incompleta (Villazón & Medrano, 2015, pág. 2), esta situación
incorpora un riesgo adicional a la hora de usar estos datos básicos en el diseño de obras de
aprovechamiento hídrico y protección contra daños provocados por el exceso de agua.
Bajo esta situación es imprescindible contar con métodos confiables que permitan rellenar
las series incompletas de datos meteorológicos en distintos intervalos de medición (Franzke
C. , O’Kane, Berner, Williams, & Lucarini, 2014, pág. 3), para este cometido el presente
trabajo recurre a la aplicación y evaluación del desempeño de una diversidad de métodos
estadísticos y estocásticos que pueden ayudar a completar datos de series de variables
climatológicas y realizar predicciones de dichos fenómenos, aplicándolos sobre estaciones
de medición situadas dentro del territorio boliviano, previo muestreo de las mismas.
2.3 JUSTIFICACIÓN
-6-
La información escasa o de mala calidad influye directamente en la eficacia de las técnicas
aplicadas para la solución de problemas en el ámbito de la Ingeniería de los Recursos
Hídricos, por lo que es necesario evaluar la eficiencia de distintos métodos que permitan
inferir los datos básicos, que serán usados en el diseño hidrológico e hidráulico, a fin de
que los resultados que se obtengan sean confiables y representen la realidad de manera
práctica.
2.4 LIMITACIONES DEL ESTUDIO

El estudio se limita a estaciones que tienen el mínimo de información necesaria para aplicar
las metodologías o usar un software de generación o relleno, que son sugeridas por los
autores de las mismas.
Se ha usado programas que a pesar de entender su funcionamiento, no han sido realizados

por el autor del presente trabajo de grado, en esos casos el control que se tiene de los
procedimientos se limita a la versatilidad del programa con el que se trabaja.
El muestreo se ve afectado por la poca información disponible, por lo tanto se usó 2 formas
distintas de muestreo para la evaluación de los modelos, una por regiones climáticas, y otra
por variables para el completado de datos a nivel diario y mensual.
El relleno anual no se contempla porque se puede derivar fácilmente de completados

diarios o mensuales.
La evaluación de los modelos se realizó usando como indicador el error, calculado en

intervalos diarios o mensuales dependiendo del paso de tiempo considerado, siendo este el
indicador más adecuado para evaluar y conmensurar diversas metodologías sobre diferentes
variables, su ventaja es que es una medida adimensional.
-7-
3 OBJETIVOS
3.1 Objetivo General

 Evaluar la eficiencia de un conjunto de modelos estadísticos y estocásticos en la
inferencia de datos faltantes de series de variables hidrometeorológicas.
3.2 Objetivos Específicos

 Recopilar, clasificar y realizar el muestreo de variables meteorológicas, a partir de
la base de datos de SENAMHI.
 Rellenar datos faltantes, para escenarios hipotéticos, usando modelos estadísticos y
estocásticos.
 Determinar la eficiencia de los modelos en base a la magnitud del error relativo,
evaluado entre los datos medidos y los valores rellenados.
 Establecer conclusiones respecto a las distintas pruebas realizadas y proponer
recomendaciones que enriquezcan estudios posteriores.
 Determinar un esquema que integre, sintetice y sistematice el estudio realizado, con
la finalidad de sugerir una metodología que busque contribuir en la solución del
problema de relleno de datos faltantes, en situaciones reales de aplicación de la
ingeniería hidráulica e hidrológica.
-8-
4 METODOLOGÍA GENERAL
4.1 Muestras
Se diseñaron distintos experimentos para determinar la diferencia en la exactitud de cada
método o modelo de relleno y en base a ello determinar que método es más eficiente para
cada variable.
Se tomó conjuntos de datos de distintas estaciones dentro del territorio Boliviano, su

selección de se efectuó dependiendo del tipo de método o modelo aplicado, uno de los
factores determinantes tomados en cuenta fue la cantidad de datos disponibles.
4.2 Determinación previa de anomalías en los datos

Previamente se determinó la calidad de los datos observados, a partir del criterio de
determinación de datos anómalos de Grubbs & Beck, que si bien funcionaria en datos solo
normalmente distribuidos, nuestro estudio sugiere que se puede utilizar también en series
de distribución asimétrica si es que en ella la centralidad de los datos está determinada.
4.3 Proceso experimental

Se determinó grupos de modelos similares o con fines similares para comparar su eficiencia
en el relleno de datos faltantes de variables hidrometeorológicas.
Se determinó escenarios hipotéticos de relleno, usando intervalos diarios y/o mensuales.
Se suprimió intencionalmente intervalos de mediciones con el fin de realizar rellenos y

comparara los valores generados con los valores medidos.
El criterio de evaluación del desempeño de los distintos modelos y métodos aplicados fue
el error relativo (para un conjunto de observaciones el indicador es la Media del cuadrado
de los errores relativos a la observación), que nos permitió observar su eficiencia para
distintas variables en los diferentes escenarios hipotéticos, garantizando previamente que
durante la generación de nuevas observaciones las series mantenían sus propiedades
estadísticas.
Media del cuadrado de los errores relativos a la observación:
√(𝐼 − 𝑂)2
𝑝𝑎𝑟𝑎 𝑂 ≠ 0
𝑂
𝑀𝐶𝐸𝑅𝑂 =
√((𝐼 + 1) − (𝑂 + 1))2
𝑝𝑎𝑟𝑎 𝑂 = 0 𝐸𝑐. 4.3.1
{ (𝑂 + 1)
𝐷𝑜𝑛𝑑𝑒: 𝐼 = 𝑉𝑎𝑙𝑜𝑟 𝑖𝑛𝑓𝑒𝑟𝑖𝑑𝑜 𝑦 𝑂 = 𝑉𝑎𝑙𝑜𝑟 𝑂𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜
La eliminación de datos para luego generarlos y su cantidad, dependió del tipo de variable
de estudio y de cómo se podría llegar a un criterio coherente para poder evaluar los
-9-
distintos modelos aplicados, sin que se favorezca en el proceso a alguno de ellos,
garantizando que todos trabajen en las mejores condiciones posibles, de manera que no
contradigan sus principios de aplicación.
En los capítulos siguientes, se realiza una descripción más detallada de cada una de las
metodológicas particularmente usadas, explicando los detalles a tomar en consideración, la
descripción actual es más bien un acercamiento a todo aquello que las pruebas realizadas
tenían en común.
- 10 -
5 CONSIDERACIONES TEORICAS PRELIMINARES
5.1 Fenómenos Meteorológicos
Los fenómenos meteorológicos, son la forma en la que se nos presentan las condiciones
climáticas, en las cuales se va a efectuar cualquier tipo de diseño hidráulico o hidrológico.
Si bien estaríamos tratando con un fenómeno natural, se tienen evidencias de que se está
produciendo una interferencia humana en el sistema climático, y el cambio climático
plantea riesgos para los sistemas humanos y naturales (Grupo Intergubernamental de
expertos sobre el cambio climático, 2014, pág. 18).
Las dificultades para producir modelos matemáticos, que representen el comportamiento y

las manifestaciones de los fenómenos meteorológicos, radica en:
 La variedad de escalas en la que estos se presentan; el comportamiento

diferenciado de los eventos climatológicos a lo largo de toda la superficie terrestre.
 La cantidad limitada de datos que tenemos a nuestra disponibilidad en relación al
espacio poblacional total de los mismos.
 El efecto que ejerce la dirección progresista antropocéntrica de excesivo consumo
de energías, causando: deforestaciones, desequilibrios estructurales en los
ecosistemas, transformación de compuestos en estado de relativo equilibrio iónico
en fuentes de radiaciones elevadas hasta diez mil veces los niveles tolerables por
los seres vivos.
 La producción de residuos sólidos y líquidos altamente contaminantes que de forma
natural jamás habrían surgido.
Los factores citados son de difícil control, y se constituyen en características propias del
mundo en que vivimos; resultado de nuestro asentamiento y “realización” que inciden en la
naturaleza al menos desde el siglo XIX; esto nubla toda posibilidad de integración de los
factores ya que muchos de estos siguen en desarrollo y transformación; causas y efectos se
entremezclan, entonces el análisis de las variable meteorológicas a partir de la observación
y experimentación quizá sea la mejor manera para la obtención de información limpia libre
de sesgo, para la inferencia de estos fenómenos.
5.2 Variables básicas y relevantes para el Diseño Hidrológico e

Hidráulico
5.2.1 Precipitación
El fenómeno de precipitación ocurre a partir de cambios de temperatura en la atmosfera
producidos por el movimiento de corrientes de aire allí donde se han acumulado nubes, las
- 11 -
cuales son la consecuencia de la evaporación producida por el calor transmitido por el sol
a la superficie de nuestro planeta evaporando el agua de océanos y mares (Fundacíon
Española para la ciencia y la Tecnología, 2004, pág. 33); el análisis de las precipitaciones,
su frecuencia o escases, es fundamental para la realización de diseños, planificaciones y la
gestión de recursos hídricos.
5.2.2 Temperatura
Las Variaciones de temperatura y la temperatura en si de una región, tiene un fuerte
impacto sobre la gestión de recursos hídricos; elevadas temperaturas pueden deberse a
periodos de sequía; es de influencia también en otros factores como el contenido de
humedad del suelo, la humedad relativa del ambiente y también es una condicionante del
flujo base de trasporte durante los inicios del periodo de lluvias; representa también un
factor importante en el proceso de evaporación.
5.2.3 Evaporación
Una variable que si bien puede depender de la temperatura y de la presión del medio; es
fundamental de manera aislada; por ser la única perdida de agua que se puede medir con
relativa certeza y que de todas formas ocurre en cualquier ambiente, debe determinarse
durante cualquier gestión de recursos hídricos; su contraste con las pérdidas totales del
sistema en estudio nos puede llevar a estimar de manera indirecta la cantidad de líquido
que se infiltra o que escurre de manera subterránea.
5.2.4 Presión atmosférica

Debido a que nuestro país tiene regiones a distintos niveles altimétricos; la presión va ser
una característica que va influir de forma diferente en los fenómenos ligados al
comportamiento del agua superficial y subterránea, así también es necesario analizar su
interacción con los cambios de temperatura; verificando si los principios determinísticos
son coherentes con los datos medidos, determinar su valor es importante en trabajos que
implican el diseño de tuberías para controlar los efectos de fenómenos como la cavitación y
el golpe de ariete.
5.2.5 Humedad Relativa

Relación porcentual entre la cantidad de humedad en un espacio dado y la cantidad que ese
volumen podría contener si estuviera saturado (Sáenz, 1999, pág. 159), se determina a
partir de la presión ejercida por el vapor de agua y presión de vapor de saturación, es una
variable importante porque está fuertemente ligada a las pérdidas de agua por evaporación.
5.2.6 Velocidad del Viento

El movimiento del aire de una zona a otra se conoce como viento y su velocidad depende
de los posibles cambios de temperatura y presión en la atmosfera (Fundacíon Española para
la ciencia y la Tecnología, 2004, pág. 20), por lo tanto existe una interrelación entre esta
variable y las dos anteriores, además tiene importancia en la determinación de los valores
- 12 -
de evaporación en una región determinada, que serán de utilidad en los procedimientos de
balance hídrico que se apliquen en los proyectos de aprovechamiento de recursos hídricos.
5.2.7 Horas de Sol por día

El número de horas sol, permite obtener de manera indirecta la cantidad de radiación solar
que se recibe en un punto, que es un factor importante en la cuantificación indirecta de la
evaporación (Fundacíon Española para la ciencia y la Tecnología, 2004, pág. 24).
5.3 Términos y Conceptos básicos usados en el estudio

Cualquier área de la investigación científica seria y tecnológica puede verse beneficiada por
las distintas formas de tratamiento y análisis estadístico, en el caso de variables
climatológicas, la intención será producir inferencias, realizar proyecciones y pronósticos
dentro de lo razonable.
Es pertinente ir desarrollando los distintos conceptos que se han utilizado para realizar este
estudio.
5.3.1 Población
Es el espacio total de observaciones posibles de una determinada característica de un
fenómeno, en nuestro caso las observaciones son de tipo cuantitativo y a dicha
característica se la denomina también variable aleatoria, en el caso de variables
hidrometeorológicas se estaría trabajando en todos los casos con una población infinita.
5.3.2 Parámetro
El parámetro es una característica, una medida descriptiva de la población total de estudio,
los distintos parámetros que presenta una población nos brindan información sobre la
naturaleza del conjunto de datos (Webster, Estadística aplicada a los negocios y la
economía, 2001, pág. 8) y sirven como una representación compacta de la misma, son
ideales para poder trabajar sin tomar en cuenta todas las observaciones tomadas.
Un problema inacabable en la estadística y la estocástica y que comparten con otras áreas

del conocimiento, es que los conceptos que tenemos nunca logran describir los objetos de
estudio enteramente, es más son meras aproximaciones, población y parámetro son solo
conceptos ideales que se suelen aproximar a través de otros menos estrictos la muestra y el
estadístico.
5.3.3 Muestras
Tomando en cuenta lo desarrollado previamente, muestra se define como un subconjunto
del espacio de observaciones posibles, usada para representar de manera aproximada
aquello que llamamos población, esto ocurre por varias razones: existe incertidumbre
respecto a la precisión de los instrumentos de medición, a las condiciones de medición, a
si realmente podemos percibir el fenómeno en sus cualidades y cantidades reales, si
- 13 -
tenemos los recursos para medirlos, son distintas las razones porque se toma una cierta
cantidad de datos que al final conforman una o varias muestras.
5.3.4 Estadístico
Comparando con la relación que existe entre población y muestra, el estadístico seria
simplemente un estimador, mas no el parámetro poblacional, el estadístico puede inferir
directamente el parámetro, ser escogido de una o de otra muestra o ser generado a partir de
varias muestras tomadas del mismo fenómeno.
5.3.5 Estimador
El estimador es una inferencia de un parámetro, se denota con un techito encima de la
notación común de los parámetros, un estimador se define como insesgado cuando se ha
comprobado que este tiene la menor variación de entre todos los estimadores respecto el
parámetro poblacional.
5.3.6 Variable
Es la forma en la que representamos una característica del fenómeno, para que pueda ser
trabajada de manera adecuada, con los métodos que utilizamos durante este, y en general de
cualquier estudio científico en el cual logramos cualificar o cuantificar las características de
cada fenómeno, en el presente trabajo se empleó variables cuantitativas, que pueden
presentar o no relaciones de dependencia con otras.
5.3.7 Error
El error es la diferencia entre lo observado y lo real en sí, el error se da a partir de que
existen distintos factores que no podemos controlar durante la observación, la medición, el
tratamiento y la modelación, es la diferencia entre lo representado y lo real, la exactitud a
pesar de ser un concepto importantísimo, es inalcanzable por el error.
5.3.8 Error Muestral

Es la diferencia que existe entre la muestra y la población de estudio, o la diferencia entre el
estadístico y el parámetro.
5.3.9 Serie
Es un conjunto de datos con un orden definido, u ordenados bajo un criterio pre
establecido ya sea según su tamaño ocurrencia temporal o cualquier otra característica, los
cuales pueden ser o no muéstrales, como es el caso de los ruidos aleatorios necesarios para
generar observaciones sintéticas en los modelos ARIMA que solo se generan a partir de
principios matemáticos y no existen en la realidad.
- 14 -
5.3.10 Distribución de Frecuencia
Es un método de representación de la ocurrencia de ciertos eventos, los cuales se ordenan
según un criterio, por ejemplo de menor a mayor, o por clases, las cuales agrupan valores
en intervalos definidos (Suay, 2007, pág. 12), esto es importante porque algunas pruebas
estadísticos han sido diseñadas para trabajar con datos agrupados, este tratamiento de los
datos es mucho más útil cuando no existen relaciones evidentes entre variables, o cuando
las variables no presentan autocorrelación, está claro que el ordenamiento de datos bajo
cierto criterio significaría que asumimos que la posición temporal entre un dato u otro no es
significativa, hablando desde el aspecto informacional, esto representa siempre una pérdida
de información en cuanto al fenómeno de estudio, por lo tanto el análisis de frecuencia
asume previamente que la información que existe en el orden de ocurrencia de los eventos
que describen al fenómeno no es relevante.
5.4 Descripción y formulación de los parámetros y estadísticos

muéstrales
En el presente subcapítulo se presentan las expresiones matemáticas que permitan sintetizar
datos cuantitativos. Para las medidas de resumen clásico, se resalta la diferencia de las
expresiones usadas a nivel de muestra y población.
5.4.1.1 Medidas de tendencia central

A partir de datos cuantitativos no agrupados se tiene las siguientes medidas de tendencia
central:
a) Media Poblacional
Es una medida que representa la centralidad de las observaciones, partiendo de la
proposición de que la mayoría de los eventos de un fenómeno tienden a ser parecidos, y en
consecuencia ese evento medio que los representa mucho mejor que cualquier otro
parámetro. Es bastante útil cuando se reconoce que la tendencia central es simétrica.
Media Poblacional:
(∑𝑁
𝑖 𝑥𝑖 )
𝜇= 𝐸𝑐. 5.4.1
𝑁
Media Muestral:
(∑𝑛𝑖 𝑥𝑖 )
𝑋= 𝐸𝑐. 5.4.2
𝑛
- 15 -
b) Mediana
Observación que se encuentra en la mitad de una serie de datos que han sido previamente
ordenados de menor a mayor, juega un rol más importante y representativo en fenómenos
que no presentan una tendencia central simétrica.
Su posición en una muestra ordenada de menor a mayor es:
𝑛+1
𝑝𝑎𝑟𝑎 𝑠𝑒𝑟𝑖𝑒𝑠 𝑖𝑚𝑝𝑎𝑟𝑒𝑠.
𝑃={ 2
𝑛 𝐸𝑐. 5.4.3
𝑝𝑎𝑟𝑎 𝑠𝑒𝑟𝑖𝑒𝑠 𝑝𝑎𝑟𝑒𝑠.
2
c) Media Geométrica
Es una medida capaz de representar el cambio porcentual promedio de una serie de valores.
𝑀𝐺 = 𝑛√𝑥1 ∗ 𝑥2 ∗ 𝑥3 ∗ 𝑥4 … … … .∗ 𝑥 𝐸𝑐. 5.4.4

𝑛
5.4.1.2 Medidas de dispersión

Son aquellas destinadas a cuantificar que tan alejadas o dispersas están las observaciones
alrededor de la tendencia central.
a) El Rango
Diferencia entre la observación más alta y la más baja, es particularmente útil para conocer
la amplitud de la totalidad de los datos observados:
𝑅𝑔 = 𝑥𝑚𝑎𝑥 −𝑥𝑚𝑖𝑛 𝐸𝑐. 5.4.5
b) Varianza
Es el promedio del cuadrado de la diferencia de las observaciones entre cada una de las
observaciones y la media, se define como parámetro poblacional y como estadístico
muestral.
∑𝑁
𝑖 (𝑥𝑖 −𝜇)
2
𝜎2 = 𝑝𝑎𝑟𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑒𝑠. 𝐸𝑐. 5.4.6
𝑁
2
2
∑𝑛𝑖(𝑥𝑖 − 𝑋)
𝑠 = 𝑝𝑎𝑟𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠. 𝐸𝑐. 5.4.7
𝑛−1
El denominador (n – 1) indica el número de grados de libertad del estadístico, que en
general se define como el tamaño de la muestra menos el número total de estadísticos
previamente calculados y empleados en la inferencia del nuevo estadístico actual, en esta
medida previamente se ha inferido la media muestra, otra forma de definir los grados de
libertad seria, el número de observaciones menos el número de restricciones sobre tales
observaciones, interpretando este concepto con el anterior se podría decir que los distintos
estadísticos calculados representan una restricción sustraída del total de las observaciones.
- 16 -
c) Desviación Estándar
Es la medida del grado de dispersión de los datos en la misma unidad en la que han sido
tomados, se calcula con las siguientes formulas, distinguiendo si el caso es poblacional o
muestral:
∑𝑁
𝑖 (𝑥𝑖 −𝜇)
2
𝜎=√ 𝑝𝑎𝑟𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑒𝑠. 𝐸𝑐. 5.4.8
𝑁
2
√ ∑𝑛𝑖(𝑥𝑖 − 𝑋)
𝑠= 𝑝𝑎𝑟𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠. 𝐸𝑐. 5.4.9
𝑛−1
5.4.2 Definición de Clase

El número de clases es muy útil tanto para graficar histogramas de frecuencia que son una
representación gráfica de la distribución de frecuencia de la variable como para realizar las
pruebas de bondad de ajuste, el número de clases se calcula hallando un valor de c que
cumpla la siguiente desigualdad, no es algo exclusivo sino más bien un numero de clases
mínimas para poder representar a la variable o realizar las pruebas respectivas:
2𝑐 ≥ 𝑛 𝐸𝑐. 5.4.10
El cálculo del tamaño del intervalo de clase se realiza con la siguiente ecuación:
𝑅𝑔
𝐼𝑐 = 𝐸𝑐. 5.4.11
𝑐
5.4.3 Probabilidad
Es la posibilidad cuantificada numéricamente de que un evento ocurra en una escala
absoluta entre 0 y 1 o porcentual entre 0 y 100%.
5.5 Modelos Probabilísticos
5.5.1 Representación de los datos muéstrales

Gráficamente es muy fácil representarlos a partir de las clases construidas, y la
probabilidad que esté ligada a cada clase, a esta forma de representación se le denomina
histograma de frecuencia.
5.5.2 Distribución de Probabilidad

Es un despliegue de todos los posibles resultados de un experimento junto con las
probabilidades de cada resultado (Webster, Estadística aplicada a los negocios y la
economía, 2001), dependiendo la variable en estudio la distribución puede ser discreta o
continua la diferencia entre ambas se puede observar de forma clara en la Figura 5-1. El
- 17 -
presente estudio trabaja con distribuciones continuas, con funciones de probabilidad
teóricas que, se busca ajustar a la distribución empírica de los datos muéstrales.
Figura 5-1 Distribuciones de probabilidad, discreta y continua (Webster, 2001, pág. 133).
5.5.3 Otros Parámetros Estadísticos de Relevancia
5.5.3.1 Asimetría
Es un parámetro, que indica como los datos están distribuidos respecto de la media, en
cuanto la asimetría tiende a 0 se puede afirmar que la distribución es normal, solo en este
caso particular, la media, mediana y la moda se confunden en sí mismas, si la asimetría es
distante de cero, esto sugiere que la tendencia no está centralizada cerca de la media, y a
medida que se aleja esta pierde su valor representativo e inferencial, a medida que se aleja
si la asimetría es positiva entonces la centralidad está a la izquierda de los datos, si es
negativa se encuentra a la derecha, en casos prácticos se suele tomar decisiones usando el
coeficiente de asimetría, la formulación de ambos es la siguiente:
Asimetría
∑𝑛𝑖(𝑥𝑖 − 𝑥)3
𝐴= 𝐸𝑐. 5.5.1
𝑛
Coeficiente de asimetría adimencional:
𝑛 ∗ ∑𝑛𝑖(𝑥𝑖 − 𝑥)3
𝐶𝑎 = 𝐸𝑐. 5.5.2
(𝑛 − 1) ∗ (𝑛 − 2) ∗ 𝑠 3
5.5.3.2 Curtosis
Cuantifica el grado de achatamiento de la distribución, una especie de aproximación a la
curvatura de la misma, se calcula con la formulación siguiente:
Curtosis
∑𝑛𝑖(𝑥𝑖 − 𝑥)4
𝐶𝑢 = −3 𝐸𝑐. 5.5.3
𝑛 ∗ 𝑠4
- 18 -
Si la curtosis es menor a cero se denomina Platicúrtica, si es mayor a 0 es Leptocúrtica, si
es igual a 0 o tiende a 0 se la conoce como Mesocúrtica, esta es una categorización
importante respecto a la distribución y dispersión de los datos de los datos.
5.5.3.3 Coeficiente de Variación

Es un indicador de la desviación que se encuentra en unidades absolutas, de esta forma
puede servir de comparación de la desviación de distintas variables con diferentes unidades,
se calcula con la siguiente fórmula:
𝑠
𝐶𝑉 = 𝑋 𝐸𝑐. 5.5.4
5.5.4 Modelos Regresivos: Regresión Lineal Y Regresión No Lineal
5.5.4.1 Regresión simple y Correlación

La regresión y la correlación son 2 herramientas estadísticas muy poderosas y versátiles
cuando se trabaja con datos que presentan una tendencia susceptible de ser representada de
una forma determinística, muchos estudios se basan en la creencia de que se puede
identificar una relación funcional entre variables simplemente de forma empírica a partir de
las observaciones, en esta relación entre variables, se definen 2 clases de las mismas:
1. Variable independiente (Y)

2. Variable dependiente (x)
𝐷𝑜𝑛𝑑𝑒:
𝑌 = 𝑓(𝑥) 𝐸𝑐. 5.5.6
El definir que variable es dependiente y cual independiente, depende de cuál de las 2 es de

más fácil medición, por ejemplo el tiempo, se puede cuantificar de manera muy simple con
precisión moderada, se convierte en variable independiente.
5.5.4.2 Variable Dependiente

Es la variable que se explica, o que se intenta inferir a partir de otra.
5.5.4.3 Variable Independiente

Es la variable mediante la cual deseamos inferir a la dependiente, a partir del poder
explicativo en la relación.
5.5.4.4 Identificación de la tendencia

Se debe contemplar el análisis de regresión en su caso lineal y no lineal o curvilineal, ya
que ambos pueden ser de gran utilidad.
- 19 -
La identificación de qué relación presenta una variable respecto de otra se puede verificar
gráficamente a partir del gráfico de dispersión o realizando las respectivas regresiones y
comparando la precisión de los estadísticos encontrados, las diferencias entre un tipo de
relación se muestran de manera clara la Figura 5-2.
Figura 5-2 Tipos de tendencias determinísticas de una variable, el recuadro a) nos muestra una relación lineal
positiva, el b) una relación lineal negativa; el c) una relación curvilínea positiva y el d) una relación curvilínea negativa
(Webster, 2001, pág. 326).
Las diferencias de ajuste son bastante claras, pero en el caso curvilíneal, puede que más de
una función sea capaz de representar de manera eficiente la relación.
Por otro lado existen también variables que no muestran ninguna correlación en la Figura
5-3 de la dispersión de los datos, las variables se consideran independientes, y los
tratamientos regresivos a 2 variables no son aplicables por que no se encuentra ninguna
relación determinística entre las variables que pueda ser simulada.
- 20 -
Figura 5-3 Diagrama de dispersión de variables independientes (Webster, 2001, pág. 346).
5.5.4.5 Relación lineal

A medida que la variable independiente cambia, la variable dependiente va variando de
manera constante.
5.5.4.6 Relación Curvilínea

A medida que la variable cambia, la variable dependiente presenta también un cambio en su
variación.
Determinación del Modelo de Regresión Simple (Lineal):
La condición necesaria para que se aplique el modelo es tener al menos 2 pares de

observaciones.
Su ecuación es:
𝑌 = 𝑏𝑜 + 𝑏1 ∗ 𝑥 𝐸𝑐. 4.5.7
𝑏0 = 𝑖𝑛𝑡𝑒𝑟𝑐𝑒𝑝𝑡𝑜, 𝑜 𝑖𝑛𝑡𝑒𝑟𝑐𝑒𝑐𝑐𝑖ó𝑛 𝑐𝑜𝑛 𝑒𝑙 𝑒𝑗𝑒 𝑑𝑒 𝑙𝑎𝑠 𝑜𝑟𝑑𝑒𝑛𝑎𝑑𝑎𝑠.
𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑣𝑒𝑟𝑡𝑖𝑐𝑎𝑙
𝑏1 = 𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑎 𝑟𝑒𝑐𝑡𝑎 =
𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 ℎ𝑜𝑟𝑖𝑧𝑜𝑛𝑡𝑎𝑙
Dependiendo el signo que toma la pendiente, la relación será positiva o negativa, de ser 0,
la función seria simplemente un valor constante.
Existe también un tipo de relación de carácter mucho más general, ampliando los límites de
la estadística descriptiva e inferencial.
𝐷𝑒𝑡𝑒𝑟𝑚í𝑛𝑖𝑠𝑡𝑖𝑐𝑎
La relación entre Variables puede ser: {
𝐸𝑠𝑡𝑜𝑐á𝑠𝑡𝑖𝑐𝑎
Modelo de regresión lineal estocástico: es una forma más general de modelación lineal, el
cual contempla la parte aleatoria de y pretende representar todo el fenómeno real.
𝑌 = 𝛽𝑜 + 𝛽1 ∗ 𝑥 + 𝜀 𝐸𝑐. 5.5.8
- 21 -
𝛽𝑜 y 𝛽1 son 2 parámetros poblacionales, que aunque sean inferidos permanecen siempre
desconocidos, el modelo de regresión lineal además es un modelo más ideal que el
estocástico.
Basándose en los datos muéstrales se tiene el modelo de regresión lineal:
𝑌 = 𝑏𝑜 + 𝑏1 ∗ 𝑥 + 𝑒 𝐸𝑐. 5.5.9
Aun así, e permanece siendo aleatorio y otra vez este solo podría estimarse, para ello
entonces se logra formar la siguiente estimación:
𝑌̂ = 𝑏𝑜 + 𝑏1 ∗ 𝑥 𝐸𝑐. 5.5.10
5.5.4.7 Mínimos Cuadrados Ordinarios (MCO)

Se considera un criterio de mejor ajuste, el propósito es determinar una recta que se ajuste
mejor a los datos medidos.
Procedimiento matemático: Para estimar los valores de 𝑏𝑜 y 𝑏1 se puede aplicar el modelo

de mínimos cuadrados ordinario, el cual logra reproducir una recta en el centro del
diagrama de dispersión, aproximando los puntos del diagrama más que con cualquier otra
recta.
El término del error se calcula usando los valores observados, y los posibles de estimar:
𝐸𝑟𝑟𝑜𝑟 = (𝑌𝑖 − 𝑌̂𝑖 ) 𝐸𝑐. 5.5.11
Debido a que los errores pueden ser positivos y negativos, el método MCO producirá una
recta tal que la suma de los errores sea 0 y la magnitud de los errores sea mínima.
Condiciones que satisface el modelo de mínimos cuadrados:

𝑛
∑(𝑌𝑖 − 𝑌̂𝑖 ) ≅ 0 𝐸𝑐. 5.5.12

𝑖
𝑛
2
∑(𝑌𝑖 − 𝑌̂𝑖 ) = 𝑚í𝑛𝑖𝑚𝑜 𝐸𝑐. 5.5.13
𝑖
Se obtiene el mejor ajuste aplicando cálculo infinitesimal para minimizar el error, pero
también se tiene formulaciones prácticas a partir de la suma de cuadrados y los productos
cruzados, listas para inferir los parámetros muéstrales:
𝑛 𝑛
∑𝑛𝑖 𝑥𝑖 2
𝑆𝐶𝑥 = ∑(𝑥𝑖 − 𝑋) = ∑ 𝑥𝑖 2 −
2
𝐸𝑐. 5.5.14
𝑛
𝑖 𝑖
- 22 -
𝑛 𝑛
∑𝑛𝑖 𝑦𝑖 2
𝑆𝐶𝑦 = ∑(𝑦𝑖 − 𝑌) = ∑ 𝑦𝑖 2 −
2
𝐸𝑐. 5.5.15
𝑛
𝑖 𝑖
𝑛 𝑛
∑𝑛𝑖(𝑥𝑖 ∗ 𝑦𝑖 )
𝑆𝐶𝑥𝑦 = ∑[(𝑥𝑖 − 𝑋)(𝑦𝑖 − 𝑌)] = ∑(𝑥 ∗ 𝑦) − 𝐸𝑐. 5.5.16
𝑛
𝑖 𝑖
𝑆𝐶𝑥𝑦
𝑏1 = 𝐸𝑐. 5.5.17
𝑆𝐶𝑥
𝑏0 = 𝑌 − 𝑏1 ∗ 𝑋 𝐸𝑐. 5.5.18
Estos valores calculados son muy sensibles, y si se exige mayor precisión es necesario
calcular con 5 o 6 cifras significativas.
5.5.4.8 Suposiciones asumidas para la utilización del modelo de regresión lineal
1. El término 𝜀 es una variable aleatoria normalmente distribuida.

2. Se asume que la varianza de la variable dependiente es similar a la de la
independiente.
3. Los términos del error, son independientes, su diagrama de dispersión representa
una nube de puntos sin tendencia posible, a esta característica se la conoce como
homocedasticidad, la condición de homocedasticidad de los errores se encuentra
representada en la Figura 5-4, existen dos tipos de tendencias que se pueden
observar en los errores o residuos entre el modelo y los datos observados, la primera
del cuadro a) es una tendencia determinista continua que puede ser modelada por
una función cíclica o modelada a partir de un modelo autrregresivo positivo, la
segunda del cuadro b) es una fusión no continua donde la característica son saltos
entre valores positivos y negativos alternados, puede modelarse con un modelo
autorregrresivo negativo, por lo tanto que a pesar de haber aplicado el ajuste de un
modelo, los residuos entre lo modelado y los datos iniciales conservan aun
información importante que necesita ser modelada.
4. Los errores no presenta autocorrección.
- 23 -
Figura 5-4 Gráfica de los errores o residuales entre los modelos de regresión y los datos observados (Webster, 2001,
pág. 339).
5.6 Autocorrelación
La autocorrelación es un parámetro estadístico que representa la dependencia del valor de
una variable respecto sus observaciones previas, el concepto también se puede
particularizar a la variable error.
Se puede definir la autocorrelación para cierto nivel de significancia y el número de

observaciones existentes, usando la prueba Durbin-Watson.
5.7 Prueba Durbin-Watson

Es un test que se efectúa aplicándolo sobre una serie y la misma con un rezago
determinado, posteriormente se calcula una diferencia entre el valor actual y el anterior a lo
largo de toda la serie, luego se eleva al cuadrado y divide entre el total de valores, de esta
forma obtiene el estadístico d.
A partir de las tablas de Durbin-Watson se puede determinar si existe autocorrelación o si

no, para esto se construye 4 franjas para cada nivel de significancia, la hipótesis de
autocorrelación se verifica dependiendo entre que franjas cae el estadístico d.
Prueba de Hipótesis para verificar auto correlación entre los errores:

- 24 -
𝐻0 : 𝜌 𝑒 𝑡,𝑒 𝑡−1 = 0 𝑁𝑜 𝑒𝑠𝑖𝑠𝑡𝑒 𝑎𝑢𝑡𝑜𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛
𝐻𝐴 : 𝜌 𝑒 𝑡,𝑒 𝑡−1 ≠ 0 𝐸𝑥𝑖𝑠𝑡𝑒 𝑎𝑢𝑡𝑜𝑐𝑜𝑟𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛
Alternativas:
1. d es menor a dL existe autocorrelación negativa.

2. d es mayor a dL y menor a dV, no existe conclusión respecto la hipótesis.
3. d es mayor a du y menor a 4 - dV, no existe autocorrelación.
4. d es mayor a 4 – du y menor que 4 - dL no existe conclusión respecto la hipótesis.
5. d es mayor a 4 - dL existe autocorrelación positiva.
Un criterio informal pero muy preciso es que el estadístico d, tienda a 2, con esto se
garantiza que no hay autocorrelación, las alterativas descritas se encuentran representadas
en la Figura 5-5.
Existe No Existe Existe

Autocorrelación Autocorrelación Autocorrelación
negativa Inconclusivo Inconclusivo positiva
Figura 5-5 Límites para d que establecen la condición de autorrelación para una variable.
5.8 Análisis de Correlación

El valor positivo de 𝑏1 indica una relación directa; negativo, indirecta, pero solo eso no es
lo que se necesita para comprobar la fuerza de la regresión, quien se encarga de esto es el
coeficiente de correlación de Carl Pearson:
𝑟 = 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 −1≤𝑟 ≤1
𝑟 = 1 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎 𝑢𝑛𝑎 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑝𝑜𝑠𝑖𝑡𝑖𝑣𝑎 𝑝𝑒𝑟𝑓𝑒𝑐𝑡𝑎
𝑟 = −1 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎 𝑢𝑛𝑎 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑛𝑒𝑔𝑎𝑡𝑖𝑣𝑎 𝑝𝑒𝑟𝑓𝑒𝑐𝑡𝑎
Para comprender plenamente lo que mide el coeficiente de correlación es necesario

desarrollar conceptualmente 3 medidas de desviación:
Desviación total de Y, es la cantidad por la cual los valores de Y varían respecto de su

media. Se cuantifica a partir de una suma de cuadrados total:
- 25 -
𝑛
𝑆𝐶𝑇 = ∑(𝑦𝑖 − 𝑌𝑖 )2 𝐸𝑐. 5.8.1

𝑖
Esta medida se puede dividir en desviación explicada y no explicada:
Variación Explicada o Suma de Cuadrados de regresión:

𝑛
𝑆𝐶𝑅 = ∑(𝑌̂𝑖 − 𝑌𝑖 )2 𝐸𝑐. 5.8.2

𝑖
Variación No Explicada o suma de cuadrados de error:

𝑛
𝑆𝐶𝐸 = ∑(𝑦𝑖 − 𝑌̂𝑖 )2 𝐸𝑐. 5.8.3

𝑖
Entonces el coeficiente de correlación se calcula a partir de la siguiente fórmula:
𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑥𝑝𝑙𝑖𝑐𝑎𝑑𝑎 𝑆𝐶𝑅

𝑟= √ =√ 𝐸𝑐. 5.8.4
𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑡𝑜𝑡𝑎𝑙 𝑆𝐶𝑇
5.9 Coeficiente de Determinación

Es un indicador que considera una medida de bondad de ajuste, porque revela el porcentaje
de cambio de Y respecto de X, muestra que tan confiable es el modelo, pero la formulación
presentada solo tiene significancia para relaciones lineales, ya que varía según los grados de
libertad del modelo, la relación no puede ser tomada como una relación causa efecto de
manera arbitraria.
5.10 Análisis de series temporales

Una serie temporal es una secuencia de n observaciones ordenadas y equidistantes
cronológicamente, sobre una cierta característica, pueden ser escalares o vectoriales.
𝑈𝑛𝑖𝑣𝑎𝑟𝑖𝑎𝑛𝑡𝑒 𝑜 𝑒𝑠𝑐𝑎𝑙𝑎𝑟
𝑆𝑒𝑟𝑖𝑒𝑠 𝑡𝑒𝑚𝑝𝑜𝑟𝑎𝑙𝑒𝑠 {
𝑀𝑢𝑙𝑡𝑖𝑣𝑎𝑟𝑖𝑎𝑛𝑡𝑒 𝑜 𝑣𝑒𝑐𝑡𝑜𝑟𝑖𝑎𝑙
5.10.1 Componentes de las series temporales
Una serie temporal en muchos casos se puede simular con los modelos ARIMA sin
necesidad de recurrir a una separación de la serie en componentes, pero si no se pueden
garantizar las condiciones de estacionariedad en media y en varianza de una serie temporal,
pues entonces si es preciso separa la serie en componentes ya sea por un método aditivo o
multiplicativo (Webster, Estadística aplicada a los negocios y la economía, 2001, págs.
- 26 -
428-433), las diferentes componentes en las que una serie temporal se puede separar se
representan en la Figura 5-6 y son las siguientes:
a) Tendencia secular: Es una tendencia en la variable que le hace incrementar o

disminuir su magnitud con el trascurso de los periodos, se conoce también como la
componente determinística del modelo.
b) Fluctuación Cíclica: Se presenta en series que presentan picos y caídas cada cierto
tiempo, pero todas estas siguen un cierto patrón, se diferencia de las estacionales
porque se dan en periodos superiores a un año normalmente.
c) Variación Estacional: Son variaciones más leves que las cíclicas que se van
repitiendo mucho más regularmente, normalmente se acomoda bien esta
característica a fluctuaciones interanuales recurrentes.
d) Variación Irregular: es aquella componente que se torna completamente
impredecible, representa al carácter azarístico de los fenómenos reales.
- 27 -
Figura 5-6 Proceso de separación de una serie temporal en sus componentes.
5.10.2 Proceso estocástico temporal

Secuencia de variables aleatorias ordenadas y equidistantes cronológicamente, el proceso
estocástico se caracteriza por ser un modelo del flujo de la información en los fenómenos
- 28 -
temporales de la realidad, partiendo de la premisa de que los eventos pasados tienen
contenida información a partir de la cual es posible proyectar los eventos futuros, se
realizan a partir de combinaciones lineales de eventos previos, ruidos aleatorios y sus
estadísticos, a partir de esta definición el proceso estocástico no da una sola salida sino más
bien un conjunto de salidas, se observa las distintas salidas de un mismo modelo en la
Figura 5-7 , las tres salidas mantiene las propiedades estadísticas del proceso original, por lo
tanto no habría un criterio objetivo para asegura que una es mejor que las otras, por lo tanto
éticamente durante la evaluación de los mismos se restringe esta posibilidad de aplicación
de las infinidades de alternativas, de otra forma los métodos estocásticos llegarían a ser
inconmensurables respecto de los determinísticos (Mauricio, 2007, pág. 10).
Variable
Horizonte Temporal
Figura 5-7 Tres realizaciones posibles para un mismo proceso estocástico (Mauricio, 2007, pág. 10).
Las series temporales son representaciones de los procesos estocásticos, y de manera

similar a ellas los procesos se pueden separar, en la Figura 5-8 podemos ver cómo se pueden
separar las componentes de un proceso simularlas independientemente y posteriormente
regenerar la variable original con sus respectivas inferencias o predicaciones.
- 29 -
Variable
Variable
Horizonte Temporal Horizonte Temporal
Figura 5-8 PANEL A, representación de un proceso estocástico antes y después de la simulación, PANEL B,
representación de las componentes de un proceso estocástico antes y después de su simulación independiente
(Mauricio, 2007, pág. 41) .
Representación matemática de un proceso estocástico univariante:
(𝑌𝑡 : 𝑡 = 0; 𝑡 = ±1; 𝑡 = ±2; 𝑡 = ±3; … … . ) = 𝑦𝑡
5.10.3 Proceso Estacionario

Un proceso estocástico es estacionario cuando sus propiedades estadísticas como una
secuencia finita de componentes 𝑌𝑡 permanecen invariantes en el tiempo, cumplida esta
condición se facilita la descripción y la modelación de la serie a partir de su estructura
estadística.
5.10.4 Procesos No Estacionarios

Se dan cuando las propiedades estadísticas de al menos una secuencia 𝑌𝑡+ℎ son diferentes a
una secuencia 𝑌𝑡 ; si su esperanza incondicional es distinta de un grupo de componentes a la
de otro grupo de componentes dentro el conjunto total de datos ya se considera que el
proceso es no estacionario.
El correcto tratamiento consiste en definir si una serie es o no estacionaria, pero muchas

veces es muy difícil establecer esto para todas las series, aun así aproximar si una seria es o
no estacionaria influye enormemente en el proceso de simulación.
El proceso para trabajar con series no estacionarias es reducirlas a una forma estacionaria,
usando una transformación por medio de una función que reduzca la volatilidad de las
- 30 -
observaciones o una ecuación en diferencias de orden n para suprimir tendencias o ambas,
procedimientos que reducen el modelo a la condición de estacionariedad pero manteniendo
sus propiedades estadísticas.
5.11 Modelos Univariantes

Un proceso estocástico univariante es un conjunto de hipótesis bien definidas sobre ciertas
propiedades teóricas de las distribuciones de probabilidad de los componentes Yt de los
𝑁
cuales procede la serie temporal (𝑌𝑡 ) .
𝑡=1
5.11.1 Construcción de un Modelo Univariante
1. Identificación: Seleccionar un modelo teórico compatible con las propiedades

𝑁
estadísticas de la serie de observaciones (𝑌𝑡 ) .
𝑡=1
2. Estimación: asignación de valores numéricos a los parámetros del modelo.
3. Diagnosis: comprobación del ajuste del modelo a los datos utilizados.
5.11.2 Proceso Estocástico Estacionario en Media

Un proceso es estrictamente estacionario si 𝐸 = [𝑌 𝑡 ], esperanza incondicional, valor
esperado o media en procesos estacionarios, permanece constante para todo 𝑡 =
0; ±1; ±2; ±3; … … . . ; 𝑚.
5.11.3 Proceso Estacionario en Autocovarianza

Un proceso estocástico es estacionario en autocovarianza si y solo si 𝐸(𝑌𝑡 ) y 𝑉𝑎𝑟(𝑌𝑡 )
permanecen constantes para todo 𝑡 = 0; ±1; ±2; ±3; … … . . ; 𝑚.
Un proceso es estrictamente estacionario si presenta (Estacionariedad en Autocovarianza +

Normalidad), pero en la práctica se suele trabajar con procesos con estacionariedad en
autocovarianza, debido a que muy pocas series cumplen esta estricta condición.
El parámetro más representativo de la estacionariedad, y el que nos puede proporcionar

cierta información para poder decidir qué modelo aplicar es la autocorrelación, para ello se
necesitan desarrollar otros parámetros previos:
1
Media: 𝜇𝑌 = 𝐸[𝑌𝑡 ] = 𝑁 ∗ ∑𝑁
𝑖 𝑌𝑡 𝐸𝑐. 5.11.1
1
Varianza: 𝜎𝑌 2 = 𝑉𝑎𝑟[𝑌𝑡 ]= 𝐸[(𝑌𝑡 − 𝜇𝑌 )2 ]= 𝑁 ∗ ∑𝑁 2
𝑖 [(𝑌𝑡 − 𝜇𝑌 ) ] 𝐸𝑐. 5.11.2
Autocovarianza de orden 𝑘 para todo 𝑘 ≠ 0:
- 31 -
𝛾𝑘 = 𝑐𝑜𝑣[𝑌𝑡 , 𝑌𝑡+1 ] = [(𝑌𝑡 − 𝜇𝑌 )(𝑌𝑡+1 − 𝜇𝑌 )] 𝐸𝑐. 5.11.3
Solo cuando 𝑘 = 0; entonces 𝛾𝑜 = 𝑉𝑎𝑟[𝑌𝑡 ]
5.11.4 Función de Autocorrelación Simple

En un proceso estocástico estacionario se genera a partir de los valores que va tomando el
coeficiente de correlación lineal simple entre cualquier par de componentes de 𝑌𝑡 separados
entre sí por un retardo 𝑘, representa la duración y la intensidad de la memoria del proceso y
se estima con la siguiente fórmula:
𝑐𝑜𝑣[𝑌𝑡 , 𝑌𝑡+1 ]
𝜌𝑘 = 𝐸𝑐. 5.11.4
(𝑉𝑎𝑟[𝑌𝑡 ])1/2 ∗ (𝑉𝑎𝑟[𝑌𝑡+1 ])1/2
Para 𝑘 = 0; entonces 𝜌0 = 1
5.11.5 Función de Autocorrelación Parcial

Es la medida del grado de asociación lineal entre dos componentes cualesquiera de 𝑌𝑡
separadas entre sí por un retardo 𝑘 independientemente de las componentes que se
encuentren entre dicho retardo, cuantifica cuan correlacionadas están todas las componente
separadas en un cierto retardo (Mauricio, 2007, pág. 52).
1 𝜌1 𝜌2 ⋯ 𝜌𝑘−2 𝜌1
𝜌 1 𝜌1 ⋯ 𝜌𝑘−3 𝜌2
| 𝜌1 𝜌1 ⋯ 𝜌𝑘−4 𝜌3 |
| 2 1 |
⋮ ⋮ ⋮ ⋮ ⋮
𝜌𝑘−1 𝜌𝑘−2 𝜌𝑘−3 ⋯ 𝜌1 𝜌𝑘
𝜑𝑘𝑘 = 𝐸𝑐. 5.11.5
1 𝜌1 𝜌2 ⋯ 𝜌𝑘−2 𝜌𝑘−1
𝜌 1 𝜌1 ⋯ 𝜌𝑘−3 𝜌𝑘−2
| 𝜌1 𝜌 ⋯ 𝜌𝑘−4 𝜌𝑘−3 |
1
| 2 1
|
⋮ ⋮ ⋮ ⋮ ⋮
𝜌𝑘−1 𝜌𝑘−2 𝜌𝑘−3 ⋯ 𝜌1 1
Para ajustar a un buen modelo teóricamente el número de observaciones N tiene que ser
bastante más grande que 𝑘, para que las funciones de autocorrelación no se encuentren
indeterminadas, normalmente se sugiere que sea un valor menor a ¼ del registro total, pero
si evaluar las funciones en más rezagos permite identificar un modelo más adecuado se
debe hacerlo.
Las funciones de autocorrelación simple y autocorrelación parcial, son útiles para

identificar el tipo de proceso estocástico que ajusta a una serie temporal, además son un
buen indicador de la condición de estacionariedad de la serie, en la Figura 5-9 se presenta un
- 32 -
planteamiento para establecer el modelo estocástico que ajusta mejor a una serie temporal
(NCSS Statistical Software, 2016, pág. 5).
Modelo AR(1) Con parámetro regresor Modelo AR(1) Con parámetro regresor
positivo negativo
Modelo Ar(2) Con parámetro positivo Modelo Ar(2) Con parámetro negativo
predominante predominante
Figura 5-9 Distinción del tipo de modelos a aplicar sobre algunos procesos estocásticos, se muestra las funciones de
auto correlación simple y parcial para los distintos procesos y como estas nos ayudan a identificar el tipo de modelo a
seleccionar (Mauricio, 2007, pág. 73).
5.11.6 Ruido Blanco

Es un proceso estocástico estacionario de 𝜇𝐴 = 0 y 𝜎𝐴 2 = 1, compuesto por variables
escalares aleatorias e idénticamente distribuidas, puede ser un ruido blanco normalmente
distribuido, en procesos estocásticos simplemente debe cumplir con las primeras 2
condiciones, la normalidad no es necesaria.
5.12 Modelos aplicados a Series Estacionarias

5.12.1 Modelos Autorregresivos AR(p)
Los modelos autorregresivos, sirven para describir procesos estocásticos en los cuales el
valor presente depende de ciertos valores previos al mismo definidos convenientemente y
tomando la influencia de una variable aleatoria que innova (ruido blanco) para continuar el
proceso, su formulación es la siguiente:
𝑌𝑡 = 𝜑1 ∗ 𝑌𝑡−1 + 𝜑2 ∗ 𝑌𝑡−2 + 𝜑3 ∗ 𝑌𝑡−3 +. . . … + 𝜑𝑝 ∗ 𝑌𝑡−𝑝 + 𝐴𝑡 𝐸𝑐. 5.12.1
- 33 -
5.12.2 Modelos De Medias móviles MA(q)
Son modelos, que describen procesos en los cuales la base de la inferencia es la media de
las observaciones más una combinación lineal de ruidos anteriores al evento que se desea
predecir.
𝑌𝑡 = 𝜇 + 𝐴𝑡 − 𝜃1 ∗ 𝐴𝑡−1 − 𝜃2 ∗ 𝐴𝑡−2 − 𝜃3 ∗ 𝐴𝑡−3 −. . . … − 𝜃𝑞 ∗ 𝐴𝑡−𝑞 𝐸𝑐. 5.12.2
5.12.3 Modelos Autorregresivos de Media Movil ARMA(p,q)
Son una combinación de los procesos anteriores, su formulación es la siguiente:
𝑌𝑡 = 𝜇 + 𝜑1 𝑌𝑡−1 + 𝜑2 𝑌𝑡−2 + ⋯ + 𝜑𝑝 𝑌𝑡−𝑝 + 𝐴𝑡 − 𝜃1 𝐴𝑡−1 − 𝜃2 𝐴𝑡−2 − ⋯

− 𝜃𝑞 𝐴𝑡−𝑞 𝐸𝑐. 5.12.3
Para realizar la correcta estimación de parámetros, se debe tener en cuenta que las raíces
correspondientes a las siguientes ecuaciones definidas en las siguientes condiciones, están
fuera del círculo unitario o sea son menores a 1 (IHS Global Inc., 2015, pág. 131):
Condición de estacionariedad: Todas las raíces de la siguiente ecuación están fuera del
círculo unitario.
1 − 𝜑1 ∗ 𝑥 − 𝜑2 ∗ 𝑥 2 − 𝜑3 ∗ 𝑥 3 −. . . … − 𝜑𝑝 𝑥 𝑝 = 0 𝐸𝑐. 5.12.4
Condición de invertibilidad: Todas las raíces de la siguiente ecuación están fuera del
círculo unitario.
1 − 𝜃1 ∗ 𝑥 − 𝜃2 ∗ 𝑥 2 − 𝜃3 ∗ 𝑥 3 −. . . … − 𝜃𝑝 𝑥 𝑝 = 0 𝐸𝑐. 5.12.5
Esas tres clases de procesos pueden describir el comportamiento de una serie temporal en
tanto que estas sean series estacionarias.
- 34 -
Tabla 5-1 Características de los procesos estocásticos estacionarios y patrones de identificación para la aplicación de
los modelos (Mauricio, 2007, pág. 77).
5.13 Modelos Aplicados a series No Estacionarias

Cualquier proceso estocástico no estacionario, debe ser sometido a ciertos tratamientos para
garantizar la estacionariedad, de otra forma la inferencia no es posible, el concepto de
estacionariedad, se dividirá en dos conceptos nuevos para su correcta aplicación,
estacionariedad en media, estacionariedad en varianza.
5.13.1 Estacionariedad en Varianza

Un proceso es estacionario en varianza en cuanto la fluctuación de los datos es
relativamente uniforme a lo largo de todo el proceso, la Figura 5-10 muestra una serie que
presenta 2 fluctuaciones diferentes en un mismo proceso, en una primera etapa las
fluctuaciones son leves y en una segunda son mucho más fuertes.
- 35 -
Fluctuación elevada
Variable Fluctuación leve
Horizonte Temporal
Figura 5-10 Representación de un proceso estocástico con más de una volatilidad (Mauricio, 2007, pág. 84).
5.13.2 Transformación Box Cox

Es un procedimiento realizado para eliminar las variaciones de la volatilidad de las series
temporales, la presencia de esta variación se ve con mayor claridad en la Figura 5-11, la
transformación logra aumentar las fluctuaciones pequeñas y disminuir las grandes, existen
varias formas de estimar sus parámetros, pero el tanteo es la mejor alternativa de su
obtención entre los valores -2 y 2 para 𝜆, su formulación general es la siguiente:
(𝑌𝑡 + 𝑚)𝜆−1
𝑝𝑎𝑟𝑎 𝜆 ≠ 0 𝐸𝑐. 5.12.1
𝜆
𝑌´𝑡 =
ln( 𝑌 𝑡 ) 𝑝𝑎𝑟𝑎 𝜆 = 0 𝐸𝑐. 5.12.2
{
No es la única trasformación posible, pero si una de las más eficientes cuando el objeto es
generar una estacionariedad en varianza y se tiene dos volatilidades claramente marcadas.
Empíricamente en nuestro trabajo se ha observado que la trasformación BOX COX es la

más adecuada cuando existen 2 volatilidades diferentes en una misma serie temporal.
- 36 -
Variable
Horizonte Temporal
Variable
Horizonte Temporal
Figura 5-11 Diferencia entre una serie de datos y su posterior aplicación de una transformación para conseguir
estacionarizarla (Mauricio, 2007, pág. 85).
5.13.3 Estacionariedad en Media

Muchas veces las series presenta una tendencia determinística demasiado significativa
como para definirlas estacionarias, el panel A de la Figura 5-12, muestra una serie que a
pesar de haber conseguido la condición de estacionariedad en varianza, permanece sin ser
estacionaria en media, en casos como este para lograr estacionarizar la serie es necesario
suprimir dicha tendencia, el procedimiento es generar una nueva serie, un nuevo proceso
estacionario a partir de uno no estacionario, para ello aplicamos diferencias.
El operador diferencia regular de orden d, (d>1) operador que solo puede tomar valores
enteros, se simboliza como ∇d = (1 − 𝐵)𝑑 , donde B es el operador de retardo, el proceso
resultante es un proceso integrado de orden d.
- 37 -
∇𝑥𝑡 = 𝑥𝑡 − 𝑥𝑡−1 𝐸𝑐. 4.12.3
∇2 𝑥𝑡 = 𝑥𝑡 − 2 ∗ 𝑥𝑡−1 + 𝑥𝑡−2 𝐸𝑐. 412.4
El resultado de la estacionarización en media, nos conduce a la posibilidad de aplicar un

modelo estocástico sobre la serie trasformada.
Variable
Horizonte Temporal Variable Horizonte Temporal
Figura 5-12 Trasformaciones sobre la serie volátil, panel A (trasformación Box Cox), panel B (trasformación Box Cox +
primera diferencia) (Mauricio, 2007, pág. 94).
5.13.4 Modelo Autoregresivo Integrado de Media Móvil ARIMA (p,d,q)

Es un proceso estacionario, que es resultado de la estacionarización de una serie no
estacionaria aplicando ecuaciones en diferencias, el cual además basa su poder estimativo,
inferencial y predictivo en una combinación lineal tanto de observaciones anteriores como
de ruidos previamente generados, su formulación es resultado de las anteriores.
5.13.5 Selección del Modelo

El modelo seleccionado debe cumplir con las 2 condiciones previamente definidas y
además realizar inferencias coherentes, las condiciones de estacionariedad e invertibilidad
son las que validan la aplicación de un modelo estocástico.
5.13.6 Diagnosis
Para poder definir qué modelo es mejor, las funciones de auto correlación y auto
correlación parcial de los residuos entre el modelo aplicado y la serie en su mayoría no
deben superar la franja de confianza, de esta forma se garantiza que los residuos tiendan a
un ruido blanco, y no continúen teniendo información que no se haya aprovechado en el
modelo estimador, cumplida esta condición sigue la optimización que se obtendría
minimizando los estadísticos AIC (Criterio de información de Akaike) y BIC (criterio de
información Bayeciano de Schawarz), existen otras pruebas pero son demasiado limitadas
- 38 -
así que en este estudio nos enfocamos solo en esos aspectos para la obtención de nuestros
modelos.
5.14 Identificación de valores anómalos en las series temporales Prueba

de Grubbs & Beck para la detección de datos anómalos
Todos los valores que superan el umbral siguiente se consideran valores anómalos y se
debe proceder con cierta cautela a su inclusión o exclusión durante el proceso de
simulación de datos faltantes, a falta de un criterio estrictamente establecido se recupera
de la Guía de prácticas hidrológicas (Water Resource Council, 1981):
𝑥 = 𝑥̅ ± 𝑘𝑛 ∗ 𝑠 𝐸𝑐. 5.13.1
Este umbral se puede aplicar tanto a la serie corriente como al logaritmo de los datos.
Los valores de 𝑘𝑛 son una función del número de los datos.
𝑘𝑛
1 1 3
−3.6221 + 6.2844 ∗ 𝑛4 − 2.49835 ∗ 𝑛2 + 0.491436 ∗ 𝑛4 − 0.037911 ∗ 𝑛 𝑝𝑎 𝑟𝑎 𝑛 > 150
={
−0.9043 + 3.345 ∗ √log ( 𝑛 ) + 0.4046 ∗ log( 𝑛) 𝑝𝑎𝑟𝑎 𝑛 ≤ 150
𝐸𝑐. 5.13.2
De encontrarse datos anómalos, el umbral debe recalcularse sin ellos hasta que no se
determinen más datos anómalos.
5.15 Método Aglomerativo de agrupación de datos: Clúster Jerárquico
Es un método que permite determinar grupos entre distintas mediciones de datos o

muestras y puede ser empleado para determinar grupos de estaciones meteorológicas entre
estaciones con características afines, y se emplea de la siguiente forma:
Se ordena las características (variables) en vectores ordenados para cada estación.
Se realiza un procedimiento de normalización entre las variables para que sus magnitudes
estén entre 0 y 1 y de esa forma el tamaño y las unidades de cada característica no influyan
en el proceso de agrupación, esto permite que la agrupación de datos sea más coherente y
objetiva.
- 39 -
Con los vectores generados y normalizados se procede al cálculo de las distancias
euclidianas de los valores entre las estaciones.
A partir de dichas distancias se determinan distintos centroides como número de

agrupaciones posibles, cada centroide se encuentra a una distancia euclidiana mínima de
las estaciones, los centroides están posicionados de manera que la desviación estándar de
las características en las agrupaciones se minimiza.
- 40 -
6 DESCRIPCIÓN RESUMIDA DE LOS PROGRAMAS
COMPUTACIONALES UTILIZADOS
6.1 HEC-4
Este software fue desarrollado por los ingenieros y científicos de la armada de los Estados
Unidos, para contribuir en los proyectos de gestión de recursos hídricos, específicamente
para esa región del mundo aunque por la eficiencia de los resultados obtenidos se usa en la
actualidad para inferir observaciones de series de datos climáticos en otras regiones
geográficas.
El software se diseñó inicialmente para poder:
 Determinar las características estadísticas de una serie de mediciones de caudal.

 Generar nuevos flujos hipotéticos posibles que simulen el comportamiento del
cauce seleccionado
Posteriormente se observó que la capacidad de modelación del programa no se limitaba

solo a la simulación de flujos, sino que se podía aplicar a otras variables relevantes en la
gestión del agua, las cuales serían: precipitación, evaporación y variables de recursos
hídricos en general.
El software es bastante versátil porque puede trabajar con muchos datos faltantes,
simplemente ajustando el intervalo temporal de relleno para que genere observaciones de
manera automática.
HEC-4 capaz de rellenar datos mensuales que se encuentran en el interior de las series, y
cada vez que rellena un valor reajusta las ecuaciones de generación, además el valor
generado se enriquece con un componente aleatorio introducido al final de la inferencia,
por lo tanto a pesar de haber aplicado un procedimiento determinístico, esta introducción
del valor aleatorio no genera nunca un mismo resultado.
6.1.1 Método de Cómputo

Inicialmente el programa necesita que se ingrese datos de la variable a predecir o rellenar
en intervalos mensuales de al menos dos y hasta cinco estaciones meteorológicas
debidamente codificadas en un formato establecido.
Posteriormente el software realiza una transformación de la variable incrementándole una

constante y aplicando logaritmos, esto es muy similar a lo que actualmente se conoce como
transformación Box-Cox, esta transformación permite que los valores generados a partir de
los estadísticos (medias y coeficientes de correlación) que utiliza el software por intervalos
- 41 -
mensuales sean siempre superiores o iguales a 0 para garantizar que los valores generados
no sean carentes de sentido.
Para trabajar con los datos de manera que se ajusten coherentemente con los postulados de
la estadística inferencial, la regla empírica y el teorema central del límite, el software
agrupa series mes a mes y las normaliza usando la distribución Pearson Tipo III (US Army
Corps of Engineers, 1971, pág. 3).
El programa se alimenta de la información proveniente de un conjunto de estaciones

vecinas, por lo tanto trabaja con la correlación que existe entre todas ellas para ello:
 Calcula la función de correlación entre pares de estaciones.

 Ensambla una matriz de correlaciones, cuyos valores permiten estimar los
coeficientes de generación de datos faltantes para cada mes de manera similar a un
modelo de correlación múltiple.
 Si el software carece por completo de datos en un intervalo, genera valores a partir
de los valores medios para cada mes.
Muchas veces surgen problemas operacionales donde la correlación para un determinado

rezago y ciertas estaciones es superior a uno, en casos por ejemplo que hayan demasiados
datos incompletos, para ello el programa reajusta sus ecuaciones hasta obtener un valor
lógicamente viable, la función que rellena los datos toma en cuenta todos los coeficientes
de las matrices excepto aquellos que queden indeterminados por errores de truncamiento,
durante el procesos de convergencia de las raíces de las ecuaciones que necesitan ser
resueltas para obtenerlos, el programa puede reconstituir información de hasta un máximo
de cinco estaciones vecinas, y generar escenarios nuevos para hasta diez estaciones vecinas
.
6.1.2 Entrada de Datos

Los datos deben ser insertados con unidades que en sus observaciones no tengan una
magnitud cercana a un millón, se debe introducir las observaciones en un formato estándar
y además se debe establecer el inicio del año hidrológico.
EL software usa distintas cartas para que le mostremos la información y la forma en que
este va trabajar la información:
La carta A corresponde al título del proyecto y datos cualitativos que lo caractericen, uno
puede describir en ella todas las consideraciones pertinentes y necesarias.
En la carta B se delimita varios aspectos de la simulación; consta de distintos espacios para

ir especificando como es que el programa va a trabajar estos están numerados:
- 42 -
1 Corresponde al año más antiguo de datos disponibles de entre todo el conjunto de
estaciones, y a partir del cual se va iniciar el relleno.
2 Permite especificar el mes de inicio del año hidrológico.
3 Cuando está indicado el programa asumirá todos los valores positivos como datos
4 Número de años sintéticos a generar para la reconstrucción de series incompletas
5 En el caso de querer extender ciclos de medición, permite definir el número total de años
que hipotéticamente se pretende extender a partir de la serie original de más larga
duración.
6 Número de años que se puede obtener par aun límite de valores máximos y mínimos que
el programa va a poder generar es una característica que puede ayudar a que los estadísticos
de la serie rellenada no se vea afectada por los nuevos valores extremos generados en el
modelo.
7 Se especifica el número de pasos, cada paso representa la cantidad de veces que el

programa compara entre las correlaciones entre estaciones, se sugiere que sea una cantidad
igual al número de estaciones que se puede insertar menos 1.
8 Habilita los valores positivos que sean utilizados en la reconstitución de las series,
puede ser bastante útil a la hora de rellenar series de datos con la totalidad de valores
negativos, o también para generar un nuevo escenario hipotético completamente nuevo pero
con las mismas probabilidades de ocurrencia que el anterior.
9 Indica que los datos positivos se tomaran en cuenta a la hora de calcular los estadísticos
que se usaran para el relleno, a diferencia de los negativos que serán ignorados.
10 Número de estaciones para las cuales se va generar un nuevo flujo, pueden llegar a ser
hasta 10.
En la carta C se puede especificar algunos aspectos de como el programa va proceder a

realizar la simulación:
1 Número de series correlacionadas entre estaciones, solo puede llegar a ser 2 por lo tanto
el programa trabajaría con correlación entre solamente pares de estaciones, y escogería para
cada mes la que sea más elevada para efectuar el relleno.
2 Número de pares a comparar entre los valores acumulados de la variable para cada mes y
a partir de ellos priorizar el relleno entre un par de estaciones.
3 Número de test de consistencia a realizar, se puede establecer hasta un número total de

10.
- 43 -
4 Indica la lectura de estadísticos definidos previamente para la simulación.
5 Número de proyecciones al futuro a ser generadas.
6 Año inicial de la proyección
7 Mes inicial de proyección
8 Ultimo año para cada proyección, número de estaciones y de años reconstruidos.
La carta D se habilita si se ha determinado un número de combinaciones:
1 Número de estaciones en cada combinación.
2 Número asignado a la estación.
La carta E es un complemento de la carta D:
1 Toma el mismo valor de D1.
2 permite establecer coeficientes para realizar cada correlación, es útil para priorizar la
influencia de una cierta estación en cada combinación.
Las demás cartas permiten desarrollar otros aspectos más particulares y son aplicables a los
rellenos de caudal por lo tanto su desarrollo no parece ser pertinente en el presente trabajo.
6.1.3 Datos de Salida

El programa luego de analizar y procesar la información nos devuelve las matrices de
correlación entre estaciones y las series de datos completadas en el intervalo indicado para
cada una de las estaciones introducidas, de manera análoga a la entrada los resultados qué
ofrece el modelo también se encuentran clasificados en cartas.
6.2 CHAC
Es una aplicación producida por el Centro de Estudios Hidrológicos del CEDEX con
metodologías desarrolladas por el mismo, que es de sencillo manejo y con una interfaz
gráfica, de distribución libre concordando con su ideal de transmitir tecnología a la
sociedad.
El programa cuenta con varios módulos para satisfacer distintas necesidades en los trabajos
hidráulicos e hidrológicos, particularmente aprovecharemos de él su capacidad para rellenar
series de precipitación en intervalos mensuales, aunque debemos aclarar que su capacidad
no se limita solo al relleno de datos faltantes.
- 44 -
Para realizar esta operación de completado de datos el software tiene implementado el
modelo CORMUL destinado a completar datos de series de fenómenos que se extienden en
escalas temporales.
El modelo reproduce el comportamiento de una estación recurriendo a las estaciones

hidrometeorológicas de similar comportamiento, el modelo se apoya tanto en métodos
estadísticos como estocásticos, aprovecha la información del historial de la estación y de su
relación con las otras para completar sus datos faltantes, sus inferencias se realizan usando:
 Medias aritméticas.
 Medias móviles.
 Medias relativas a la altitud o posición geográfica.
 El método de Thiessen y Thiessen modificado.
 Media aritmética ponderada según la altitud del terreno
 Interpolación en función de la distancia.
 Método de isoyetas.
 Interpolación polinómica.
 Técnicas estocásticas de interpolación.
El programa particularmente se diferencia de los demás por tener 2 parámetros particulares

el coeficiente de priorización y el umbral de priorización, el exponente define la
importancia del número de datos comunes entre estaciones para poder realizar la inferencia,
mientras mayor sea su valor, los rellenos se efectuaran solo usando los datos más
frecuentes, el umbral de priorización seria el valor mínimo que la inferencia puede aceptar,
se sugiere valores de 0.7 para la inferencia (CEDEX, 2013, pág. 37).
Para estacionarizar las series, el software extrae la media en cada observación y la divide
entre la desviación estándar de la serie tratada.
En la Figura 6-1 se presenta de manera general el procedimiento utilizado para el relleno de

datos faltantes con el software.
- 45 -
Figura 6-1 Esquema del proceso de relleno de datos con el software CHAC.
6.2.2 Datos de Entrada

Se debe insertar la información temporal en un formato específico, además se debe
establecer las coordenadas geográficas y altura de cada estación, establecer los pares de
completado a partir de la correlación entre estaciones junto con el exponente y umbral de
priorización.
6.2.3 Salida de Datos

El Software nos devuelve datos mensuales y las matrices de correlación, los datos se
generan en un horizonte temporal definido previamente, pero no siempre hay la suficiente
información para rellenar todos los huecos, por esta razón se intentó hacer que el software
trabaje de la manera más permisiva.
6.3 Aplicación de relleno de Datos Faltantes en el Código R

El Codigo R es un lenguaje de programación con una gran cantidad de funciones
estadísticas previamente incorporadas, permitiendo construir rutinas computacionales de
aplicación estadística y estocástica, desde las más simples hasta las más complejas.

EL programa para la inferencia de las observaciones faltantes usa dos paquetes diseñados
uno para la gestión de los datos de entrada y el otro para la generación de valores sintéticos
a partir de las propiedades estadísticas de las series involucradas.
- 46 -
El primer paquete denominado Zoo, cuenta con métodos de indexación de observaciones,
aplicable en series de tiempo discretas que presentan datos faltantes, el software es
ventajoso porque es capaz de manejar series irregulares de distintas escalas de medición y
permite trabajar con los datos de distintas estaciones meteorológicas, como vectores de un
cierto número de componentes, para cada intervalo de medición.
HydroGOF es el segundo paquete usado por la aplicación de relleno de datos en el código

R, permite rellenar datos de distintas variables usando 2 métodos:
 El método de coeficiente de correlación ponderado

 El método de la distancia inversa ponderada,
De entre los que se elige el más adecuado para cada serie por rellenar.
 El software primeramente determina un matriz de correlaciones entre las

observaciones de cada estación.
 Posteriormente calcula las distancias entre estaciones para determinar cómo varia la
correlación al incrementar la distancia entre estaciones.
Cuando las correlaciones son altas se aplica de manera directa el método de correlación por
coeficientes ponderados, asignando un peso a cada estación en relación a los coeficientes de
las demás estaciones, por otro lado si las correlaciones son bajas se realiza un relleno
también usando los coeficientes pero ponderando con mayor peso a las estaciones más
cercanas.
6.3.2 Datos de entrada

EL software requiere que se ingrese los datos de la variable que se desea inferir en un
archivo en el cual se asigna un vector a cada periodo de observación, las componentes
viene a ser los datos de cada una de las estaciones en el mismo periodo.
Se exige también que se ingrese un archivo con las coordenadas de cada una de las
estaciones en el sistema UTM y además de ello la altura sobre el nivel del mar de cada una
de las estaciones.

El programa luego de la simulación nos devuelve un archivo en el mismo formato en que
ingresamos los datos de entrada de las series pero con los vectores rellenados para cada
periodo de observación que faltaba inicialmente.
6.4 CLIGEN
Es un generador de clima estocástico desarrollado por el laboratorio nacional de erosión de
los Estados Unidos, permite poder estimar diariamente valores de precipitación,
temperatura máxima, temperatura mínima, temperatura de punto de roció, radiación solar
- 47 -
para una posición geográfica, velocidad y dirección del viento (Nicks, Jane, & Gander,
1995, págs. 3-7).
Su generador de valores aleatorios, obtiene los mismos resultados si los datos de entrada y
el ordenador en que se trabaja son los mismos, de manera similar a HEC-4 se lo diseño
para aplicaciones de la ingeniería hidráulica en la región de américa del norte pero por su
utilidad se extendió su aplicación en diversas partes del mundo.
A diferencia de otros programas computacionales CLIGEN nos permite realizar

simulaciones de 1 a 1000 años con solo 30 años de observaciones.

CLIGEN genera valores de temperatura máxima, temperatura mínima y radiación solar
independientemente de los valores de precipitación que se tenga, el software ha
incorporado un control de calidad de sus números aleatorios producidos a partir de una
distribución Gamma.
El esquema de generación de datos aleatorios es el siguiente:
 Generación de números aleatorios entre 0 y 1 con distribución uniforme

 Generación de números aleatorios para la simulación de la desviación estándar de
las nuevas observaciones.
 Aplicación de las ecuaciones de Cligen para generar valores diarios para las
distintas variables.
Los números aleatorios generados por el software permanecen siendo aleatorios después de
300000 valores, pero que necesariamente mantienen su condición de estacionalidad en
media y varianza, los valores además se generan dentro de un intervalo de confianza
definido para que no se reproduzcan observaciones que sean lógicamente incoherentes en
relación a las variables de estudio.
Para Generar datos de precipitación trabaja usando probabilidad condicionada para cada
mes, separando el proceso para días con lluvia y sin lluvia.
El procedimiento empleado para la simulación del clima a partir de las variables climáticas
de la región se detalla en la Figura 6-2 presentada a continuación.
- 48 -
Figura 6-2 Esquema del proceso de relleno de datos con el software CLIGEN.

Los datos se deben insertar en un formato específico con unidades compatibles, además en
la interfaz de WEPP se debe introducir los datos de precipitación máxima para 30 y 360
minutos antes de proceder a la generación de clima sintético en un horizonte temporal
definido.

El software genera valores combinando la información entre variables, y genera
observaciones sintéticas alternativas que representan un clima con las mismas
características del original , por lo tanto también puede ser una alternativa de generación de
datos de una variable a partir de otras.
6.5 CLIMGEN
Es un software producido por la Universidad Estatal de Washington, que surge como una
alternativa al software WGEN que necesita trabajar con series que tienen al menos 30 años
de observaciones diarias, que además no necesariamente se ajusta a todos los climas ni de
Estados Unidos ni del mundo, el software puede generar datos diarios a partir de series
diarias o simplemente de resúmenes mensuales (Nelson, 2002, pág. 2).
- 49 -
El esquema del proceso es bastante similar al del CLIGEN, por tener ambos la misma
finalidad, pero presenta algunas variaciones.
 El Software determina la probabilidad condicionada que existe entre días que

llueve y días que no para cada mes del año.
 Prosigue estableciendo la distribución que van a tomar los días lluviosos, para esto
hace uso de la distribución de Weibull y obtiene valores de precipitación a partir de
números aleatorios previamente generados de las características estadísticas de la
serie inicial que se introdujo.
 Para la generación temperatura y la radiación solar, las series temporales, se
descomponen hasta llegar a una serie residual, libre de todo tipo de tendencias
perceptibles por el modelo y a partir de ellas genera valores aleatorios para estas
variables.
 Para volver a la variable original, determina unas matrices de correlación cruzada,
las cuales variaran sus coeficientes en función de los estimadores producidos para la
probabilidad condicionada y la distribución de Weibull, de esta forma los valores
generados de las demás variables entran en relación con la posibilidad de que un día
sea húmedo o seco.

Los valores de entrada para el software se pueden ingresar en cualquier formato utilizado
por los otros generadores de clima estocástico, pero además se debe ingresar la información
geográfica correspondiente a cada estación.

De manera similar a CLIGEN el software nos devuelve los datos valores generados para
un periodo de tiempo definido, el tamaño de los registros que se define simular influye
enormemente en el tiempo de procesamiento de la información.
6.6 WGEN
El modelo tiene la capacidad de generar datos sintéticos de clima con las mismas
características estadísticas de los datos de series incompletas, estos nuevos datos generados
representan escenarios alternativos al ocurrido, pero se pretende evaluar como funcionarían
durante un proceso de relleno de datos de manera análoga a los generadores de clima antes
expuestos.
El generador a partir de valores diarios o mensuales de precipitación, temperatura máxima

y radiación solar, puede generar nuevas series en las cuales se conserva la dependencia
temporal, la correlación entre variables y las características estacionales de los datos de
clima de una localización especifica.
- 50 -
Para determinar la ocurrencia de días secos y húmedos el modelo utiliza una cadena de
Markov de primer orden (Richardson & Wright, 1984, pág. 6), cada vez que genera un día
húmedo recalcula los parámetros de la distribución gama que es la que utiliza para generar
los distintos valores de precipitación para días húmedos, los días húmedos son todos
aquellos con una precipitación mayor a 0.01 mm, se ha aplicado la distribución gama para
la generación de los valores de precipitación porque esta distribución es la que produce
valores más representativos en comparación con otras distribuciones.
Los valores de temperatura son generados simulando un proceso estacionario semanal, en

una matriz que calcula los coeficientes para generar las nuevas observaciones a partir de los
datos de temperatura mínima, máxima y radiación solar, estos coeficientes se determinan a
partir de la correlación serial o a partir de la correlación cruzada entre variables.
Los valores de radiación son obtenidos, multiplicando los elementos residuales de los
valores generados para temperatura mínima y máxima, y adicionándolos a la media de los
valores de radiación solar.

El software permite ingresar datos diarios o mensuales, lo hemos utilizado en la plataforma
GoldSlim, en la cual los datos de entrada son estadísticos mensuales respecto de los datos
observados, los datos que se deben ingresar son los siguientes:
Precipitación:
Probabilidad condicional para cada mes de que un día llueva dado que llovió el día anterior.
Probabilidad condicional para cada mes de que un día no llueva dado que llovió el día
anterior.
Valores medios de precipitación para cada uno de los meses del año.
Valores de desviación estándar de precipitación para cada uno de los meses del año.
Temperatura Máxima:
Media de los máximos anuales de temperatura máxima para días secos y días húmedos.
Amplitud anual de temperatura máxima para días secos y húmedos.
Media del coeficiente de variación de la temperatura máxima anual para los días secos y
húmedos.
- 51 -
Amplitud anual del coeficiente de variación de temperatura máxima anual para los días
secos y húmedos.
Temperatura Mínima:
Media de los datos de temperatura mínima anual.
Amplitud de la temperatura mínima anual.
Media anual del coeficiente de variación de la temperatura mínima.
Amplitud anual del coeficiente de variación de la temperatura mínima.
Radiación solar:
Media anual de radiación solar
La información de radiación solar se puede inferir a través de un mapa de radiación solar.

El programa nos genera valores de precipitación, temperatura mínima y máxima para los
días que tenían huecos, y estos pueden utilizarse como observaciones sintéticas, resultados
que comparamos con los otros generadores estocásticos de clima.
6.7 EVIEWS9
Es un software diseñado para poder computar una diversidad de modelos matemáticos, es
útil, porque ya viene incorporado con herramientas de cálculo de coeficientes de modelos
estocásticos aplicados a series temporales, generadores de números aleatorios para estos
coeficientes y funciones de simulación de datos sintéticos.
Es capaz de calcular y graficar rápidamente las funciones de autocorrelación simple y

autocorrelación parcial, el programa puede determinar sus estadísticos a partir de distintos
métodos del cálculo integral y numérico.
Es de especial relevancia en nuestro estudio porque permite usar los modelos ARIMA
(Autorregresivos Integrados de Media Móvil) de manera muy versátil, siendo capaz de
evaluar el nivel de significancia de coeficientes y los errores ligados a las inferencias en
cuestión de segundos.

El software no hace todo el trabajo por sí solo, tiene una herramienta de generación de
valores y pronostico automatizada, que no es muy buena en la práctica por lo tanto se
utilizó el software aplicando la metodología BOX-JENKINGS, que es un buen lineamento
para trabajar con series estacionarias.
El procedimiento empleado para realizar las inferencias es el siguiente:
- 52 -
 Definir la condición de estacionariedad de la serie mediante las grafica de las
funciones de autocorrelacion simple y parcial, o mediante la prueba de la raíz
unitaria.
 Si la serie no es estacionaria, determinar su condición de no estacionariedad.
 Si la serie es no estacionaria en media aplicar ecuaciones en diferencias de hasta
segundo orden para poder estacionarizarla.
 Si la serie es no estacionaria en varianza aplicar las trasformaciones logarítmica o
Box Cox.
 Conseguida la condición de estacionariedad de la serie determinar posibles
modelos a aplicar para simular el comportamiento de la serie.
 Escoger un modelo, que agote toda la información contenida en la serie original
(que no presente auto correlación en los residuales) y que tenga coeficientes
autorregresivos o de media móvil significativos (nivel de significancia menor al 15
%)
El proceso es iterativo doblemente pues luego de encontrar un modelo adecuado, y rellenar

un hueco, se debe incorporar ese valor para rellenar el siguiente hasta tener completo todo
el horizonte temporal de estudio.
La metodología Box & Jenkins es un procemiento iterativo utilizado para poder determinar
el modelo más eficiente para simular una serie temporal a partir de modelos ARIMA, la
Figura 6-3 describe de manera clara los pasos a seguir para conseguir dicho propósito.
- 53 -
Figura 6-3 Enfoque de la metodológica BOX JENKINS para la generación de valores sintéticos a partir de series
temporales.

El software exige únicamente que se ingrese la serie de cualquier variable en el tiempo,
pero garantizando que tenga la información mínima para trabajar con los modelos
estocásticos, un mínimo de 50 datos satisface esta condición.

El software nos va generando valores de relleno para cada periodo que definamos, además
de eso nos puede presentar los resultados en una interfaz gráfica, y en cualquier momento
podemos acceder a los estadísticos del modelo y la simulación.
- 54 -
7 EVALUACIÓN PRELIMINAR DE LOS MODELOS
ARIMA
Para evaluar si realmente es posible continuar la investigación, fue necesario poner a

prueba la eficacia de los modelos estocásticos, para la inferencia de observaciones en series
de variables climáticas.
De manera rápida se realizó una serie de rellenos en cinco variables diferentes, a partir de
los gráficos de las observaciones generadas con estos modelos, se determinó si las
propiedades estadísticas de las series regeneradas, se mantenían, ya que si esto ocurre, los
modelos ARIMA se mostraban aptos para alcanzar nuestro propósito.
Se realizaron tanto rellenos como extensiones de las series en los casos que era viable
hacerlo.
Este experimento, es el único en que no se en verificó la eficiencia empírica de las

inferencias, sino más bien se centró en si los modelos ARIMA mantenían la coherencia
lógica durante el relleno de datos y la extensión en intervalos cortos de las series
observadas, para delimitar hasta qué punto los modelos estocásticos son capaces de generar
valores que realmente serían posibles de observar en la realidad.
Por otro lado, al ser una etapa preliminar, se aprovechó para ver la eficiencia del criterio de
Grubbs & Beck, para determinar si ciertos valores extremos reportados, se pueden
considerar como una anomalía de medición o simplemente como un valor extremo posible.
7.1 Metodología
Como punto de partida se seleccionaron 5 estaciones de medición para las siguientes
variables climáticas:
Humedad Relativa Porcentual [%]
Presión Atmosférica [HPA]
Temperatura Media [ºC]
Evaporación Total [mm]
Precipitación Total [mm]
7.1.1 Muestreo de los Datos

Las estaciones fueron escogidas de manera aleatoria para cada variable, lo único que fue
determinante durante el proceso de muestreo fue la cantidad de datos disponibles, que
debiera ser mayor a 50 observaciones consecutivas, en un intervalo definido de medición.
- 55 -
Los modelos se aplicaron a nivel diario y mensual, una prueba se realizó a nivel anual en la
única estación que presentaba más de 50 años de registro.
Para todas las variables el intervalo de medición de los datos es a nivel diario, pero
dependiendo de la cantidad de observaciones consecutivas disponibles se definió realizar
los rellenos a nivel diario, mensual o anual.
En la Tabla 7-1 se presentan las estaciones elegidas por muestreo aleatorio simple,
observando que el procedimiento fue aplicado haciendo una distinción por variable.
Tabla 7-1 Estaciones muestreadas clasificadas por las variables en las que se aplicó el relleno de datos faltantes y las
extensiones a corto plazo.
Humedad Relativa [%]

Estación Altura msnm Intervalos temporales
1.1. Collana 3911 Mensuales
1.2. Independencia 2788 Mensuales
1.3. Culpina 2960 Mensuales
1.4. Achiri 3880 Mensuales
1.5. Cobija 235 Mensuales
Presión Atmosférica[HPA]
2.1. Cochabamba Aeropuerto 2548 Mensuales
2.2. Trinidad 2094 Mensuales
2.3. Sucre 2570 Mensuales
2.4. Concepción 497 Anuales
2.5. Rurrenabaque 204 Mensuales
Temperatura [ºC]
3.1. La Tamborada 2597 Mensuales
3.2. Entre Ríos 1260 Mensuales
3.3. Mizque 2045 Diarios
3.4. Irupana 1946 Mensuales
3.5. Anzaldo 3032 Mensuales
Evaporación [mm]
4.1. Chipiri 260 Diarios
4.2. Okinawa I 252 Diarios
4.3. Huarina Cota Cota 385 Mensuales
4.4. Belén 3833 Mensuales
- 56 -
4.5. Hichucota 4460 Mensuales
Precipitación [mm]
5.1. Kallutaca 3900 Mensuales
5.2. San Juan 305 Mensuales
5.3. Chinoli 3450 Mensuales
5.4. Padilla 2102 Mensuales
5.5 Aiquile 2255 Mensuales
Figura 7-1 Mapa con la ubicación geográfica de las estaciones, la variable de relleno y el código de cada estación.
En la Figura 7-1, se encuentran localizadas todas las estaciones en las que se evaluó de
manera preliminar los modelos estocásticos aplicables a series temporales, los códigos
corresponden a las estaciones clasificadas en la Tabla 7-1.
- 57 -
7.1.2 Procedimiento
Después de haber definido la estación, la variable y el intervalo temporal de aplicación del
modelo, como ya se mencionó, se realizó una evaluación preliminar de la calidad de los
datos, usando el criterio de Grubbs & Beck.
Se grafica las series y se observa si los datos considerados anómalos por el criterio,
evidentemente no son coherentes con las demás observaciones, o con la naturaleza de la
variable en estudio.
Luego se determinó, si las series son o no estacionarias, usando al prueba de Raíz Unitaria,
en la cual su nivel de significancia debe tender a 0, para que la serie se considere
estacionaria en media, esta condición también se debe observar en base a las funciones de
autocorrelación simple y parcial, dado que si estas no decaen rápidamente se considera la
serie como no estacionaria en media.
La condición de estacionariedad en varianza se determina observando la gráfica de los

datos a lo largo del tiempo y detectando si existe más de una volatilidad en los datos, de ser
así se debe determinar si se tiene 2 o más volatilidades en la serie, si se tiene 2
volatilidades entonces se debe aplicar una transformación Box Cox y si se tiene más de tres
volatilidades lo más adecuado será aplicar una trasformación logarítmica, esto permitirá
lograr alcanzar la condición de estacionariedad en media.
En caso de no llegar a una serie estacionaria, se debe proceder a separar la variable en sus
componentes para que sean simuladas de manera independiente, solo si es posible.
Luego de haber determinado las condiciones de estacionariedad de las series se procede a

observar las funciones de autocorrelación simple y parcial, para determinar qué datos, en
ciertos rezagos de la propia serie, son relevantes para realizar la simulación.
Los niveles de significancia en la función de autocorrelación simple indican que se debe

usar uno modelo de media móvil. Los de la función de autocorrelación parcial indican que
se debe emplear un modelo auorregresivo, se debe ir tanteando uno por uno, ya que el
empleo de uno de los modelos afecta al nivel de significancia de los demás en la mayoría
de los casos, por esta razón la determinación del modelo que ajuste mejor se realiza
iterativamente a partir de la observación de las funciones de autocorrelacion.
El proceso de búsqueda del modelo más adecuado, se realiza hasta determinar uno o más
modelos que sean capaces de agotar la información de la serie, esto se consigue logrando
que los residuos sean independientes, que no guarden autocorrelacion en ningún rezago
dentro del intervalo usado para la inferencia, para ello debemos observar la función de
autocorrelacion simple y parcial de los residuos entre el modelo y la serie original.
Posteriormente se vuelve a graficar los datos generados junto con los observados para ver si
las propiedades estadísticas y las volatilidades de la serie permanecen inalteradas.
- 58 -
En el caso de haber más de un hueco por rellenar, se efectúa nuevamente el procedimiento
descrito hasta encontrar otro modelo que ajuste para el relleno del siguiente hueco y así
sucesivamente hasta terminar de rellenar por completo la serie de datos de cada variable.
La Figura 7-2 muestra en detalle el algoritmo utilizado para el relleno de datos faltantes con
los modelos ARIMA para las distintas variables seleccionadas.
Figura 7-2 Procedimiento realizado para el relleno de datos con los modelos ARIMA para diferentes variables
hidrometeorológicas.
7.2 Resultados por Variables

7.2.1 HUMEDAD RELATIVA [%]
7.2.1.1 Estación: Collana
Altura: 3911 m.s.n.m. Longitud Este: 68º16´54´´ Latitud Sud: 16º54´01´´
𝑥̅ = 73.35 %
𝑠 = 15.83 %
- 59 -
𝑛 = 318
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck
𝑘𝑛 = 3.316
𝑥𝑠 = 100 %
𝑥𝑖 = 20.854 %
No hay datos Anómalos según la prueba.
Las serie no parece confiable, ya que presenta variaciones a lo largo del tiempo demasiado
exageradas, como se percibe en la Figura 7-3, pero el criterio no parece hallar datos
anómalos porque considera que la tendencia determinística que se percibe puede ser
posible, sin embargo a pesar de tener nuestras dudas sobre los datos, la serie parece ir
variando crecientemente en ciclos más o menos continuos lo que imposibilita definir qué
datos realmente son fiables y cuáles no.
Respecto al extraño comportamiento de los datos, una explicación podría ser que se haya
cambiado varias veces de equipo de medición y esta variación afecto en la precisión de las
mediciones, otra un tanto menos justificable, es que las mediciones corresponderían justo a
un periodo de variabilidad climática, ya que las variaciones estacionales en la serie si son
coherentes.
Horizonte Temporal [Años]


Figura 7-3 Humedad Relativa a nivel mensual en Collana en [%], a) Original, Serie de datos medida, b) serie de datos
Completada y Extendida.
- 60 -
Tanto en el relleno de datos como en la proyección a corto plazo los modelos obtenidos
logran mantener las propiedades estadísticas de la serie sin importar que haya cambios en la
condición de estacionariedad en media o en varianza en la serie original, como podemos
observar en la Figura 7-3. Los rellenos mantienen las propiedades estadísticas de la serie
original.
Modelos Utilizados:
1)
𝑌𝑡 (1.5−1)
𝑌𝑡 ´ =
1.5
∇𝑌𝑡 ´ = 𝑌𝑡 ´ − 𝑌´𝑡−1
∇𝑌𝑡 ´ = (𝜇∇𝑌´t + 𝐴𝑡 − 𝜃8 𝐴𝑡−8 ) ∗ (𝜇∇𝑌´t + 𝐴𝑡 − Ѳ47 𝐴𝑡−47 )
∇𝑌𝑡 ´ = (𝜇∇𝑌´t + 𝐴𝑡 − 0.283304 ∗ 𝐴𝑡−8 ) ∗ (𝜇∇𝑌´t + 𝐴𝑡 − 0.303534 ∗ 𝐴𝑡−47 )
𝛼𝜃8 = 0.0003; 𝛼Ѳ47 = 0.04
2)
𝑌𝑡 (1.5−1)
𝑌𝑡 ´ =
1.5
∇𝑌𝑡 ´ = 𝑌𝑡 ´ − 𝑌´𝑡−1
𝛼𝜃8 = 0.0006; 𝛼Ѳ47 = 0.0268
3)
𝑌𝑡 (1.5−1)
𝑌𝑡 ´ =
1.5
∇𝑌𝑡 ´ = 𝑌𝑡 ´ − 𝑌´𝑡−1
𝛼𝜃8 = 0.0004; 𝛼Ѳ47 = 0.0177
- 61 -
4)
𝑌𝑡 ´ = log(𝑌𝑡 )
∇𝑌𝑡 ´ = 𝑌𝑡 ´ − 𝑌´𝑡−1
∇𝑌𝑡 ´ = (𝜇∇𝑌´t + 𝜑12 ∇𝑌´𝑡−12 + 𝐴𝑡 − 𝜃10 𝐴𝑡−10 ) ∗ (𝜇∇𝑌´t + 𝐴𝑡 − Ѳ36 𝐴𝑡−36 )
∇𝑌𝑡 ´ = (𝜇∇𝑌´t + 0.255208∇𝑌´𝑡−12 + 𝐴𝑡 − 0.220927𝐴𝑡−10 ) ∗ (𝜇∇𝑌´t + 𝐴𝑡

− 0.199107𝐴𝑡−36 )
𝛼𝜃12 = 0.0002; 𝛼Ѳ10 = 0.0019; 𝛼Ѳ36 = 0.0152
5)
𝑌𝑡 ´ = log(𝑌𝑡 )
∇𝑌𝑡 ´ = 𝑌𝑡 ´ − 𝑌´𝑡−1
∇𝑌𝑡 ´ = (𝜇∇𝑌´t + 𝜑24 ∇𝑌´𝑡−24 + 𝐴𝑡 − 𝜃24 𝐴𝑡−24 ) ∗ (𝜇∇𝑌´t + 𝐴𝑡 − Ѳ96 𝐴𝑡−96 )
∇𝑌𝑡 ´ = (𝜇∇𝑌´t + 0.850858∇𝑌´𝑡−12 + 𝐴𝑡 + 0.710320𝐴𝑡−10 ) ∗ (𝜇∇𝑌´t + 𝐴𝑡

− 0.289039𝐴𝑡−36 )
𝛼𝜃12 ≅ 0; 𝛼Ѳ10 = 0.0001; 𝛼Ѳ36 = 0.0043
HUMEDAD RELATIVA [%]
7.2.1.2 Estación: Independencia
𝑥̅ = 71.62 %
𝑠 = 9.16 %
𝑛 = 367
𝑘𝑛 = 3.316
𝑥𝑠 = 100 %
𝑥𝑖 = 41.24 %
- 62 -

Figura 7-4 Humedad Relativa a nivel mensual en Independencia en [%], a) Original, Serie de datos medida, b)
Completada, Serie de datos completada.
Los modelos utilizados consiguen rellenar los datos faltantes simulando la centralidad y la
volatilidad de la serie origina, se verifica que el relleno usando modelos ARIMA es igual
de efectivo al rellenar datos posteriores y anteriores a la serie original, si observamos la
Figura 7-4 podemos constatar que existe un hueco al iniciar el proceso de observación pero
que este se consigue rellenar a partir de datos posteriores manteniendo las propiedades
estadísticas de los datos observados inicialmente.
Modelos Utilizados:
1)
𝑌𝑡 = (𝜇 + 𝐴𝑡 + 𝜑5 𝑌𝑡−5 + 𝜑8 𝑌𝑡−8 + 𝜑10 𝑌𝑡−10 − 𝜃9 𝐴𝑡−9 − 𝜃12 𝐴𝑡−12 ) ∗ (𝜇 + 𝐴𝑡 − Ѳ5 𝐴𝑡−5 )
𝑌𝑡 = (𝜇 + 𝐴𝑡 + 0.324461𝑌𝑡−5 + 0.322670𝑌𝑡−8 + 0.352783𝑌𝑡−10 − 0.324467𝐴𝑡−9

− 0.280060𝐴𝑡−12 ) ∗ (𝜇 + 𝐴𝑡 + 0.692253𝐴𝑡−5 )
𝛼𝜑5 ≅ 0; 𝛼𝜑8 ≅ 0; 𝛼𝜑10 ≅ 0; 𝛼𝜃9 = 0.0022; 𝛼𝜃12 = 0.0052; 𝛼Ѳ5 ≅ 0
- 63 -
2)
𝑌𝑡 = (𝜇 + 𝐴𝑡 + 0.322561𝑌𝑡−5 + 0.322076𝑌𝑡−8 + 0.355283𝑌𝑡−10 + 0.351200𝐴𝑡−9

− 0.281549𝐴𝑡−12 ) ∗ (𝜇 + 𝐴𝑡 + 0.689458𝐴𝑡−5 )
𝛼𝜑5 = 0.0018; 𝛼𝜑8 = 0.0032; 𝛼𝜑10 ≅ 0; 𝛼𝜃9 = 0.0036; 𝛼𝜃12 = 0.0033; 𝛼Ѳ5
≅0
3)
𝑌𝑡 = (𝜇 + 𝐴𝑡 + 0.325395𝑌𝑡−5 + 0.316831𝑌𝑡−8 + 0.357698𝑌𝑡−10 + 0.353216𝐴𝑡−9

− 0.282335𝐴𝑡−12 ) ∗ (𝜇 + 𝐴𝑡 + 0.691617𝐴𝑡−5 )
𝛼𝜑5 = 0.0202; 𝛼𝜑8 = 0.0042; 𝛼𝜑10 ≅ 0; 𝛼𝜃9 = 0.0022; 𝛼𝜃12 = 0.0108; 𝛼Ѳ5
≅0
4)
𝑌𝑡 = (𝜇 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑5 𝑌𝑡−5 + 𝜑10 𝑌𝑡−10 − 𝜃12 𝐴𝑡−12 ) ∗ (𝜇 + 𝐴𝑡 − Ѳ5 𝐴𝑡−5 )
𝑌𝑡 = (𝜇 + 𝐴𝑡 + 0.452322𝑌𝑡−1 + 0.164938𝑌𝑡−5 + 0.382340𝑌𝑡−10 − 0.209611𝐴𝑡−12 ) ∗ (𝜇

+ 𝐴𝑡 + 0.416405𝐴𝑡−5 )
𝛼𝜑1 ≅ 0; 𝛼𝜑5 = 0.0583; 𝛼𝜑10 ≅ 0; 𝛼𝜃12 = 0.0536; 𝛼Ѳ5 = 0.0001
5)
𝑌𝑡 = (𝜇 + 𝐴𝑡 + 0.524252𝑌𝑡−1 + 0.326170𝑌𝑡−6 + 0.148443𝑌𝑡−10 − 0.194645𝐴𝑡−12 ) ∗ (𝜇

+ 𝐴𝑡 − 0.220681𝐴𝑡−3 )
𝛼𝜑1 ≅ 0; 𝛼𝜑6 ≅ 0; 𝛼𝜑10 = 0.0331; 𝛼𝜃12 = 0.0516; 𝛼Ѳ3 = 0.0149
6)
𝑌𝑡 = (𝜇 + 𝐴𝑡 + 0.478217𝑌𝑡−1 + 0.288429𝑌𝑡−6 + 0.233090𝑌𝑡−10 − 0.217835𝐴𝑡−12 ) ∗ (𝜇

+ 𝐴𝑡 + 0.348249𝐴𝑡−6 )
𝛼𝜑1 ≅ 0; 𝛼𝜑6 = 0.0059; 𝛼𝜑10 = 0.0024; 𝛼𝜃12 = 0.0123; 𝛼Ѳ6 = 0.0052
- 64 -
7)
𝑌𝑡 = (𝜇 + 𝐴𝑡 + 0.497188𝑌𝑡−1 + 0.366010𝑌𝑡−6 + 0.136176𝑌𝑡−10 − 0.214051𝐴𝑡−12 ) ∗ (𝜇

+ 𝐴𝑡 + 0.153163𝐴𝑡−6 )
𝛼𝜑1 ≅ 0; 𝛼𝜑6 ≅ 0; 𝛼𝜑10 = 0.0359; 𝛼𝜃12 = 0.0147; 𝛼Ѳ6 = 0.0461
8)
𝑌𝑡 = (𝜇 + 𝐴𝑡 + 0.524273𝑌𝑡−1 + 0.366010𝑌𝑡−6 + 0.136176𝑌𝑡−10 − 0.214051𝐴𝑡−12 ) ∗ (𝜇

+ 𝐴𝑡 + 0.153163𝐴𝑡−6 )
𝛼𝜑1 ≅ 0; 𝛼𝜑6 ≅ 0; 𝛼𝜑10 = 0.0135; 𝛼𝜃12 = 0.0225; 𝛼Ѳ6 = 0.0755
9)
∇𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑1 ∇𝑌𝑡−1 + 𝜑5 ∇𝑌𝑡−5 + 𝜑12 ∇𝑌𝑡−12 − 𝜃11 𝐴𝑡−11 ) ∗ (𝜇∇𝑌𝑡 + 𝐴𝑡

− Ѳ2 𝐴𝑡−2 )
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.218227∇𝑌𝑡−1 − 0.162101∇𝑌𝑡−5 + 0.264356∇𝑌𝑡−12

− 0.273265𝐴𝑡−11 ) ∗ (𝜇∇𝑌𝑡 + 𝐴𝑡 + 0.270561𝐴𝑡−2 )
𝛼𝜑1 ≅ 0; 𝛼𝜑5 = 0.0018; 𝛼𝜑12 ≅ 0; 𝛼𝜃11 ≅ 0; 𝛼Ѳ2 ≅ 0
10)

− Ѳ2 𝐴𝑡−2 )
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.208597∇𝑌𝑡−1 − 0.161164∇𝑌𝑡−5 + 0.264849∇𝑌𝑡−12

− 0.274314𝐴𝑡−11 ) ∗ (𝜇∇𝑌𝑡 + 𝐴𝑡 + 0.287511𝐴𝑡−2 )
𝛼𝜑1 ≅ 0; 𝛼𝜑5 = 0.0013; 𝛼𝜑12 ≅ 0; 𝛼𝜃11 ≅ 0; 𝛼Ѳ2 ≅ 0
11)
- 65 -
− Ѳ2 𝐴𝑡−2 )
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.208597∇𝑌𝑡−1 − 0.161164∇𝑌𝑡−5 + 0.264849∇𝑌𝑡−12

− 0.274314𝐴𝑡−11 ) ∗ (𝜇∇𝑌𝑡 + 𝐴𝑡 + 0.287511𝐴𝑡−2 )
𝛼𝜑1 ≅ 0; 𝛼𝜑5 = 0.0013; 𝛼𝜑12 ≅ 0; 𝛼𝜃11 ≅ 0; 𝛼Ѳ2 ≅ 0
12)

− Ѳ2 𝐴𝑡−2 )
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.221373∇𝑌𝑡−1 − 0.171761∇𝑌𝑡−5 + 0.246055∇𝑌𝑡−12

− 0.277114𝐴𝑡−11 ) ∗ (𝜇∇𝑌𝑡 + 𝐴𝑡 + 0.316740𝐴𝑡−2 )
𝛼𝜑1 ≅ 0; 𝛼𝜑5 = 0.0005; 𝛼𝜑12 ≅ 0; 𝛼𝜃11 ≅ 0; 𝛼Ѳ2 ≅ 0
13)

− Ѳ2 𝐴𝑡−2 )
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.237259∇𝑌𝑡−1 − 0.161799∇𝑌𝑡−5 + 0.232151∇𝑌𝑡−12

− 0.269273𝐴𝑡−11 ) ∗ (𝜇∇𝑌𝑡 + 𝐴𝑡 + 0.291706𝐴𝑡−2 )
𝛼𝜑1 ≅ 0; 𝛼𝜑5 = 0.0007; 𝛼𝜑12 ≅ 0; 𝛼𝜃11 ≅ 0; 𝛼Ѳ2 ≅ 0
14)

− Ѳ2 𝐴𝑡−2 )
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.243803∇𝑌𝑡−1 − 0.162021∇𝑌𝑡−5 + 0.222432∇𝑌𝑡−12

− 0.278429𝐴𝑡−11 ) ∗ (𝜇∇𝑌𝑡 + 𝐴𝑡 + 0.295372𝐴𝑡−2 )
𝛼𝜑1 ≅ 0; 𝛼𝜑5 = 0.0006; 𝛼𝜑12 ≅ 0; 𝛼𝜃11 ≅ 0; 𝛼Ѳ2 ≅ 0
- 66 -
7.2.1.3 Estación: Culpina

𝑥̅ = 42.09 %
𝑠 = 10.58 %
𝑛 = 129
𝑘𝑛 = 4.809
𝑥𝑠 = 92.95 %
𝑥𝑖 = 0 %
No hay datos Anómalos según la prueba

- 67 -
Figura 7-5 Humedad Relativa a nivel mensual en Culpina en [%], a) Original, Serie de datos medida, b) Completada y
Extendida, Serie de datos completada y extendida.
Hay una leve tendencia determinística creciente que se puede observar a simple vista en la
Figura 7-5, la cual pone en evidencia que el modelo no es estacionario en media pero la
transformación realizada aplicando la primera diferencia permite que la serie se
estacionarice completamente y que los modelos ARIMA reproduzcan buenos resultados.
Modelos utilizados:
1)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑1 ∇𝑌𝑡−1 + 𝜑24 ∇𝑌𝑡−24 − 𝜃5 𝐴𝑡−5 ) ∗ (𝜇∇𝑌𝑡 + 𝐴𝑡 − Ѳ2 𝐴𝑡−2 )
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.636538∇𝑌𝑡−1 + 0.292589∇𝑌𝑡−24 + 0.464658𝐴𝑡−5 ) ∗ (𝜇∇𝑌𝑡 + 𝐴𝑡

+ 0.759680𝐴𝑡−2 )
𝛼𝜑1 ≅ 0; 𝛼𝜑24 ≅ 0; 𝛼𝜃5 ≅ 0; 𝛼Ѳ2 ≅ 0
2)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑1 ∇𝑌𝑡−1 + 𝜑23 ∇𝑌𝑡−23 + 𝜑24 ∇𝑌𝑡−24 − 𝜃5 𝐴𝑡−5 )

∗ (𝜇∇𝑌𝑡 + 𝐴𝑡 − Ѳ2 𝐴𝑡−2 )
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.855661∇𝑌𝑡−1 + 0.317522∇𝑌𝑡−23 + 0.368979∇𝑌𝑡−24

+ 0.313820𝐴𝑡−5 ) ∗ (𝜇∇𝑌𝑡 + 𝐴𝑡 + 0.864449𝐴𝑡−2 )
𝛼𝜑1 ≅ 0; 𝛼𝜑24 = 0.0014; 𝛼𝜃5 = 0.0007; 𝛼Ѳ2 ≅ 0
- 68 -
7.2.1.4 Estación: Achiri
𝑥̅ = 80.57 %
𝑠 = 8.87 %
𝑛 = 255
𝑘𝑛 = 3.288
𝑥𝑠 = 100 %
𝑥𝑖 = 51.39 %


Figura 7-6 Humedad Relativa a nivel mensual en Achiri en [%], a) Original, Serie de datos medida, b) Completada y
Extendida, Serie de datos completada y extendida.
- 69 -
No fue necesario aplicar ninguna transformación pero si agregar una constante en el
modelo para separar la tendencia central de la componente aleatoria, los rellenos y la
proyección a corto plazo son de buena calidad la Figura 7-6 que nos presenta los datos antes
y después de ser rellenados muestra de manera clara como el modelo reproduce las
propiedades estadísticas originales.
Modelos Utilizados:
1)
𝑌𝑡 = 𝐶 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑19 𝑌𝑡−19
𝑌𝑡 = 75.75489 + 𝐴𝑡 + 0.429817𝑌𝑡−1 − 0.265732𝑌𝑡−19
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑19 = 0.0016
2)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑1 ∇𝑌𝑡−1 + 𝜑2 ∇𝑌𝑡−2 − 𝜃19 𝐴𝑡−19 ) ∗ (𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑8 ∇𝑌𝑡−8 − Ѳ3 𝐴𝑡−3 )
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.473563∇𝑌𝑡−1 − 0.346527∇𝑌𝑡−2 + 0.192448𝐴𝑡−19 )

∗ (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.178714∇𝑌𝑡−8 + 0.436231𝐴𝑡−3 )
𝛼𝜑1 ≅ 0; 𝛼𝜑2 = 0.0001; 𝛼𝜃19 = 0.0131; 𝛼Ф8 = 0.0007; 𝛼Ѳ3 ≅ 0
3)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.435875∇𝑌𝑡−1 − 0.350814∇𝑌𝑡−2 + 0.196143𝐴𝑡−19 )

∗ (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.180257∇𝑌𝑡−8 + 0.438807𝐴𝑡−3 )
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜃19 = 0.0056; 𝛼Ф8 = 0.0397; 𝛼Ѳ3 ≅ 0
4)
- 70 -
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.504352∇𝑌𝑡−1 − 0.374495∇𝑌𝑡−2 + 0.167262𝐴𝑡−19 )
∗ (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.160206∇𝑌𝑡−8 + 0.459758𝐴𝑡−3 )
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜃19 = 0.0180; 𝛼Ф8 = 0.0642; 𝛼Ѳ3 ≅ 0
5)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.504655∇𝑌𝑡−1 − 0.374872∇𝑌𝑡−2 + 0.167262𝐴𝑡−19 )

∗ (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.160440∇𝑌𝑡−8 + 0.460225𝐴𝑡−3 )
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜃19 = 0.0188; 𝛼Ф8 = 0.0266; 𝛼Ѳ3 ≅ 0
6)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.529637∇𝑌𝑡−1 − 0.397099∇𝑌𝑡−2 + 0.175609𝐴𝑡−19 )

∗ (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.178308∇𝑌𝑡−8 + 0.47.9084𝐴𝑡−3 )
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜃19 = 0.0147; 𝛼Ф8 = 0.0120; 𝛼Ѳ3 ≅ 0
7)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑1 ∇𝑌𝑡−1 + 𝜑2 ∇𝑌𝑡−2 − 𝜃3 𝐴𝑡−3 − 𝜃4 𝐴𝑡−4 ) ∗ (𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑8 ∇𝑌𝑡−8 )
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.483540∇𝑌𝑡−1 − 0.379041∇𝑌𝑡−2 + 0.468622𝐴𝑡−3

+ 0.151575𝐴𝑡−4 ) ∗ (𝐴𝑡 − 0.181993∇𝑌𝑡−8 )
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼Ѳ3 ≅ 0; 𝛼𝜃4 = 0.0045; 𝛼Ф8 = 0.0022
8)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑1 ∇𝑌𝑡−1 + 𝜑2 ∇𝑌𝑡−2 − 𝜃3 𝐴𝑡−3 − 𝜃4 𝐴𝑡−4 ) ∗ (𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑8 ∇𝑌𝑡−8 )
- 71 -
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.483466∇𝑌𝑡−1 − 0.375951∇𝑌𝑡−2 + 0.466895𝐴𝑡−3
+ 0.147804𝐴𝑡−4 ) ∗ (𝐴𝑡 − 0.185828∇𝑌𝑡−8 )
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼Ѳ3 ≅ 0; 𝛼𝜃4 = 0.0053; 𝛼Ф8 = 0.0016
7.2.1.5 Estación: Cobija
𝑥̅ = 62.80 %
𝑠 = 10.65 %
𝑛 = 747
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 1º Iteración
𝑘𝑛 = 2.849
𝑥𝑠 = 93.15 %
𝑥𝑖 = 32.43 %
Hay 4 datos anómalos según la 1º Iteración.
𝑥̅ = 63.05 %
𝑠 = 10.09
𝑛 = 743
Intervalos de valores anómalos determinados por la Prueba de Grubbs &Beck 2º Iteración
𝑘𝑛 = 2.857
𝑥𝑠 = 91.87 %
𝑥𝑖 = 34.22 %
𝑥̅ = 63.21 %
- 72 -
𝑠 = 9.87
𝑛 = 739
𝑘𝑛 = 2.865
𝑥𝑠 = 91.49 %
𝑥𝑖 = 34.93 %
No se encontraron datos anómalos en la 3º iteración
Hay 8 datos anómalos susceptibles a ser descartados y rellenados.
Los datos identificados no parecen ser confiables por lo tanto es mejor prescindir de ellos y
rellenar con otros usando los modelos disponibles.

- 73 -
Figura 7-7 Humedad Relativa a nivel mensual en Cobija en [%], a) Original, Serie de datos medida, b) Corregida, Serie
de datos corregida usando el criterio de Grubbs & Beck, c) Completada, Serie de datos rellenada.
Inicialmente la serie presentaba algunas anomalías que la prueba de Grubbs & Beck detecto
y suprimió de manera efectiva, si observamos la Figura 7-7, la serie original presenta
algunos datos extremadamente bajos de humedad y al aplicar dicho criterios estos son
convenientemente removidos, al hacerlo se puede constatar que la serie presenta una leve
tendencia que luego de estacionarizarla y aplicar los modelos se reproduce coherentemente.
Modelos Utilizados:
1)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑1 ∇𝑌𝑡−1 + 𝜑29 ∇𝑌𝑡−29 − 𝜃12 𝐴𝑡−12 )
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.387335∇𝑌𝑡−1 − 0.258061∇𝑌𝑡−29 − 0.282982𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0499; 𝛼𝜃12 = 0.0057
2)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.315145∇𝑌𝑡−1 − 0.231953∇𝑌𝑡−29 − 0.219581𝐴𝑡−12 )
𝛼𝜑1 = 0.0002; 𝛼𝜑29 = 0.0371; 𝛼𝜃12 = 0.0149
3)
- 74 -
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.284748∇𝑌𝑡−1 − 0.231470∇𝑌𝑡−29 − 0.200076𝐴𝑡−12 )
𝛼𝜑1 = 0.0002; 𝛼𝜑29 = 0.0175; 𝛼𝜃12 = 0.0135
4)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.297587∇𝑌𝑡−1 − 0.179373∇𝑌𝑡−29 − 0.237659𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0285; 𝛼𝜃12 = 0.0009
5)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.290176∇𝑌𝑡−1 − 0.176283∇𝑌𝑡−29 − 0.238795𝐴𝑡−12 )
𝛼𝜑1 = 0.0001; 𝛼𝜑29 = 0.0348; 𝛼𝜃12 = 0.0011
6)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.293151∇𝑌𝑡−1 − 0.159005∇𝑌𝑡−29 − 0.265169𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0549; 𝛼𝜃12 = 0.0001
7)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.292750∇𝑌𝑡−1 − 0.160097∇𝑌𝑡−29 − 0.266674𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0480; 𝛼𝜃12 ≅ 0
8)
- 75 -
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.300877∇𝑌𝑡−1 − 0.15559∇𝑌𝑡−29 − 0.249188𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0533; 𝛼𝜃12 = 0.0001
9)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.288630∇𝑌𝑡−1 − 0.169980∇𝑌𝑡−29 − 0.234392𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0314; 𝛼𝜃12 = 0.0002
10)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.288661∇𝑌𝑡−1 − 0.170263∇𝑌𝑡−29 − 0.234498𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0315; 𝛼𝜃12 = 0.0006
11)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.297763∇𝑌𝑡−1 − 0.175854∇𝑌𝑡−29 − 0.222773𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0180; 𝛼𝜃12 = 0.0006
12)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.312036∇𝑌𝑡−1 − 0.126169∇𝑌𝑡−29 − 0.232754𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0316; 𝛼𝜃12 ≅ 0
- 76 -
13)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.329251∇𝑌𝑡−1 − 0.108166∇𝑌𝑡−29 − 0.223638𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0438; 𝛼𝜃12 ≅ 0
14)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.323791∇𝑌𝑡−1 − 0.095504∇𝑌𝑡−29 − 0.227361𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0561; 𝛼𝜃12 ≅ 0
15)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.324814∇𝑌𝑡−1 − 0.093922∇𝑌𝑡−29 − 0.231182𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0553; 𝛼𝜃12 ≅ 0
16)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.316141∇𝑌𝑡−1 − 0.094934∇𝑌𝑡−29 − 0.235132𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0462; 𝛼𝜃12 ≅ 0
17)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.313274∇𝑌𝑡−1 − 0.105244∇𝑌𝑡−29 − 0.239729𝐴𝑡−12 )
- 77 -
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0088; 𝛼𝜃12 ≅ 0
18)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.312848∇𝑌𝑡−1 − 0.105874∇𝑌𝑡−29 − 0.239803𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0082; 𝛼𝜃12 ≅ 0
19)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.312864∇𝑌𝑡−1 − 0.105913∇𝑌𝑡−29 − 0.239866𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0079; 𝛼𝜃12 ≅ 0
20)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.308743∇𝑌𝑡−1 − 0.110276∇𝑌𝑡−29 − 0.241615𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0054; 𝛼𝜃12 ≅ 0
21)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.308683∇𝑌𝑡−1 − 0.110486∇𝑌𝑡−29 − 0.241477𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0052; 𝛼𝜃12 ≅ 0
22)
- 78 -
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.308657∇𝑌𝑡−1 − 0.110629∇𝑌𝑡−29 − 0.241507𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0051; 𝛼𝜃12 ≅ 0
22)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.308428∇𝑌𝑡−1 − 0.109917∇𝑌𝑡−29 − 0.242729𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0052; 𝛼𝜃12 ≅ 0
22)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.308445∇𝑌𝑡−1 − 0.108604∇𝑌𝑡−29 − 0.242812𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0055; 𝛼𝜃12 ≅ 0
23)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.339305∇𝑌𝑡−1 − 0.118640∇𝑌𝑡−29 − 0.247711𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0044; 𝛼𝜃12 ≅ 0
24)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.330829∇𝑌𝑡−1 − 0.120850∇𝑌𝑡−29 − 0.229735𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0041; 𝛼𝜃12 ≅ 0
25)
- 79 -
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.355702∇𝑌𝑡−1 − 0.099578∇𝑌𝑡−29 − 0.246792𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0059; 𝛼𝜃12 ≅ 0
26)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.355035∇𝑌𝑡−1 − 0.098766∇𝑌𝑡−29 − 0.243937𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜑29 = 0.0061; 𝛼𝜃12 ≅ 0
7.2.2 PRESIÓN ATMOSFÉRICA [HPA]
7.2.2.1 Estación: Cochabamba Aeropuerto
𝑥̅ = 765.11 𝐻𝑃𝐴
𝑠 = 46.76 𝐻𝑃𝐴
𝑛 = 97
𝑘𝑛 = 3.006
𝑥𝑠 = 902.69 𝐻𝑃𝐴
𝑥𝑖 = 627.53 𝐻𝑃𝐴
𝑥̅ = 757.33 𝐻𝑃𝐴
𝑠 = 13.49
𝑛 = 94
- 80 -
Intervalos de valores anómalos determinados por la Prueba de Grubbs & Beck 2 º Iteración
𝑘𝑛 = 2.996
𝑥𝑠 = 797.73 𝐻𝑃𝐴
𝑥𝑖 = 716,92 𝐻𝑃𝐴
Hay 1 dato anómalos según la 2º Iteración.
𝑥̅ = 755.945 𝐻𝑃𝐴
𝑠 = 1.76
𝑛 = 93
𝑘𝑛 = 2.992
𝑥𝑠 = 761.20 𝐻𝑃𝐴
𝑥𝑖 = 750.69 𝐻𝑃𝐴
𝑥̅ = 755.88 𝐻𝑃𝐴
𝑠 = 1.64
𝑛 = 92
𝑘𝑛 = 2.988
𝑥𝑠 = 760.77 𝐻𝑃𝐴
𝑥𝑖 = 750.99 𝐻𝑃𝐴
No Hay datos anómalos según la 4º Iteración.
Las fluctuaciones de presión no pueden ser ni aproximadamente tan elevadas, los picos que
se presentan en el registro son errores que afectan directamente la continuidad de la serie y
distorsionan sus propiedades estadísticas por lo tanto deben ser eliminados.
- 81 -


Figura 7-8 Presión atmosférica a nivel mensual en Cochabamba Aeropuerto en [HPA], a) Original, Serie de datos
medida, b) Corregida, Serie de datos corregida usando el criterio de Grubbs & Beck, c) Completada y Extendida, Serie
de datos rellenada y extendida.
Observando la Figura 7-8, vemos que la eliminación de datos anómalos, permite representar
de una manera muy diferente la serie de datos, además corrige las propiedades estadísticas
media y varianza que se encontraban fuertemente desviadas y distorsionadas, el
completado de datos es satisfactorio, la proyección a corto plazo no reproduce bien valores
- 82 -
extremos pero mantiene la tendencia central y la tendencia de la serie original, no así su
volatilidad.
Modelos Utilizados:
1)
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 𝜑4 𝑌𝑡−4 + 𝜑5 𝑌𝑡−5 + 𝜑6 𝑌𝑡−6 − 𝜃12 𝐴𝑡−12
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.218694𝑌𝑡−4 + 0.243727𝑌𝑡−5 + 0.537316𝑌𝑡−6 + 0.160153𝐴𝑡−12
𝛼𝜑4 ≅ 0; 𝛼𝜑5 = 0.0004; 𝛼𝜑6 = 0.0021; 𝛼𝜃12 = 0.0393
PRESIÓN ATMOSFÉRICA [HPA]
7.2.2.2 Estación: Trinidad
𝑥̅ = 986.06 𝐻𝑃𝐴
𝑠 = 3.60 𝐻𝑃𝐴
𝑛 = 104
𝑘𝑛 = 3.030
𝑥𝑠 = 996.98 𝐻𝑃𝐴
𝑥𝑖 = 975.13 𝐻𝑃𝐴
𝑥̅ = 986.41 𝐻𝑃𝐴
𝑠 = 2.58
𝑛 = 102
𝑘𝑛 = 3.024
𝑥𝑠 = 994.20 𝐻𝑃𝐴
- 83 -
𝑥𝑖 = 978.62 𝐻𝑃𝐴
𝑥̅ = 986.50 𝐻𝑃𝐴
𝑠 = 2.44
𝑛 = 101
𝑘𝑛 = 3.020
𝑥𝑠 = 993.86 𝐻𝑃𝐴
𝑥𝑖 = 979.14 𝐻𝑃𝐴
Los 3 valores determinados parecen ser errores, porque no suelen haber fluctuaciones tan
elevadas de presión en condiciones naturales.

- 84 -
Figura 7-9 Presión atmosférica a nivel mensual en Trinidad en [HPA], a) Original, Serie de datos medida, b) Corregida,
Serie de datos corregida usando el criterio de Grubbs & Beck c) Completada y Extendida, Serie de datos rellenada y
extendida.
La eliminación de los datos anómalos como se observa en la Figura 7-9, revela la tendencia
cíclica de la serie, lo cual permite a los modelos ajustar con mucha mayor precisión, los
datos rellenados son muy buenos, en cambio la inferencia a corto plazo si bien reproduce la
tendencia y la centralidad, no reproduce la volatilidad de los datos originales.
Modelos Utilizados:
1)
𝑌𝑡 = 𝐶 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 − 𝜃13 𝐴𝑡−13
𝑌𝑡 = 985.9762 + 𝐴𝑡 + 0.360687𝑌𝑡−1 − 0.554535𝐴𝑡−13
𝛼𝐶 ≅ 0; 𝛼𝜑1 = 0.0011; 𝛼𝜃13 = 0.0016
2)
𝑌𝑡 = 𝐶 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 − 𝜃13 𝐴𝑡−13
𝑌𝑡 = 986.3456 + 𝐴𝑡 + 0.390890𝑌𝑡−1 − 0.618550𝐴𝑡−13
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜃13 ≅ 0
3)
𝑌𝑡 = (𝐶 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑17 𝑌𝑡−17 − 𝜃5 𝐴𝑡−5 ) ∗ (𝐶 + 𝐴𝑡 + 𝜑13 𝑌𝑡−13 )
- 85 -
𝑌𝑡 = (985.8888 + 𝐴𝑡 + 0.310696𝑌𝑡−1 − 0.282986𝑌𝑡−17 − 0.123979𝐴𝑡−5 )
∗ (𝐶 + 𝐴𝑡 + 0.260880𝑌𝑡−13 )
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑17 = 0.0011 𝛼𝜃5 = 0.0680; 𝛼Ф13 = 0.0041
7.2.2.3 Estación: Sucre
𝑥̅ = 719.72 𝐻𝑃𝐴
𝑠 = 0.77
𝑛 = 289
Intervalos de valores anómalos determinados por la Prueba de Grubbs &Beck
𝑘𝑛 = 3.307
𝑥𝑠 = 722.28 𝐻𝑃𝐴
𝑥𝑖 = 717.16 𝐻𝑃𝐴
No hay datos anómalos encontrados al realizar la prueba.

- 86 -
Figura 7-10 Presión atmosférica a nivel mensual en Sucre en [HPA], a) Original, Serie de datos medida, b) Completada,
Serie de datos rellenada y extendida.
Observamos en la Figura 7-10 que en la proyección a corto plazo los resultados son bastante
buenos, esto se debe a que la serie de datos es estacionaria en media y varianza las
condiciones más favorables para aplicar los modelos estocásticos.
Modelos Utilizados:
1)
𝑌𝑡 = 𝐶 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑24 𝑌𝑡−24 − 𝜃12 𝐴𝑡−12
𝑌𝑡 = 719.7349 + 𝐴𝑡 + 0.253556𝑌𝑡−1 + 0.249942𝑌𝑡−24 − 0.310348𝐴𝑡−12
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑24 = 0.249942; 𝛼𝜃12 ≅ 0
7.2.2.4 Estación: Concepción
𝑥̅ = 1009.954 𝐻𝑃𝐴
𝑠 = 0.61 𝐻𝑃𝐴
𝑛 = 62
𝑘𝑛 = 2.85
- 87 -
𝑥𝑠 = 1011.71 𝐻𝑃𝐴
𝑥𝑖 = 1008.20 𝐻𝑃𝐴
No hay datos anómalos encontrados al realizar la prueba.


Figura 7-11 Presión atmosférica a nivel mensual en Concepción en [HPA], a) Original, Serie de datos medida, b)
Extendida, Serie de datos extendida.
Los resultados en cuanto a la proyección a corto plazo son bastante favorables se

encuentran correctamente centralizados pero con una variabilidad seméjate a la previa a la
proyección, sin embargo la serie original parece haber sido generando usando dos
instrumentos diferentes de distinta precisión, ya que los primeros periodos mantienen una
centralidad semejante pero una gran variación en su volatilidad con respecto a los más
actuales como se observa en los datos originales de representados en la Figura 7-11.
Modelos Utilizados:
1)
𝑌𝑡 = 𝐶 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1
- 88 -
𝑌𝑡 = 979.2789 + 𝐴𝑡 + 0.970534𝑌𝑡−1
𝛼𝐶 ≅ 0; 𝛼𝜑1 = 0.0010
7.2.2.5 Estación: Rurrenabaque
𝑥̅ = 986.56 𝐻𝑃𝐴
𝑠 = 36.44 𝐻𝑃𝐴
𝑛 = 688
𝑘𝑛 = 2.967
𝑥𝑠 = 1094.67 𝐻𝑃𝐴
𝑥𝑖 = 878.46 𝐻𝑃𝐴
𝑥̅ = 984.08 𝐻𝑃𝐴
𝑠 = 18.25
𝑛 = 683
𝑘𝑛 = 2.976
𝑥𝑠 = 1038.39 𝐻𝑃𝐴
𝑥𝑖 = 929.77 𝐻𝑃𝐴
𝑥̅ = 987.04 𝐻𝑃𝐴
𝑠 = 4.21
𝑛 = 645
- 89 -
𝑘𝑛 = 3.043
𝑥𝑠 = 999.85 𝐻𝑃𝐴
𝑥𝑖 = 974.24 𝐻𝑃𝐴
Hay 8 datos anómalos según la 3 º Iteración.
𝑥̅ = 987.25 𝐻𝑃𝐴
𝑠 = 2.86
𝑛 = 637
𝑘𝑛 = 3.057
𝑥𝑠 = 995.98 𝐻𝑃𝐴
𝑥𝑖 = 978.51 𝐻𝑃𝐴
Hay 4 datos anómalos según la 4 º Iteración.
𝑥̅ = 987.31 𝐻𝑃𝐴
𝑠 = 2.75
𝑛 = 633
𝑘𝑛 = 3.060
𝑥𝑠 = 995.73 𝐻𝑃𝐴
𝑥𝑖 = 978.89 𝐻𝑃𝐴
Se encontró una gran cantidad de mediciones que distorsionan exageradamente la serie, son
errores de medición que deben ser eliminados para así poder conocer las propiedades
estadísticas reales de la serie.
- 90 -


Figura 7-12 Presión atmosférica a nivel mensual en Rurrenabaque en [HPA], a) Original, Serie de datos medida, b)
Corregida, Serie de datos corregida usando el criterio de Grubbs & Beck, c) Completada, Serie de datos rellenada y
extendida.
La eliminación de los datos anómalos permite distinguir las verdaderas características de la

serie como se observa en la Figura 7-12, sin su afección los grandes huecos de las serie
pueden ser rellenados manteniendo la centralidad y la volatilidad de la serie, en la
proyección acorto plazo parece ocurre algo similar.
Modelos Utilizados:
1)
- 91 -
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
∇2 𝑌𝑡 = 𝐴𝑡 + 𝜑1 ∇2 𝑌𝑡−1 + 𝜑2 ∇2 𝑌𝑡−2 + 𝜑7 ∇2 𝑌𝑡−7 − 𝜃8 A𝑡−8
∇2 𝑌𝑡 = 𝐴𝑡 − 0.733307∇2 𝑌𝑡−1 − 0.415084∇2 𝑌𝑡−2 − 0.237756∇2 𝑌𝑡−7 + 0.382674A𝑡−8
𝛼𝜑1 ≅ 0; 𝛼𝜑2 = 0.0001; 𝛼𝜑7 = 0.0543; 𝛼𝜑8 = 0.0160
2)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
∇2 𝑌𝑡 = 𝐴𝑡 − 0.770466∇2 𝑌𝑡−1 − 0.443659∇2 𝑌𝑡−2 − 0.263738∇2 𝑌𝑡−7 + 0.409651A𝑡−8
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑7 = 0.0032; 𝛼𝜑8 = 0.0010
3)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
∇2 𝑌𝑡 = 𝐴𝑡 + 𝜑1 ∇2 𝑌𝑡−1 + 𝜑2 ∇2 𝑌𝑡−2 + 𝜑7 ∇2 𝑌𝑡−7 − 𝜃8 A𝑡−8 − 𝜃12 A𝑡−12
∇2 𝑌𝑡 = 𝐴𝑡 − 0.870242∇2 𝑌𝑡−1 − 0.472180∇2 𝑌𝑡−2 − 0.228304∇2 𝑌𝑡−7 + 0.311982A𝑡−8

− 0.285644A𝑡−12
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑7 = 0.0138; 𝛼𝜑8 = 0.0011; 𝛼𝜑12 = 0.0013
4)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
∇2 𝑌𝑡 = 𝐴𝑡 − 0.780976∇2 𝑌𝑡−1 − 0.443410∇2 𝑌𝑡−2 − 0.255619𝜑7 ∇2 𝑌𝑡−7 + 0.401622A𝑡−8
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑7 = 0.0032; 𝛼𝜑8 ≅ 0
5)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
∇2 𝑌𝑡 = 𝐴𝑡 − 0.780343∇2 𝑌𝑡−1 − 0.439498∇2 𝑌𝑡−2 − 0.257143∇2 𝑌𝑡−7 + 0.396189A𝑡−8
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑7 = 0.0025; 𝛼𝜑8 ≅ 0
- 92 -
6)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
∇2 𝑌𝑡 = 𝐴𝑡 − 0.772805∇2 𝑌𝑡−1 − 0.430655∇2 𝑌𝑡−2 − 0.248449∇2 𝑌𝑡−7 + 0.385688A𝑡−8
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑7 = 0.0008; 𝛼𝜑7 ≅ 0
7)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
∇2 𝑌𝑡 = 𝐴𝑡 − 0.769972∇2 𝑌𝑡−1 − 0.431456∇2 𝑌𝑡−2 − 0.247070∇2 𝑌𝑡−7 + 0.379577A𝑡−8
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑7 = 0.0005; 𝛼𝜑8 ≅ 0
8)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
∇2 𝑌𝑡 = 𝐴𝑡 − 0.762479∇2 𝑌𝑡−1 − 0.412657∇2 𝑌𝑡−2 − 0.264249∇2 𝑌𝑡−7 + 0.398665A𝑡−8
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑7 = 0.0002; 𝛼𝜑8 ≅ 0
9)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑2 𝑌𝑡−2
𝑌𝑡 = 𝐴𝑡 + 0.503060𝑌𝑡−1 + 0.496720𝜑2 𝑌𝑡−2
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0
10)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑2 𝑌𝑡−2
𝑌𝑡 = 𝐴𝑡 + 0.503072𝑌𝑡−1 + 0.496717𝜑2 𝑌𝑡−2
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0
11)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑2 𝑌𝑡−2 + 𝜑3 𝑌𝑡−3 + 𝜑4 𝑌𝑡−4 + 𝜑5 𝑌𝑡−5 + 𝜑6 𝑌𝑡−6 + 𝜑7 𝑌𝑡−7

- 93 -
𝑌𝑡 = 𝐴𝑡 + 0.161486𝑌𝑡−1 + 0.155204𝑌𝑡−2 + 0.149460𝑌𝑡−3 + 0.141084𝑌𝑡−4
+ 0.126993𝑌𝑡−5 + 0.133651𝑌𝑡−6 + 0.132065𝑌𝑡−7
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 ≅ 0; 𝛼𝜑6 ≅ 0; 𝛼𝜑 7 ≅ 0
12)
𝑌𝑡 = 𝐴𝑡 + 0.161703𝑌𝑡−1 + 0.155289𝑌𝑡−2 + 0.149470𝑌𝑡−3 + 0.141040𝑌𝑡−4

+ 0.126896𝑌𝑡−5 + 0.133513𝑌𝑡−6 + 0.132034𝑌𝑡−7
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 ≅ 0; 𝛼𝜑6 ≅ 0; 𝛼𝜑 7 ≅ 0
13)
𝑌𝑡 = 𝐴𝑡 + 0.161726𝑌𝑡−1 + 0.155214𝑌𝑡−2 + 0.149352𝑌𝑡−3 + 0.141000𝑌𝑡−4

+ 0.126928𝑌𝑡−5 + 0.133592𝑌𝑡−6 + 0.132133𝑌𝑡−7
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 ≅ 0; 𝛼𝜑6 ≅ 0; 𝛼𝜑 7 ≅ 0
14)
𝑌𝑡 = 𝐴𝑡 + 0.161342𝑌𝑡−1 + 0.154957𝑌𝑡−2 + 0.149256𝑌𝑡−3 + 0.141023𝑌𝑡−4

+ 0.127045𝑌𝑡−5 + 0.133592839𝑌𝑡−6 + 0.132491𝑌𝑡−7
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 ≅ 0; 𝛼𝜑6 ≅ 0; 𝛼𝜑 7 ≅ 0
15)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑3 𝑌𝑡−3 + 𝜑4 𝑌𝑡−4 + 𝜑5 𝑌𝑡−5 + 𝜑6 𝑌𝑡−6 + 𝜑7 𝑌𝑡−7
𝑌𝑡 = 𝐴𝑡 + 0.140272𝑌𝑡−1 + 0.146917𝑌𝑡−3 + 0.302077𝑌𝑡−4 + 0.138554𝑌𝑡−5

+ 0.142884𝑌𝑡−6 + 0.129216𝑌𝑡−7
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 ≅ 0; 𝛼𝜑6 ≅ 0; 𝛼𝜑7 ≅ 0
16)
𝑌𝑡 = 𝐴𝑡 + 0.150314𝑌𝑡−1 + 0.158611𝑌𝑡−3 + 0.215833𝑌𝑡−4 + 0.161346𝑌𝑡−5

+ 0.160122𝑌𝑡−6 + 0.153566𝑌𝑡−7
- 94 -
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 ≅ 0; 𝛼𝜑6 ≅ 0; 𝛼𝜑7 ≅ 0
17)
𝑌𝑡 = 𝐴𝑡 + 0.158717𝑌𝑡−1 + 0.163420𝑌𝑡−3 + 0.211229𝑌𝑡−4 + 0.163147𝑌𝑡−5

+ 0.1627820𝑌𝑡−6 + 0.140499𝑌𝑡−7
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 ≅ 0; 𝛼𝜑6 ≅ 0; 𝛼𝜑7 ≅ 0
18)
𝑌𝑡 = 𝐴𝑡 + 0.158981𝑌𝑡−1 + 0.163444𝑌𝑡−3 + 0.211174𝑌𝑡−4 + 0.163042𝑌𝑡−5

+ 0.162687𝑌𝑡−6 + 0.140470𝑌𝑡−7
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 ≅ 0; 𝛼𝜑6 ≅ 0; 𝛼𝜑7 ≅ 0
19)
𝑌𝑡 = 𝐴𝑡 + 0.158405𝑌𝑡−1 + 0.163566𝑌𝑡−3 + 0.210676𝑌𝑡−4 + 0.163803𝑌𝑡−5

+ 0.162848𝑌𝑡−6 + 0.140517𝑌𝑡−7
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 ≅ 0; 𝛼𝜑6 ≅ 0; 𝛼𝜑7 ≅ 0
20)
𝑌𝑡 = 𝐴𝑡 + 0.159253𝑌𝑡−1 + 0.163656𝑌𝑡−3 + 0.210386𝑌𝑡−4 + 0.163455𝑌𝑡−5

+ 0.162566𝑌𝑡−6 + 0.140513𝑌𝑡−7
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 ≅ 0; 𝛼𝜑6 ≅ 0; 𝛼𝜑7 ≅ 0
21)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑3 𝑌𝑡−3 + 𝜑4 𝑌𝑡−4 + 𝜑5 𝑌𝑡−5 + 𝜑6 𝑌𝑡−6 + 𝜑7 𝑌𝑡−7 +𝜑8 𝑌𝑡−8 + 𝜑10 𝑌𝑡−10
𝑌𝑡 = 𝐴𝑡 + 0.144172𝑌𝑡−1 + 0.134222𝑌𝑡−3 + 0.166009𝑌𝑡−4 + 0.120482𝑌𝑡−5

+ 0.112825𝑌𝑡−6 + 0.093227𝑌𝑡−7 + 0.113822𝑌𝑡−8 + 0.115097𝑌𝑡−10
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 ≅ 0; 𝛼𝜑6 = 0.0001;
- 95 -
𝛼𝜑7 = 0.0015; 𝛼𝜑8 = 0.0001; 𝛼𝜑10 ≅ 0
22)
𝑌𝑡 = 𝐴𝑡 + 0.149824𝑌𝑡−1 + 0.133002𝑌𝑡−3 + 0.165270𝑌𝑡−4 + 0.119066𝑌𝑡−5

+ 0.111866𝑌𝑡−6 + 0.092605𝑌𝑡−7 + 0.113323𝑌𝑡−8 + 0.114906𝑌𝑡−10
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 ≅ 0; 𝛼𝜑6 = 0.0001;
𝛼𝜑7 = 0.0015; 𝛼𝜑8 = 0.0001; 𝛼𝜑10 ≅ 0
23)
𝑌𝑡 = 𝐴𝑡 + 0.152073𝑌𝑡−1 + 0.131871𝑌𝑡−3 + 0.163353𝑌𝑡−4 + 0.116466𝑌𝑡−5

+ 0.114277𝑌𝑡−6 + 0.098187𝑌𝑡−7 + 0.113189𝑌𝑡−8 + 0.110449𝑌𝑡−10
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 ≅ 0; 𝛼𝜑6 ≅ 0;
𝛼𝜑7 = 0.0004; 𝛼𝜑8 ≅ 0; 𝛼𝜑10 = 0.0001
24)
𝑌𝑡 = 𝐴𝑡 + 0.155547𝑌𝑡−1 + 0.135852𝑌𝑡−3 + 0.166312𝑌𝑡−4 + 0.116473𝑌𝑡−5

+ 0.112318𝑌𝑡−6 + 0.095267𝑌𝑡−7 + 0.109173𝑌𝑡−8 + 0.108930𝑌𝑡−10
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 ≅ 0; 𝛼𝜑6 ≅ 0;
𝛼𝜑7 = 0.0006; 𝛼𝜑8 = 0.0001; 𝛼𝜑10 = 0.0001
25)
𝑌𝑡 = 𝐴𝑡 + 0.155544𝑌𝑡−1 + 0.135853𝑌𝑡−3 + 0.166297𝑌𝑡−4 + 0.116457𝑌𝑡−5

+ 0.112307𝑌𝑡−6 + 0.095285𝑌𝑡−7 + 0.109200𝑌𝑡−8 + 0.108929𝑌𝑡−10
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 ≅ 0; 𝛼𝜑6 ≅ 0;
𝛼𝜑7 = 0.0005; 𝛼𝜑8 = 0.0001; 𝛼𝜑10 = 0.0001
- 96 -
25)
𝑌𝑡 = 𝐴𝑡 + 0.155544𝑌𝑡−1 + 0.135853𝑌𝑡−3 + 0.166297𝑌𝑡−4 + 0.116457𝑌𝑡−5

+ 0.112307𝑌𝑡−6 + 0.095285𝑌𝑡−7 + 0.109200𝑌𝑡−8 + 0.108929𝑌𝑡−10
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 ≅ 0; 𝛼𝜑6 ≅ 0;
𝛼𝜑7 = 0.0005; 𝛼𝜑8 = 0.0001; 𝛼𝜑10 = 0.0001
26)
𝑌𝑡 = 𝐴𝑡 + 0.155688𝑌𝑡−1 + 0.135884𝑌𝑡−3 + 0.166253𝑌𝑡−4 + 0.116361𝑌𝑡−5

+ 0.112211𝑌𝑡−6 + 0.095225𝑌𝑡−7 + 0.109181𝑌𝑡−8 + 0.109075𝑌𝑡−10
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 ≅ 0; 𝛼𝜑6 ≅ 0;
𝛼𝜑7 = 0.0003; 𝛼𝜑8 ≅ 0; 𝛼𝜑10 ≅ 0
27)
𝑌𝑡 = 𝐴𝑡 + 0.155807𝑌𝑡−1 + 0.135868𝑌𝑡−3 + 0.166212𝑌𝑡−4 + 0.116310𝑌𝑡−5

+ 0.112171𝑌𝑡−6 + 0.095196𝑌𝑡−7 + 0.109177𝑌𝑡−8 + 0.109141𝑌𝑡−10
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 ≅ 0; 𝛼𝜑6 ≅ 0;
𝛼𝜑7 = 0.0002; 𝛼𝜑8 ≅ 0; 𝛼𝜑10 ≅ 0
28)
𝑌𝑡 = 𝐴𝑡 + 0.155881𝑌𝑡−1 + 0.135824𝑌𝑡−3 + 0.166234𝑌𝑡−4 + 0.116315𝑌𝑡−5

+ 0.112159𝑌𝑡−6 + 0.095138𝑌𝑡−7 + 0.109153𝑌𝑡−8 + 0.109184𝑌𝑡−10
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 ≅ 0; 𝛼𝜑6 ≅ 0;
𝛼𝜑7 = 0.0001; 𝛼𝜑8 ≅ 0; 𝛼𝜑10 ≅ 0
29)
- 97 -
𝑌𝑡 = 𝐴𝑡 + 0.156879𝑌𝑡−1 + 0.136151𝑌𝑡−3 + 0.165823𝑌𝑡−4 + 0.115985𝑌𝑡−5
+ 0.111388𝑌𝑡−6 + 0.094809𝑌𝑡−7 + 0.108902𝑌𝑡−8 + 0.109961𝑌𝑡−10
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 ≅ 0; 𝛼𝜑6 ≅ 0;
𝛼𝜑7 ≅ 0; 𝛼𝜑8 ≅ 0; 𝛼𝜑10 ≅ 0
30)
𝑌𝑡 = 𝐴𝑡 + 0.132228𝑌𝑡−1 + 0.140750𝑌𝑡−3 + 0.150413𝑌𝑡−4 + 0.161517𝑌𝑡−5

+ 0.119703𝑌𝑡−6 + 0.087318𝑌𝑡−7 + 0.103783𝑌𝑡−8 + 0.104190𝑌𝑡−10
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 ≅ 0; 𝛼𝜑6 ≅ 0;
𝛼𝜑7 ≅ 0; 𝛼𝜑8 = 0.0002; 𝛼𝜑10 ≅ 0
7.2.3 TEMPERATURA [ºC]
7.2.3.1 Estación: La Tamborada
𝑥̅ = 29.77 º𝐶
𝑠 = 1.93 º𝐶
𝑛 = 312
𝑘𝑛 = 3.314
𝑥𝑠 = 36.18 º𝐶
𝑥𝑖 = 23.36 º𝐶
Hay 1 dato anómalo según la 1º Iteración.
𝑥̅ = 29.79 º𝐶
𝑠 = 1.89
- 98 -
𝑛 = 311
𝑘𝑛 = 3.314
𝑥𝑠 = 36.07 º𝐶
𝑥𝑖 = 23.52 º𝐶
No hay datos anómalos según la 2º Iteración.
Se encontró solo 1 dato anómalo según la prueba
El valor considerado anómalo este bastante cerca del umbral no se lo debe eliminar por que
corresponde a una observación que en magnitud satisface el criterio de precisión, las
medidas fueron tomadas en intervalos de 0,5 ºC por lo tanto el error de precisión aceptable
seria de +1º C, la observación anómala difiere del límite del umbral en exactamente 1,02
ºC, 0.02 ºC no es una variación medible así que se acepta la observación.
Temperatura [ ºC]

Temperatura [ ºC]
Figura 7-13 Temperatura a nivel mensual en La Tamborada en [ºC], a) Original, Serie de datos medida, b) Completada
y Extendida, Serie de datos completada y extendida.
- 99 -
En los rellenos no hay nada particular, los modelos logran rellenar la serie eficientemente, y
en la predicción a corto plazo, si bien parecería que la volatilidad no se mantiene, pues esto
es propio de la serie, se observa en la serie original que esta presenta una tendencia cíclica y
determinística decreciente que se refleja en los resultados de la proyección, si observamos
los datos originales y los rellenos en la Figura 7-13 hay una continuidad del proceso
estudiado.
Modelos Utilizados:
1)
∇𝑌𝑡 = 𝐴𝑡 + 𝜑12 ∇𝑌𝑡−12
∇𝑌𝑡 = 𝐴𝑡 + 0.360663∇𝑌𝑡−12
𝛼𝜑1 ≅ 0
2)
∇𝑌𝑡 = 𝐴𝑡 + 𝜑12 ∇𝑌𝑡−12
∇𝑌𝑡 = 𝐴𝑡 + 0.375516∇𝑌𝑡−12
𝛼𝜑1 ≅ 0
3)
∇𝑌𝑡 = 𝐴𝑡 + 𝜑1 ∇𝑌𝑡−1 + 𝜑2 ∇𝑌𝑡−2 + 𝜑12 ∇𝑌𝑡−12 + 𝜑23 ∇𝑌𝑡−23 + 𝜑60 ∇𝑌𝑡−60
∇𝑌𝑡 = 𝐴𝑡 − 0.158919∇𝑌𝑡−1 − 0.124510∇𝑌𝑡−2 + 0.271131∇𝑌𝑡−12 + 0.186896∇𝑌𝑡−23

+ 0.227673∇𝑌𝑡−60
𝛼𝜑1 = 0.0007; 𝛼𝜑2 = 0.0103; 𝛼𝜑12 ≅ 0; 𝛼𝜑23 = 0.0017; 𝛼𝜑60 = 0.0002
4)
- 100 -
∇𝑌𝑡 = 𝐴𝑡 − 0.168760∇𝑌𝑡−1 − 0.131452∇𝑌𝑡−2 + 0.272881∇𝑌𝑡−12 + 0.188714∇𝑌𝑡−23

+ 0.209489∇𝑌𝑡−60
𝛼𝜑1 = 0.0001; 𝛼𝜑2 = 0.0039; 𝛼𝜑12 ≅ 0; 𝛼𝜑23 = 0.0006; 𝛼𝜑60 ≅ 0
5)
∇𝑌𝑡 = 𝐴𝑡 − 0.163410∇𝑌𝑡−1 − 0.134545∇𝑌𝑡−2 + 0.265866∇𝑌𝑡−12 + 0.212337∇𝑌𝑡−23

+ 0.208032∇𝑌𝑡−60
𝛼𝜑1 = 0.0001; 𝛼𝜑2 = 0.0039; 𝛼𝜑12 ≅ 0; 𝛼𝜑23 = 0.0006; 𝛼𝜑60 ≅ 0
TEMPERATURA [ºC]
7.2.3.2 Estación: Entre Ríos -Tarija
𝑥̅ = 6.15 º𝐶
𝑠 = 5.74 º𝐶
𝑛 = 350
𝑘𝑛 = 3.178
𝑥𝑠 = 25.20 º𝐶
𝑥𝑖 = −12.90 º𝐶
No hay datos anómalos que se hallen con la prueba.
- 101 -
Temperatura [ ºC]

Temperatura [ ºC]
Figura 7-14 Temperatura a nivel mensual en Entre Ríos en [ºC], a) Original, Serie de datos medida, b) Completada y
Extendida, Serie de datos rellenada y extendida.
Se identifica una leve tendencia determinística, apesar que la serie parece estacionaria, la
aplicación de diferencias de segundo orden en la serie permite determinar modelos que
reproducen las propiedades estadistas de la serie original tanto en inferencia de datos
faltantes como en las proyecciones a corto plazo los huecos se han rellenado
convenienteemtne como se observa en la Figura 7-14.
Modelos Utilizados:
1)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
∇2 𝑌𝑡 = 𝐴𝑡 + 𝜑1 ∇2 𝑌𝑡−1 + 𝜑2 ∇2 𝑌𝑡−2 + 𝜑6 ∇2 𝑌𝑡−6 + 𝜑7 ∇2 𝑌𝑡−7
∇2 𝑌𝑡 = 𝐴𝑡 − 0.761691∇2 𝑌𝑡−1 − 0.319070∇2 𝑌𝑡−2 − 0.389396𝜑6 ∇2 𝑌𝑡−6

− 0.356542∇2 𝑌𝑡−7
𝛼𝜑1 ≅ 0; 𝛼𝜑2 = 0.0087; 𝛼𝜑6 = 0.0054; 𝛼𝜑7 = 0.0052
- 102 -
2)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
∇2 𝑌𝑡 = 𝜇∇2 𝑌𝑡 + 𝐴𝑡 + 𝜑1 ∇2 𝑌𝑡−1 + 𝜑2 ∇2 𝑌𝑡−2 − 𝜃1 A𝑡−1 − 𝜃2 A𝑡−2
∇2 𝑌𝑡 = 𝜇∇2 𝑌𝑡 + 𝐴𝑡 − 0.659892∇2 𝑌𝑡−1 − 0.230769∇2 𝑌𝑡−2 + 1.419065A𝑡−1

− 0.428759A𝑡−2
𝛼𝜑1 ≅ 0; 𝛼𝜑2 = 0.0101; 𝛼𝜑6 ≅ 0; 𝛼𝜑7 ≅ 0
3)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
∇2 𝑌𝑡 = 𝜇∇2 𝑌𝑡 + 𝐴𝑡 − 0.655201∇2 𝑌𝑡−6 − 0.258933∇2 𝑌𝑡−44 + 1.432402A𝑡−1

− 0.438274A𝑡−3
𝛼𝜑6 ≅ 0; 𝛼𝜑44 = 0.0003; 𝛼𝜃1 ≅ 0; 𝛼𝜃3 ≅ 0
4)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
∇2 𝑌𝑡 = 𝜇∇2 𝑌𝑡 + 𝐴𝑡 − 0.671760∇2 𝑌𝑡−6 − 0.224107∇2 𝑌𝑡−44 + 1.454979A𝑡−1

− 0.457050A𝑡−3
𝛼𝜑6 ≅ 0; 𝛼𝜑44 = 0.0011; 𝛼𝜃1 ≅ 0; 𝛼𝜃3 ≅ 0
5)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
∇2 𝑌𝑡 = 𝜇∇2 𝑌𝑡 + 𝐴𝑡 − 0.691522∇2 𝑌𝑡−6 − 0.205505∇2 𝑌𝑡−44 + 1.488067A𝑡−1

− 0.489234A𝑡−3
𝛼𝜑6 ≅ 0; 𝛼𝜑44 = 0.0019; 𝛼𝜃1 ≅ 0; 𝛼𝜃3 = 0.0001
6)
- 103 -
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
∇2 𝑌𝑡 = 𝜇∇2 𝑌𝑡 + 𝐴𝑡 − 0.507865∇2 𝑌𝑡−6 + 0. 350297∇2 𝑌𝑡−59 + 1.421523A𝑡−1

− 0.422145A𝑡−3
𝛼𝜑6 ≅ 0; 𝛼𝜑59 ≅ 0; 𝛼𝜃1 ≅ 0; 𝛼𝜃3 ≅ 0
7)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
∇2 𝑌𝑡 = 𝜇∇2 𝑌𝑡 + 𝐴𝑡 + 𝜑6 ∇2 𝑌𝑡−6 + 𝜑44 ∇2 𝑌𝑡−44 + 𝜑59 ∇2 𝑌𝑡−59 − 𝜃1 A𝑡−1 − 𝜃3 A𝑡−3
∇2 𝑌𝑡 = 𝜇∇2 𝑌𝑡 + 𝐴𝑡 − 0.427373∇2 𝑌𝑡−6 − 0.181361∇2 𝑌𝑡−44 + 0. 373177∇2 𝑌𝑡−59

+ 1.413118A𝑡−1 − 0.413613A𝑡−3
𝛼𝜑6 ≅ 0; 𝛼𝜑44 = 0.0001; 𝛼𝜑59 ≅ 0; 𝛼𝜃1 ≅ 0; 𝛼𝜃3 ≅ 0
8)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
∇2 𝑌𝑡 = 𝜇∇2 𝑌𝑡 + 𝐴𝑡 − 0.431000∇2 𝑌𝑡−6 − 0.181439∇2 𝑌𝑡−44 + 0. 370096∇2 𝑌𝑡−59

+ 1.411361A𝑡−1 − 0.411985A𝑡−3
𝛼𝜑6 ≅ 0; 𝛼𝜑44 = 0.0001; 𝛼𝜑59 ≅ 0; 𝛼𝜃1 ≅ 0; 𝛼𝜃3 ≅ 0
9)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
∇2 𝑌𝑡 = 𝜇∇2 𝑌𝑡 + 𝐴𝑡 − 0.433626∇2 𝑌𝑡−6 − 0.176216∇2 𝑌𝑡−44 + 0. 368548∇2 𝑌𝑡−59

+ 1.415276A𝑡−1 − 0.415907A𝑡−3
𝛼𝜑6 ≅ 0; 𝛼𝜑44 = 0.0001; 𝛼𝜑59 ≅ 0; 𝛼𝜃1 ≅ 0; 𝛼𝜃3 ≅ 0
10)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
- 104 -
∇2 𝑌𝑡 = 𝜇∇2 𝑌𝑡 + 𝐴𝑡 − 0.419737∇2 𝑌𝑡−6 − 0.180520∇2 𝑌𝑡−44 + 0. 357986∇2 𝑌𝑡−59

+ 1.425541A𝑡−1 − 0.426117A𝑡−3
𝛼𝜑6 ≅ 0; 𝛼𝜑44 = 0.0002; 𝛼𝜑59 ≅ 0; 𝛼𝜃1 ≅ 0; 𝛼𝜃3 ≅ 0
11)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
∇2 𝑌𝑡 = 𝜇∇2 𝑌𝑡 + 𝐴𝑡 − 0.411901∇2 𝑌𝑡−6 − 0.175312∇2 𝑌𝑡−44 + 0. 361983∇2 𝑌𝑡−59

+ 1.422186A𝑡−1 − 0.422827A𝑡−3
𝛼𝜑6 ≅ 0; 𝛼𝜑44 = 0.0003; 𝛼𝜑59 ≅ 0; 𝛼𝜃1 ≅ 0; 𝛼𝜃3 ≅ 0
12)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
∇2 𝑌𝑡 = 𝜇∇2 𝑌𝑡 + 𝐴𝑡 − 0.408953∇2 𝑌𝑡−6 − 0.179804∇2 𝑌𝑡−44 + 0. 370546∇2 𝑌𝑡−59

+ 1.418492A𝑡−1 − 0.419355A𝑡−3
𝛼𝜑6 ≅ 0; 𝛼𝜑44 = 0.0001; 𝛼𝜑59 ≅ 0; 𝛼𝜃1 ≅ 0; 𝛼𝜃3 ≅ 0
13)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
∇2 𝑌𝑡 = 𝜇∇2 𝑌𝑡 + 𝐴𝑡 − 0.411539∇2 𝑌𝑡−6 − 0.189632∇2 𝑌𝑡−44 + 0. 370081∇2 𝑌𝑡−59

+ 1.420744A𝑡−1 − 0.421316A𝑡−3
𝛼𝜑6 ≅ 0; 𝛼𝜑44 ≅ 0; 𝛼𝜑59 ≅ 0; 𝛼𝜃1 ≅ 0; 𝛼𝜃3 ≅ 0
14)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
- 105 -
∇2 𝑌𝑡 = 𝜇∇2 𝑌𝑡 + 𝐴𝑡 − 0.406109∇2 𝑌𝑡−6 − 0.188413∇2 𝑌𝑡−44 + 0. 368205∇2 𝑌𝑡−59
+ 1.432636A𝑡−1 − 0.433365A𝑡−3
𝛼𝜑6 ≅ 0; 𝛼𝜑44 ≅ 0; 𝛼𝜑59 ≅ 0; 𝛼𝜃1 ≅ 0; 𝛼𝜃3 ≅ 0
15)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
∇2 𝑌𝑡 = 𝜇∇2 𝑌𝑡 + 𝐴𝑡 + 𝜑6 ∇2 𝑌𝑡−6 + 𝜑44 ∇2 𝑌𝑡−44 + 𝜑59 ∇2 𝑌𝑡−59 + 𝜑72 ∇2 𝑌𝑡−72 − 𝜃1 A𝑡−1

− 𝜃3 A𝑡−3
∇2 𝑌𝑡 = 𝜇∇2 𝑌𝑡 + 𝐴𝑡 − 0.292544∇2 𝑌𝑡−6 − 0.128307∇2 𝑌𝑡−44 + 0. 283792∇2 𝑌𝑡−59

+ 0. 333849∇2 𝑌𝑡−72 + 1.425912A𝑡−1 − 0.426476A𝑡−3
𝛼𝜑6 ≅ 0; 𝛼𝜑44 = 0.0020; 𝛼𝜑59 ≅ 0; 𝛼𝜑72 ≅ 0; 𝛼𝜃1 ≅ 0; 𝛼𝜃3 ≅ 0
16)
∇2 𝑌𝑡 = 𝑌𝑡 − 2𝑌𝑡−1 + 𝑌𝑡−2
∇2 𝑌𝑡 = 𝜇∇2 𝑌𝑡 + 𝐴𝑡 + 𝜑6 ∇2 𝑌𝑡−6 + 𝜑44 ∇2 𝑌𝑡−44 + 𝜑59 ∇2 𝑌𝑡−59 + 𝜑72 ∇2 𝑌𝑡−72 − 𝜃1 A𝑡−1

− 𝜃3 A𝑡−3
∇2 𝑌𝑡 = 𝜇∇2 𝑌𝑡 + 𝐴𝑡 − 0.249129∇2 𝑌𝑡−6 − 0.127188∇2 𝑌𝑡−44 + 0. 267464∇2 𝑌𝑡−59

+ 0. 362205∇2 𝑌𝑡−72 + 1.406493A𝑡−1 − 0.407420A𝑡−3
𝛼𝜑6 ≅ 0; 𝛼𝜑44 = 0.0040; 𝛼𝜑59 ≅ 0; 𝛼𝜑72 ≅ 0; 𝛼𝜃1 ≅ 0; 𝛼𝜃3 ≅ 0
TEMPERATURA [ºC]
7.2.3.3 Estación: Mizque
𝑥̅ = 6.15 º𝐶
𝑠 = 5.74 º𝐶
𝑛 = 5694
𝑘𝑛 = 3.178
𝑥𝑠 = 28.27 º𝐶
- 106 -
𝑥𝑖 = −10.13 º𝐶
No se descubren valores anómalos aplicando la prueba

Temperatura [ ºC]

Temperatura [ ºC]
Figura 7-15 Temperatura a nivel diario en Mizque en [ºC], a) Original, Serie de datos medida, b) Completada, Serie de
datos rellenada.
Si observamos el hueco que hay entre 1997 y 1998 en la Figura 7-15, vemos que se generan
malos resultados en intervalos de series diarias de temperatura como esta, solo se consigue
reproducir la centralidad del modelo pero la variabilidad no es reproducida por los modelos
por lo tanto es muy malo el ajuste y es desaconsejable.
Modelos Utilizados
1)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑2 ∇𝑌𝑡−2 + 𝜑36 ∇𝑌𝑡−36 + 𝜑47 ∇𝑌𝑡−47 + 𝜃23 𝐴𝑡−23
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.097586∇𝑌𝑡−2 + 0.075136∇𝑌𝑡−36 + 0.086859∇𝑌𝑡−47

+ 0.082005𝐴𝑡−23
- 107 -
𝛼𝜑2 = 0.0001; 𝛼𝜑36 = 0.0024; 𝛼𝜑47 = 0.0017; 𝛼𝜃23 = 0.0007
2)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑2 ∇𝑌𝑡−2 + 𝜑36 ∇𝑌𝑡−36 + 𝜑47 ∇𝑌𝑡−47 + 𝜃11 𝐴𝑡−11 + 𝜃23 𝐴𝑡−23
+ 𝜃63 𝐴𝑡−63
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.104235∇𝑌𝑡−2 + 0.061649∇𝑌𝑡−36 + 0.074716∇𝑌𝑡−47

+ 0.059012𝐴𝑡−11 + 0.080742𝐴𝑡−23 + 0.048016𝐴𝑡−63
𝛼𝜑2 ≅ 0; 𝛼𝜑36 = 0.0048; 𝛼𝜑47 = 0.0025; 𝛼𝜃11 = 0.0148; 𝛼𝜃23 =

0.0002; 𝛼𝜃63 = 0.0266
3)
+ 𝜃63 𝐴𝑡−63
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.095704∇𝑌𝑡−2 + 0.060062∇𝑌𝑡−36 + 0.063406∇𝑌𝑡−47

+ 0.051195𝐴𝑡−11 + 0.070182𝐴𝑡−23 + 0.045558𝐴𝑡−63
𝛼𝜑2 ≅ 0; 𝛼𝜑36 = 0.0029; 𝛼𝜑47 = 0.0039; 𝛼𝜃11 = 0.0190; 𝛼𝜃23 =

0.0004; 𝛼𝜃63 = 0.0198
4)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.094155∇𝑌𝑡−2 + 0.058754∇𝑌𝑡−36 + 0.051962∇𝑌𝑡−47

+ 0.049217𝐴𝑡−11 + 0.045558𝐴𝑡−23
𝛼𝜑2 ≅ 0; 𝛼𝜑36 = 0.0020; 𝛼𝜑47 = 0.0083; 𝛼𝜃11 = 0.0181; 𝛼𝜃23 = 0.0063
5)
- 108 -
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.105704∇𝑌𝑡−2 + 0.042352∇𝑌𝑡−36 + 0.038962∇𝑌𝑡−47
+ 0.032560𝐴𝑡−11 + 0.048777𝐴𝑡−23
𝛼𝜑2 ≅ 0; 𝛼𝜑36 = 0.0158; 𝛼𝜑47 = 0.0283; 𝛼𝜃11 = 0.0699; 𝛼𝜃23 = 0.0041
6)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.100816∇𝑌𝑡−2 + 0.037070∇𝑌𝑡−36 + 0.049229∇𝑌𝑡−47

+ 0.037994𝐴𝑡−10 + 0.044070𝐴𝑡−23
𝛼𝜑2 ≅ 0; 𝛼𝜑36 = 0.0297; 𝛼𝜑47 = 0.0037; 𝛼𝜃10 = 0.0248; 𝛼𝜃23 = 0.0085
7)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.089592∇𝑌𝑡−2 + 0.030515∇𝑌𝑡−36 + 0.047219∇𝑌𝑡−47

+ 0.031353𝐴𝑡−10 + 0.051225𝐴𝑡−23
𝛼𝜑2 ≅ 0; 𝛼𝜑36 = 0.0528; 𝛼𝜑47 = 0.0029; 𝛼𝜃10 = 0.0428; 𝛼𝜃23 = 0.0009
8)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑2 ∇𝑌𝑡−2 + 𝜑3 ∇𝑌𝑡−3 + 𝜑4 ∇𝑌𝑡−4 + 𝜑5 ∇𝑌𝑡−5 + 𝜑36 ∇𝑌𝑡−36 + 𝜑47 ∇𝑌𝑡−47
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.128698∇𝑌𝑡−2 − 0.089174∇𝑌𝑡−3 − 0.086527∇𝑌𝑡−4

− 0.043831∇𝑌𝑡−5 + 0.027549∇𝑌𝑡−36 + 0.046021∇𝑌𝑡−47
𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 = 0.0159; 𝛼𝜑36 = 0.0819; 𝛼𝜑47 =

0.0033
9)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑2 ∇𝑌𝑡−2 + 𝜑3 ∇𝑌𝑡−3 + 𝜑4 ∇𝑌𝑡−4 + 𝜑47 ∇𝑌𝑡−47
- 109 -
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.109833∇𝑌𝑡−2 − 0.079182∇𝑌𝑡−3 − 0.064088∇𝑌𝑡−4
− 0.050808∇𝑌𝑡−47
𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 = 0.0002; 𝛼𝜑47 = 0.0008
10)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.105310∇𝑌𝑡−2 − 0.083166∇𝑌𝑡−3 − 0.070293∇𝑌𝑡−4

+ 0.043416∇𝑌𝑡−47
𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑47 = 0.0044
11)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.110634∇𝑌𝑡−2 − 0.086232∇𝑌𝑡−3 − 0.066047∇𝑌𝑡−4

+ 0.046100∇𝑌𝑡−47
𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 = 0.0001; 𝛼𝜑47 = 0.0021
12)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.110414∇𝑌𝑡−2 − 0.085693∇𝑌𝑡−3 − 0.066443∇𝑌𝑡−4

+ 0.046065∇𝑌𝑡−47
𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 = 0.0001; 𝛼𝜑47 = 0.0021
13)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.106425∇𝑌𝑡−2 − 0.088173∇𝑌𝑡−3 − 0.067657∇𝑌𝑡−4

+ 0.039800∇𝑌𝑡−47
- 110 -
𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 = 0.0001; 𝛼𝜑47 = 0.0061
14)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.105624∇𝑌𝑡−2 − 0.087921∇𝑌𝑡−3 − 0.067209∇𝑌𝑡−4

+ 0.040354∇𝑌𝑡−47
𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 = 0.0001; 𝛼𝜑47 = 0.0054
15)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.106142∇𝑌𝑡−2 − 0.088017∇𝑌𝑡−3 − 0.067498∇𝑌𝑡−4

+ 0.039952∇𝑌𝑡−47
𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 = 0.0001; 𝛼𝜑47 = 0.0059
16)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.103324∇𝑌𝑡−2 − 0.096505∇𝑌𝑡−3 − 0.073697∇𝑌𝑡−4

+ 0.037601∇𝑌𝑡−47
𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑47 = 0.0088
17)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.102468∇𝑌𝑡−2 − 0.089703∇𝑌𝑡−3 − 0.081474∇𝑌𝑡−4

+ 0.042004∇𝑌𝑡−47
𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑47 = 0.0022
18)
- 111 -
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.116284∇𝑌𝑡−2 − 0.090667∇𝑌𝑡−3 − 0.063798∇𝑌𝑡−4

+ 0.029744∇𝑌𝑡−47
𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑47 = 0.0189
19)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.119446∇𝑌𝑡−2 − 0.090047∇𝑌𝑡−3 − 0.065403∇𝑌𝑡−4

+ 0.022684∇𝑌𝑡−47
𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑47 = 0.0716
TEMPERATURA [ºC]
7.2.3.4 Estación: Irupana
𝑥̅ = 10.37 º𝐶
𝑠 = 2.89 º𝐶
𝑛 = 670
𝑘𝑛 = 3.310
𝑥𝑠 = 20 º𝐶
𝑥𝑖 = 0.82 º𝐶
No se descubren valores anómalos aplicando la prueba.
- 112 -
Temperatura [ ºC]

Temperatura [ ºC]
Figura 7-16 Temperatura a nivel mensual en Irupana en [ºC], a) Original, Serie de datos medida, b) Completada
y Extendida, Serie de datos rellenada.
Los datos iniciales se encuentran desfasados, pero esto no afecta en nada a la capacidad
inferencial del modelo en tanto que este reproduce bien la centralidad y la volatilidad de la
serie original como se observa en el relleno representado en la Figura 7-16, los datos
generados entre 1960 y 1961 son bastante naturales.
Modelos Utilizados:
1)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑7 ∇𝑌𝑡−7 + 𝜃13 𝐴𝑡−13
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.436228∇𝑌𝑡−7 − 0.231431𝐴𝑡−13
- 113 -
𝛼𝜑7 ≅ 0; 𝛼𝜃13 = 0.0498
2)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑7 ∇𝑌𝑡−7 + 𝜃15 𝐴𝑡−15
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.351123∇𝑌𝑡−7 + 0.388781𝐴𝑡−15
𝛼𝜑7 = 0.0004; 𝛼𝜃15 = 0.0004
3)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑7 ∇𝑌𝑡−7 + 𝜃15 𝐴𝑡−15
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.347027∇𝑌𝑡−7 + 0.405074𝐴𝑡−15
𝛼𝜑7 = 0.0003; 𝛼𝜃15 = 0.0001
4)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑7 ∇𝑌𝑡−7 + 𝜃15 𝐴𝑡−15
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.328306∇𝑌𝑡−7 + 0.353071𝐴𝑡−15
𝛼𝜑7 = 0.0011; 𝛼𝜃15 = 0.0004
5)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑7 ∇𝑌𝑡−7 + 𝜃15 𝐴𝑡−15
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.305980∇𝑌𝑡−7 + 0.381231𝐴𝑡−15
𝛼𝜑7 = 0.0018; 𝛼𝜃15 = 0.0001
6)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑7 ∇𝑌𝑡−7 + 𝜃15 𝐴𝑡−15
- 114 -
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.318599∇𝑌𝑡−7 + 0.408214𝐴𝑡−15
𝛼𝜑7 = 0.0020; 𝛼𝜃15 = 0.0001
7)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑7 ∇𝑌𝑡−7 + 𝜃15 𝐴𝑡−15
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.349443∇𝑌𝑡−7 + 0.366736𝐴𝑡−15
𝛼𝜑7 = 0.0002; 𝛼𝜃15 = 0.0003
8)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑7 ∇𝑌𝑡−7 + 𝜃15 𝐴𝑡−15
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.310153∇𝑌𝑡−7 + 0.261367𝐴𝑡−15
𝛼𝜑7 ≅ 0; 𝛼𝜃15 = 0.0022
9)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑7 ∇𝑌𝑡−7 + 𝜃15 𝐴𝑡−15
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.310443∇𝑌𝑡−7 + 0.262473𝐴𝑡−15
𝛼𝜑7 ≅ 0; 𝛼𝜃15 = 0.0003
10)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑7 ∇𝑌𝑡−7 + 𝜃15 𝐴𝑡−15
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.305904∇𝑌𝑡−7 + 0.276006𝐴𝑡−15
𝛼𝜑7 ≅ 0; 𝛼𝜃15 = 0.0001
11)
- 115 -
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑7 ∇𝑌𝑡−7 + 𝜃15 𝐴𝑡−15
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.304196∇𝑌𝑡−7 + 0.199315𝐴𝑡−15
𝛼𝜑7 ≅ 0; 𝛼𝜃15 = 0.0007
12)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑7 ∇𝑌𝑡−7 + 𝜃15 𝐴𝑡−15
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.262501∇𝑌𝑡−7 + 0.124975𝐴𝑡−15
𝛼𝜑7 ≅ 0; 𝛼𝜃15 = 0.0029
13)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑7 ∇𝑌𝑡−7 + 𝜃15 𝐴𝑡−15
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.260597∇𝑌𝑡−7 + 0.131822𝐴𝑡−15
𝛼𝜑7 ≅ 0; 𝛼𝜃15 = 0.0016
15)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑7 ∇𝑌𝑡−7 + 𝜃15 𝐴𝑡−15
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.256034∇𝑌𝑡−7 + 0.152122𝐴𝑡−15
𝛼𝜑7 ≅ 0; 𝛼𝜃15 = 0.0002
16)
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑7 ∇𝑌𝑡−7 + 𝜃15 𝐴𝑡−15
∇𝑌𝑡 = 𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.257715∇𝑌𝑡−7 + 0.152998𝐴𝑡−15
𝛼𝜑7 ≅ 0; 𝛼𝜃15 = 0.0001
TEMPERATURA [ºC]
- 116 -
7.2.3.5 Estación: Anzaldo
𝑥̅ = 22.16 º𝐶
𝑠 = 3.24 º𝐶
𝑛 = 530
𝑘𝑛 = 3.206
𝑥𝑠 = 32.55 º𝐶
𝑥𝑖 = 11.76 º𝐶

Temperatura [ ºC]

Temperatura [ ºC]
Figura 7-17 Temperatura a nivel mensual en Anzaldo en [ºC], a) Original, Serie de datos medida, b) Completada, Serie
de datos rellenada.
- 117 -
Observado los huecos entre 1980 y 1982 y entre 1993 y 194 de la Figura 7-17, los rellenos
parecen ser menos fiables en tanto el hueco es más grande, esto se genera por que la serie
no presenta una volatilidad constante a lo largo del tiempo, hay al menos 3 cambios en la
volatilidad de la serie original los cuales no se reproducen de la mejor manera con los
modelos encontrados.
Modelos Utilizados:
1)
𝑌𝑡 = (𝐶 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 − 𝜃3 𝐴𝑡−3 ) ∗ (𝐶 + 𝐴𝑡 − Ѳ11 𝐴𝑡−11 )
𝑌𝑡 = (27.87417 + 𝐴𝑡 + 0.526596𝑌𝑡−1 + 0.457615𝐴𝑡−3 )

∗ (27.87417 + 𝐴𝑡 − 0.384577𝐴𝑡−11 )
𝛼𝐶 ≅ 0; 𝛼𝜑1 = 0.0061; 𝛼𝜑3 = 0.0004; 𝛼Ѳ11 = 0.0218
2)
𝑌𝑡 = (28.27435 + 𝐴𝑡 + 0.583571𝑌𝑡−1 + 0.269863𝐴𝑡−3 )

∗ (28.27435 + 𝐴𝑡 − 0.404645𝐴𝑡−11 )
𝛼𝐶 ≅ 0; 𝛼𝜑1 = 0.0001; 𝛼𝜑3 = 0.0178; 𝛼Ѳ11 = 0.0112
3)
𝑌𝑡 = (28.27343 + 𝐴𝑡 + 0.584055𝑌𝑡−1 + 0.270679𝐴𝑡−3 )

∗ (28.27343 + 𝐴𝑡 − 0.410670𝐴𝑡−11 )
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑3 = 0.0232; 𝛼Ѳ11 = 0.0036
4)
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 + 𝜑1 ∇𝑌𝑡−1 − 𝜃3 𝐴𝑡−3 ) ∗ (𝜇∇𝑌𝑡 + 𝐴𝑡 − Ѳ11 𝐴𝑡−11 )
∇𝑌𝑡 = (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.298161∇𝑌𝑡−1 + 0.252859𝐴𝑡−3 ) ∗ (𝜇∇𝑌𝑡 + 𝐴𝑡 − 0.349756𝐴𝑡−11 )
𝛼𝜑1 = 0.0012; 𝛼𝜑3 = 0.0016; 𝛼Ѳ11 = 0.0004
5)
- 118 -
𝛼𝜑1 = 0.0010; 𝛼𝜑3 = 0.0010; 𝛼Ѳ11 = 0.0002
6)
𝛼𝜑1 = 0.0014; 𝛼𝜑3 = 0.0010; 𝛼Ѳ11 = 0.0067
7)
𝛼𝜑1 = 0.0005; 𝛼𝜑3 = 0.0007; 𝛼Ѳ11 = 0.0040
8)
𝛼𝜑1 = 0.0004; 𝛼𝜑3 = 0.0005; 𝛼Ѳ11 = 0.0019
9)
𝛼𝜑1 = 0.0001; 𝛼𝜑3 = 0.0001; 𝛼Ѳ11 = 0.0008
- 119 -
10)
𝛼𝜑1 = 0.0001; 𝛼𝜑3 = 0.0001; 𝛼Ѳ11 = 0.0007
11)
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼Ѳ11 = 0.0002
12)
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼Ѳ11 ≅ 0
13)
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼Ѳ11 ≅ 0
14)
- 120 -
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼Ѳ11 ≅ 0
15)
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼Ѳ11 ≅ 0
16)
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼Ѳ11 ≅ 0
7.2.4 EVAPORACIÓN [mm]
7.2.4.1 Estación: Chipiri
𝑥̅ = 3.13 𝑚𝑚
𝑠 = 1.6 𝑚𝑚
𝑛 = 1670
𝑘𝑛 = 3.312
𝑥𝑠 = 8.43 𝑚𝑚
𝑥𝑖 = 0 𝑚𝑚
Se descubren 6 valores anómalos aplicando la prueba, susceptibles de ser eliminados y

rellenados, pero dada la variabilidad en la volatilidad y siendo los valores encontrados del
orden de otros valores observados con frecuencia no se sugiere eliminar las observaciones.
- 121 -
Evaporación [mm]

Evaporación [mm]
Figura 7-18 Evaporación a nivel mensual en Chipiri en [mm], a) Original, Serie de datos medida, b) Completada. Serie
de datos rellenada.
La serie es completamente no estacionaria en varianza, los fuertes cambios en la volatilidad

que se observan en la Figura 7-18 hacen evidencia de ello, a pesar de las transformaciones
realizadas, los modelos no pueden reproducir la volatilidad de la serie original y generan
valores posibles pero completamente desaconsejables.
Modelos Utilizados:
1)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑7 𝑌𝑡−7 + 𝜑33 𝑌𝑡−33
𝑌𝑡 = 𝐴𝑡 + 0.557182𝑌𝑡−1 + 0.235761𝑌𝑡−7 + 0.192597𝑌𝑡−33
𝛼𝜑1 ≅ 0; 𝛼𝜑7 ≅ 0; 𝛼𝜑33 = 0.0010
2)
- 122 -
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑7 𝑌𝑡−7 + 𝜑33 𝑌𝑡−33
𝑌𝑡 = 𝐴𝑡 + 0.544514𝑌𝑡−1 + 0.237547𝑌𝑡−7 + 0.201307𝑌𝑡−33
𝛼𝜑1 ≅ 0; 𝛼𝜑7 ≅ 0; 𝛼𝜑33 = 0.0001
3)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑7 𝑌𝑡−7 + 𝜑33 𝑌𝑡−33
𝑌𝑡 = 𝐴𝑡 + 0.541865𝑌𝑡−1 + 0.242236𝑌𝑡−7 + 0.197736𝑌𝑡−33
𝛼𝜑1 ≅ 0; 𝛼𝜑7 ≅ 0; 𝛼𝜑33 = 0.0002
4)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑7 𝑌𝑡−7 + 𝜑33 𝑌𝑡−33
𝑌𝑡 = 𝐴𝑡 + 0.537096𝑌𝑡−1 + 0.242929𝑌𝑡−7 + 0.202189𝑌𝑡−33
𝛼𝜑1 ≅ 0; 𝛼𝜑7 ≅ 0; 𝛼𝜑33 = 0.0001
5)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑7 𝑌𝑡−7 + 𝜑33 𝑌𝑡−33
𝑌𝑡 = 𝐴𝑡 + 0.547021𝑌𝑡−1 + 0.235923𝑌𝑡−7 + 0.192711𝑌𝑡−33
𝛼𝜑1 ≅ 0; 𝛼𝜑7 ≅ 0; 𝛼𝜑33 = 0.0001
6)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑7 𝑌𝑡−7 + 𝜑33 𝑌𝑡−33
𝑌𝑡 = 𝐴𝑡 + 0.565340𝑌𝑡−1 + 0.227658𝑌𝑡−7 + 0.183033𝑌𝑡−33
𝛼𝜑1 ≅ 0; 𝛼𝜑7 ≅ 0; 𝛼𝜑33 = 0.0002
7)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑7 𝑌𝑡−7 + 𝜑33 𝑌𝑡−33
𝑌𝑡 = 𝐴𝑡 + 0.572488𝑌𝑡−1 + 0.220821𝑌𝑡−7 + 0.187408𝑌𝑡−33
𝛼𝜑1 ≅ 0; 𝛼𝜑7 ≅ 0; 𝛼𝜑33 = 0.0005
8)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑7 𝑌𝑡−7 + 𝜑33 𝑌𝑡−33

- 123 -
𝑌𝑡 = 𝐴𝑡 + 0.568088𝑌𝑡−1 + 0.223775𝑌𝑡−7 + 0.188210𝑌𝑡−33
𝛼𝜑1 ≅ 0; 𝛼𝜑7 ≅ 0; 𝛼𝜑33 = 0.0004
9)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑7 𝑌𝑡−7 + 𝜑33 𝑌𝑡−33
𝑌𝑡 = 𝐴𝑡 + 0.567685𝑌𝑡−1 + 0.215716𝑌𝑡−7 + 0.196057𝑌𝑡−33
𝛼𝜑1 ≅ 0; 𝛼𝜑7 ≅ 0; 𝛼𝜑33 = 0.0002
10)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑7 𝑌𝑡−7 + 𝜑33 𝑌𝑡−33
𝑌𝑡 = 𝐴𝑡 + 0.569080𝑌𝑡−1 + 0.218047𝑌𝑡−7 + 0.193330𝑌𝑡−33
𝛼𝜑1 ≅ 0; 𝛼𝜑7 ≅ 0; 𝛼𝜑33 = 0.0002
11)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑7 𝑌𝑡−7 + 𝜑33 𝑌𝑡−33
𝑌𝑡 = 𝐴𝑡 + 0.571572𝑌𝑡−1 + 0.220870𝑌𝑡−7 + 0.188401𝑌𝑡−33
𝛼𝜑1 ≅ 0; 𝛼𝜑7 ≅ 0; 𝛼𝜑33 = 0.0002
12)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑7 𝑌𝑡−7 + 𝜑33 𝑌𝑡−33
𝑌𝑡 = 𝐴𝑡 + 0.574057𝑌𝑡−1 + 0.221782𝑌𝑡−7 + 0.184233𝑌𝑡−33
𝛼𝜑1 ≅ 0; 𝛼𝜑7 ≅ 0; 𝛼𝜑33 = 0.0003
13)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑7 𝑌𝑡−7 + 𝜑33 𝑌𝑡−33
𝑌𝑡 = 𝐴𝑡 + 0.573109𝑌𝑡−1 + 0.222398𝑌𝑡−7 + 0.185175𝑌𝑡−33
𝛼𝜑1 ≅ 0; 𝛼𝜑7 ≅ 0; 𝛼𝜑33 = 0.0002
14)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑7 𝑌𝑡−7 + 𝜑33 𝑌𝑡−33
𝑌𝑡 = 𝐴𝑡 + 0.566684𝑌𝑡−1 + 0.224600𝑌𝑡−7 + 0.189509𝑌𝑡−33

- 124 -
𝛼𝜑1 ≅ 0; 𝛼𝜑7 ≅ 0; 𝛼𝜑33 = 0.0002
15)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑7 𝑌𝑡−7 + 𝜑33 𝑌𝑡−33
𝑌𝑡 = 𝐴𝑡 + 0.576489𝑌𝑡−1 + 0.229720𝑌𝑡−7 + 0.175687𝑌𝑡−33
𝛼𝜑1 ≅ 0; 𝛼𝜑7 ≅ 0; 𝛼𝜑33 = 0.0003
16)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑7 𝑌𝑡−7 + 𝜑33 𝑌𝑡−33
𝑌𝑡 = 𝐴𝑡 + 0.579077𝑌𝑡−1 + 0.231668𝑌𝑡−7 + 0.172647𝑌𝑡−33
𝛼𝜑1 ≅ 0; 𝛼𝜑7 ≅ 0; 𝛼𝜑33 = 0.0002
17)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑7 𝑌𝑡−7 + 𝜑33 𝑌𝑡−33
𝑌𝑡 = 𝐴𝑡 + 0.549906𝑌𝑡−1 + 0.244281𝑌𝑡−7 + 0.179556𝑌𝑡−33
𝛼𝜑1 ≅ 0; 𝛼𝜑7 ≅ 0; 𝛼𝜑33 ≅ 0
18)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑7 𝑌𝑡−7 + 𝜑33 𝑌𝑡−33
𝑌𝑡 = 𝐴𝑡 + 0.553745𝑌𝑡−1 + 0.236703𝑌𝑡−7 + 0.180145𝑌𝑡−33
𝛼𝜑1 ≅ 0; 𝛼𝜑7 ≅ 0; 𝛼𝜑33 ≅ 0
18)
𝑌𝑡 = 𝜇 + 𝐴𝑡 − 0.168475𝑌𝑡−2 − 0.066757𝑌𝑡−6 − 0.071945𝑌𝑡−12 − 0.078162𝐴𝑡−126
𝛼𝜑2 ≅ 0; 𝛼𝜑6 = 0.0278; 𝛼𝜑12 = 0.0097; 𝛼𝜃126 = 0.0240
EVAPORACIÓN [mm]
7.2.4.2 Estación: Okinawa I
- 125 -
𝑥̅ = 4.65 𝑚𝑚
𝑠 = 1.77 𝑚𝑚
𝑛 = 681
𝑘𝑛 = 3.31
𝑥𝑠 = 10.51 𝑚𝑚

Evaporación [mm]

Evaporación [mm]
Figura 7-19 Evaporación a nivel diario en Chipiri en [mm], a) Original, Serie de datos medida, b) Completada, Serie de
datos completada.
Una componente cíclica que los modelos no puede reproducir parece afectar a la volatilidad
de las inferencias al menos cuando los huecos son demasiados extensos como el que se
presenta en el mes de agosto de 2004 cuyos rellenos son representados en la Figura 7-19,
- 126 -
los rellenos generados son similares a otros periodos previos de la serie pero en la posición
donde se encuentran no mantienen la continuidad de la serie, de la misma manera a otros
rellenos diarios las inferencias parecen desaconsejables.
Modelos Utilizados:
1)
𝑌´𝑡 = 𝑙𝑜𝑔(𝑌𝑡 )
𝑌´𝑡 = 𝐴𝑡 + 𝜑1 𝑌´𝑡−1 + 𝜑2 𝑌´𝑡−2 + 𝜑3 𝑌´𝑡−3
𝑌´𝑡 = 𝐴𝑡 + 0.177481𝑌´𝑡−1 + 0.430950𝑌´𝑡−2 + 0.366275𝑌´𝑡−3
𝛼𝜑1 = 0.0217; 𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0
2)
𝑌´𝑡 = 𝐴𝑡 + 𝜑1 𝑌´𝑡−1 + 𝜑2 𝑌´𝑡−2 + 𝜑3 𝑌´𝑡−3
𝑌´𝑡 = 𝐴𝑡 + 0.204215𝑌´𝑡−1 + 0.400693𝑌´𝑡−2 + 0.370722𝑌´𝑡−3
𝛼𝜑1 = 0.0090; 𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0
3)
𝑌´𝑡 = 𝐴𝑡 + 𝜑1 𝑌´𝑡−1 + 𝜑2 𝑌´𝑡−2 + 𝜑3 𝑌´𝑡−3
𝑌´𝑡 = 𝐴𝑡 + 0.202511𝑌´𝑡−1 + 0.401563𝑌´𝑡−2 + 0.372720𝑌´𝑡−3
𝛼𝜑1 = 0.0065; 𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0
4)
𝑌´𝑡 = 𝐴𝑡 + 𝜑1 𝑌´𝑡−1 + 𝜑2 𝑌´𝑡−2 + 𝜑3 𝑌´𝑡−3
𝑌´𝑡 = 𝐴𝑡 + 0.203099𝑌´𝑡−1 + 0.400586𝑌´𝑡−2 + 0.374464𝑌´𝑡−3
𝛼𝜑1 = 0.0058; 𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0
5)
- 127 -
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑2 𝑌𝑡−2 + 𝜑3 𝑌𝑡−3
𝑌𝑡 = 𝐴𝑡 + 0.224008𝑌𝑡−1 + 0.466549𝑌𝑡−2 + 0.280472𝑌𝑡−3
𝛼𝜑1 = 0.0059; 𝛼𝜑2 ≅ 0; 𝛼𝜑3 = 0.0002
6)
𝑌´𝑡 = 𝐴𝑡 + 𝜑1 𝑌´𝑡−1 + 𝜑2 𝑌´𝑡−2 + 𝜑3 𝑌´𝑡−3
𝑌´𝑡 = 𝐴𝑡 + 0.204779𝑌´𝑡−1 + 0.404745𝑌´𝑡−2 + 0.370755𝑌´𝑡−3
𝛼𝜑1 = 0.0036; 𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0
7)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑3 𝑌𝑡−3 + 𝜑26 𝑌𝑡−26
𝑌𝑡 = 𝐴𝑡 + 0.316125𝑌𝑡−1 + 0.339569𝑌𝑡−3 + 0.332699𝑌𝑡−26
𝛼𝜑1 = 0.0049; 𝛼𝜑3 = 0.0020; 𝛼𝜑26 = 0.0036
8)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑3 𝑌𝑡−3 + 𝜑15 𝑌𝑡−15
𝑌𝑡 = 𝐴𝑡 + 0.262021𝑌𝑡−1 + 0.355385𝑌𝑡−3 + 0.371603𝑌𝑡−15
𝛼𝜑1 = 0.0031; 𝛼𝜑3 ≅ 0; 𝛼𝜑15 = 0.0002
9)
𝑌´𝑡 = 𝐴𝑡 + 𝜑1 𝑌´𝑡−1 + 𝜑2 𝑌´𝑡−2 + 𝜑3 𝑌´𝑡−3
𝑌´𝑡 = +𝐴𝑡 + 0.267866𝑌´𝑡−1 + 0.366032𝑌´𝑡−2 + 0.338362𝑌´𝑡−3
𝛼𝜑1 = 0.0036; 𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0
10)
𝑌´𝑡 = 𝐴𝑡 + 𝜑1 𝑌´𝑡−1 + 𝜑2 𝑌´𝑡−2 + 𝜑3 𝑌´𝑡−3
𝑌´𝑡 = +𝐴𝑡 + 0.311887𝑌´𝑡−1 + 0.344596𝑌´𝑡−2 + 0.311026𝑌´𝑡−3

- 128 -
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0
11)
∇𝑌´𝑡 = 𝑌´𝑡 − 𝑌´𝑡−1
∇𝑌´𝑡 = 𝐴𝑡 + 𝜑1 ∇𝑌´𝑡−1 + 𝜑2 ∇𝑌´𝑡−2 + 𝜑3 ∇𝑌´𝑡−3 + 𝜑4 ∇𝑌´𝑡−4
∇𝑌´𝑡 = 𝐴𝑡 − 0.786170𝑌´𝑡−1 − 0.525124𝑌´𝑡−2 − 0.338788𝑌´𝑡−3 − 0.233921𝑌´𝑡−4
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑3 = 0.0001; 𝛼𝜑4 ≅ 0
12)
∇𝑌𝑡 = 𝐴𝑡 − 0.788907𝑌𝑡−1 − 0.482422𝑌𝑡−2 − 0.387280𝑌𝑡−3 − 0.313723𝑌𝑡−4

− 0.133737𝑌𝑡−5
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 = 0.0082
13)
∇𝑌𝑡 = 𝐴𝑡 − 0.755427𝑌𝑡−1 − 0.487561𝑌𝑡−2 − 0.440524𝑌𝑡−3 − 0.369075𝑌𝑡−4

− 0.160165𝑌𝑡−5
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 = 0.0018
14)
∇𝑌𝑡 = 𝐴𝑡 − 0.757080𝑌𝑡−1 − 0.506523𝑌𝑡−2 − 0.467513𝑌𝑡−3 − 0.377682𝑌𝑡−4

− 0.150984𝑌𝑡−5
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑5 = 0.0029
15)
- 129 -
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.200153𝑌𝑡−1 + 0.192465𝑌𝑡−2 + 0.605371𝑌𝑡−10 + 0.571721𝐴𝑡−10
𝛼𝜑1 ≅ 0; 𝛼𝜑2 = 0.0278; 𝛼𝜑10 = 0.0097; 𝛼𝜃10 = 0.0240
16)
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.200059𝑌𝑡−1 + 0.184370𝑌𝑡−2 + 0.613818𝑌𝑡−10 + 0.582993𝐴𝑡−10
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑10 ≅ 0; 𝛼𝜃10 ≅ 0
17)
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑2 𝑌𝑡−2 + 𝜑10 𝑌𝑡−10 + 𝜑23 𝑌𝑡−23 − 𝜃10 𝐴𝑡−10
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.177039𝑌𝑡−1 + 0.159777𝑌𝑡−2 + 0.526596𝑌𝑡−10 + 0.134929𝑌𝑡−23

+ 0.496050𝐴𝑡−10
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑10 ≅ 0; 𝛼𝜑23 = 0.0004; 𝛼𝜃10 ≅ 0
18)
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.168757𝑌𝑡−1 + 0.169619𝑌𝑡−2 + 0.495724𝑌𝑡−10 + 0.164246𝑌𝑡−23

+ 0.473271𝐴𝑡−10
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑10 ≅ 0; 𝛼𝜑23 ≅ 0; 𝛼𝜃10 ≅ 0
EVAPORACIÓN [mm]
7.2.4.3 Estación: Huarina Cota Cota
𝑥̅ = 135.38 𝑚𝑚
𝑠 = 27.94 𝑚𝑚
𝑛 = 350
- 130 -
𝑘𝑛 = 3.318
𝑥𝑠 = 228.10 𝑚𝑚
𝑥𝑖 = 42.65 𝑚𝑚

Evaporación [mm]

Evaporación [mm]
Figura 7-20 Evaporación a nivel mensual en Harina Cota Cota en [mm], a) Original, Serie de datos medida, b)
Completada, Serie de datos rellenada y extendida.
Los modelos encontrados reproducen rellenos demasiado conservadores para periodos de

huecos de extensa duración como observamos en la Figura 7-20 en el periodo comprendido
entre 1991 y 1998, aun así la continuidad de la serie y su volatilidad no se ve fuertemente
afectada y los valores generados puede ser de bastante utilidad.
Modelos Utilizados:
1)
𝑌𝑡 = 𝐶 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑12 𝑌𝑡−12 + 𝜑24 𝑌𝑡−24
𝑌𝑡 = 130.4427 + 𝐴𝑡 + 0.324118𝑌𝑡−1 + 0.236679𝑌𝑡−12 + 0.238603𝑌𝑡−24

- 131 -
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑12 = 0.0008; 𝛼𝜑24 = 0.0007
2)
𝑌𝑡 = 𝐶 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑12 𝑌𝑡−12 + 𝜑24 𝑌𝑡−24
𝑌𝑡 = 130.2880 + 𝐴𝑡 + 0.324387𝑌𝑡−1 + 0.236055𝑌𝑡−12 + 0.241338𝑌𝑡−24
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑12 = 0.0002; 𝛼𝜑24 = 0.0005
3)
𝑌𝑡 = 𝐶 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑24 𝑌𝑡−24 + 𝜑60 𝑌𝑡−60 + 𝜑83 𝑌𝑡−83 + 𝜑111 𝑌𝑡−111
𝑌𝑡 = 130.2360 + 𝐴𝑡 + 0.344145𝑌𝑡−1 + 0.244145𝑌𝑡−24 + 0.214205𝑌𝑡−60

+ 0.149362𝑌𝑡−83 − 0.134524𝑌𝑡−111
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑24 = 0.0002; 𝛼𝜑60 = 0.0024; 𝛼𝜑83 = 0.0354; 𝛼𝜑111

= 0.0724
4)
𝑌𝑡 = 134.9800 + 𝐴𝑡 + 0.355307𝑌𝑡−1 + 0.233669𝑌𝑡−24 + 0.223237𝑌𝑡−60

+ 0.158341𝑌𝑡−83 − 0.158341𝑌𝑡−111
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑24 ≅ 0; 𝛼𝜑60 ≅ 0; 𝛼𝜑83 = 0.0013; 𝛼𝜑111 = 0.0014
5)
𝑌𝑡 = 136.5344 + 𝐴𝑡 + 0.309544𝑌𝑡−1 + 0.245216𝑌𝑡−24 + 0.226872𝑌𝑡−60

+ 0.181173𝑌𝑡−83 − 0.136489𝑌𝑡−111
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑24 ≅ 0; 𝛼𝜑60 ≅ 0; 𝛼𝜑83 = 0.0002; 𝛼𝜑111 = 0.0011
6)
𝑌𝑡 = 136.6527 + 𝐴𝑡 + 0.298446𝑌𝑡−1 + 0.248005𝑌𝑡−24 + 0.231796𝑌𝑡−60

+ 0.180476𝑌𝑡−83 − 0.129226𝑌𝑡−111
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑24 ≅ 0; 𝛼𝜑60 ≅ 0; 𝛼𝜑83 = 0.0001; 𝛼𝜑111 = 0.0013
- 132 -
EVAPORACIÓN [mm]
7.2.4.4 Estación: Belén
𝑥̅ = 116.37 𝑚𝑚
𝑠 = 25.90 𝑚𝑚
𝑛 = 511
𝑘𝑛 = 3.318
𝑥𝑠 = 202.32 𝑚𝑚
𝑥𝑖 = 30.43 𝑚𝑚
𝑥̅ = 116.60 𝑚𝑚
𝑠 = 24.87
𝑛 = 508
𝑘𝑛 = 3.318
𝑥𝑠 = 199.11 𝑚𝑚
𝑥𝑖 = 34.08 𝑚𝑚
No se encontraron datos anómalos en la 2º Iteración
En total la prueba identifica 3 datos anómalos susceptibles de ser ignorados y rellenados,
Los valores encontrados por la prueba son distantes a los umbrales definidos por lo tanto su
aceptación como observaciones no es un tema de precisión, pero los primeros 2 están
demasiado alejados, sus valores respectivamente de 15.9 mm y 14.4 mm y deben ser
retirados, por otro lado el tercero es 206.2 mm que está por encima del límite superior del
umbral, pero hay bastantes valores similares por debajo del umbral por lo tanto esta puede
ser una observación atípica más que errónea y no se sugiere eliminarla.
- 133 -
Evaporación [mm]

Evaporación [mm]

Evaporación [mm]
Figura 7-21 Evaporación a nivel mensual en Belén en [mm], a) Original, Serie de datos medida, b) Corregida, Serie de
datos corregida usando el criterio de Grubbs & Beck, c) Completada y Extendida, Serie de datos rellenada y
extendida.
Los resultados no parecen ser muy naturales, como observamos en la Figura 7-21, los picos
de la serie no son bien reproducidos durante los rellenos, esto es porque los modelos
tuvieron que reproducir varios huecos grandes sucesivos con observaciones entre ellos.
Modelos Utilizados:
- 134 -
1)
𝑌𝑡 = 𝐶 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑27 𝑌𝑡−27 − 𝜃3 𝐴𝑡−3 − 𝜃8 𝐴𝑡−8
𝑌𝑡 = 113.3502 + 𝐴𝑡 + 0.646282𝑌𝑡−1 − 0.230971𝑌𝑡−27 + 0.477415𝐴𝑡−3

+ 0.522585𝐴𝑡−8
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑27 = 0.0172; 𝛼𝜃3 = 0; 𝛼𝜃8 = 0.0002
2)
𝑌𝑡 = 112.9749 + 𝐴𝑡 + 0.622212𝑌𝑡−1 − 0.237223𝑌𝑡−27 + 0.477415𝐴𝑡−3

+ 0.501286𝐴𝑡−8
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑27 = 0.0138; 𝛼𝜃3 = 0; 𝛼𝜃8 = 0.0009
3)
𝑌𝑡 = 113.2146 + 𝐴𝑡 + 0.608842𝑌𝑡−1 − 0.254924𝑌𝑡−27 + 0.432479𝐴𝑡−3

+ 0.516589𝐴𝑡−8
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑27 = 0.0037; 𝛼𝜃3 = 0; 𝛼𝜃8 = 0.0007
4)
𝑌𝑡 = 113.3914 + 𝐴𝑡 + 0.568329𝑌𝑡−1 − 0.279079𝑌𝑡−27 + 0.422569𝐴𝑡−3

+ 0.436501𝐴𝑡−8
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑27 = 0.0031; 𝛼𝜃3 = 0; 𝛼𝜃8 = 0.0012
5)
𝑌𝑡 = 113.8533 + 𝐴𝑡 + 0.57223𝑌𝑡−1 − 0.261465𝑌𝑡−27 + 0.440475𝐴𝑡−3 + 0.275012𝐴𝑡−8
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑27 = 0.0004; 𝛼𝜃3 ≅ 0; 𝛼𝜃8 = 0.0013
6)
- 135 -
𝑌𝑡 = 114.3174 + 𝐴𝑡 + 0.565077𝑌𝑡−1 − 0.191214𝑌𝑡−27 + 0.404344𝐴𝑡−3
+ 0.177414𝐴𝑡−8
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑27 = 0.0093; 𝛼𝜃3 = 0.0002; 𝛼𝜃8 = 0.0836
7)
𝑌𝑡 = 114.2691 + 𝐴𝑡 + 0.558758𝑌𝑡−1 − 0.191096𝑌𝑡−27 + 0.391873𝐴𝑡−3

+ 0.188546𝐴𝑡−8
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑27 = 0.0074; 𝛼𝜃3 = 0.0001; 𝛼𝜃8 = 0.0581
8)
𝑌𝑡 = 𝐶 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑27 𝑌𝑡−27 − 𝜃3 𝐴𝑡−3
𝑌𝑡 = 113.6528 + 𝐴𝑡 + 0.583116𝑌𝑡−1 − 0.202593𝑌𝑡−27 + 0.399457𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑27 = 0.0033; 𝛼𝜃3 = 0.0001
9)
𝑌𝑡 = 𝐶 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑23 𝑌𝑡−23 + 𝜑27 𝑌𝑡−27 − 𝜃3 𝐴𝑡−3
𝑌𝑡 = 113.3541 + 𝐴𝑡 + 0.594120𝑌𝑡−1 + 0.197105𝑌𝑡−23 − 0.205575𝑌𝑡−27

+ 0.366392𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0099; 𝛼𝜑27 = 0.0031; 𝛼𝜃3 = 0.0010
10)
𝑌𝑡 = 112.9895 + 𝐴𝑡 + 0.596263𝑌𝑡−1 + 0.188161𝑌𝑡−23 − 0.201346𝑌𝑡−27

+ 0.349968𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0147; 𝛼𝜑27 = 0.0041; 𝛼𝜃3 = 0.0013
11)
𝑌𝑡 = 113.6722 + 𝐴𝑡 + 0.601520𝑌𝑡−1 + 0.199623𝑌𝑡−23 − 0.192048𝑌𝑡−27

+ 0.356663𝐴𝑡−3
- 136 -
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0223; 𝛼𝜑27 = 0.0055; 𝛼𝜃3 ≅ 0
12)
𝑌𝑡 = 113.8648 + 𝐴𝑡 + 0.600046𝑌𝑡−1 + 0.200816𝑌𝑡−23 − 0.194451𝑌𝑡−27

+ 0.350733𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0058; 𝛼𝜑27 = 0.0032; 𝛼𝜃3 = 0.0005
13)
𝑌𝑡 = 114.2978 + 𝐴𝑡 + 0.563351𝑌𝑡−1 + 0.218390𝑌𝑡−23 − 0.199882𝑌𝑡−27

+ 0.335724𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0011; 𝛼𝜑27 = 0.0009; 𝛼𝜃3 = 0.0002
14)
𝑌𝑡 = 114.6150 + 𝐴𝑡 + 0.563790𝑌𝑡−1 + 0.220895𝑌𝑡−23 − 0.196264𝑌𝑡−27

+ 0.324557𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0009; 𝛼𝜑27 = 0.0011; 𝛼𝜃3 = 0.0002
15)
𝑌𝑡 = 117.5599 + 𝐴𝑡 + 0.573616𝑌𝑡−1 + 0.218842𝑌𝑡−23 − 0.151857𝑌𝑡−27

+ 0.231713𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0011; 𝛼𝜑27 = 0.0018; 𝛼𝜃3 = 0.0014
16)
𝑌𝑡 = 116.9836 + 𝐴𝑡 + 0.567555𝑌𝑡−1 + 0.198840𝑌𝑡−23 − 0.147023𝑌𝑡−27

+ 0.241053𝐴𝑡−3
- 137 -
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0022; 𝛼𝜑27 = 0.0032; 𝛼𝜃3 = 0.0010
17)
𝑌𝑡 = 116.0148 + 𝐴𝑡 + 0.579935𝑌𝑡−1 + 0.179094𝑌𝑡−23 − 0.169817𝑌𝑡−27

+ 0.227009𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0032; 𝛼𝜑27 = 0.0003; 𝛼𝜃3 = 0.0013
18)
𝑌𝑡 = 118.0161 + 𝐴𝑡 + 0.593310𝑌𝑡−1 + 0.191550𝑌𝑡−23 − 0.164387𝑌𝑡−27

+ 0.200472𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0005; 𝛼𝜑27 = 0.0002; 𝛼𝜃3 = 0.0035
19)
𝑌𝑡 = 117.3526 + 𝐴𝑡 + 0.590895𝑌𝑡−1 + 0.178012𝑌𝑡−23 − 0.156428𝑌𝑡−27

+ 0.203468𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0013; 𝛼𝜑27 = 0.0005; 𝛼𝜃3 = 0.0033
20)
𝑌𝑡 = 117.8620 + 𝐴𝑡 + 0.579726𝑌𝑡−1 + 0.161782𝑌𝑡−23 − 0.139334𝑌𝑡−27

+ 0.216137𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0017; 𝛼𝜑27 = 0.0012; 𝛼𝜃3 = 0.0002
21)
𝑌𝑡 = 117.9460 + 𝐴𝑡 + 0.579317𝑌𝑡−1 + 0.160836𝑌𝑡−23 − 0.138624𝑌𝑡−27

+ 0.216264𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0011; 𝛼𝜑27 = 0.0008; 𝛼𝜃3 = 0.0001
- 138 -
22)
𝑌𝑡 = 117.5540 + 𝐴𝑡 + 0.585173𝑌𝑡−1 + 0.162627𝑌𝑡−23 − 0.151020𝑌𝑡−27

+ 0.216412𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0009; 𝛼𝜑27 = 0.0002; 𝛼𝜃3 = 0.0001
23)
𝑌𝑡 = 117.3431 + 𝐴𝑡 + 0.587305𝑌𝑡−1 + 0.163138𝑌𝑡−23 − 0.150550𝑌𝑡−27

+ 0.203866𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0009; 𝛼𝜑27 = 0.0002; 𝛼𝜃3 = 0.0002
24)
𝑌𝑡 = 117.3802 + 𝐴𝑡 + 0.587241𝑌𝑡−1 + 0.163182𝑌𝑡−23 − 0.150484𝑌𝑡−27

+ 0.204219𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0007; 𝛼𝜑27 = 0.0007; 𝛼𝜃3 = 0.0002
25)
𝑌𝑡 = 117.3348 + 𝐴𝑡 + 0.585750𝑌𝑡−1 + 0.163120𝑌𝑡−23 − 0.150857𝑌𝑡−27

+ 0.203685𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0005; 𝛼𝜑27 = 0.0001; 𝛼𝜃3 = 0.0001
26)
𝑌𝑡 = 117.4874 + 𝐴𝑡 + 0.582636𝑌𝑡−1 + 0.166733𝑌𝑡−23 − 0.149502𝑌𝑡−27

+ 0.198862𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0003; 𝛼𝜑27 = 0.0001; 𝛼𝜃3 = 0.0002
27)
- 139 -
𝑌𝑡 = 117.3307 + 𝐴𝑡 + 0.583205𝑌𝑡−1 + 0.172924𝑌𝑡−23 − 0.149263𝑌𝑡−27

+ 0.195396𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0002; 𝛼𝜑27 = 0.0001; 𝛼𝜃3 = 0.0002
28)
𝑌𝑡 = 117.3453 + 𝐴𝑡 + 0.583380𝑌𝑡−1 + 0.172988𝑌𝑡−23 − 0.149798𝑌𝑡−27

+ 0.195443𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0001; 𝛼𝜑27 ≅ 0; 𝛼𝜃3 = 0.0001
29)
𝑌𝑡 = 118.0030 + 𝐴𝑡 + 0.572357𝑌𝑡−1 + 0.174560𝑌𝑡−23 − 0.146277𝑌𝑡−27

+ 0.182077𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0001; 𝛼𝜑27 = 0.0001; 𝛼𝜃3 = 0.0001
30)
𝑌𝑡 = 117.8151 + 𝐴𝑡 + 0.554061𝑌𝑡−1 + 0.175942𝑌𝑡−23 − 0.137242𝑌𝑡−27

+ 0.152944𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0001; 𝛼𝜑27 = 0.0003; 𝛼𝜃3 = 0.0011
31)
𝑌𝑡 = 117.6807 + 𝐴𝑡 + 0.556218𝑌𝑡−1 + 0.171117𝑌𝑡−23 − 0.139337𝑌𝑡−27

+ 0.150755𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0001; 𝛼𝜑27 = 0.0003; 𝛼𝜃3 = 0.0013
32)
- 140 -
𝑌𝑡 = 117.5758 + 𝐴𝑡 + 0.556480𝑌𝑡−1 + 0.168086𝑌𝑡−23 − 0.139205𝑌𝑡−27
+ 0.154607𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0001; 𝛼𝜑27 = 0.0002; 𝛼𝜃3 = 0.0009
33)
𝑌𝑡 = 117.5709 + 𝐴𝑡 + 0.556483𝑌𝑡−1 + 0.168216𝑌𝑡−23 − 0.139455𝑌𝑡−27

+ 0.154583𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 = 0.0001; 𝛼𝜑27 = 0.0001; 𝛼𝜃3 = 0.0007
34)
𝑌𝑡 = 117.2763 + 𝐴𝑡 + 0.559187𝑌𝑡−1 + 0.172642𝑌𝑡−23 − 0.144189𝑌𝑡−27

+ 0.154111𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 ≅ 0; 𝛼𝜑27 = 0.0001; 𝛼𝜃3 = 0.0007
35)
𝑌𝑡 = 117.0119 + 𝐴𝑡 + 0.563138𝑌𝑡−1 + 0.183148𝑌𝑡−23 − 0.142910𝑌𝑡−27

+ 0.147300𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 ≅ 0; 𝛼𝜑27 = 0.0001; 𝛼𝜃3 = 0.0013
36)
𝑌𝑡 = 116.8438 + 𝐴𝑡 + 0.563468𝑌𝑡−1 + 0.184810𝑌𝑡−23 − 0.142013𝑌𝑡−27

+ 0.147278𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 ≅ 0; 𝛼𝜑27 = 0.0001; 𝛼𝜃3 = 0.0010
37)
𝑌𝑡 = 116.2760 + 𝐴𝑡 + 0.569808𝑌𝑡−1 + 0.183324𝑌𝑡−23 − 0.137846𝑌𝑡−27

+ 0.127775𝐴𝑡−3
- 141 -
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 ≅ 0; 𝛼𝜑27 = 0.0001; 𝛼𝜃3 = 0.0036
38)
𝑌𝑡 = 115.5027 + 𝐴𝑡 + 0.581412𝑌𝑡−1 + 0.202062𝑌𝑡−23 − 0.115853𝑌𝑡−27

+ 0.119157𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 ≅ 0; 𝛼𝜑27 = 0.0011; 𝛼𝜃3 = 0.0062
39)
𝑌𝑡 = 115.0485 + 𝐴𝑡 + 0.582866𝑌𝑡−1 + 0.206012𝑌𝑡−23 − 0.114404𝑌𝑡−27

+ 0.108533𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 ≅ 0; 𝛼𝜑27 = 0.0006; 𝛼𝜃3 = 0.0164
40)
𝑌𝑡 = 114.9086 + 𝐴𝑡 + 0.575620𝑌𝑡−1 + 0.202411𝑌𝑡−23 − 0.116414𝑌𝑡−27

+ 0.106047𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 ≅ 0; 𝛼𝜑27 = 0.0002; 𝛼𝜃3 = 0.0120
41)
𝑌𝑡 = 116.0047 + 𝐴𝑡 + 0.529196𝑌𝑡−1 + 0.196183𝑌𝑡−23 − 0.110623𝑌𝑡−27

+ 0.080824𝐴𝑡−3
𝛼𝐶 ≅ 0; 𝛼𝜑1 ≅ 0; 𝛼𝜑23 ≅ 0; 𝛼𝜑27 = 0.0003; 𝛼𝜃3 = 0.0370
EVAPORACIÓN [mm]
7.2.4.5 Estación: Hichucota
𝑥̅ = 115.91 𝑚𝑚
- 142 -
𝑠 = 19.27 𝑚𝑚
𝑛 = 405
𝑘𝑛 = 3.318
𝑥𝑠 = 179.84 𝑚𝑚
𝑥𝑖 = 51.98 𝑚𝑚

Evaporación [mm]

Evaporación [mm]
Figura 7-22 Evaporación a nivel mensual en Hichucota en [mm], a) Original, Serie de datos medida, b) Completada y
Se ve en la serie distintas volatilidades a medida que transcurren los periodos, como vemos
en la Figura 7-22, hay bastantes variaciones en la volatilidad de la serie, y esto no permite
que los modelos ajusten a un modelo que reproduzca la volatilidad particular que tienen los
huecos de gran tamaño.
- 143 -
Modelos Utilizados:
1)
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑3 𝑌𝑡−3 + 𝜑8 𝑌𝑡−8 − 𝜃1 𝐴𝑡−1 − 𝜃8 𝐴𝑡−8
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.883603𝑌𝑡−1 − 0.191561𝑌𝑡−3 + 0.307910𝑌𝑡−8 + 0.506718𝐴𝑡−1

+ 0.401027𝐴𝑡−8
𝛼𝜑1 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜑8 ≅ 0; 𝛼𝜃1 ≅ 0; 𝛼𝜃8 = 0.0019
2)
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑8 𝑌𝑡−8 − 𝜃1 𝐴𝑡−1 − 𝜃8 𝐴𝑡−8
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.725922𝑌𝑡−1 + 0.273900𝑌𝑡−8 + 0.358578𝐴𝑡−1 + 0.452001𝐴𝑡−8
𝛼𝜑1 ≅ 0; 𝛼𝜑8 ≅ 0; 𝛼𝜃1 = 0.0002; 𝛼𝜃8 = 0.0001
3)
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.983179𝑌𝑡−1 + 0.016626𝑌𝑡−8 + 0.584646𝐴𝑡−1 + 0.288751𝐴𝑡−8
𝛼𝜑1 ≅ 0; 𝛼𝜑8 = 0.0040; 𝛼𝜃1 ≅ 0; 𝛼𝜃8 = 0.0001
4)
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.733251𝑌𝑡−1 + 0.266601𝑌𝑡−8 + 0.339470𝐴𝑡−1 + 0.486178𝐴𝑡−8
𝛼𝜑1 ≅ 0; 𝛼𝜑8 ≅ 0; 𝛼𝜃1 = 0.0001; 𝛼𝜃8 ≅ 0
5)
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.740121𝑌𝑡−1 + 0.259733𝑌𝑡−8 + 0.351950𝐴𝑡−1 + 0.475182𝐴𝑡−8
𝛼𝜑1 ≅ 0; 𝛼𝜑8 ≅ 0; 𝛼𝜃1 ≅ 0; 𝛼𝜃8 ≅ 0
6)
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑2 𝑌𝑡−2 − 𝜑3 𝑌𝑡−3 − 𝜃4 𝐴𝑡−4
𝑌𝑡 = 𝜇 + 𝐴𝑡 − 0.662788𝑌𝑡−1 − 0.587766𝑌𝑡−2 − 0.534576𝐴𝑡−3 + 0.534576𝐴𝑡−4
- 144 -
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜃8 ≅ 0
7)
𝑌𝑡 = 𝜇 + 𝐴𝑡 − 0.691595𝑌𝑡−1 − 0.590842𝑌𝑡−2 − 0.567289𝐴𝑡−3 + 0.621016𝐴𝑡−4
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜃8 ≅ 0
8)
𝑌𝑡 = 𝜇 + 𝐴𝑡 − 0.641300𝑌𝑡−1 − 0.527849𝑌𝑡−2 − 0.500792𝐴𝑡−3 + 0.538483𝐴𝑡−4
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜃8 ≅ 0
9)
𝑌𝑡 = 𝜇 + 𝐴𝑡 − 0.679736𝑌𝑡−1 − 0.552998𝑌𝑡−2 − 0.536885𝐴𝑡−3 + 0.561497𝐴𝑡−4
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜃8 ≅ 0
10)
𝑌𝑡 = 𝜇 + 𝐴𝑡 − 0.680779𝑌𝑡−1 − 0.548808𝑌𝑡−2 − 0.537098𝐴𝑡−3 + 0.556858𝐴𝑡−4
𝛼𝜑1 ≅ 0; 𝛼𝜑2 ≅ 0; 𝛼𝜑3 ≅ 0; 𝛼𝜃8 ≅ 0
7.2.5 PRECIPITACIÓN [mm]
7.2.5.1 Estación: Kallutaca
𝑥̅ = 47.62 𝑚𝑚
𝑠 = 51.40 𝑚𝑚
𝑛 = 109
- 145 -
𝑘𝑛 = 3.046
𝑥𝑠 = 204.17 𝑚𝑚
𝑥̅ = 45.99 𝑚𝑚
𝑠 = 48.52
𝑛 = 108
𝑘𝑛 = 3.043
𝑥𝑠 = 194.22 𝑚𝑚
En total la prueba identifica 1 datos anómalos susceptibles de ser ignorados y rellenados
Los picos de las observaciones tienen magnitudes del mismo orden por lo tanto la
observación pasa simplemente siendo un dato atípico y no se sugiere prescindir de ella para
las inferencias posteriores.
Precipitación [mm]
- 146 -
Precipitación [mm]
Figura 7-23 Precipitación a nivel mensual en Kallutaca en [mm], a) Original, Serie de datos medida, b) Completada y
A pesar de tener pocos datos el relleno y la proyección a corto plazo son muy buenos, en
cambio a largo plazo se ve que produce resultados que solo reflejan la tendencia de una
serie que inicialmente tenía pocos datos como podemos observar en la Figura 7-23, de todas
formas para extender la serie tanto tiempo los modelos tienen un desempeño regular.
Modelos Utilizados:
1)
𝑌𝑡 = 𝐶 + 𝐴𝑡 + 𝜑13 𝑌𝑡−13 − 𝜃12 𝐴𝑡−12
𝑌𝑡 = 43.21234 + 𝐴𝑡 + 0.559865𝑌𝑡−13 − 0.309504𝐴𝑡−12
𝛼𝐶 ≅ 0; 𝛼𝜑13 ≅ 0; 𝛼𝜃12 ≅ 0
2)
𝑌𝑡 = (𝜇 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑12 𝑌𝑡−12 − 𝜃37 𝐴𝑡−37 ) ∗ (𝜇 + 𝐴𝑡 − 𝜃12 𝐴𝑡−12 )
𝑌𝑡 = (𝜇 + 𝐴𝑡 + 0.101822𝑌𝑡−1 + 0.896899𝑌𝑡−12 − 0.266927𝐴𝑡−37 ) ∗ (𝜇 + 𝐴𝑡

+ 0.614404𝐴𝑡−12 )
𝛼𝜑1 = 0.0234; 𝛼𝜑12 ≅ 0; 𝛼𝜃37 = 0.0868; 𝛼𝜃12 ≅ 0
3)
𝑌𝑡 = (𝜇 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 − 𝜃37 𝐴𝑡−37 ) ∗ (𝜇 + 𝐴𝑡 − 𝜃12 𝐴𝑡−12 )
𝑌𝑡 = (𝜇 + 𝐴𝑡 + 0.625669𝑌𝑡−1 − 0.470924𝐴𝑡−36 ) ∗ (𝜇 + 𝐴𝑡 + 0.251733𝐴𝑡−12 )
𝛼𝜑1 ≅ 0; 𝛼𝜃36 ≅ 0; 𝛼𝜃12 = 0.0010
4)
- 147 -
𝑌𝑡 = (𝐶 + 𝐴𝑡 + 𝜑11 𝑌𝑡−11 + 𝜑12 𝑌𝑡−12 + 𝜑25 𝑌𝑡−25 − 𝜃48 𝐴𝑡−48 ) ∗ (𝐶 + 𝐴𝑡 − 𝜃12 𝐴𝑡−12 )
𝑌𝑡 = (47.27756 + 𝐴𝑡 + 0.004516𝑌𝑡−11 + 0.997535𝑌𝑡−12 − 0.195260𝑌𝑡−25

+ 0.319518𝐴𝑡−48 ) ∗ (𝐶 + 𝐴𝑡 + 0.952635𝐴𝑡−12 )
𝛼𝐶 = 0.0242; 𝛼𝜑11 = 0.0184; 𝛼𝜑12 ≅ 0; 𝛼𝜑25 = 0.0110; 𝛼𝜃48 = 0.0087;
𝛼𝜃12 = 0.0003
PRECIPITACIÓN [mm]
7.2.5.2 Estación: San Juan
𝑥̅ = 57.30 𝑚𝑚
𝑠 = 64.33 𝑚𝑚
𝑛 = 384
𝑘𝑛 = 3.318
𝑥𝑠 = 270.74 𝑚𝑚
𝑥̅ = 54.87 𝑚𝑚
𝑠 = 60.09
𝑛 = 380
𝑘𝑛 = 3.318
𝑥𝑠 = 254.22 𝑚𝑚
Se encontró 1 dato anómalo en la 2º Iteración

- 148 -
𝑥̅ = 54.31 𝑚𝑚
𝑠 = 59.15
𝑛 = 379
𝑘𝑛 = 3.318
𝑥𝑠 = 250.56 𝑚𝑚
Se identificaron 5 datos anómalos pero para un registro de 37 años y observando los otros
valores extremos, estos parecen ser solamente precipitaciones atípicas que si son posibles,
por lo tanto no se aconseja prescindir de ellas.
Precipitación [mm]

Precipitación [mm]
Figura 7-24 Precipitación a nivel mensual en San Juan en [mm], a) Original, Serie de datos medida, b) Completada
y Extendida, Serie de datos rellenada y extendida.
- 149 -
Los resultados no son muy naturales esto parece ser una situación generada por la gran
cantidad de variaciones en la volatilidad de la serie observable en la Figura 7-24, variaciones
bastante difíciles de reproducir por los modelos.
Modelos Utilizados:
1)
𝑌𝑡 = 𝐶 + 𝐴𝑡 + 𝜑6 𝑌𝑡−6 + 𝜑7 𝑌𝑡−7
𝑌𝑡 = 39.61614 + 𝐴𝑡 − 0.208505𝑌𝑡−6 − 0.190323𝑌𝑡−7
𝛼𝐶 ≅ 0; 𝛼𝜑6 = 0.0827; 𝛼𝜃7 = 0.0978
2)
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑36 𝑌𝑡−36 − 𝜃1 𝐴𝑡−1
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.837578𝑌𝑡−1 + 0.161721𝑌𝑡−36 − 0.865673𝑌𝑡−1
𝛼𝜑1 ≅ 0; 𝛼𝜑36 = 0.0273; 𝛼𝜃1 ≅ 0
3)
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜃4 𝐴𝑡−4 − 𝜃17 𝐴𝑡−17
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.993514𝑌𝑡−1 − 0.925826𝐴𝑡−4 − 0.074174𝐴𝑡−17
𝛼𝜑1 ≅ 0; 𝛼𝜑4 = 0.0003; 𝛼𝜃17 ≅ 0
4)
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑12 𝑌𝑡−12 − 𝜃12 𝐴𝑡−12
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.837578𝑌𝑡−1 + 0.161721𝑌𝑡−12 + 0.865673𝑌𝑡−12
𝛼𝜑1 ≅ 0; 𝛼𝜑12 ≅ 0; 𝛼𝜃12 ≅ 0
5)
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.602429𝑌𝑡−1 + 0.104177𝑌𝑡−12 + 0.159509𝑌𝑡−24 + 0.125702𝑌𝑡−36

+ 0.509449𝐴𝑡−1
𝛼𝜑1 ≅ 0; 𝛼𝜑12 = 0.0076; 𝛼𝜑24 ≅ 0; 𝛼𝜑36 = 0.0001; 𝛼𝜃1 ≅ 0
PRECIPITACIÓN [mm]
- 150 -
7.2.5.3 Estación: Chinoli
𝑥̅ = 10.53 𝑚𝑚
𝑠 = 10.32 𝑚𝑚
𝑛 = 592
𝑘𝑛 = 3.318
𝑥𝑠 = 44.76 𝑚𝑚
𝑥̅ = 10.29 𝑚𝑚
𝑠 = 9.75
𝑛 = 589
𝑘𝑛 = 3.318
𝑥𝑠 = 42.63 𝑚𝑚
Se encontró 1 dato anómalo en la 2º Iteración
𝑥̅ = 10.23 𝑚𝑚
𝑠 = 9.66
𝑛 = 588
𝑘𝑛 = 3.318
𝑥𝑠 = 42.29 𝑚𝑚
- 151 -
De los datos anómalos identificados solo el primero parece ser una exageración a ser
eliminada, los otros son de un orden similar a los de la precipitación en los meses de
máxima en que esta variable es máxima y no se aconseja prescindir de ellos.
Precipitación [mm]

Precipitación [mm]
Figura 7-25 Precipitación a nivel mensual en Chinoli en [mm], a) Original, Serie de datos medida, b) Completada y
A pesar de haber mantenido datos extremos que son atípicos pero posibles como se observa
el pico de1963 de la Figura 7-25, los modelos no generan valores extremos similares pero
mantiene la centralidad y la volatilidad de la serie original de datos.
Modelos Utilizados:
1)
- 152 -
∇𝑌𝑡 = 𝜇 + 𝐴𝑡 + 𝜑1 ∇𝑌𝑡−1 + 𝜑7 ∇𝑌𝑡−7 − 𝜃4 𝐴𝑡−4 − 𝜃6 𝐴𝑡−6
∇𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.648636𝑌𝑡−1 + 0.200135𝑌𝑡−7 + 0.392401𝐴𝑡−4 + 0.242692𝐴𝑡−6
𝛼𝜑1 ≅ 0; 𝛼𝜑7 = 0.0256; 𝛼𝜃4 = 0.0001; 𝛼𝜃6 = 0.0398
2)
∇𝑌𝑡 = 𝜇 + 𝐴𝑡 − 0.644887𝑌𝑡−1 − 0.209900𝑌𝑡−7 + 0.3864871𝐴𝑡−4 + 0.248753𝐴𝑡−6
𝛼𝜑1 ≅ 0; 𝛼𝜑7 = 0.0282; 𝛼𝜃4 = 0.0020; 𝛼𝜃6 = 0.0269
3)
∇𝑌𝑡 = 𝜇 + 𝐴𝑡 − 0.634596𝑌𝑡−1 − 0.214725𝑌𝑡−7 + 0.383584𝐴𝑡−4 + 0.227521𝐴𝑡−6
𝛼𝜑1 ≅ 0; 𝛼𝜑7 = 0.0210; 𝛼𝜃4 = 0.0020; 𝛼𝜃6 = 0.0372
4)
∇𝑌𝑡 = 𝜇 + 𝐴𝑡 + 𝜑1 ∇𝑌𝑡−1 + 𝜑4 ∇𝑌𝑡−4 + 𝜑12 ∇𝑌𝑡−12 − 𝜃12 𝐴𝑡−12
∇𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.167010∇𝑌𝑡−1 − 0.056987∇𝑌𝑡−4 + 0.889930∇𝑌𝑡−12 + 0.969541𝐴𝑡−12
𝛼𝜑1 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑12 ≅ 0; 𝛼𝜃12 ≅ 0
5)
∇𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.168943∇𝑌𝑡−1 − 0.057954∇𝑌𝑡−4 + 0.888981∇𝑌𝑡−12 + 0.972702𝐴𝑡−12
𝛼𝜑1 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑12 ≅ 0; 𝛼𝜃12 ≅ 0
6)
- 153 -
∇𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.043829∇𝑌𝑡−1 − 0.014587∇𝑌𝑡−4 + 0.970702∇𝑌𝑡−12 + 0.967552𝐴𝑡−12
𝛼𝜑1 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑12 ≅ 0; 𝛼𝜃12 ≅ 0
7)
∇𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.011972∇𝑌𝑡−1 − 0.003930∇𝑌𝑡−4 + 0.991930∇𝑌𝑡−12 + 0.973602𝐴𝑡−12
𝛼𝜑1 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑12 ≅ 0; 𝛼𝜃12 ≅ 0
8)
∇𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.005374∇𝑌𝑡−1 − 0.001760∇𝑌𝑡−4 + 0.996371∇𝑌𝑡−12 + 0.980191𝐴𝑡−12
𝛼𝜑1 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑12 ≅ 0; 𝛼𝜃12 ≅ 0
9)
∇𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.003684∇𝑌𝑡−1 − 0.001203∇𝑌𝑡−4 + 0.997508∇𝑌𝑡−12 + 0.982221𝐴𝑡−12
𝛼𝜑1 ≅ 0; 𝛼𝜑4 ≅ 0; 𝛼𝜑12 ≅ 0; 𝛼𝜃12 ≅ 0
PRECIPITACIÓN [mm]
7.2.5.4 Estación: Padilla
𝑥̅ = 51.99 𝑚𝑚
𝑠 = 54.32 𝑚𝑚
𝑛 = 581
- 154 -
𝑘𝑛 = 3.318
𝑥𝑠 = 232.2 𝑚𝑚
𝑥̅ = 50.74 𝑚𝑚
𝑠 = 51.6
𝑛 = 578
𝑘𝑛 = 3.318
𝑥𝑠 = 221.95 𝑚𝑚
Se encontró 2 datos anómalos en la 2º Iteración
𝑥̅ = 50.26 𝑚𝑚
𝑠 = 50.84
𝑛 = 576
𝑘𝑛 = 3.318
𝑥𝑠 = 218.92 𝑚𝑚
Solo los primeros 2 valores encontrados parecen ser lo suficientemente grandes para
considerarse errores de medición por lo tanto solo se procede a prescindir de esos 2 y se
acepta los otros por ser de un orden similar al de los demás eventos observados.
- 155 -
Precipitación [mm]

Precipitación [mm]
Figura 7-26 Precipitación a nivel mensual en Padilla en [mm], a) Original, Serie de datos medida, b) Completada y
Sucede algo similar a la serie anterior, se reproduce bien la volatilidad y la centralidad pero
no se generan valores extremos de la misma magnitud que los producidos en 1968 y 1984
como se observa en la Figura 7-26.
Modelos Utilizados:
1)
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 − 𝜃11 𝐴𝑡−11
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.462846∇𝑌𝑡−1 + 0.529704∇𝑌𝑡−11 + 0.369923𝐴𝑡−11
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜃11 ≅ 0
2)
- 156 -
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 − 𝜃11 𝐴𝑡−11
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.459829∇𝑌𝑡−1 + 0.534191∇𝑌𝑡−11 + 0.397381𝐴𝑡−11
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜃11 ≅ 0
3)
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 − 𝜃11 𝐴𝑡−11
𝑌𝑡 = 𝜇 + 𝐴𝑡 + 0.412320∇𝑌𝑡−1 + 0.579965∇𝑌𝑡−11 + 0.401803𝐴𝑡−11
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜃11 ≅ 0
4)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11
𝑌𝑡 = 𝐴𝑡 + 0.412320∇𝑌𝑡−1 + 0.579965∇𝑌𝑡−11
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0
5)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑25 𝑌𝑡−25 + 𝜑35 𝑌𝑡−35 + 𝜑49 𝑌𝑡−49 + +𝜑71 𝑌𝑡−71
𝑌𝑡 = 𝐴𝑡 + 0.130343𝑌𝑡−1 + 0.129347𝑌𝑡−11 + 0.204227𝑌𝑡−25 + 0.137180𝑌𝑡−35

+ 0.168720𝑌𝑡−49 + 0.225679𝑌𝑡−71
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑25 ≅ 0; 𝛼𝜑35 ≅ 0; 𝛼𝜑49 ≅ 0; 𝛼𝜑71 ≅ 0
6)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑25 𝑌𝑡−25 + 𝜑35 𝑌𝑡−35 + 𝜑49 𝑌𝑡−49 + +𝜑71 𝑌𝑡−71
𝑌𝑡 = 𝐴𝑡 + 0.133094𝑌𝑡−1 + 0.123237𝑌𝑡−11 + 0.200569𝑌𝑡−25 + 0.141384𝑌𝑡−35

+ 0.172943𝑌𝑡−49 + 0.225663𝑌𝑡−71
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑25 ≅ 0; 𝛼𝜑35 ≅ 0; 𝛼𝜑49 ≅ 0; 𝛼𝜑71 ≅ 0
PRECIPITACIÓN [mm]
7.2.5.5 Estación: Aiquile
𝑥̅ = 7.08 𝑚𝑚
- 157 -
𝑠 = 6.92 𝑚𝑚
𝑛 = 556
𝑘𝑛 = 3.318
𝑥𝑠 = 30.04 𝑚𝑚
𝑥̅ = 6.86 𝑚𝑚
𝑠 = 6.29
𝑛 = 552
𝑘𝑛 = 3.318
𝑥𝑠 = 27.72 𝑚𝑚
Se encontró 2 datos anómalos en la 2º Iteración
𝑥̅ = 6.79 𝑚𝑚
𝑠 = 6.19
𝑛 = 550
𝑘𝑛 = 3.318
𝑥𝑠 = 27.33 𝑚𝑚
Se identificó 6 datos anómalos con la prueba que son susceptibles a ser eliminados y
rellenados.
- 158 -
Solamente 1 de los datos es tan elevado como para considerarse anómalos y solo se
procedió a eliminar ese valor para generar las inferencias, la razón es que los otros totales
mensuales que la prueba identifica como anómalos en relación a los demás observados sí
parecen posibles.
Precipitación [mm]

Precipitación [mm]

Precipitación [mm]
Figura 7-27 Precipitación a nivel mensual en Aiquile en [mm], a) Original, Serie de datos medida, b) Corregida, Serie de
datos corregida usando el criterio de Grubbs & Beck, c) Completada, Serie de datos rellenada.
No se reproduce bien la volatilidad por que la serie original tiene una gran variabilidad de
su volatilidad distinguible en la Figura 7-27, un así los datos generados son estadísticamente
aceptables.
- 159 -
Modelos Utilizados:
1)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11
𝑌𝑡 = 𝐴𝑡 + 0.428168𝑌𝑡−1 + 0.446784𝑌𝑡−11
𝛼𝜑1 = 0.0006; 𝛼𝜑11 = 0.0118
2)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27
𝑌𝑡 = 𝐴𝑡 + 0.320743𝑌𝑡−1 + 0.444222𝑌𝑡−11 + 0.183473𝑌𝑡−27
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑27 = 0.0128
3)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27
𝑌𝑡 = 𝐴𝑡 + 0.356387𝑌𝑡−1 + 0.445059𝑌𝑡−11 + 0.147681𝑌𝑡−27
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑27 = 0.0092
4)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27
𝑌𝑡 = 𝐴𝑡 + 0.373640𝑌𝑡−1 + 0.456671𝑌𝑡−11 + 0.130860𝑌𝑡−27
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑27 = 0.0175
5)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27
𝑌𝑡 = 𝐴𝑡 + 0.373991𝑌𝑡−1 + 0.437694𝑌𝑡−11 + 0.138114𝑌𝑡−27
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑27 = 0.0111
6)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27
𝑌𝑡 = 𝐴𝑡 + 0.370895𝑌𝑡−1 + 0.435488𝑌𝑡−11 + 0.147130𝑌𝑡−27
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑27 = 0.0073
- 160 -
7)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27
𝑌𝑡 = 𝐴𝑡 + 0.386077𝑌𝑡−1 + 0.428110𝑌𝑡−11 + 0.133358𝑌𝑡−27
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑27 = 0.0113
8)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27
𝑌𝑡 = 𝐴𝑡 + 0.3866514𝑌𝑡−1 + 0.428814𝑌𝑡−11 + 0.135062𝑌𝑡−27
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑27 = 0.0067
9)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27
𝑌𝑡 = 𝐴𝑡 + 0.399572𝑌𝑡−1 + 0.429267𝑌𝑡−11 + 0.120756𝑌𝑡−27
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑27 = 0.0063
10)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11
𝑌𝑡 = 𝐴𝑡 + 0.356151𝑌𝑡−1 + 0.356151𝑌𝑡−11
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0
11)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11
𝑌𝑡 = 𝐴𝑡 + 0.353647𝑌𝑡−1 + 0.583579𝑌𝑡−11
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0
12)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11
𝑌𝑡 = 𝐴𝑡 + 0.370982𝑌𝑡−1 + 0.547439𝑌𝑡−11
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0
13)
- 161 -
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27
𝑌𝑡 = 𝐴𝑡 + 0.399438𝑌𝑡−1 + 0.429553𝑌𝑡−11 + 0.120961𝑌𝑡−27
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑27 = 0.0014
14)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27
𝑌𝑡 = 𝐴𝑡 + 0.399425𝑌𝑡−1 + 0.429279𝑌𝑡−11 + 0.121208𝑌𝑡−27
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑27 = 0.0012
15)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27
𝑌𝑡 = 𝐴𝑡 + 0.408859𝑌𝑡−1 + 0.399442𝑌𝑡−11 + 0.122962𝑌𝑡−27
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑27 = 0.0001
16)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27
𝑌𝑡 = 𝐴𝑡 + 0.409121𝑌𝑡−1 + 0.398855𝑌𝑡−11 + 0.123914𝑌𝑡−27
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑27 = 0.0001
17)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27
𝑌𝑡 = 𝐴𝑡 + 0.414174𝑌𝑡−1 + 0.407493𝑌𝑡−11 + 0.114439𝑌𝑡−27
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑27 = 0.0001
18)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27
𝑌𝑡 = 𝐴𝑡 + 0.415917𝑌𝑡−1 + 0.403958𝑌𝑡−11 + 0.116174𝑌𝑡−27
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑27 ≅ 0
19)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27

- 162 -
𝑌𝑡 = 𝐴𝑡 + 0.411980𝑌𝑡−1 + 0.406200𝑌𝑡−11 + 0.119233𝑌𝑡−27
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑27 ≅ 0
20)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27
𝑌𝑡 = 𝐴𝑡 + 0.409429𝑌𝑡−1 + 0.407231𝑌𝑡−11 + 0.119284𝑌𝑡−27
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑27 ≅ 0
21)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27
𝑌𝑡 = 𝐴𝑡 + 0.408897𝑌𝑡−1 + 0.411887𝑌𝑡−11 + 0.119374𝑌𝑡−27
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑27 ≅ 0
22)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27
𝑌𝑡 = 𝐴𝑡 + 0.409087𝑌𝑡−1 + 0.409202𝑌𝑡−11 + 0.119950𝑌𝑡−27
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑27 ≅ 0
23)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27
𝑌𝑡 = 𝐴𝑡 + 0.409523𝑌𝑡−1 + 0.409334𝑌𝑡−11 + 0.116963𝑌𝑡−27
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑27 ≅ 0
24)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27
𝑌𝑡 = 𝐴𝑡 + 0.409164𝑌𝑡−1 + 0.409827𝑌𝑡−11 + 0.116438𝑌𝑡−27
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑27 ≅ 0
25)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27

- 163 -
𝑌𝑡 = 𝐴𝑡 + 0.401710𝑌𝑡−1 + 0.422031𝑌𝑡−11 + 0.116736𝑌𝑡−27
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑27 ≅ 0
26)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27
𝑌𝑡 = 𝐴𝑡 + 0.405024𝑌𝑡−1 + 0.421865𝑌𝑡−11 + 0.112059𝑌𝑡−27
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑27 ≅ 0
27)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27
𝑌𝑡 = 𝐴𝑡 + 0.405024𝑌𝑡−1 + 0.421631𝑌𝑡−11 + 0.112138𝑌𝑡−27
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑27 ≅ 0
28)
𝑌𝑡 = 𝐴𝑡 + 𝜑1 𝑌𝑡−1 + 𝜑11 𝑌𝑡−11 + 𝜑27 𝑌𝑡−27
𝑌𝑡 = 𝐴𝑡 + 0.404951𝑌𝑡−1 + 0.411755𝑌𝑡−11 + 0.120254𝑌𝑡−27
𝛼𝜑1 ≅ 0; 𝛼𝜑11 ≅ 0; 𝛼𝜑27 ≅ 0
7.3 Resumen de Resultados

Los resultados obtenidos se han resumido en la Tabla 7-2, donde el desempeño de los
modelos estocásticos para el relleno de datos de las distintas variables hidrometeorológicas
seleccionadas para esta evaluación preliminar se encuentra categorizado de la siguiente
manera:
 Excelente: El modelo es capaz de reproducir valores extrémales (máximos y

mínimos), reproduce adecuadamente la volatilidad, reproduce las tendencias
determinística, cíclica y estacional y mantiene la centralidad de las observaciones
originales.
 Bueno: El Modelo reproduce adecuadamente la volatilidad, reproduce las
tendencias determinística, cíclica y estacional y mantiene la centralidad de las
observaciones originales.
 Regular: El Modelo mantiene la centralidad de las observaciones originales.
 Malo: El modelo solo nos arroja una serie de valores cercanos a la media o
reproduce algunas características de la serie original de manera muy pobre.
- 164 -
Tabla 7-2 Resumen de los resultados obtenidos en el relleno de distintas variables con los modelos ARIMA.
Humedad Relativa [%] Estacionariedad Reducible a

Estacionariedad Desempeño
Estación Altura Intervalos En En En En
msnm temporales Media Varianza Media Varianza
1.1. Collana 3911 Mensuales No No Si Si Excelente
1.2. Independencia 2788 Mensuales No Si Si Si Excelente
1.3. Culpina 2960 Mensuales No Si Si Si Bueno
1.4. Achiri 3880 Mensuales Si Si Si Si Excelente
1.5. Cobija 235 Mensuales No Si Si Si Bueno
Presión Atmosférica[HPA] Estacionariedad Reducible a

2.1. Cochabamba - Aero 2548 Mensuales Si Si Si Si Regular
2.2. Trinidad 2094 Mensuales Si Si Si Si Bueno
2.3. Sucre 2570 Mensuales Si Si Si Si Bueno
2.4. Concepción 497 Anuales No Si Si Si Bueno
2.5. Rurrenabaque 204 Mensuales Si Si Si Si Excelente
Temperatura [ºC] Estacionariedad Reducible a

3.1. La Tamborada 2597 Mensuales No Si Si Si Regular
3.2. Entre Ríos 1260 Mensuales No No Si No Regular
3.3. Mizque 2045 Diarios No Si No Si Malo
3.4. Irupana 1946 Mensuales No Si Si Si Excelente
3.5. Anzaldo 3032 Mensuales Si Si Si Si Regular
Evaporación [mm] Estacionariedad Reducible a

4.1. Chipiri 260 Diarios Si No Si No Malo
4.2. Okinawa I 252 Diarios Si No Si Si Regular
4.3. Huarina Cota Cota 385 Mensuales Si Si Si Si Bueno
4.4. Belén 3833 Mensuales Si Si Si Si Excelente
4.5. Hichucota 4460 Mensuales Si Si Si Si Regular
Precipitación [mm] Estacionariedad Reducible a

5.1. Kallutaca 3900 Mensuales Si Si Si Si Bueno
5.2. San Juan 305 Mensuales Si No Si No Malo
5.3. Chinoli 3450 Mensuales No No Si Si Regular
5.4. Padilla 2102 Mensuales No No Si No Malo
5.5 Aiquile 2255 Mensuales No No Si Si Regular
- 165 -
7.4 Conclusiones Preliminares
La transformación Box Cox, es bastanteaste adecuada para poder alcanzar la condición de
estacionariedad en varianza en las series de datos a nivel mensual cuando las series
presentan dos volatilidades claramente distinguibles.
Existen modelos que presentan un buen nivel de significancia en sus estadísticos

estimados, pero no producen predicciones coherentes, por lo tanto no siempre los modelos
con mayor bondad de ajuste serían los más indicados para realizar inferencias o
predicciones.
A partir del procedimiento de completado de datos sucesivo, se observó que dependiendo

de la extensión de la serie de datos con la que se trabaja las propiedades estadísticas del
proceso estacionario pueden o no variar en el tiempo, series cíclicas de corta duración
aparentan no ser procesos estacionarios, es más parecen ser tendenciales, pero al ir
alargando la serie su condición de estacionariedad se va consolidando, por otro lado, series
que aparentemente carecen de tendencia determinística, con grandes fluctuaciones y de
corta duración encajan perfectamente en la categoría de los procesos estacionarios, pero al
ir alargando el horizonte temporal, la tendencia determinística se hace más preponderante y
ya no se las puede considerar como series estacionarias.
Describimos a continuación algunos ejemplos de los casos mencionados.
- 166 -
Estación: Anzaldo
Serie Temperatura Media Mensual
a)
Proceso Estacionario
b)
Proceso No Estacionario
Figura 7-28 Serie de temperatura media a nivel mensual en Anzaldo, a) Periodo estacionario entre 1977 y 1994, b)
Periodo no estacionario.
Observando la Figura 7-28, se distingue que en el periodo comprendido entre los años 1977
y 1999 la serie se comporta de forma estacionaria, pero si se toma en cuenta la serie en su
totalidad desde 1966 hasta 2013 se percibe claramente que existe una tendencia
decreciente que no puede ser ignorada durante la simulación.
- 167 -
Estación: Okinawa I
Serie Evaporación Total Diaria
a)
Proceso No Estacionario
b)
Proceso Estacionario
Figura 7-29 Serie de evaporación total a nivel diario en Okinawa I, a) Proceso no estacionario temporal comprendido
entre marzo y noviembre de 2004, b) Proceso estacionario entre 2004 y 2005.
En la Figura 7-29, entre marzo y noviembre de 2004, existe una tendencia determinística
entonces afirmamos a partir de esas observaciones que la serie es un proceso no
estacionario, pero si se concibe la seria a lo largo de los 2 años de estudio, la serie es de
tipo estacionaria porque sus propiedades estadísticas permanecen invariantes en a lo largo
de la totalidad del periodo observado.
A partir de observaciones de este tipo se llega a dos conclusiones que no suelen estar
definidas de manera clara en La bibliografía consultada, en este sentido la condición de
estacionariedad de una serie temporal depende de la longitud del registro y solo podemos
tener certeza de ella mientras más extenso se hace el registro de datos medidos.
En los procesos estocásticos estacionarios, o no estacionarios en media, los modelos

ARIMA trabajan bastante bien independientemente de si sus valores son positivos
negativos o 0, esto es una ventaja en relación a los modelos probabilísticos, que al
producirse eventos de este tipo colapsan o reducen fuertemente su capacidad predictiva e
inferencial, porque estos muchas veces para generar sus observaciones sintéticas, utilizan
distribuciones de probabilidad asintóticas que no alcanzan valores nulos.
- 168 -
El proceso de generación de valores sintéticos si bien es muy coherente tiende a estar
demasiado centralizado y los valores extremos generados mantienen la frecuencia
correspondiente a la de las series de datos observadas.
Los modelos estocásticos parecen reproducir bien las propiedades estadísticas de variables
que no tengan gran variabilidad en su volatilidad como es el caso de la presión atmosférica
y la humedad relativa.
La prueba de Grubbs & Beck genera umbrales que permiten distinguir entre observaciones
atípicas y datos anómalos, es un criterio que también es utilizado y validado por el Water
Resource Council y viene incorporado a un software estadístico de uso general como
MiniTab para la censura de datos.
En desventaja el criterio de Grubbs & Beck, no es capaz de encontrar valores anómalos en

series que constan con más de una centralidad, generando umbrales demasiado amplios, no
pudiendo definir de manera clara que valores son o no resultados de anomalías en el
proceso de la medición, se trabajó precisamente con una serie de datos de esta naturaleza
en la cual la prueba no rinde buenos resultados, la serie es la siguiente:
Estación: Collana
Serie Humedad Relativa media mensual
a)
b)
Figura 7-30 Estación Collana, serie de humedad relativa media mensual, a) Serie de datos observada, b) Serie de datos
completada y extendida.
- 169 -
Como se puede observar en la Figura 7-30, no un criterio claro para definir que intervalo de
medición es el que se ha medido de manera adecuada, el criterio de Grubbs & Beck
tampoco parece ser de utilidad, ya que valida todos los datos independientemente de su
calidad porque ninguno de ellos se aleja de la centralidad de la serie considerablemente.
Las predicciones a periodo corto son bastante aceptables como se observa en la serie de
datos rellenada y extendida de la Figura 7-30, a periodos largos solo parece haber garantía si
la serie es enteramente estacionaria en media y en varianza, ya que esta condición
permanecería constante a lo largo del tiempo garantizando que todos los eventos posibles a
largo plazo sean similares a los ocurridos en el pasado.
Se concluye por una parte que la prueba de eliminación de datos anómalos de Grubbs &
Beck no es eficiente en series de datos con más de una tendencia central, que en la realidad
son muy poco comunes y su existencia puede sugerir que la serie enteramente fue medida
de manera deficiente.
Por otro lado la efectiva de las inferencias de los modelos ARIMA no es muy sensible a la
calidad de las observaciones así que si se tiene datos de mala calidad pero que tiene
tendencias reproducibles los modelos las simulan sin problemas.
De las pruebas realizadas en la distinta variable climática, parece que los modelos
aprovechan la información preliminar en intervalos mensuales y anuales, no así en los
diarios donde se ve las características estadísticas quedan fuertemente distorsionadas por
las inferencias obtenidas que si bien son valores posibles no parecen reproducir las
propiedades estadísticas de las series originales.
- 170 -
Serie de Evaporación Total Diaria
Estación: Chipiri
Figura 7-31 Estación Chipiri, serie de evaporación total diaria a) Serie de datos observados, b) Serie de datos
Como se observa en la Figura 7-31, la serie no mantiene sus propiedades estadísticas durante
el relleno, la causa son los fuertes cambios en la volatilidad a nivel diario para la variable
de evaporación total de la serie a lo largo del tiempo.
Se concluye que si las variaciones de la volatilidad de la serie son demasiado elevadas al

menos a nivel diario, los modelos ARIMA pierden su poder inferencial.
- 171 -
Serie de Evaporación Total Mensual
Estación: Belén
Figura 7-32 Estación de Belén, serie de evaporación total mensual a) Serie de datos observados, b) Serie de datos
La serie mantiene sus propiedades estadísticas durante el relleno como se observa en la

Figura 7-32, esto es una muestra clara de que cuando las series son estacionarias los modelos
ARIMA son altamente eficientes reproduciendo sus propiedades estadísticas a pesar de
que la serie sea en algunos intervalos temporales completamente intermitente.
Se percibe que las mediciones de humedad relativa y presión atmosférica no se han

realizado con la misma seriedad que las demás, ya que los errores encontrados en ellas van
contra toda coherencia lógica, esto quizá porque estas variables no se les está dando la
importancia que merecen o los equipos utilizados para medirlas no se están utilizando
correctamente, de todas formas los modelos estocásticos parecen ser una muy buena
herramienta para subsanar esta clase de deficiencias si es que el resto de las mediciones se
han tomado eficientemente y el registro es lo suficientemente largo.
Los modelos ARIMA se muestran aptos para rellenar series mensuales de variables
hidrometeorológicas e inclusive diarias si es que la condición de estacionariedad se
encuentra garantizada, cuando esta condición no se cumple el desempeño de los modelos es
muy baja principalmente si el intervalo de observación de la variable disminuye.
7.5 Recomendaciones
Se aconseja que se sea más riguroso a la hora de realizar mediciones de presión atmosférica
y de la temperatura de punto de roció para inferir valores de humedad relativa por que los
- 172 -
datos de la base de datos como los que trabajamos eran de baja calidad y con evidentes
errores durante el proceso de medición.
Específicamente en series no estacionarias de variables con intervalos de observación anual

y mensual, se podría usar modelos ARIMA para efectuar el relleno de datos faltantes.
- 173 -
8 COMPARACIÓN ENTRE LA EFICIENCIA DE
INFERENCIA USANDO LOS MODELOS ARIMA
ENTRE DISTINTAS VARIABLES EN INTERVALOS
MENSUALES USANDO EL SOFTWARE EVIEWS9.
Los modelos estocásticos aplicados a las series temporales eran modelos de una muy
difícil aplicación en la ingeniería en general, por el problema que planteaba determinar el
valor de los estadísticos necesarios para determinar la ecuación del estimador de las
variables en estudio, ante esta desventaja se tuvo que seguir trabajando y se ignoró la
posibilidad de usar estos modelos hasta la aparición de las computadoras digitales que
consiguieron realizar procesos iterativos en cuestión de segundos, resolver operaciones de
matrices de gran tamaño y resolver sistemas de ecuaciones, la viabilidad de aplicación de
los procesos a fenómenos temporales se comprobó en la econometría y de a poco fue
también contribuyendo en otras ramas que trabajan con este tipo de variables que
presentan evoluciones a lo largo del tiempo, ahora de entero nos proponemos evaluar cuál
es la eficiencia de las inferencias obtenidas con ellas.
Las aplicaciones en econometría han determinado que los modelos estocásticos

autorregresivos y de media móvil son capaces de afrontar el problemas de la inferencia de
la predicción de variables que evolucionan a lo largo del tiempo, y una de las principales
razone por las que hemos fijado nuestro interés en ellas es por las capacidad que tiene de
generar datos a partir de pocas estaciones, que nos permiten con una sola metodología
poder trabajar con variables con propiedades estadísticas muy diferentes, que son capaces
de similar las series temporales simplemente a partir de sí mismas y que pueden hacerlo
inclusive a partir de sus componentes.
8.1 Metodología
Se plantea analizar el efecto de los modelos estocásticos aplicados a series temporales sobre
series de distintas variables climatológicas usando como guía la metodología Box-Jenkings
aconsejada en todas las aplicaciones de modelos estocásticos de series temporales, se
selección aleatoriamente de la base de datos de SENAMHI series que tengan una buena
cantidad de datos para cada variable ya que en general la información que presenta su base
de datos no es de la mejor calidad.
8.1.1 Muestreo
Se realizó un muestreo de tres series para cada variable de estudio, esto para poder
evaluar las diferencias entre aplicar un modelo en una u otra variable, se presenta en la
Tabla 8-1 las variables trabajadas y las estaciones con las que se trabajó:
- 174 -
Tabla 8-1 Estaciones muestreadas clasificadas por las variables en las que se aplicó el relleno de datos faltantes
usando los modelos ARIMA.
Evaporación Total Mensual:
Estación Departamento Altura msnm Clima

1.1. El Belén La Paz 3822 Frío
1.2. Hichucota La Paz 4460 Frío
1.3. Huarina Cota Cota La Paz 3838 Frío
Humedad Relativa Media Mensual:

2.1. Achiri La Paz 3880 Frío
2.2. Collana La Paz 3911 Frío
2.3. Independencia Cochabamba 2788 Templado
Precipitación Total Mensual:

3.1. Padilla Chuquisaca 2102 Templado
3.2. San Juan Huancollo La Paz 3829 Frío
3.3. San Julian Santa Cruz 305 Cálido
Presión Atmosférica Media Mensual:

4.1. Cochabamba Aero. Cochabamba 2548 Templado
4.2. Rurrenabaque Aero. Beni 204 Cálido
4.3. Sucre Aero. Chuquisaca 2904 Templado
Temperatura Media Mensual:

5.1. Entre Ríos - Tarija Tarija 1260 Templado
5.2. Irupana La Paz 1946 Templado
5.3. La Tamborada Cochabamba 2597 Templado
- 175 -
Figura 8-1 Localización geográfica de las estaciones hidrometeorológicas utilizadas para la evaluación del desempeño
durante el relleno las distintitas variables utilizadas.
Las estaciones en las que se efectuó los rellenos están localizadas en distintas posiciones
del territorio boliviano como se ven representadas en la Figura 8-1, el código de cada
estación corresponde a los determinados en la Tabla 8-1.
8.1.2 Supresión de datos mensuales para el relleno de datos

Se propone escenarios cada uno con una cantidad de datos mensuales faltantes los cuales se
suprimen antes de cargar los datos en el software EViews9, esto para poder ver si el
software se comporta de manera diferente ante el tamaño de los huecos en los registros, ya
que las series de SENAMHI tienen gran variedad de huecos y de distintos tamaños, los
escenarios son los siguientes.
Datos Faltantes:
 1 Mes
 3 Meses
- 176 -
 6 Meses
 12 Meses
8.1.3 Metodología Box-Jenkings

No es fácil distinguir a qué modelo las series ajustan mejor, por lo tanto se aplica la
metodología BOX-JENKINGS solo para obtener un modelo preliminar, el quema de
realización es presentado en la Figura 8-2.
Pasos:
1. Verificación de la estacionalidad en la serie, se debe considerar que la serie debe

ser estacionaria en media y en varianza, la condición de estacionariedad se puede
evaluar a partir de la prueba de raíz unitaria, donde una serie estacionaria tendría
que tener niveles de significancia bajos, o también observando si existe una
tendencia determinística y variaciones en la volatilidad de la serie a través de una
gráfica de los datos medidos a lo largo del tiempo.
2. Si la serie no es estacionaria se distingue su condición no estacionalidad, en caso de
presentar no estacionariedad en varianza se aplica la transformación BOX COX o
una transformación logarítmica, la transformación BOX COX tiene buenos
resultados cuando hay exactamente 2 volatilidades diferentes en la serie de datos
medida, si existen más de 2 volatilidades la transformación logarítmica será la más
adecuada; de no ser estacionaria en media, se aplica el operador diferencia sobre la
serie, si la serie es no estacionaria en media y no estacionaria en varianza se aplica
primero la trasformación BOX COX y luego el operador diferencia; en ambos casos
él operador diferencia puede usarse en distintos órdenes pero en general las series se
transforman en estacionarias en media ya en la segunda diferencia.
3. Se aplica entonces la metodología BOX-JENKINGS para obtener un modelo
preliminar observado las funciones de auto correlación simple y de auto correlación
parcial, luego de ello se va hallando los coeficientes de los modelos que tengan
mayor nivel de significancia (valor mínimo).
4. Para validar el modelo se establece que el estadístico de AKAKINE debe ser
mínimo, y además los residuos de la modelación deberían tender a ruido blanco, se
puede realizar también la minimización del estadístico bayesiano de Schwarz.
- 177 -
Figura 8-2 Algorítmo para la aplicación de la metodología BOX JENKINGS para el relleno de datos faltantes y
la realización de predicciones.
En caso de ser series incompletas, se aplicara de manera sucesiva distintos modelos

completando consecutivamente las series, esto porque los procesos estocásticos ARIMA
requieren de series de información completa.
De manera similar a las pruebas realizadas en los capítulos anteriores el indicador a evaluar
será el error relativo a la observación.
8.2 Resultados
Hasta 10% de
observaciones
rellenadas
Error
Relativo
Medio
Número de
observaciones
rellenadas
Figura 8-3 Evaluación del error relativo a la observación de los modelos estocásticos ARIMA a nivel mensual para la
variable evaporación total en tres estaciones hidrometeorológicas muestreadas aleatoriamente dentro el territorio
boliviano, para el relleno de huecos de datos de distinta extensión.
Las 3 estaciones corresponden a un clima frío, el completado parece ser mejor en aquella
que tiene una altitud más considerable: Hichucota ubicada a 4460 msnm, en relación a
Belén ubicada a 3822 msnm y Huarina Cota Cota a 3838 msnm.
- 178 -
Si observamos la Figura 8-3 no encontramos diferencias en la incidencia del error en el
número de meses faltantes rellenados, y la magnitud del error de los rellenos está dentro de
rangos tolerables.
Hasta 10% de
observaciones
rellenadas
Error
Relativo
Medio
Número de
observaciones
rellenadas
variable humedad relativa media en tres estaciones hidrometeorológicas muestreadas aleatoriamente dentro el
territorio boliviano, para el relleno de huecos de datos de distinta extensión.
En la Figura 8-4 se percibe que Achiri y Collana son de Clima frío y están a mayor altura
que Independencia con clima templado, por lo tanto el resultado del relleno no parece
depender ni del clima, ni de la altura, ni del número de meses faltantes, pero si observamos
la magnitud de los errores estos están dentro de rangos tolerables.
El error producido esta dentro de los rangos tolerables.
Hasta 10% de
observaciones
rellenadas
Error
Relativo
Medio
Número de
observaciones
rellenadas
variable precipitación total en tres estaciones hidrometeorológicas muestreadas aleatoriamente dentro el territorio
boliviano, para el relleno de huecos de datos de distinta extensión.
- 179 -
Observando la Figura 8-5 encontramos que el error del relleno parece ser menor en los
climas frío (San Juan) y cálido (San Julián) que en el clima templado (Padilla), la
inexactitud para esta última estación es demasiado elevada, los errores elevados durante el
relleno se deben a que las condiciones de estacionalidad en media y en varianza no
pudieron satisfacerse durante el proceso de relleno, se observa también que el error se
incrementa, cuando el número de meses faltantes es mayor.
Hasta 10% de
observaciones
rellenadas
Error
Relativo
Medio
Número de
observaciones
rellenadas
variable presión media en tres estaciones hidrometeorológicas muestreadas aleatoriamente dentro el territorio
boliviano, para el relleno de huecos de distinta extensión.
A partir de los resultados presentados en la Figura 8-6, se observa que el número de valores
rellenados incide en la magnitud del error pero que está en todos los casos es bastante baja
y se encuentra en rangos tolerables.
- 180 -
Hasta 10% de
observaciones
rellenadas
Error
Relativo
Medio
Número de
observaciones
rellenadas
variable temperatura media en tres estaciones hidrometeorológicas muestreadas aleatoriamente dentro el territorio
boliviano, para el relleno de huecos de distinta extensión.
A partir de los resultados presentados en la Figura 8-7, se observa que el número de valores
rellenados no incide en la magnitud del error pero estos son demasiado elevados para la
estación (Entre Ríos) en comparación con las otras dos estaciones que si producen errores
de magnitudes tolerables durante los rellenos, esto se puede explicar por qué durante el
relleno no se consiguió mantener la condición de estacionalidad en varianza del modelo lo
que determinó que las volatilidades de la simulación sean imprecisas en relación a los datos
observados.
Para la variable temperatura media mensual las tres estaciones se encuentran en clima
similar (templado) pero parece haber una relación entre la altura a la que se encuentra y la
magnitud del error así el error va decreciendo a medida que la altura aumenta: Entre Ríos a
1260 msnm, Irupana a 1946 msnm y La Tamborada a 2597 msnm.
8.3 Resultados por Variables

Des pues de realizar las pruebas anteriores, se determinó medias de los errores relativos de
las diferentes estaciones para poder suavizar los resultados en general, y poder sacar
conclusiones más certeras en relación a la eficiencia de los modelos ARIMA para el relleno
de datos faltantes de variables hidrometeorológicas, los resultados obtenidos se presentan
en la Figura 8-8, de manera que se puede comparar el desempeño de los rellenos a partir de
la media del error relativo.
- 181 -
Hasta 10% de
observaciones
rellenadas
Error
Relativo
Medio
Figura 8-8 Resultados Obtenidos por variables y escenarios el Eje vertical representa la media de los errores relativos
a las observaciones suprimidas.
8.4 Conclusiones
En concordancia con el estudio preliminar hemos comprobado que los modelos estocásticos
aplicados a las series temporales son bastante exactos en la inferencia de datos faltantes
para las siguientes variables a nivel mensual: evaporación total, humedad relativa, presión
atmosférica y temperatura media mensual, de esta manera confirmamos que los modelos
autorregresivos y de media móvil no solo son capaces de mantener las propiedades
estadísticas en sus inferencias sino que también producen observaciones sintéticas con un
buen nivel de exactitud y sin necesitar de la información de otras estaciones de medición
cercanas.
8.5 Recomendaciones
Se propone seguir investigando la aplicación de los modelos ARIMA para otras variables
que influyan en el proceso hidrológico y en los diseños hidráulicos, además de ello se exige
comparar su desempeño con el de otro software destinados a realizar relleno de datos
faltantes.
También se recomienda evaluar el desempeño de los modelos ARIMA en relación a otros

programas aplicados en el relleno de datos como es el caso de HEC-4 y la aplicación de
relleno de datos en el código R.
- 182 -
9 COMPARACIÓN DE LA EFICIENCIA DE
DESAGREGACIÓN MENSUAL-DIARIA A PARTIR DE
LA INFORMACIÓN DE ESTACIONES VECINAS ENTRE
LOS SOFTWARE DE MODELACIÓN ESTADÍSTICA
HEC-4 Y CHAC PARA LA VARIABLE PRECIPITACIÓN
DIARIA.
Para aplicaciones hidrológicas que requieran de datos diarios y tienen una serie incompleta
de observaciones de precipitación, surge una metodología que en primera instancia realiza
el relleno a nivel mensual, en base a la mayor correlación encontrada entre estaciones
próximas mes a mes.
Una vez realizado el relleno mensual, se realiza una desagregación de los datos mensuales
a diarios usando para el efecto la proporcionalidad de los datos diarios con relación al
acumulado mensual observado en la estación con datos medidos y serie completa.
9.1 Metodología
9.1.1 Selección de Estaciones
Las muestras tomadas son 3 grupos de estaciones con datos de precipitación diaria, cada
uno se encuentra en un clima diferente y a una elevación sobre el nivel del mar distinta, los
distintos climas, también se encuentran a niveles altimétricos diferenciados, las estaciones
seleccionadas para la desagregación mensual a diaria, usando como referencia estaciones
vecinas, las estaciones rellenadas son las que se encuentran en la Tabla 9-1:
Tabla 9-1 Estaciones pertenecientes a tres climas diferentes de nuestro país en las cuales se efectuó relleno de datos
faltantes con los programas computacionales HEC-4 y CHAC.

Lambate La Paz 3280 Frío
Pocona Cochabamba 2658 Templado
Montero Santa Cruz 317 Cálido
Las estaciones se nutren de la información de 4 estaciones que se consideran vecinas por

encontrarse geográficamente cercanas y presentar características climáticas semejantes.
Estaciones Vecinas a Lambate:
 Chulumani
 Coroico
 Irupana
- 183 -
 Palca
Figura 9-1 Grupo de estaciones seleccionado para el relleno de datos diarios a partir de la desagregación mensual-
diaria con datos de estaciones vecinas a la estación de Lambate.
Estaciones Vecinas a Pocona:
 Arani
 Mizque
 Monte Puncu
 Totora
- 184 -
diaria con datos de estaciones vecinas a la estación de Pocona.
Estaciones Vecinas a Montero:
 La Bélgica
 Okinawa I
 Portachuelo
 Viru Viru
- 185 -
diaria con datos de estaciones vecinas a la estación de Montero.
Las Figuras: Figura 9-1, Figura 9-2 y Figura 9-3, son una representación gráfica de los grupos
de estaciones vecinas que fueron asumidos para los experimentos de relleno de datos por
desagregación mensual-diaria tomando en consideración la correlación mensual de las
estaciones vecinas con la estación seleccionada para el relleno.
9.1.2 Supresión Intencional de observaciones para evaluar empíricamente los

resultados de la desagregación
Se propone analizar el comportamiento de los programas computacionales simulando datos
para una época húmeda y otra seca, la época húmeda comprende el intervalo temporal
Noviembre-Febrero, y la seca el intervalo Marzo-Octubre.
Para el conjunto de estaciones y sus datos se determina los periodos en los cuales todas las
estaciones constan de datos medidos a nivel mensual y diario.
A partir de los periodos medidos se selecciona aleatoriamente tres meses de cada época de
3 años diferentes para estudiar su comportamiento.
- 186 -
Para cada uno de los meses seleccionados se define un escenario en el cual se suprimirá y
se rellenara datos correspondientes a la estación de referencia.
Los escenarios están clasificados en relación a la cantidad de observaciones a nivel diario

que serán suprimidas para efectuar el relleno:
Época Húmeda:
 5 días Seguidos
 15 Días Seguidos
 5 Días Aleatorios
Época Seca:
No se ha considerado trabajar con supresión de datos consecutivos para la época seca del
año porque en estos casos, existe una gran cantidad de días consecutivos en los que no
llueve.
9.1.3 Aplicación del Software HEC-4

Se introduce las series de precipitación total mensual para poder generar los valores
mensuales a partir de las estaciones de referencia, se considera que el año hidrológico
inicia en agosto, se plantea que el completado cubra todos los valores mensuales faltantes
en el horizonte temporal de la estación que se desea completar, se guarda los valores
generados y la matriz de correlación mensual.
Posteriormente a partir de la matriz de correlación mensual se busca un par entre la

estación que se desea completar y la que tenga mayor correlación mensual, en el mes que se
presenta el dato mensual faltante.
Se procede a rellenar los datos a nivel mensual con HEC-4 para el mes que carece de un
total de precipitación mensual en la estación incompleta.
El valor encontrado representa la precipitación total para el mes con huecos que se pretende
rellenar.
Se determina el porcentaje que representa cada uno de los días faltantes pero en la estación
con la serie completa en relación al total de observaciones faltantes, esos porcentajes sirven
como coeficientes que multiplican a la diferencia entre el total de observaciones antes del
relleno y el valor generado por HEC-4 para la estación con datos faltantes.
- 187 -
9.1.4 Aplicación del Software CHAC
Se introduce las series de precipitación total mensual para poder generar los valores
mensuales a partir de las estaciones de referencia, se considera que el año hidrológico
inicia en agosto, se plantea que el completado cubra todos los valores mensuales faltantes,
para ello CHAC discrimina las estaciones que no tengan la suficiente correlación y solo
trabaja con las que considera guardan correlación mensual, luego de manera similar a lo
procedido en HEC-4, se guarda los valores generados y la matriz de correlación mensual.
Posteriormente a partir de la matriz de correlación mensual se busca un par entre la

estación que se desea completar y la que tenga mayor correlación mensual en el mes que se
presenta el dato mensual faltante.
Se procede a rellenar los datos a nivel mensual con CHAC para el mes que carece de un
total de precipitación mensual en la estación incompleta.
El valor encontrado representa la precipitación total para el mes con huecos que se pretende
rellenar.
Se determina el porcentaje que representa cada uno de los días faltantes pero en la estación
con la serie completa en relación al total de observaciones faltantes, esos porcentajes sirven
como coeficientes que multiplican a la diferencia entre el total de observaciones antes del
relleno y el valor generado por CHAC para la estación con datos faltantes.
9.1.5 Evaluación
A partir de los datos desagregados de la precipitación total mensual a diaria con cada uno
de los programas, se efectúa un contraste empírico entre las observaciones suprimidas y
los valores generados por los ellos.
Se cuantifica el error relativo a la observación y se acumula para cada escenario,

posteriormente se obtiene la media del error relativo por día de valor inferido, indicador
bajo el cual planteamos conclusiones posteriores.
- 188 -
9.2 Resultados Obtenidos
Precipitación Total Diaria
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 9-4 Comparación del Error Relativo obtenido entre los valores observados de precipitación total diaria y los
valores rellenados con el método de Mensual-Diaria. Estación Lambate durante la época húmeda del año hidrológico
entre los software HEC-4 y CHAC.
Si observamos los resultados de la Figura 9-4, encontramos que el software HEC-4 tiene en
todos los escenarios un desempeño superior al software CHAC para la época húmeda del
año en la estación de Lambate, también se distingue que los rellenos efectuados de manera
consecutiva tienen mayor error que aquellos que ese efectuaron en días aleatoriamente
seleccionados a lo largo del mes, otra característica adicional que se percibe es que a
medida que el número de datos faltantes se incrementa la magnitud de la media de los
errores también se hace más grande.
- 189 -
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
valores rellenados con el método de desagregación Mensual-Diaria. Estación Lambate durante la época seca del año
hidrológico entre los software HEC-4 y CHAC.
Se percibe a partir de los resultados de la Figura 9-5 que el software HEC-4 tiene en ambos
escenarios un desempeño superior al software CHAC para la época seca del año, en la
estación de Lámbete, otra característica adicional es que a medida que el número de datos
faltantes se incrementa, la magnitud de la media de los errores también se hace más grande.
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
valores rellenados con el método de desagregación Mensual-Diaria. Estación Pocona durante la época húmeda del
año hidrológico entre los software HEC-4 y CHAC.
- 190 -
En los resultados mostrados en la Figura 9-6 los valores del error relativo medio, nos indican
que el software HEC-4 tiene un mejor desempeño que el software CHAC en el relleno
mensual, aspecto que repercute en la desagregación a valores diarios, que corresponde a la
época húmeda del año en la estación de Pocona, además se percibe que el orden de
aparición de los datos faltantes es determinante, ya que cuando la aparición de datos
faltantes es consecutiva, se produce un error de mayor magnitud, por ultimo también se
observa que cuando el número de valores faltantes es mayor, la media de los errores
también se incrementa.
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
valores rellenados con el método de desagregación Mensual-Diaria. Estación Pocona durante la época seca del año
Si observamos los resultados presentados en la Figura 9-7 encontramos que El software

CHAC por muy poco rinde mejor que el software HEC-4 para la época seca del año en la
estación de Pocona.
- 191 -
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
valores rellenados con el método de desagregación Mensual-Diaria. Estación Montero durante la época húmeda del
año hidrológico entre los software HEC-4 y CHAC.
En los 4 escenarios nalizados, el software HEC-4 presenta resultados más satisfactorios,

para el relleno de datos en la época húmeda aspecto que se repite, con los datos de la
estación de Montero, como se observa en la Figura 9-8, verificando a su vez que para los
días de aparición aleatoria, la magnitud de los errores es menor que cuando se efectúan
rellenos de días consecutivos, por último también se percibe, que mientras mayor es el
número de datos faltantes, la magnitud del error es mayor.
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
valores rellenados con el método de desagregación Mensual-Diaria. Estación Montero durante la época seca del año
- 192 -
Durante la época seca del año, en la estación de Montero, los resultados representados en la
Figura 9-9 muestran que el rendimiento del software CHAC es levemente superior al del
software HEC-4 y que el número de observaciones faltantes no es determinante para esta
época del año.
Para la época húmeda el software HEC-4, tiene un error relativo más reducido que CHAC,
por otro lado para la época seca parece haber mayor error usando HEC-4 para clima frío y
con CHAC mejores resultados para clima templado y cálido.
En la época húmeda se distingue claramente que rellenar datos faltantes desordenados, es

más eficiente que rellenar datos faltantes consecutivos con ambos programas, para la época
seca parece ser algo indistinto.
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
valores rellenados con el método de desagregación Mensual-Diaria para cada escenario climático usando el programa
HEC-4 durante la época húmeda del año.
Los resultados de la desagregación usando el software HEC-4, para la época húmeda en las
estaciones de referencia localizadas en tres climas distintos, que se encuentran
representados en la Figura 9-10 con Lambate (Clima frio) Pocona (Clima templado) y
Montero (Clima cálido), nos muestran que el valor de la media de los errores relativos, para
cada escenario es menor en las regiones de clima frio y templado, en comparación con las
de clima cálido, esto puede ser por que la distancia entre estaciones de medición en el
altiplano y los valles es menor que en los llanos.
- 193 -
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
HEC-4 durante la época seca del año.
Los resultados de la desagregación usando el software HEC-4, para la época seca, en las
estaciones de referencia localizadas en tres climas distintos, que se encuentran
Montero (Clima cálido), nos muestran que el valor de la media de los errores relativos a la
observación para cada escenario es bastante menor en las regiones de clima frio y templado
en comparación con las de clima cálido esto puede ser por que la distancia entre estaciones
de medición en el altiplano y los valles es menor que en los llanos.
- 194 -
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
CHAC durante la época húmeda del año.
Los resultados de la desagregación usando el software CHAC, para la época húmeda, en

las estaciones de referencia localizadas en tres climas distintos que se encuentran
Montero (Clima cálido), nos muestran que el valor de la media de los errores relativos a la
observación para cada escenario es bastante menor en las regiones de clima frio y templado
en comparación con las de clima cálido esto puede ser por que la distancia entre estaciones
de medición en el altiplano y los valles es menor que en los llanos.
- 195 -
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
HEC-4 durante la época seca del año.
Los resultados de la desagregación usando el software CHAC para la época seca en

estaciones de referencia localizadas en tres climas distintos que se encuentran
Montero (Clima cálido), nos muestran que en el clima templado los resultados son muy
superiores a los del clima frio y cálido.
Observando las gráficas para ambos programas en época húmeda y diferenciando los
climas, podemos constatar que en ambos casos el método de desagregación es más eficiente
en el clima frío, luego en el templado, y con mayor error en el clima cálido.
9.3 Conclusiones
Viendo los resultados en su conjunto podemos ver que hay una cierta superioridad en la
exactitud de las inferencias obtenidas con el Software HEC- 4 en comparación con el
software CHAC, para ambos programas los rellenos tienen mejores resultados cuando no
tienen que rellenar series de datos faltantes de varios días consecutivos durante la época
húmeda del año, en la época seca esto no es determinante, también se observa que en la
época seca el programa CHAC parece ser igual de aconsejable para realizar la
desagregación a nivel diario.
La desagregación con ambos programas es mucho más eficiente para ambas épocas, seca y
húmeda en los climas frio y templando, las inferencias son más inexactas para el clima
cálido de la estación en los llanos que se encuentra mucho más distanciada de las estaciones
vecinas que las estaciones del valle y del altiplano.
- 196 -
En la mayoría de las pruebas realizadas se percibe que la magnitud de la media de los
errores se incrementa conforme el número de datos faltantes se hace también más grande.
9.4 Recomendaciones
Se recomienda, antes de realizar los procesos de desagregación, identificar grupos de
estaciones vecinas que estén lo más cerca posible de la estación que se desea rellenar.
Para realizar la desagregación mensual a nivel diario, durante la época húmeda del año para
la precipitación total diaria se aconseja trabajar con el software HEC-4, para la época seca
se podría usar cualquiera de los dos HEC-4 o CHAC.
- 197 -
10 COMPARACIÓN DE LA EFICIENCIA EN EL RELLENO
DE DATOS DIARIO USANDO LOS GENERADORES
ESTOCÁSTICOS DE CLIMA CLIGEN, CLIMGEN Y
WGEN
Las muestras están conformadas por tres estaciones, cada una se encuentra en un clima
diferente, con elevaciones sobre el nivel del mar distintas, debido a que en nuestro territorio
los climas diferenciados también se encuentran en niveles altimétricos diferenciados, las
variables están constituidas por series de valores diarios de precipitación, temperatura
máxima y temperatura mínima, la localización de las estaciones se encuentra representada
en la Figura 10-1 y sus características están tabuladas en la Tabla 10-1.
10.1 Metodología
10.1.1 Selección de los datos
Tabla 10-1 Estaciones utilizadas `para el relleno de datos faltantes con los generadores estocásticos de clima.

Laykacota La Paz 3632 Frío
La Tamborada Cochabamba 2597 Templado
Vallecito Santa Cruz 398 Cálido
- 198 -
Figura 10-1 Localización geográfica de las estaciones utilizadas para evaluar la eficiencia de los rellenos de datos de
variables climáticas con los distintitos generadores estocásticos de clima.
10.1.2 Supresión Intencional de observaciones para evaluar el relleno de datos

Se propone analizar el comportamiento de los programas simulando datos para una época
húmeda y otra seca, la época húmeda comprende el intervalo temporal Noviembre-Febrero,
y la seca el intervalo Marzo-Octubre.
Ingresada la información diaria y los datos geográficos, se procede a la generación de

clima, para cada valor eliminado se genera una observación o dato sintético, que es
contrastado con el valor medido.
Los datos que se eliminan para que puedan ser rellenados, corresponden a los siguientes
escenarios:
Época Húmeda:
- 199 -
Época Seca:
10.1.3 Aplicación del programa computacional CLIGEN

CLIGEN es un generador estocástico de clima a nivel diario que a diferencia de los demás
generadores, genera valores independientes para cada variable, su algoritmo principalmente
consiste en la generación de números aleatorios para cada variable, manteniendo las
propiedades estadistas que los valores observados.
El programa al no interrelacionar variables para la generación de clima viene incorporado

de un algoritmo de control de calidad, que le permite determinar que valores generados
durante la simulación son aceptables y cuáles no, por ejemplo el algoritmo elimina
cualquier valor negativo de precipitación y lo remplaza por un valor posible o un valor
nulo, también la temperatura mínima siempre debe ser menor que la temperatura máxima,
pueden parecer detalles muy simples pero como la generación de valores para cada
variable es independiente, son de especial relevancia.
Para la generación de valores de precipitación, el programa debe ser capaz de determinar la

frecuencia de días que llueve mes a mes, de manera similar a otros generadores estocásticos
determina estos valores a partir de las probabilidades condicionadas entre eventos de
precipitación y sequía.
Para generar las observaciones sintéticas, es necesario cargar las observaciones medidas en
un formato establecido de texto que puede ser leído por el programa computacional.
Adicionalmente a los datos de precipitación diaria cargados, es preciso ingresar valores de

precipitación máxima para 30 y 360 minutos de tormenta, para un periodo de retorno de
dos años, estos valores fueron inferidos a partir de los coeficientes de desagregación
regional y curvas de intensidad, duración y frecuencia de estaciones vecinas.
El programa también exige que insertemos localización de la estación de medición ven

coordenadas geográficas.
- 200 -
Posteriormente se debe definir el intervalo temporal de generación de clima en años
determinando el año de inicio de la simulación y el año final de la situación.
Con todos eso datos el software procede con la generación sintética de variables
climáticas.
10.1.4 Aplicación del programa computacional CLIMGEN

CLIMGEN utiliza la distribución de Weibull para representar el comportamiento
estadístico de la precipitación diaria, en lugar de aplicar series de Fourier como otros
programas del mismo tipo que intentan simular las variaciones estacionales de los datos de
clima.
Para que el programa pueda generar un número determinado de días secos y lluviosos, el
programa aplica un modelo de cadenas de Markov de segundo orden, para cada mes se
determina la frecuencia de días que llueven dado que llovió un día anterior y de días no
llueven dado que no llovió un día anterior; los días lluviosos son representados con la letra
W y los secos con la letra D.
Las formulas usadas para determinar esas frecuencias son las siguientes:
P(W/D)=α Ec.10.1
P(D/D)=(1-α) Ec.10.2
P(D/W)=β Ec.10.3
P(W/W)=(1-β) Ec.10.4
P(W/D)= Probabilidad de que ocurra un evento de precipitación, dado que el día anterior
no ocurrió ningún evento de precipitación.
P(D/D)= Probabilidad de que no ocurra un evento de precipitación, dado que el día

anterior no ocurrió ningún evento de precipitación.
P(D/W)= Probabilidad de que no ocurra un evento de precipitación, dado que el día

anterior ocurrió ningún evento de precipitación.
P(W/W)= Probabilidad de que ocurra un evento de precipitación, dado que el día anterior
ocurrió ningún evento de precipitación.
Definidas estas probabilidades el programa utiliza la una distribución Weibull a dos

parámetros para calcular la magnitud de la precipitación en los días húmedos.
Los valores de temperatura máxima y mínima son más sencillos de modelar por que no
suelen haber muchos valores nulos en condiciones normales, el programa asume que la
temperatura es un proceso estacionario, a partir de esta suposición se establece que los
- 201 -
valores de temperatura máxima y mínima se pueden simular a través de un modelo
estocástico multivariado con medias y desviaciones estándar condicionadas por la
condición de día seco y húmedo establecida en el paso anterior.
Al utilizar un proceso estocástico multivariado para generar los valores de temperatura

máxima y mínima se utilizan para este fin las correlaciones cruzadas entre las tres variables
precipitación, temperatura máxima y temperatura mínima (Esquivel, Cerrano, Sánchez,
Lopez, & Gutierrez, 2015, pág. 5).
El programa también exige que insertemos localización de la estación de medición ven

coordenadas geográficas.

El programa antes de hacer el relleno indica de manera cualitativa la calidad de los datos
medidos parar poder realizar alas inferencias.
climáticas.
10.1.5 Aplicación programa computacional WGEN

WGEN es capaz de generar valores diarios de precipitación, temperatura máxima y
mínima y radiación solar a nivel diario, los valores de precipitación se generan
independientemente de otras variables, para poder determinarlos es preciso determinar si
un día llueve o no llueve.
El modelo utilizado para la generación de los valores sintéticos de precipitación es el de la

cadena Gama de Markov, una cadena de Markov de primer orden establecida para
determinar la cantidad de días lluviosos o secos de cada mes del año, los parámetros de la
distribución Gama son utilizados para hallar el valor de la precipitación en los días
lluviosos.
Los valores de radiación solar dependen directamente de si el día ha sido lluvioso o seco,
por lo tanto se generan a partir de los estadísticos para esta variable obtenidos a partir de
los datos de entrada y de los valores generados de precipitación.
Los valores de temperatura máxima y mínima se obtienen a partir de la correlación cruzada

entre temperatura máxima, mínima y radiación solar a partir de los datos observados, la
- 202 -
matriz de correlaciones va variando a medida que se van generando nuevos valores y por lo
tanto el programa se encarga de ir evaluándola constantemente.
El modelo está diseñado para preservar las dependencias temporales que puedan tener las
variables, así como las características estacionales en cada zona de estudio.
Adicionalmente es necesario rellenar estadísticos referentes a las variables medidas, los

estadísticos que se debe ingresar son los siguientes:
 Frecuencia de precipitación para cada día que llovió de cada mes dado que no
llovió el día anterior.
 Frecuencia de precipitación para cada día que no llovió de cada mes dado que no
llovió el día anterior.
 Precipitación máxima en un día obtenida a partir de todos los datos observados.
 Temperatura media anual máxima para los días lluviosos.
 Temperatura media anual máxima para los días secos.
 Amplitud térmica anual para los días lluviosos.
 Amplitud térmica anual para los días secos.
 Temperatura media anula minina.
 Coeficiente de variación anual para la temperatura máxima.
 Coeficiente de variación anual para la temperatura mínima.
 Radiación solar media.

climáticas.
10.1.6 Evaluación
A partir de los datos generados con cada software de precipitación total diaria, temperatura
máxima diaria y temperatura mínima diaria, se hace un contraste empírico con las
observaciones existentes y suprimidas intencionalmente.
Se cuantifica el error relativo a la observación, se acumula para cada escenario y

posteriormente se obtiene la media del error relativo por día de valor inferido, criterio que
se utilizara para sacar las conclusiones.
- 203 -
10.2 Resultados
10.2.1 Precipitación Total Diaria
Época Húmeda:
Estación: Laykacota
Departamento: La Paz
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-2 Comparación del Error Relativo para la variable precipitación diaria, entre los valores medidos y estimados
con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos faltantes durante la
época húmeda del año en la estación Laykacota.
Observando la Figura 10-2 se percibe que si el número de huecos es reducido a lo largo del
mes, el software WGEN parece tener un desempeño mejor en relación a CLIGEN Y
CLIMGEN, además en todos los resultados la magnitud de los errores relativos indica que
el relleno es más eficiente para días con datos faltantes no consecutivos.
Estación: La Tamborada
Departamento: Cochabamba
- 204 -
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
época húmeda del año en la estación La Tamborada.
A partir de la Figura 10-3 deducimos que en todos los casos el mejor desempeño para la
inferencia de datos faltantes lo tiene el software WGEN; CLIMGEN tienen menor
magnitud de error cuando los datos faltantes son consecutivos, al contrario del desempeño
de WGEN que no acusa gran diferencia.
Estación: Vallecito
Departamento: Santa Cruz
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
época húmeda del año en la estación Vallecito.
- 205 -
Si observamos la Figura 10-4, los errores relativos de los valores rellenados en los distintos
escenarios por el programa computacional WGEN son menores, además no se ven
influenciados por la posición de los huecos en la serie algo que hace más simple el proceso
de relleno, para CLIMGEN la magnitud del error es mayor si los datos faltantes son
consecutivos.
A partir de los resultados presentados de las tres estaciones, en las que se efectuó el relleno
de datos, se concluye que el programa computacional WGEN produce mejores resultados
en dos de las estaciones estudiadas, para la variable precipitación diaria, durante la época
húmeda del año.
Época Seca:
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
época seca del año en la estación Laykacota.
Observando la Figura 10-5, deducimos que el software CLIMGEN tiene un buen

desempeño, para ninguno de los programas utilizados los errores dependen de si los datos
faltantes son consecutivos o no.
- 206 -
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
época seca del año en la estación La Tamborada.
Observando la Figura 10-6 deducimos que CLIMGEN tiene mejor desempeño en relación a
los otros dos software y otra vez de manera similar al experimento anterior no parece ser
determínate si los datos faltantes son o no consecutivos.
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
época seca del año en la estacion Vallecito.
A partir de la observación de los resultados representados en la Figura 10-7 deducimos que

el software CLIMGEN tiene mejor desempeño al rellenar datos faltantes en la estación de
Vallecito durante la época seca, como en los otros dos experimentos no parece ser
determinante si los datos rellenados son consecutivos o no.
- 207 -
En términos generales el programa CLIMGEN, produce mejores resultados que los
restantes para la variable precipitación diaria, durante la época seca del año, también se
puede concluir que para esta época del año, no es determínate en la eficiencia de los
rellenos si los datos faltantes son o no consecutivos, esto se debe a la frecuente presencia
de valores nulos en la serie de precipitación diaria durante la época seca del año.
10.2.2 Temperatura Máxima
Época Húmeda:
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-8 Comparación del Error Relativo para la variable temperatura máxima diaria, entre los valores medidos y
estimados con los modelos indicados, para los escenarios indicados en la abscisa según el número de datos faltantes
durante la época húmeda del año en la estación Laykacota.
En la Figura 10-8 distinguimos que CLIGEN y CLIMGEN parecen ser mejores que WGEN
durante el relleno de datos de temperatura máxima a nivel diario, en la estación de
Laykacota para la época húmeda del año, no parece haber gran diferencia entre rellenar
valores consecutivos o aleatorios para ninguno de los programas .
- 208 -
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
faltantes durante la época húmeda del año en la estación La Tamborada.
Si vemos la Figura 10-9, los resultados obtenidos por los software CLIGEN y CLIMGEN
son superiores a los de WGEN, y no parece haber gran diferencia entre rellenar valores
consecutivos o aleatorios.
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
durante la época húmeda del año en la estación Vallecito.
- 209 -
Observando la Figura 10-10 se percibe que los tres programas tiene un desempeño similar
en el caso de un clima cálido durante la época húmeda del año y de nuevo no parece haber
diferencia entre rellenar datos seguidos o aleatorios.
CLIGEN es la mejor alternativa para inferir datos faltantes de temperatura máxima diaria y
los resultados son independientementes del número de datos faltantes o de si estos son
consecutivos o no.
Época Seca:
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
durante la época seca del año en la estación Laykacota.
Observando los resultados representados en la Figura 10-10, CLIGEN y CLIMGEN

claramente son superiores a WGEN, la magnitud de los errores para días consecutivos de
datos faltantes y para días aleatorios no es muy diferente.
- 210 -
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
durante la época seca del año en la estación La Tamborada.
Observando los resultados representados en la Figura 10-12, CLIGEN y CLIMGEN tiene un

desempeño claramente superior a WGEN y otra vez si los datos faltantes son o no
consecutivos no es un factor determínate en la magnitud del error durante las inferencias.
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
durante la época seca del año en la estación Vallecito.
- 211 -
Observando la Figura 10-13 se deduce que para el clima cálido, los tres programas parecen
tener un desempeño similar para la época seca del año.
CLIGEN Y CLIMGEM tienen un mejor desempeño que WGEN en los climas frio y
templado para la variable temperatura máxima diaria en la época seca.
10.2.3 Temperatura Mínima
Época Húmeda:
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-14 Comparación del Error Relativo para la variable temperatura mínima diaria, entre los valores medidos y
durante la época húmeda del año en la estación Laykacota.
Si observamos los resultados presentados en la Figura 10-14, CLIGEN y CLIMGEN tienen

un desempeño superior a WGEN, y no parece haber gran diferencia entre rellenar valores
consecutivos o aleatorios.
- 212 -
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
durante la época húmeda del año en la estación La Tamborada.
Si observamos los resultados presentados en la Figura 10-15, CLIGEN y CLIMGEN tienen

errores producidos durante el relleno son muy inferiores a los de WGEN y además no
parece haber gran diferencia entre rellenar valores consecutivos o aleatorios.
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
durante la época húmeda del año en la estación Vallecito.
- 213 -
De manera similar a los dos experimentos anteriores si observamos los resultados
representados en la Figura 10-16, los errores producidos durante la inferencia de datos
faltantes usando los programas CLIGEN y CLIMGEN son muy inferiores en comparación
con los producidos con WGEN y el desempeño de los software no parece ser influenciado
por que los datos a rellenar sean o no consecutivos.
CLIGEN y CLIMGEN son las mejores alternativas para inferir datos faltantes de
temperatura mínima diaria durante la época húmeda independientemente del número de
datos faltantes o de si estos son consecutivos o no.
Época Seca:
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
durante la época seca del año en la estación Laykacota.
Observando la Figura 10-17 los resultados obtenidos con los software CLIGEN y
CLIMGEN claramente son superiores a WGEN, no parece afectar si los datos a rellenar son
consecutivos o distribuidos aleatoriamente.
- 214 -
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
durante la época seca del año en la estación La Tamborada.
Observando la Figura 10-18 los resultados obtenidos con los software CLIGEN y
CLIMGEN claramente son superiores a WGEN, no parece afectar si los datos a rellenar son
consecutivos o distribuidos aleatoriamente.
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
durante la época seca del año en la estación Vallecito.
- 215 -
En la representación de los resultados presentados en la Figura 10-19, se observa que
CLIGEN y CLIMGEN tienen un mejor desempeño que WGEN y no parece afectar si los
datos a rellenar son consecutivos o distribuidos aleatoriamente.
CLIGEN Y CLIMGEM tienen un mejor desempeño que WGEN en los climas frio y
templado para la variable temperatura mínima diaria en la época seca.
10.2.4 Prueba adicional

De manera adicional se pretendió comparar la eficiencia para el relleno de datos faltantes
con los modelos ARIMA y los generadores estocásticos de clima, en tres series de
precipitación a nivel mensual, las cuales fueron:
 Cochabamba – Aeropuerto
 Laykacota
 Montero
Los resultados obtenidos se presenta en la Figura 10-20; y cómo podemos observar los
generadores estocásticos de clima tienen un desempeño bastante superior al generar datos
diarios de precipitación y agregarlos después a nivel mensual, se destaca que el programa
CLIGEN tiene el mejor rendimiento de entre todas la metodologías, el desempeño de los
modelos ARIMA es deficiente por que la precipitación es una variable no estacionaria y
además de eso suele tener valores nulos en sus registros que son bástate difíciles de
reproducir por los modelos autorregresivos de media móvil.
Hasta 12% de
observaciones
rellenadas
Error Medio
Relativo a la
Observación
Figura 10-20 Resultados que representan el Error Relativo Medio, obtenido con las distintas metodologías de relleno
de datos para la variable precipitación total mensual en diferentes estaciones.
- 216 -
10.2.5 Resumen de Resultados
Para poder determinar conclusiones más precisas del relleno se vio conveniente integrar
los resultados de las figuras anteriores por variables y según la época de relleno; las nuevas
figuras nos muestran un panorama más claro del comportamiento de los programas
utilizados y de la calidad de sus inferencias.
a) Precipitación Total Diaria
Media del
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-21 Media del error relativo en el relleno de datos de precipitación diaria con los distintos programas
utilizados y para los escenarios representados en la abscisa, para la época húmeda del año.
Los resultados presentados en la Figura 10-21 indican que para la época húmeda del año, el
programa WGEN se desenvuelve mejor que los otros dos al inferir datos faltantes de
precipitación diaria.
Media del
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-22 Media del error relativo en el relleno de datos de precipitación diaria con los distintos programas
utilizados y para los escenarios representados en la abscisa, para la época seca del año.
- 217 -
Los resultados presentados en la Figura 10-22, indican que para la época seca del año, el
programa CLIMGEN se desenvuelve mejor que los otros dos al inferir datos faltantes de
precipitación diaria.
b) Temperatura máxima Diaria
Media del
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-23 Media del error relativo en el relleno de datos de temperatura máxima diaria con los distintos programas
Los resultados presentados en la Figura 10-23, indican que para la época húmeda del año, los
programas CLIGEN y CLIMGEN se desenvuelve mejor que WGEN al inferir datos
faltantes de temperatura máxima diaria.
c) Temperatura mínima Diaria
Media del
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-24 Media del error relativo en el relleno de datos de temperatura máxima diaria con los distintos programas
- 218 -
Los resultados presentados en la Figura 10-24, indican que para la época seca del año, los
faltantes de temperatura máxima diaria.
Media del
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-25 Media del error relativo en el relleno de datos de temperatura mínima diaria con los distintos programas
Los resultados presentados en la Figura 10-25, indican que para la época húmeda del año, los
faltantes de temperatura mínima diaria.
Media del
Error Medio
Relativo a la
Observación
Hasta 12% de
observaciones
rellenadas
Figura 10-26 Media del error relativo en el relleno de datos de temperatura mínima diaria con los distintos programas
- 219 -
Los resultados presentados en la Figura 10-26, indican que para la época seca del año, los
faltantes de temperatura mínima diaria.
10.3 Conclusiones
Los resultados de generación de observaciones diarias para la variable precipitación total
diaria tiene errores relativos demasiado elevados, después de haber realizado
comparaciones entre los modelos y determinar cuál rellena datos mejor, ninguno de ellos
parece generar observaciones sintéticas dentro las tolerancias de error admisibles, por lo
tanto los generadores estocásticos de clima no parecen ser convenientes para el relleno de
datos de precipitación total diaria, más aun tomando en cuenta los resultados obtenidos en
el capítulo anterior obteniendo inferencias mucho mejores mediante la desagregación
mensual-diaria usando los software HEC-4 y CHAC.
Por otro lado para las inferencias realizadas para las variables temperatura máxima diaria y
temperatura mínima diaria si son bastante aceptables, para este fin los programas CLIGEN
y CLIMGEN tienen un buen desempeño, el software WGEN sigue produciendo valores
demasiado inexactos para estas variables.
El número de datos faltantes tanto en la época seca como en la época húmeda no es

determinante.
Los rellenos mantienen su calidad sin importar si las observaciones generadas pertenecen a
datos faltantes consecutivos o aleatoriamente distribuidos.
Los generadores estocásticos de clima tienen un desempeño superior a la hora de generar

valores mensuales de precipitación en relación con los modelos ARIMA.
10.4 Recomendaciones
Si se desea rellenar datos diarios de precipitación total no se aconseja utilizar generadores
estocásticos de clima, se sugiere utilizar la desagregación mensual-diaria desarrollada en
el capítulo anterior ya que en escenarios y condiciones semejantes produce mejores
resultados.
Se recomienda inferir datos de temperatura máxima y mínima los generadores estocásticos

parecen ser la mejor alternativa, particularmente CLIGEN y CLIMGEN que son
bastanteaste más exactos que WGEN.
- 220 -
11 COMPARACIÓN ENTRE EL RELLENO MENSUAL
ENTRE LOS MODELOS ARIMA, HEC – 4 Y LA
APLICACIÓN DE RELLENO DE DATOS EN EL CÓDIGO
R
El Laboratorio de Hidráulica de la universidad mayor de San Simón se encontraba durante

el tiempo que se estaba realizando el presente trabajo rellenando datos de distintas
variables climáticas y meteorológicas como el tema era común se aprovechó para evaluar la
eficiencia de los modelos empleados en ese proceso de inferencia de datos para el grupo de
variables en las que se realizó el relleno datos faltantes, aprovechando la información se
planteó también compara los rellenos usados con las técnicas empleadas en el laboratorio y
las que se pretenden implementar en el presente estudio.
Por lo tanto se comparó el relleno efectuado por 3 metodologías diferentes: HEC-4, la

aplicación de relleno de datos en el código R y la metodología Box Jenkings para la
realización de inferencias en series temporales , esto para realizar un contraste entre lo
conseguido en el capítulo anterior y las metodologías usualmente usadas en el medio,
además ante la novedad que represento la aplicación en el código R nos impulsó a que
determino empíricamente su eficiencia en el relleno de distintas variables climáticas.
En este caso se trabajó solamente con las variables en las cuales se realizaron rellenos de
datos faltantes en el laboratorio de hidráulica, los rellenos se efectuaron a nivel mensual
para las variables velocidad del viento, cantidad de horas de sol por día y evaporación
total.
Respecto a los modelos ARIMA y el programa HEC-4 su funcionamiento ya fue

desarrollado en capítulos anteriores, y en esta parte aprovecharemos explicando solamente
las particularidades de la aplicación de relleno de datos en el código R.
Es una aplicación que se utilizó para preparar los datos de entrada del modelo WEAP, el
cual procede a rellenar datos de estaciones con vacíos a partir de estaciones vecinas, con la
cual se obtuvo buenos resultados durante las simulaciones efectuadas (Kaenel & Depsky,
2016, pág. 1), el código desarrollado realiza las siguientes acciones:
 Importación de los datos de entrada y calcula de distancia espacial entre las

estaciones de medición.
 Determinación de la superposición temporal entre estaciones y cálculo de los
coeficientes de correlación entre las estaciones.
 Selección del método de relleno más adecuado entre 2 métodos: Método de
coeficientes de correlación ponderados y Método del peso por inverso de la
- 221 -
distancia entre estaciones, el programa determina el método en relación a la
cantidad de datos que presenta cada estación y la distancia que existe entre
estaciones, una estación con muchos datos pero alejada es favorecida para realizar
el relleno con el primer método, por otra parte una estación con pocos datos pero
cercana es favorecida para rellenar con el segundo método.
 Relleno de datos usando el método seleccionado.
 Calculo de índices de error entre lo simulado y observado, nosotros preferimos
evaluar este error de manera independiente entre los valores suprimidos
intencionalmente y los nuevos valores generados.
11.1 Metodología
11.1.1 Muestreo
Como los grupos para la inferencia fueron determinados previamente siguiendo el criterio
de afinidad y cantidad de datos en las estaciones para realizar el relleno de datos usando el
software Hec-4, nos limitamos a trabajar con estos grupos y verificar la inferencia
realizando pruebas también con las otras 2 metodologías restantes.
Los Grupos de estaciones meteorológicas que se utilizaron para a efectuar los rellenos están
tabulados en las Tabla 11-1,
Tabla 11-2 y Tabla 11-3:
Tabla 11-1 Grupos de estaciones donde se aplicó el relleno de datos faltantes usando los modelos estocásticos
ARIMA, el software HEC-4 y la aplicación de relleno de datos en el código R para la variable Magnitud de Velocidad
de Viento Media.
Magnitud de Velocidad de Viento Media [KM/H]

Grupo 1 Grupo 2 Grupo 3
1.1. Arani 2.1. Ayo Ayo 3.1. Riberalta
1.2. Colomi 2.2. Calacoto 3.2. Reyes
1.3. San Benito 2.3. Collana 3.3. San Joaquín
1.4. Tarata 2.4. Luribay 3.4. Santa Ana
1.5. Tiraque 2.5. Salla 3.5. Guayaramerín
- 222 -
Figura 11-1 Localización de estaciones de medición por grupos para el relleno de datos faltantes de Magnitud de
Velocidad de viento Media para la comparación entre la eficiencia de las 3 metodologías utilizadas.
ARIMA, el software HEC-4 y la aplicación de relleno de datos en el código R para la variable Horas de Sol por día a
nivel medio.
HORAS DE SOL POR DIA [HORAS/DIA]

1.1. Sucre 2.1. Ayo Ayo 3.1. Los Pinos
1.2. Incahuasi 2.2. Belén 3.2. Tarapacaya
1.3. Azurduy 2.3. El Alto Aeropuerto 3.3. Río Mulato
1.4. La Torre 2.4. Chirapaca 3.4. Colcha K
1.5. Culpina 2.5. Viacha 3.5. Chinoli
- 223 -
Figura 11-2 Localización de estaciones de medición por grupos para el relleno de datos faltantes de Horas de Sol por
Día para la comparación entre la eficiencia de las 3 metodologías utilizadas.
ARIMA, el software HEC-4 y la aplicación de relleno de datos en el código R para la variable Evaporación Total.
Evaporación Total [mm]

1.1. Talula Tako Tako 2.1. Tarapaya 3.1. Santa Cruz
1.2. Redención Pampa 2.2. Los pinos 3.2. Vallecito
1.3. Sucre 2.3. Chinoli 3.3. General Saavedra
1.4. Zudáñez 2.4. Ayo Ayo N/A
1.5. La Barraca 2.5 .Carabuco N/A
- 224 -
Figura 11-3 Localización de estaciones de medición por grupos para el relleno de datos faltantes de Evaporación
Total para la comparación entre la eficiencia de las 3 metodologías utilizadas.
ARIMA, el software HEC-4 y la aplicación de relleno de datos en el código R para la variable Precipitación Total.
Precipitación Total [mm]

1.1. Cochabamba 2.1. Achumani 3.1. Montero
1.2. La Tamborada 2.2. Laykacota 3.2. Okinawa I
1.3. Pairumani 2.3. Mecapaca 3.3. Santa Cruz
1.4. Parotani 2.4. Palca 3.4. Trompillo
1.5. Santivañez 2.5. San Calixto 3.5. Viru Viru
- 225 -
Figura 11-4 Localización de estaciones de medición por grupos para el relleno de datos faltantes de Precipitación
Total para la comparación entre la eficiencia de las 3 metodologías utilizadas.
Los números que identifican a las estaciones en las Figuras: Figura 11-1; Figura 11-2; Figura
11-3 y Figura 11-4, corresponden a las estaciones numeradas en las Tablas: Tabla 11-1;
Tabla 11-2; Tabla 11-3 y Tabla 11-4 respectivamente para que estas puedan ser identificadas
en cada mapa.
11.1.2 Procedimiento
Para que los modelos sean conmensurables se tuvo que ajustar el experimento a las
características inferenciales mínimas necesarias que necesitaría la metodología Box
Jenkings para poder trabajar eficientemente que lógicamente son menos exigentes que para
los demás métodos empleados, así que los datos extraídos corresponden a los últimos
valores del final de la serie sin huecos de una de las estaciones de medición en la cual el
número de datos consecutivos sea máximo, es la condición límite de trabajo para hacer que
los modelos ARIMA trabajen de manera adecuada y por lo tanto pueda ser conmensurable
con el relleno generado por los demás software.
- 226 -
La eliminación de datos se realizó en varios intervalos mensuales de 1, 3, 6 y 12 meses y
de esa forma rellenar y comparar el error producido por los modelos.
11.1.3 Evaluación
El indicador de la eficiencia durante los rellenos fue el error medio relativo a la
observación, adicionalmente se podría también incluir una relación entre este error y el
número de datos empleados e identificar qué modelo es superior en relación a la
información de entrada empleada, que naturalmente nos indicara que modelo es más útil en
condiciones más desfavorables y mucho más corrientes propias del medio en el que se
realizan trabajos de diseño hidrológico donde las condiciones políticas no favorezcan la
obtención de información.
11.2 Resultados
11.2.1 Magnitud de Velocidad de Viento Media Mensual
Estación: Arani
Error Medio
Hasta 10% de
Relativo a la
observaciones
Observación
rellenadas
1.4
1.2
1
ARIMA
0.8
HEC - 4
0.6 APP R-CODE
0.4
0.2
Número de
0 observaciones
Quitando 1 Mes Quitando 3 Mes Quitando 6 Mes Quitando 12 Mes rellenadas
Figura 11-5 Comparación entre el error relativo a la observación en el proceso de relleno de datos a nivel mensual
para la variable velocidad del viento con los datos de la estación Arani entre las 3 metodologías empleadas.
- 227 -
Estación: Ayo Ayo
Error Medio
Hasta 10% de
Relativo a la
observaciones
Observación
rellenadas
1.4
1.2
1
ARIMA
0.8
HEC - 4
0.6 APP R-CODE
0.4
0.2
Número de
0
observaciones
Quitando 1 Mes Quitando 3 Mes Quitando 6 Mes Quitando 12 Mes rellenadas
para la variable velocidad del viento con los datos de la estación Ayo Ayo entre las 3 metodologías empleadas.
Estación: Riberalta
Error Medio
Relativo a la Hasta 10% de
Observación observaciones
rellenadas
1.8
1.6
1.4
1.2 ARIMA
1
HEC - 4
0.8
APP R-CODE
0.6
0.4
0.2
0 Número de
Quitando 1 Mes Quitando 3 Mes Quitando 6 Mes Quitando 12 Mes observaciones
rellenadas
para la variable velocidad del viento con los datos de la estación Riberalta entre las 3 metodologías empleadas.
- 228 -
Observando en conjunto los resultados representados en las Figuras Figura 11-5; Figura 11-6
y Figura 11-7; al rellenar observaciones faltantes de la magnitud de la velocidad de viento
los modelos ARIMA ofrecen mejores resultados que los producidos en HEC-4 y la
aplicación en el código R.
11.2.2 Media Mensual de la cantidad Horas de sol por día
Estación: Sucre
Error Medio
Hasta 10% de
Relativo a la
observaciones
Observación
rellenadas
0.9
0.8
0.7 ARIMA
0.6
0.5 HEC - 4
0.4
0.3 APP R-CODE
0.2
0.1
0 Número de
1 Observación 3 Observaciones 6 Observaciones 12 Observaciones observaciones
Faltante Faltantes Faltantes Faltantes rellenadas
para la variable Cantidad media de horas sol por día con los datos de la estación Sucre entre las 3 metodologías
empleadas.
Estación: Ayo ayo
Error Medio
Hasta 10% de
Relativo a la
observaciones
Observación
rellenadas
0.8
0.7
0.6 ARIMA
0.5
HEC - 4
0.4
0.3 APP R-CODE
0.2
0.1
0.0 Número de
1 Observación 3 Observaciones 6 Observaciones 12 Observaciones observaciones
Faltante Faltantes Faltantes Faltantes rellenadas
para la variable Cantidad media de horas sol por día con los datos de la estación Ayo Ayo entre las 3 metodologías
empleadas.
- 229 -
Estación: Los Pinos
Error Medio Hasta 10% de

Relativo a la observaciones
Observación rellenadas
0.14
0.12
0.1
ARIMA
0.08
HEC - 4
0.06
APP R-CODE
0.04
0.02
0
1 Observación 3 Observaciones 6 Observaciones 12 Observaciones Número de
observaciones
Faltante Faltantes Faltantes Faltantes
rellenadas
para la variable Cantidad media de horas sol por día con los datos de la estación Los Pinos entre las 3 metodologías
empleadas.
Observando las Figuras: Figura 11-8;Figura 11-9 y Figura 11-10; encontramos que el software
HEC-4 produce resultados levemente superiores a los de los modelos ARIMA, por otro
lado la aplicación en R realiza inferencias con errores demasiado elevados en relación a las
otras dos metodologías.
- 230 -
11.2.3 Evaporación Total Mensual
Estación: Talula Tako Tako

0.4
0.35
0.3
0.25 ARIMA
0.2 HEC - 4
0.15 APP R-CODE
0.1
0.05
0
1 Observación 3 Observaciones 6 Observaciones 12 Observaciones Número de
Faltante Faltantes Faltantes Faltantes observaciones
rellenadas
para la variable Evaporación total con los datos de la estación Talula Tako Tako entre las 3 metodologías empleadas.
Estación: Tarapacaya

0.7
0.6
0.5
ARIMA
0.4
HEC - 4
0.3
APP R-CODE
0.2
0.1
0.0
1 Observación 3 Observaciones 6 Observaciones 12 Observaciones
Número de
Faltante Faltantes Faltantes Faltantes
observaciones
rellenadas
para la variable Evaporación total con los datos de la estación Tarapacaya entre las 3 metodologías empleadas.
- 231 -
Estación: Santa Cruz
Error Medio
Hasta 10% de
Relativo a la
observaciones
Observación
0.6 rellenadas
0.5
0.4
ARIMA
0.3 HEC - 4
0.2 APP R-CODE
0.1
0.0
Número de
1 Observación 3 Observaciones 6 Observaciones 12 observaciones
Faltante Faltantes Faltantes Observaciones rellenadas
Faltantes
para la variable Evaporación total con los datos de la estación Santa Cruz entre las 3 metodologías empleadas.
De manera similar a la variable anterior los resultados de las Figuras Figura 11-10Figura
11-11;Figura 11-12 y Figura 11-13; sugieren que el software HEC-4 parece tener resultados
levemente superiores a los de los modelos ARIMA y la aplicación en el código R parece
quedarse bastante atrás en relación a las otras dos metodologías.
- 232 -
11.2.4 Precipitación Total Mensual
Estación: Cochabamba
Error Medio
Hasta 10% de
Relativo a la
observaciones
Observación
0.6 rellenadas
0.5
0.4
ARIMA
0.3 HEC-4
APP R-CODE
0.2
0.1
0
1 Observación 3 observaciones 6 Observaciones 12 Observaciones Número de
observaciones
Faltante Faltante Faltante Faltante
rellenadas
para la variable Precipitación total con los datos de la estación Cochabamba entre las 3 metodologías empleadas.
Error Medio
0.7 rellenadas
0.6
0.5
ARIMA
0.4
HEC-4
0.3
APP R-CODE
0.2
0.1
0 Número de
observaciones
1 Observación 3 observaciones 6 Observaciones 12 Observaciones
rellenadas
Faltante Faltante Faltante Faltante
para la variable Precipitación total con los datos de la estación Laykacota entre las 3 metodologías empleadas.
- 233 -
Estación: Montero
Error Medio
rellenadas
2.5
1.5 ARIMA
HEC-4
1 APP R-CODE
0.5
0 Número de
1 Observación 3 observaciones 6 Observaciones 12 Observaciones observaciones
Faltante Faltante Faltante Faltante rellenadas
mensual para la variable Precipitación total con los datos de la estación Montero entre las 3 metodologías
empleadas .
Observando las Figuras Figura 11-14; Figura 11-15; Figura 11-16; se puede concluir que la
metodología más eficiente en el relleno de datos faltantes de la precipitación total mensual
es el programa HEC-4; la aplicación desarrollada en el código R también presenta buenos
resultados, los modelos ARIMA quedan un poco atrás pero esto es razonable en relación a
la pequeña cantidad de datos que estos requieren para poder emplearse.
- 234 -
11.2.5 Relación entre el Error y el Número de datos de entrada para los distintos
Modelos por variables
11.2.5.1 Magnitud de Velocidad Del Viento
Error Medio
Relativo a la
Observación
Figura 11-17 Relación entre el número de datos de entrada usados para el relleno de datos y la magnitud del error
relativo obtenido para cada metodología en las distintas pruebas efectuadas para la inferencia de la magnitud de la
velocidad del viento.
La Figura 11-17 muestra claramente que con mucho menos datos los modelos ARIMA
pueden realizar inferencias mucho más eficientes que HEC-4 y la aplicación en el código
para la variable magnitud de la velocidad media del viento a nivel mensual.
11.2.5.2 Media mensual de Horas Sol por día
Error Medio
Relativo a la
Observación
relativo obtenido para cada metodología en las distintas pruebas efectuadas para la inferencia de la media mensual
de horas sol por día.
- 235 -
Observando la Figura 11-18 encontramos que a pesar de entre un desempeño mejor HEC-4 y
el código R e n relación a los modelos ARIMA, requieren una cantidad inmensamente
mayor de datos para conseguir rellenara los datos faltantes para la variable media mensual
de horas sol por día .
11.2.5.3 Evaporación Total Mensual
Error Medio
Relativo a la
Observación
relativo obtenido para cada metodología en las distintas pruebas efectuadas para la inferencia de la evaporación
total mensual.
Observando la Figura 11-19 encontramos que a pesar de entre un desempeño mejor HEC-4 y
el código R en relación a los modelos ARIMA, requieren una cantidad inmensamente
mayor de datos para conseguir rellenara los datos faltantes para la variable evaporación
total mensual.
11.2.5.4 Precipitación Total Mensual
Error Medio
Relativo a la
Observación
relativo obtenido para cada metodología en las distintas pruebas efectuadas para la inferencia de la precipitación
total mensual.
- 236 -
La Figura 11-20 muestra claramente que con mucho menos datos, los modelos ARIMA
pueden realizar inferencias mucho más eficientes que HEC-4, pero no superiores a las
hechas por la aplicación en el código para la variable precipitación total mensual.
11.3 Conclusiones
Para todas las variables de estudio en la mayoría de los casos el error incrementa un poco a
medida que el número de observaciones faltantes se va incrementando.
En el caso de las inferencias de la velocidad media del viento a nivel mensual sus errores
son bastante elevados, pero dada la naturaleza de la variable se sabe que es bástate difícil de
inferirla, por lo tanto los resultados obtenidos se pueden considerar bastante satisfactorios
tanto para las inferencias producidas por los modelos ARIMA como para las hechas por el
software HEC-4 quedando por encima de los resultados de la aplicación de relleno de datos
en el código R.
Considerando que los modelos ARIMA trabajan con mucho menos observaciones para
realizar sus inferencias parece ser que es el que se desempeñaría mejor ante la condición
crítica que siempre puede estar presente la cual es la carencia de observaciones, y dado que
la calidad de los resultados de estos modelos es bástate similar a la de los producidos por el
software HEC-4, sí se dan estas condiciones de carencia de datos los modelos
autorregresivos de media móvil podrán generan inferencias útiles para los diseños
hidráulicos e hidrológicos.
11.4 Recomendaciones
Siempre que sea posible se debería realizar los rellenos trabajando con grupos de
estaciones vecinas que se encuentran cerca, que tenga una cantidad considerable de
observaciones y mantengan una correlación a nivel mensual elevada entre ellas como para
poder aplicar el software HEC-4.
Si se da el caso de que se tenga que trabajar con estaciones con pocas o ninguna estación
vecina o que las correlaciones entre estaciones sean demasiado bajas se habilitan los
modelos arrima como medio de inferencia de datos faltantes ya que estos son bastante
exactos trabajando con estaciones con pocos datos observados y gran cantidad de huecos en
su registro.
- 237 -
12 RELLENO DE OBSERVACIONES FALTANTES USANDO
LA MEDIA DE LOS DATOS FALTANTES EN
INTERVALOS MENSUALES DE VARIABLES
CLIMÁTICAS
Medir el grado de representatividad de la media para cada variable es una interrogante que
debemos resolver, pensamos al iniciar estas pruebas que la media podía ser un buen valor
para hacer rellenos en series que tengan pocos datos faltantes, lógicamente entendido el
proceso estacional que se presenta en las variables climáticas, las medias que pretendíamos
usar para el relleno de datos era medias mensuales, para poder conmensurar la viabilidad
de aplicación de las medias para distintos meses y distintas variables se usó el coeficiente
de variación cuya formulación fue determinada precisamente para estudios de este tipo.
El rango tolerable que puede tener el coeficiente de variación para establecer que dos
muestras tienen características similares es entre 0 y 100 porciento, valores por encima
ponen en manifiesto que una dispersión excepcional en los datos (Molina & Rodrigo,
2010, pág. 13), en esos casos la media perdería su valor inferencial.
12.1 Metodología
12.1.1 Muestreo
Se realizó un muestreo de tres series para cada variable de estudio, esto para poder
evaluar las diferencias entre aplicar un modelo en una u otra variable, se presenta a
continuación las variables trabajadas y las estaciones con las que se trabajó en la Tabla
12-1, la numeración de las estaciones en la tabla sirve de guía para identificar su
localización en la Figura 12-1:
Tabla 12-1 Estaciones donde se determinó el coeficiente de variación a nivel mensual clasificadas por variables
hidrometeorológicas.
Evaporación Total Mensual:

1.1. Lakacota La Paz 3632 Frío
1.2 Comarapa Santa cruz 1614 Cálido
1.3 Coimata Tarija 2027 Templado
Humedad Relativa Media Mensual:

2.1. Magdalena Beni 141 Cálido
- 238 -
2.2. Potosí Aero. Potosí 4100 Frío
2.3. Yesera Norte Tarija 2200 Templado
Precipitación Total Mensual:

3.1. Ballivian La Paz 4020 Frío
3.2. Potolo Chuquisaca 3080 Frío
3.3. Irpa Chico La Paz 3830 Frío
Presión Media Mensual:

4.1. San Matias Santa Cruz 285 Cálido
4.2. Bermejo Aero. Tarija 385 Cálido
4.3. San Ramón Beni 139 Cálido
Temperatura Media Mensual:

5.1. Tinguipaya Potosí 3200 Frío
5.2. Cristal Mayu Cochabamba 517 Cálido
5.3.Guayaramerín Aero Beni 130 Cálido
- 239 -
Figura 12-1 Localización de estaciones empleadas para calcular el coeficiente de variación de las distintas variables a
nivel mensual e identificar en que variables podría ser viable el relleno de datos faltantes a partir de la media de los
datos mensuales observados.
12.1.2 Evaluación
Se calcula el coeficiente de variación mensual, para determinar si la variación respecto la
media de las observaciones es significativa como para afectar a la serie que se pretende
rellenar.
Para finalizar se pretende luego de haber terminado de evaluar los resultados obtenidos con
los distintos métodos aplicados, establecer una estructura más o menos general para
afrontar el problema del relleno de datos o la predicción de datos faltantes.
12.2 Resultados
12.2.1 Evaporación Total Mensual
- 240 -
% CV
120
100
80
60
40
20
0
ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC
Figura 12-2 Coeficiente de Variación a nivel mensual para la evaporación total en Laykacota.
Estación: Comarapa
% CV
20
15
10
0
Figura 12-3 Coeficiente de Variación a nivel mensual para la evaporación total en Comarapa.
Estación: Coimata
- 241 -
% CV
25
20
15
10
0
Figura 12-4 Coeficiente de Variación a nivel mensual para la evaporación total en Coimata.
Observando las Figuras Figura 12-2; Figura 12-3 y Figura 12-4; encontramos que la magnitud
del coeficiente de variación, para la variable Evaporación a nivel mensual es demasiado
elevada para inferir datos faltantes con un parámetro estadístico puntual como la media
mensual de los datos observados.
12.2.2 Humedad Relativa Media Mensual
Estación: Magdalena
% CV
12
10
8
6
4
2
0
Figura 12-5 Coeficiente de Variación a nivel mensual para la humedad relativa media en Magdalena.
- 242 -
Estación: Potosí Aeropuerto
% CV
35
30
25
20
15
10
5
0
Figura 12-6 Coeficiente de Variación a nivel mensual para la humedad relativa media en Potosí Aeropuerto.
Estación: Yesera Norte
% CV
20
15
10
0
Figura 12-7 Coeficiente de Variación a nivel mensual para la humedad relativa media en Yesera Norte.
de coeficiente de variación para la variable humedad relativa media a nivel mensual, es
demasiado elevada para inferir datos faltantes con un parámetro estadístico puntual como la
media mensual de los datos observados.
- 243 -
12.2.3 Precipitación Total Mensual
Estación: Ballivian
% CV
300
250
200
150
100
50
0
Figura 12-8 Coeficiente de Variación a nivel mensual para precipitación total en Ballivian.
Estación: Potolo
% CV
300
250
200
150
100
50
0
Figura 12-9 Coeficiente de Variación a nivel mensual para precipitación total en Potolo.
- 244 -
Estación: Irpa Chico
% CV
200
150
100
50
0
Figura 12-10 Coeficiente de Variación a nivel mensual para precipitación total en Irpa Chico.
del coeficiente de variación para la variable precipitación total a nivel mensual es
demasiado elevada para inferir datos faltantes con un parámetro estadístico puntual como la
media mensual de los datos observados.
12.2.4 Presión Atmosférica Media Mensual
Estación: San Matias
% CV
0.3
0.25
0.2
0.15
0.1
0.05
0
Figura 12-11 Coeficiente de Variación a nivel mensual para presión media en San Matias.
- 245 -
Estación: Bermejo Aeropuerto
% CV
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
Figura 12-12 Coeficiente de Variación a nivel mensual para presión media en Bermejo Aeropuerto.
Estación: San Ramón
% CV
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
Figura 12-13 Coeficiente de Variación a nivel mensual para presión media en San Ramón.
Observando las Figuras Figura 10-11; Figura 10-12 y Figura 10-13; encontramos que la
magnitud de coeficiente de variación para la variable presión atmosférica media a nivel
mensual es bajo y por lo tanto es posible inferir datos faltantes con un parámetro estadístico
puntual como la media mensual de los datos observados.
- 246 -
12.2.5 Temperatura Media Mensual
Estación: Tinguipaya
% CV
120
100
80
60
40
20
0
Figura 12-14 Coeficiente de Variación a nivel mensual para temperatura media en Tinguipaya.
Estación: Cristal Mayu
% CV
7
6
5
4
3
2
1
0
Figura 12-15 Coeficiente de Variación a nivel mensual para temperatura media en Cristal Mayu.
- 247 -
Estación: Guayaramerín Aeropuerto
% CV
200
150
100
50
0
Figura 12-16 Coeficiente de Variación a nivel mensual para temperatura media en Guayaramerín Aeropuerto.
Observando las Figuras Figura 12-14; Figura 12-15 y Figura 12-16; encontramos que la
magnitud del coeficiente de variación para la variable Temperatura media a nivel mensual,
es demasiado elevada para inferir datos faltantes con un parámetro estadístico puntual como
la media mensual de los datos observados.
12.3 Conclusión
Observando las Figuras desde Figura 12-2 hasta Figura 12-16; se percibe que el relleno de
datos a partir de media para algunos meses es posible, pero que entre abril y septiembre la
desviación en los datos es demasiado elevada e inhabilita completamente el criterio, para
los otros meses disminuye de manera considerable, pero aun así la inferencia por media
solo parece ser viable para la presión media mensual, para los meses en los que el
coeficiente de variación es menor, entre octubre y marzo, se podría generar estimadores que
dependen de la media y un ruido con las mismas características de la desviación de la serie,
es probable que esto nos brinde mejores resultados.
- 248 -
13 AGRUPACIÓN DE ESTACIONES DE MEDICIÓN
USANDO EL MÉTODO DE CLÚSTER JERÁRQUICO.
Durante todo el proceso de investigación hasta este capítulo asumimos dos criterios para
agrupar estaciones meteorológicas, uno de ellos era la cercanía espacial y otro el
parentesco entre el clima de las regiones donde se situaban las estaciones meteorológicas,
pero en un país de tan grande superficie con estaciones de medición de variables
hidrometeorológicas dispersas se hace necesario trabajar con un criterio más objetivo.
Por esta razón proponemos la aplicación de un método que es muy utilizado para la
agrupación de vectores de datos que presentan características similares, el método Cluster
estandarizado nos permitió determinar grupos de estaciones meteorológicas en lo extenso
de todo el departamento de Cochabamba, posteriormente escogiendo uno de los grupos se
realizó el relleno de datos con los software HEC-4, CHAC y la aplicación del código R en
huecos de series de datos.
La variable que consideramos para los rellenos fue la precipitación total mensual y la
caracterización de las estaciones fue en relación de su posición geográfica, altitud y
precipitación media anual, todas estas características son estandarizadas por el modelo para
que se determine los grupos óptimos a partir del cálculo de la distancia euclidiana mínima.
13.1 Metodología
13.1.1 Muestreo
Se determinó que se debería partir de estaciones que tuvieran al menos diez años de
medición para que así se tenga una base confiable para realizar los rellenos, los software
utilizados obtienen sus generadores a partir de series de datos mensuales de medición y
para que puedan realizar inferencias coherentes y confiables requieren un mínimo de
insumos que debería ser mayor al de los diez años, lamentablemente en el territorio
cochabambino una gran mayoría de las estaciones no cuenta con esa cantidad mínima y
tuvieron que ser descartadas, la localización de las estaciones utilizadas está representada
en la Figura 13-1, y la numeración de las estaciones corresponde al código de identificación
asignado en la Tabla 13-1.
- 249 -
Tabla 13-1 Caracterización de la estaciones con al menos 10 años de observaciones disponibles de precipitación total
mensual que están localizadas dentro del departamento de Cochabamba.
COD E LS LO A MPTA
E Latitud Sud Longitud Oeste Altura Media Precipitación Total
Estación [º] [º] [msnm] Anual [mm]
1 Anzaldo 17.68 65.93 3032.00 607.8
2 Arani 17.57 65.75 2767.00 455.7
3 Capinota 17.70 66.26 2406.00 602.4
4 Chipiriri 16.87 65.48 260.00 4886.3
Cochabamba
5 Aeropuerto 17.42 66.34 2548.00 546.9
6 Colomi 17.34 65.87 3309.00 685.1
7 Cristal Mayu 17.01 65.64 517.00 4313.1
8 La Jota (Chimore) 17.00 65.17 254.00 4218.4
9 La Tamborada 17.45 66.14 2597.00 583.8
10 Misicuni 17.09 66.33 3793.00 712.8
11 Mizque 17.94 65.34 2045.00 565.9
12 Pairumani 17.37 66.32 2600.00 670.9
13 Parotani 17.57 66.34 2493.00 710.1
14 Puerto Villarroel 16.84 64.79 195.00 2319.0
15 Sacabamba 17.80 65.80 3174.00 8667.0
16 Santivañez 17.57 66.25 2554.00 558.3
17 Tarata 17.61 66.02 2775.00 687.7
18 Tiraque 17.43 65.72 3304.00 614.7
- 250 -
Figura 13-1 Localización de todas las estaciones de medición en el departamento de Cochabamba con más de 10 años
de registros de precipitación.
13.1.2 Forma de Implementación

El método de agrupación de las estaciones se implementó en la región delimitada por el
departamento de Cochabamba para la variable para poder agrupar rellenos de usando los
software usados con anterioridad con mayor eficiencia y verificar que se dan buenos
resultados de una agrupación de estaciones para el relleno de una manera más sistemática.
Las variables que se consideraron determinantes en la caracterización de las estaciones y

para la definición de los grupos para realizar posteriormente el relleno de datos fueron las
siguientes:
 Latitud.
 Longitud.
 Altura sobre el nivel del mar.
 Media del total de precipitación anual.
- 251 -
13.1.3 Evaluación
Se realizó la evaluación seleccionando uno de los grupos generados y aplicando 3 software
usados para el relleno de datos de precipitación: HEC-4, CHAC y la aplicación de relleno
de datos en el código R, se determinó si la agrupación de datos por Clúster jerárquico era
efectiva en base a los errores relativos a la observación obtenidos eliminado datos en
intervalos diferentes de tiempo y si su influencia determinaba la eficiencia en el relleno de
cada software.
13.2 Resultados
Agrupación de estaciones
seleccionada para la
evaluación
Estación seleccionada
para el relleno.
Figura 13-2 Resultados de la Agrupación Cluster estandarizada que nos sugiere distintas agrupaciones de estaciones
para distintos niveles de tolerancia.
Tabla 13-2 Grupos de estaciones de precipitación en Cochabamba determinados por el método de agrupación Cluster
para una distancia euclidiana estandarizada de 2.5.
Grupo 1 Grupo 2 Grupo 3 Estaciones sueltas

Cochabamba Aero Anzaldo Chipiriri Misicuni
Pairumani Tarata Cristal Mayu Mizque
La Tamborada Arani La Jota Puerto Villarroel
Parotani Sacabamba
Santivañez
Capinota
Colomi
Tiraque
- 252 -
13.2.1 Evaluación del error relativo a la observación estación Sacabamba
Hasta 10% de
observaciones
rellenadas
0.6
0.5
0.4 CHAC
HEC - 4
0.3
App R Code
0.2
0.1
0
Quitando 1 Mes Quitando 3 Mes Quitando 6 Mes Quitando 12 Mes
para la variable Precipitación total mensual con los distintos modelos después de haber generado un grupo a partir
del método Cluster.
El grupo obtenido a partir de la agrupación Cluster, permite que el programa HEC-4 y la aplicación
en R tengan resultados satisfactorios para todos los distintos escenarios de relleno, por otra parte el
desempeño con CHAC no ha mejorado, además se observa que la magnitud de los errores se
incrementa a medida que el número de datos faltantes se incrementa.
13.3 Conclusión
Después de haber realizado el relleno podemos observar en los resultados presentados en la
Figura 13-3, que el software CHAC no mejora su desempeño en el relleno de huecos de
series de precipitación, por otro lado la aplicación de relleno de datos en el código R
cuando se ha generado grupos con la técnica del Clúster Jerárquico nos da resultados muy
buenos y de una exactitud similar obtenida por el software HEC-4 que parece funcionar
bastante bien a pesar de no trabajar con las mejores agrupaciones de datos como se observó
en las pruebas anteriores.
Las agrupaciones generadas por el Método Clúster optimizan los procesos de relleno de
datos para dos de las metodologías estudiadas, el método se puede considerar como un
criterio objetivo para la agrupación de datos por que genera los grupos a partir de las
variables cualitativas.
- 253 -
13.3.1 Recomendaciones
Si se consigue tener estaciones cercanas con un buen número de datos medidos (al menos
mayores a diez años) se sugiere utilizar la agrupación Clúster que optimizan los procesos
de relleno desarrollados con los distintos programas para la variable precipitación total
mensual.
- 254 -
14 ANÁLISIS PARA LA SIMULACIÓN ESTOCÁSTICA DEL
ÍNDICE DE OSCILACIÓN DEL SUR
Se busca encontrar un modelo matemático que sea capaz de representar el comportamiento

del Índice de Oscilación Sur, variable de especial relevancia debido a las teleconexiones
entre este fenómeno y sus perturbaciones en el clima de zonas que se encuentran muy
distantes.
Los datos de esta variable fueron medidos desde el año 1951, aunque se tiene registros
previos de su afección, sobre distintas regiones de la tierra en términos cualitativos, de
todas formas el presente trabajo usa solo la información cuantitativa que se encuentra
disponible.
14.1 Descripción del Fenómeno

El Ciclo ENOS es un fenómeno de oscilación entre una fase cálida (El Niño) y una fase fría
(la niña) que se manifiesta a través de un enfriamiento anormal de la temperatura en la
superficie del océano Pacífico ecuatorial central y oriental, estas variaciones de temperatura
alcanzan las costas de américa del sur y traen consigo alteraciones en los patrones
climáticos regulares, aunque sus efectos no se limitan a estas zonas, llegando a afectar a
regiones mucho más apartadas del globo, este ciclo se desarrolla en forma aperiódica y no
consecutiva, o sea puede ocurrir un niño seguido de otro y posteriormente después una
niña.
La Oscilación del Sur consiste en una fluctuación anual irregular a gran escala que refleja
un proceso de intercambio de masas en la atmosfera que se da entre Indonesia y la región
subtropical del Pacífico Sur, describe la variación de intensidad de los vientos alisios que
influyen directamente en los cambios de temperatura en el océano Pacífico.
El índice de Oscilación Sur es el índice operacional más usado para identificar las fases de
la Oscilación Sur, se determina a partir de la diferencia estandarizada entre las presiones
medias mensuales entre la región baja de Darwin (Pacífico Occidental) y la región alta de
Tahití (Pacífico Oriental-Central) y se suelen considerar como anomalías representativas
valores mayores a 0.5 ya sea negativos o positivos.
Cabe aclarar que no existe un solo IOS, sino 3 de los cuales derivan también otros índices,
los IOS varían en su formulación matemática y en el periodo de referencia para cuantificar
las anomalías (Díaz, 2008, págs. 87-89), particularmente trabajaremos con el IOS NOAA,
pero desarrollaremos conceptualmente los tres.
1. IOS NOAA: Utiliza una formula definida por el Centro de Predicción del Clima y el
Servicio Meteorológico de los Estados Unidos de América, ambos dependientes de
- 255 -
la institución NOAA (Administración Nacional del Océano y la Atmosfera) y es
usada por entidades en el Reino Unido y en Japón, variando simplemente su
periodo de referencia, el periodo de referencia con el que trabajamos es aquel
definido por el NOAA de los Estados Unidos.
El índice contiene una doble estandarización con el fin de garartizar que sea
considerado estacionario o sea que sus propiedades estadísticas se mantengan
constantes en el tiempo, tema que se discute durante el desarrollo del trabajo
posterior.
2. IOS Troup: Se calcula a partir de la fórmula de Troup, y es empleada en el Servicio
Meteorológico de Australia, para realizar la estandarización se emplea la
desviación estándar de la diferencia de las presiones.
3. IOS Trenberth: Se determina usando la fórmula que lleva el mismo nombre y es
empleada por la sección de Análisis Climático de la Universidad de Colorado en
Estados Unidos, se diferencia por que en lugar de usar la desviación estándar de las
series mensuales para la estandarización la realiza con la desviación estándar anual.
Formulación Del IOS NOAA
Ec. 14.1.1
Dónde:
Ec. 14.1.2
Es la presión estandarizada de un mes en Taití y en Darwin, Sref es la desviación estándar

mensual de la serie presión atmosférica a loa que pertenece en el periodo de referencia
1951/1980 que se determina de manera respectiva para cada lugar, es una desviación
estándar muestral.
Las fases del IOS son: Una negativa caracterizada por el descenso de la presión atmosférica
en el sector oriental del océano Pacífico (IOS negativos, El niño) y otra positiva donde la
presión atmosférica del mismo sector incrementa (IOS positivo, La Niña).
Es de gran importancia estudiar el ciclo o en su defecto el índice por que las consecuencias
socioeconómicas de las perturbaciones climáticas asociadas con la variabilidad del ciclo
ENOS tienen la posibilidad de ser catastróficas para algunas regiones del mundo.
- 256 -
14.2 Procedimiento y Resultados
La serie temporal de IOS desde 1951 hasta 2016 es la presentada en la Figura 14-1, se trata
de los valores suavizados de las observaciones mensuales de la variación de precipitación
entre dos estaciones una en Darwin y la otra en Tahití.
En el presente trabajo se buscara pronosticar el IOS para los 45 años posteriores al 2016,
siempre y cuando se consiga representar esta variable de manera adecuada.
Figura 14-1 Índice de Oscilación Sur entre 1950 y 2017.
La prueba de raíz unitaria indica que el proceso es estacionario en media, y un valor del
estadístico de Durbin-Watson cercano a 2 nos indica que el proceso es estacionario en
media por ser un proceso independiente, ya que la prueba de Durbin-Watson es
originalmente la prueba de independencia de las series.
Tabla 14.2.1: Resultados de la prueba de Raíz unitaria para la determinación de la estacionaridad de

la serie.
Tabla 14-1 Resultados de la prueba de Raíz unitaria para la determinación de la estacionaridad de la serie.
Null Hypothesis: INDICEOSCILACIONSUR has a unit root

Exogenous: Constant
Lag Length: 2 (Automatic - based on SIC, maxlag=20)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic -7.598530 0.0000

Test critical values: 1% level -3.438402
5% level -2.864984
10% level -2.568659
- 257 -
R-squared 0.259137 Mean dependent var 0.000380
Adjusted R-squared 0.256309 S.D. dependent var 0.807984
S.E. of regression 0.696786 Akaike info criterion 2.120372
Sum squared resid 381.6110 Schwarz criterion 2.144028
Log likelihood -833.5471 Hannan-Quinn criter. 2.129465
F-statistic 91.64168 Durbin-Watson stat 1.999659
Prob(F-statistic) 0.000000
Observado las funciones de auto correlación simple y parcial en la Figura 14-2 encontramos
que el proceso se considera estacionario en media porque ambas decaen rápidamente.
Figura 14-2 Funciones de autocorrelación simple y parcial con sus valores y niveles de significancia para el IOS.
La media no es constante en el tiempo, pero al parecer una cierta centralidad importante en

los datos, el proceso se puede considerar estacionario en media, por otro lado la volatilidad
de las observaciones no es uniforme, no parece haber razones para considerar que el
proceso sea estacionario en varianza.
Las transformaciones Box Cox y Logarítmica, fracasaron en el intento de estacionrización

en varianza, cuando consiguen estacionarizar algunos tramos desestacinarizan otros y así no
se logra la condición de estacionariedad en varianza.
- 258 -
No se puede aplicar un método estocástico de inferencia a un proceso no estacionario, por
otro lado se puede aplicar a las componentes del proceso si estas se consiguen
estacionarizar.
Se calculó el valor de los indices estacionales del modelo, aplicando la descomposición

multiplicativa de las componentes temporales.
Los índices estacionales superan en creces el 10% de variación estacional y esto indica que
la descomposición multiplicativa es la más pertinente para descomponer la serie en estudio,
por otro lado los índices muestran también que la variación en la volatilidad de la serie es
enorme, y siendo un proceso estacionario en media esto fue un problema difícil de afrontar
durante la modelación, ya que la fuerte tendencia central de la serie, no permitió modelar
esas volatilidades tan elevadas solamente usando modelos estocásticos.
Tabla 14-2 Valores de los Índices Estaciones para cada mes de la serie.
Índice
Periodo Estacional
Enero 497.16
Febrero 448.38
Marzo 151.57
Abril 316.41
Mayo -124.51
Junio -172.58
Julio -189.35
Agosto -116.05
Septiembre 60.06
Octubre -113.81
Noviembre 127.01
Diciembre 315.72
Las componentes resultantes que quedan luego de la descomposición multiplicativa son las
siguientes:
- 259 -
Figura 14-3 Gráfico 14.2.3: Componente cíclica del Índice de Oscilación Sur entre 1950 y 2017.
Luego de la separación de la componente estacional y la aleatoria de la cíclica dividiendo

los datos de la serie entre el promedio móvil de cada doce meses, se ve que la componente
cíclica representada en la Figura 14-3 también tiene una leve variación en su volatilidad, esta
variación se consigue reducir aplicando una transformación logarítmica a esta componente.
El resultado de la transformación logarítmica es el siguiente:
Figura 14-4 Logarítmico de la componente cíclica del Índice de Oscilación Sur entre 1950 y 2017.
La Trasformación que genera esta mejoría es la siguiente:
𝑌´𝑡 = log(𝑌𝑡 + 1)
Se aplica un modelo autor regresivo de media móvil en el logaritmo de la serie, se observa

que el modelo tiene una memoria bastante larga donde el periodo del ciclo esta entre 25 y
- 260 -
30 años, el modelo encontrado como se observa en la Figura 14-4 es capaz de reproducir las
propiedades estadísticas de la componente cíclica, sus coeficientes y estadísticos están
detallados en la Tabla 14.2.3, los coeficientes adquieren valores representativos y los
niveles de significancia son tolerables.
Tabla 14-3 Valores de los estadísticos para cada coeficiente del modelo que ajusta a la componente cíclica de la serie
con sus respectivos estadísticos y niveles de significancia.
Variable Coefficient Std. Error t-Statistic Prob.
AR(108) -0.210654 0.059387 -3.547147 0.0004

AR(180) 0.122128 0.029952 4.077421 0.0001
AR(192) -0.161502 0.033135 -4.874084 0.0000
AR(408) 0.115649 0.036088 3.204666 0.0014
AR(552) 0.656825 0.040330 16.28619 0.0000
SAR(12) 0.461198 0.041906 11.00544 0.0000
MA(24) -0.170655 0.042440 -4.021073 0.0001
MA(84) -0.296541 0.045655 -6.495221 0.0000
MA(108) 0.437065 0.105753 4.132874 0.0000
MA(432) 0.234678 0.061327 3.826667 0.0001
MA(240) -0.227970 0.050455 -4.518314 0.0000
SIGMASQ 0.226417 0.016883 13.41057 0.0000
R-squared 0.591544 Mean dependent var -0.087864

S.E. of regression 0.479479 Akaike info criterion 1.979943
Sum squared resid 179.3220 Schwarz criterion 2.050769
Log likelihood -772.0573 Hannan-Quinn criter. 2.007164
Durbin-Watson stat 0.166224
Un modelo autorregresivo de media móvil de memoria larga, donde todos los rezagos son
múltiplos de 12, esto significa que la correlación es elevada entre el pares de meses
distantes entre años, es curioso que un componente SAR(autorregresivo estacional), ajusta
de buena manera, esto quiere decir que a pesar de haber realizado la descomposición
estacional, esta no ha podido separar completamente la estacionalidad de la componente
cíclica, los niveles de significancia de los coeficientes autor regresivos, indican bondad de
ajuste, y el criterio de información de Akaike tabulado en la Tabla 14-3, es bastante bajo
corrobora el agotamiento de la información en la serie.
La Serie que nos queda luego de haber extraído la componente cíclica se encuentra
representada en la Figura 14-5 y esta debería tener al menos una componente estacional y
una aleatoria, esta serie es también conocida como razón media por medio móvil:
- 261 -
Figura 14-5 Serie resultante de la extracción de la componente cíclica del Índice de Oscilación Sur entre 1950 y 2017,
presenta la componente estacional y aleatoria para el mismo periodo.
Si volvemos a observar la Figura 14-5 encontramos que la serie es de nuevo estacionaria en

media, pero ahora podemos identificar de forma mucho más clara que el proceso original
no está estacionario en varianza y se confirmó que la serie es de una volatilidad diversa.
Se procedió entonces a separar la serie en sus componentes estacional y aleatoria, para

determinar la posibilidad de su modelación, la separación de la componente estacional de
la aleatoria se realiza dividiendo la razón r promedio móvil entre la razón promedio por
promedio móvil, que no es más que la media de todas las observaciones mensuales,
permitiendo separar la componente estacional de la aleatoria.
La componente estacional obtenida es la siguiente:
Figura 14-6 Componente estacional del Índice de Oscilación Sur entre 1950 y 2017.
- 262 -
Efectivamente se consigue separar la componente estacional la cual se encuentra
representada en la Figura 14-6 del proceso, y viendo su amplitud confirmamos que la
volatilidad de la serie entre intervalos anuales es bástate elevada, este es un proceso que
rápidamente se consiguió simular con un proceso autor regresivo de media móvil, los
coeficientes, estadísticos y niveles de significancia se encuentran en la Tabla 14-3.
Tabla 14-4 Valores de los estadísticos para cada coeficiente del modelo que ajusta a la componente estacional de la
serie con sus respectivos estadísticos y niveles de significancia.
Variable Coefficient Std. Error t-Statistic Prob.
AR(1) 0.415457 0.002459 168.9722 0.0000

AR(6) -0.710493 0.001660 -427.8931 0.0000
AR(18) 0.077615 0.000893 86.89756 0.0000
SAR(12) 1.000000 3.88E-13 2.57E+12 0.0000
MA(12) 0.196276 0.071260 2.754376 0.0060
MA(6) 0.228533 0.012813 17.83584 0.0000
SIGMASQ 1.25E-13 2.01E-14 6.211843 0.0000
R-squared 1.000000 Mean dependent var 1.000000

S.E. of regression 3.55E-07 Akaike info criterion -26.44093
Sum squared resid 9.87E-11 Schwarz criterion -26.39961
Log likelihood 10477.61 Hannan-Quinn criter. -26.42505
Durbin-Watson stat 1.259303
El modelo generado tiene buenos niveles de significancia, pero la información concerniente

a los datos no parece agotarse, esto se ve con claridad en el estadístico de Akaike
presentado en la Tabla 14-4, que es de magnitud elevada y solo nos quedó evaluar su
eficiencia de manera empírica durante la simulación.
La componente que nos quedaría es la aleatoria de la cual mostramos su grafica a

continuación:
- 263 -
Figura 14-7 Componente aleatoria del Índice de Oscilación Sur entre 1950 y 2017.
La gráfica nos muestra un auténtico proceso estocástico no estacionario en varianza, la

hipótesis de que el proceso simulado no era estacionario es confirmada al observar la Figura
14-7 en la cual hay un sinnúmero de volatilidades que están separadas en intervalos
interanuales, esta característica del proceso nos permitió resolver la dificultad de simular un
proceso no estacionario en varianza.
Es pertinente indicar que ningún proceso autoregresivo, de media móvil, diferenciado, o

transformado pudo simular un ruido tan particular.
Ante la dificultad de encontrar un modelo que simule la componente aleatoria del proceso
nos vimos obligados a recurrir al concepto de regresión para poder simular el ruido.
Planteamos encontrar una relación entre la componte cíclica y la componente aleatoria, si

bien son independientes del tiempo, podría existir una correlación entre ambas, el resultado
obtenido fue sorprendente, el Figura 14-8 nos muestra que si hay una tendencia
determinística que nos permita inferir una respecto a la otra, los datos parecen formar una
familia de hipérboles rotadas, y a medida que la magnitud de la componente cíclica decrece
la de la componente aleatoria se hace más grande:
- 264 -
Figura 14-8 Relación entre la componente cíclica y aleatoria del Índice de Oscilación Sur entre 1950 y 2017.
Se encontró que la componente aleatoria está relacionada con la de la componente cíclica,

y se podría determinar una función determinista que pueda simular dicho comportamiento,
ya sea una fusión exponencial trigonométrica o una hipérbole, pero nosotros proponemos
usar esta relación para generar ruido a partir de los ya existentes, entre pares de intervalos
anuales.
Los resultados del modelo, obtenidos para la componente cíclica se presentan en la Figura
14-9 y como se puede observar los ciclos con extensiones de varios años se reproducen de
manera bastante eficaz:
Figura 14-9 Extensión de la componente cíclica del Índice de Oscilación Sur entre 1950 y 2017 hasta 2060.
Los resultados del modelo, obtenidos para la componente estacional se presentan en la

Figura 14-10, se observa entonces que la forma de los ciclos estacionales interanuales no se
distorsiona y por lo tanto la modelación de esta componente es adecuada:
- 265 -
Figura 14-10 Extensión de la componente estacional del Índice de Oscilación Sur entre 1950 y 2017 hasta 2060.
Los resultados del modelo obtenido para la componente aleatoria se presentan en la Figura
14-11, como se observa el ruido era bástate difícil de simular por que presentaba diferentes
tipos de volatilidad pero la relación entre las componentes aleatoria y cíclica permitió
generar un ruido que mantenga esas volatilidades en la serie generada:
Figura 14-11 Extensión de la componente aleatoria del Índice de Oscilación Sur entre 1950 y 2017 hasta 2060.
Los resultados son claros los modelos generados reproducen las propiedades estadísticas de
las componentes originales, para verificar de otra manera regeneraremos la serie
componente a componente, este proceso de regeneración se encuentra representado en las
Figuras Figura 14-12 y Figura 14-13.
- 266 -
14.3 Resultados de la simulación de las componentes Cíclica y Estacional
Se procede posteriormente a reconstituir al serie componente a componente, al observar la
Figura 14-12, encontramos que la combinación entre la componente cálcica y estacional
generadas por la simulación tiene características similares a esta componente de los datos
observados y por lo tanto se procede con la reconstitución.
Componente Estacional.
14.4 Resultados de la simulación de la Serie IOS = Componente Cíclica, Estacional y

Aleatoria
Al juntar las tres componentes obtenidas a partir de la situación obtuvimos los resultados
presentados en la Figura 14-13, como se observa la modelación subestima las oscilaciones
negativas, pero parece simular bien a las oscilaciones positivas, tanto en frecuencia de
eventos extremos como en su centralidad.
- 267 -
Componente Estacional + Componente Aleatoria.
Se logró valores sintéticos del Índice de Oscilación Sur, usando técnicas de tratamiento de
series temporales y estadística inferencial de manera que las predicciones mantienen las
propiedades estadísticas de la serie original, aspecto que se observa en la Figura 14-13.
Independientemente de cual sea la serie temporal parece que los modelos autorregresivos
de media móvil son buenos para simular las componentes cíclica y estacional como se
observa en las Figuras Figura 14-9 y Figura 14-10, por otro lado se encontró una tendencia
determinística entre la componente aleatoria y la cíclica que de no haber sido tan compleja
se podría haber simulado con algún método regresivo, aunque el procedimiento usado no
dista mucho de ello, este trabajo puede servir de ejemplo, para quienes desean simular
series no estacionarias, usando todos los modelos que tengan a su disposición y
combinándolos de manera coherente.
Para verificar empíricamente la eficiencia de la metodología se eliminan los últimos 10

años de observación y se realiza una simulación de los mismos, los resultados se presentan
de manera en la Figura 14-14:
- 268 -
Figura 14-14 Contraste Empírico para el periodo comprendido entre Enero de 2007 y Diciembre de 2017.
14.5 Conclusión
El modelo reproduce los eventos niño y niña pero no con exactamente las mismas
intensidades de las mediciones, esto puede ser debido a que durante el contraste excluimos
10 años de datos de los 65 que se tenía registrados, y un solo ciclo de IOS es de casi 50
años por lo tanto se perdió bástate información para realizar dicha comprobación empírica.
Figura 14-15 Componente cíclica de los datos medidos del IOS.
Como se observa en la Figura 14-15, eso 10 años quitados para evaluar el desempeño del modelo
parecen determinantes a la hora de generar inferencias a corto o largo plazo del índice mencionado.
- 269 -
15 CONCLUSIONES GENERALES
15.1 Respecto al relleno de datos a nivel diario
El método de desagregación de valores mensuales a diarios, es más eficiente para rellenar

la precipitación en comparación con los generadores estocásticos de clima. El programa
HEC-4 tiene un rendimiento mucho mejor que CHAC en la época húmeda. En la época
seca del año parece conveniente usar CHAC porque tiene mejores resultados en los climas
templado y cálido.
Los generadores estocásticos de clima, son bastante deficientes a la hora de reproducir

valores diarios de precipitación, por el contrario tienen una exactitud admisible a la hora de
rellenar datos de temperatura mínima y máxima.
Los resultados mostrados por CLIGEN nos muestran una relación entre la magnitud del
error cometido durante el relleno y el clima de la región para la época húmeda, mostrando
mayor error a medida que el clima se hace más frígido, en CLIMGEN no se observa de
manera clara ninguna relación, para la época seca, los programas rellenan mejor los valores
diarios de temperatura máxima y minina en el caso del clima templado.
El relleno de datos en intervalos mensuales, de las variables evaporación media, humedad

relativa media y presión atmosférica media, es viable usando los modelos autorregresivos
integrados de media móvil, produciendo valores con características estadísticas similares y
con un error dentro de rangos tolerables.
La inferencia de observaciones faltantes en intervalos mensuales a través del promedio no

parece viable más que para la variable presión atmosférica media y solo para el periodo
comprendido entre octubre y marzo, para las demás variables la media no es lo
suficientemente representativa para realizar un relleno.
15.2 Control de calidad de datos durante los rellenos
 Si una gran parte de los datos observados, presentan fallas durante el proceso de
medición afectaran, directamente a las propiedades estadísticas de la serie, por lo
que un control de calidad del proceso de medición es imprescindible.
 La prueba de Grubbs & Beck es bastante buena construyendo umbrales que separan
datos anómalos de una serie temporal, siempre y cuando esta tenga una tendencia
central definida.
15.3 Agrupación de estaciones para efectuar rellenos de datos
- 270 -
 El método Cluster de agrupación de conjuntos de datos es un método objetivo, que
trabaja con variables cuantitativas que permite definir grupos óptimos para
posteriormente aplicar métodos para el relleno de datos faltantes.
15.4 Rellenos e inferencias utilizando los modelos ARIMA
 La trasformación Box Cox es de extrema utilidad durante el proceso de

estacionarización en varianza de series de datos con dos volatilidades diferentes.
 Para una serie con tres o más volatilidades diferentes la transformación logarítmica
puede conseguir estacionarizarla en varianza.
 Los modelos estocásticos ARIMA aplicados a las series temporales pueden simular
bien, variables que pueden reducirse a estacionarias mientras no tengan demasiadas
variaciones de volatilidad.
 Los modelos estocásticos ARIMA aplicados a las series temporales pueden
aplicarse tanto en el relleno de datos como en la predicción a corto plazo de
variables hidrometeorológicas a nivel mensual.
 La mayoría de los procesos estocásticos hidrometeorológicos no mantienen sus
condiciones de estacionariedad a lo largo del tiempo, solo algunos procesos se
pueden considerar genuinamente estacionarios, pero afortunadamente los métodos
de estacionarización parecen permitir llegar a esta condición y realizar inferencias.
 Las condiciones de estacionariedad de una serie temporal, si bien son definibles e
identificables, dependen principalmente de la extensión total del registro de estudio
es por esta razón que las predicciones solo se pueden hacer a corto plazo, en
relación a la extensión total de la serie de datos.
 Los modelos ARIMA son útiles, hasta que se nos presentan series de datos
irreducibles a las condiciones de estacionariedad, en este caso se hace viable la
aplicación de los principios de separación de series temporales, en componentes
para poder simular cada una de ellas de manera independiente.
 En algunos casos algunas componentes de las series temporales, luego de haber sido
separadas, pueden guardar una relación determinística que puede ser simulada,
permitiendo generar valores de una componente que aparentemente era aleatoria.
15.5 Rellenos e inferencias utilizando programas computacionales

especializados
 El software de relleno de datos HEC-4, produce resultados mejores que CHAC para
la época húmeda del año, durante el relleno de datos a través de la desagregación
mensual diaria a partir de estaciones vecinas con elevada correlación a nivel
- 271 -
mensual para la época húmeda del año, para la época seca el desempeño de ambos
es similar y no existe discrepancias entre usar uno u otro.
 El desempeño de los software HEC-4 y CHAC, se ve afectado por la cantidad de
datos que se pretende rellenar, para la variable precipitación total mensual, mientras
más datos se rellena se produce un incremento de la media de los errores.
 Si se rellena dos series con la misma cantidad de datos faltantes, en una con datos
consecutivos y en otra de datos aleatoriamente distribuidos se produce mayor error
cuando los datos son consecutivos, para ambos software HEC-4 y CHAC, esta
característica no se percibe para el relleno de datos durante la época seca ya que
existe una gran cantidad de valores nulos.
 Los software de relleno de datos HEC-4 y CHAC durante el proceso de
desagregación mensual –diaria tienen mejores resultados con estaciones de las
regiones del altiplano y los valles, porque las estaciones vecinas a la estación que se
desea rellenar son más próximas y con mayor correlación.
 Los generadores estocásticos de clima producen rellenos de datos diarios de
precipitación deficientes, en contraste con la metodología de desagregación
mensual diaria, a partir de estaciones vecinas con correlación elevada a nivel
mensual.
 Los generadores estocásticos de clima CLIGEN y CLIMGEN son bastante
eficientes, para inferir y rellenar vacíos correspondientes a las variables temperatura
máxima y mínima a nivel diario.
 El resultado de los rellenos a nivel diario de los generadores estocásticos de clima
para las variables temperatura máxima y mínima no depende del orden o
aleatoriedad de los datos faltantes, pero sí de la cantidad de datos por rellenar.
 Los modelos estocásticos ARIMA son bastante eficientes en el relleno de datos de
series de variables de corta extensión, produciendo errores relativos mínimos en
relación a la poca cantidad de datos que necesitan para realizar sus inferencias.
 Comparando los rellenos generados entre los modelos ARIMA, el software HEC-4
y la aplicación de relleno de datos en el código R se determinó que el más eficiente
es HEC-4 pero que los modelos ARIMA generan resultados similares con una
cantidad de datos menor.
 La inferencia de datos faltantes, a través de la media de las observaciones mensuales
de las variables hidrometeorológicas, parece ser deficiente excepto, para una
variable con muy poca volatilidad como la presión atmosférica.
 Para la variable Precipitación Total a nivel mensual los resultados obtenidos con los
generadores estocásticos de clima también ese encuentra dentro de rangos tolerables de
error relativo y parecen ser una buena alternativa a los programas que trabajan a partir de la
correlación entre estaciones vecinas, si es que no se cuenta con estaciones cercanas a
aquella que se desea rellenar y se cuenta con suficientes datos.
- 272 -
15.6 Esquema Conclusivo
Esquematizamos las conclusiones anteriores para poder aplicar rellenos de datos y mensual
a partir de las diferentes herramientas computacionales estudiadas:
Metodología
Variable HEC-4 CHAC CLIGEN CLIMGEN WGEN ARIMA
Buen
desempeño Desempeño Desempeño
Desempeño
cuando los limitado, deficiente debido
Errores relativos regular,
datos presenta a que las series de
demasiado elevados, los errores
faltantes no resultados precipitación a
Precipitación rellenos no dependen de relativos
son similares a nivel diario tienen
Total la cantidad de datos menores a
consecutivos los de HEC- demasiados
faltantes consecutivos los de
durante la 4 durante la valores nulos y no
que exista. CLIGEN Y
época seca y época seca son procesos
CLIMGEN.
húmeda del del año. estacionarios.
año.
Buen desempeño, errores
Deficiente,
relativos bajos, la
magnitud
magnitud de los errores
Temperatura de errores
no depende ni de la
Máxima relativos
cantidad de datos
demasiado
faltantes ni de si estos
elevada.
son o no consecutivos.
No Evaluado. No Evaluado.
Buen desempeño, errores
Deficiente,
relativos bajos, la
magnitud
magnitud de los errores
Temperatura de errores
no depende ni de la
Mínima relativos
cantidad de datos
demasiado
faltantes ni de si estos
elevada.
son o no consecutivos.
Figura 15-1 Resumen de aplicaciones posibles para el relleno de datos a nivel diario.
Variable HEC-4 APP R-CODE ARIMA CHAC CLIGEN CLIMGEN WGEN

Buenos
Buen Desempeño
resultados en
desempeño, moderado, es
general, Desempeño
en tanto se prometedor si se Buen desempeño, errores
mantiene su moderado, a
tiene pretende relativos bajos, útiles si se
eficiencia medida que las
registros de trabajar con tiene información adicional
Precipitación también estaciones
estaciones estaciones que de temperatura máxima y
Total trabajando con vecinas se van
de medición se encuentran mínima en lugar de series de
estaciones alejando su
con buena alejadas de otras precipitación de estaciones
alejadas que eficiencia va
correlación a y presentan vecinas.
tienen buena decayendo.
nivel registros de
correlación a
mensual. corta extensión.
nivel mensual.
- 273 -
Metodología
Variable
HEC-4 APP R-CODE ARIMA
Bajo Buen
desempeño, desempeño,
Desempeño óptimo, la errores errores
distancia entre estaciones relativos relativos
no parece influir, es obtenidos bajos, es
Evaporación determinante solo la durante el aconsejable
Total correlación a nivel relleno de cuando se
mensual. magnitud tiene poca
demasiado información
elevada. disponible.
Desempeño
superior, las
series aunque
no sean
procesos
Errores
Buen desempeño, errores estacionarios,
relativos
relativos bajos a pesar de pero
demasiado
que ciertas estaciones se reducibles a
elevados, no es
encuentren bastante series
aconsejable su
Magnitud de alejadas. estacionarias
aplicación.
Velocidad de por los
Viento Media métodos
propuestos
en al
metodología.
Buen
desempeño,
Desempeño óptimo, la Desempeño errores
distancia entre estaciones regular, se ve relativos
Cantidad de no parece influir, es afectado por la bajos, es
Horas de Sol determinante solo la distancia entre aconsejable
por día correlación a nivel estaciones cuando se
mensual. vecinas. tiene poca
información
disponible.
Buen
desempeño,
errores
relativos
bajos, es
No Evaluado.
Temperatura aconsejable
Media cuando se
tiene poca
información
disponible.
- 274 -
Buen
desempeño,
debido a que
Presión el proceso ese
Atmosférica estacionario,
Media o reducible a
un proceso
estacionario.
Buen
desempeño,
debido a que
Humedad el proceso ese
Relativa estacionario,
o reducible a
un proceso
estacionario.
Figura 15-2 Resumen de aplicaciones posibles para el relleno de datos a nivel mensual.
- 275 -
16 RECOMENDACIONES
 La cuestión de la calidad de datos, durante el proceso de medición de las variables

hidrometeoro lógicas debía ser mucho más estricta para obtener datos de mejor
calidad.
 Es recomendable que se evalúen otros generadores estocásticos de clima, para ver si
los resultados obtenidos son solo propios de los programas utilizados, o se
manifiestan también en los otros generadores.
 Evaluar más afondo la aplicación de los modelos ARIMA para las mismas
variables pero en los casos extremos (máximos y mínimos).
 Trabajar siempre tratando de satisfacer las condiciones de información mínima
necesaria para realizar las inferencias en cada modelo o programa aplicado.
 No limitarse a tomar decisiones a partir de los niveles de significancia de los
estadísticos encontrados durante las inferencias, sino también contrastar los
resultados de las mismas con los hechos empíricos y pruebas que podamos realizar
durante la prefactibilidad de nuestros proyectos.
 Para posteriores estudios se debería procurar que el número de datos extraídos para
la situación no dependa solo de los escenarios planteados, sino también de que
represente un porcentaje más indicado, superior al 10 % para suavizar la influencia
de los valores extremos que se puedan obtener durante la simulación.
 Respecto a los programas empleados que generan observaciones a partir de la
generación de números aleatorios, el numero pruebas realizadas para ser
conclusivos es limitado y en posteriores estudios debería realizarse pruebas con
cientas o miles de corridas, en este caso, se realizó de la forma con el fin de
realizar una comparación más precisas entre la eficiencia de los modelos igualando
el número de pruebas para que ninguno tenga ventajas sobre los demás.
 La aplicación de los modelos ARIMA para la simulación de IOS nos sugiere que se
podrían usar un registro más completo para la misma variable con el fin de obtener
mejores resultados.
 Determinando el desempeño de los diferentes modelos y programas empleados se
encuentra que en la mayoría de los casos el programa HEC-4 es bastante eficiente a
pesar de las fuertes limitaciones con las que cuenta, por lo tanto se recomienda
reprogramarlo en los actuales leguajes de programación, como es el caso del
Código R.
- 276 -
17 BIBLIOGRAFIA
Agung, I. g. (2009). Time Series Data Analysis using Eviews.
Álvarez, F. (2006). Variables Aleatorias .
Castaño, E. (2007). Reconstrucción de series de Tiempo.
Castaño, E. (2015). Series de Tiempo de Memoria Larga, Identificación y Aplicaciones.
CEDEX. (2013). CHAC Cálculo hidrometeorológico de aportes y crecidas.
Díaz, J. M. (2008). El ABC de los Índices usados en al identificación y definición

cuantitativa de El Niño - oscimación del sur (ENSO).
Esparza, C. (2007). Series Temporales.
Esquivel, G., Cerrano, J., Sánchez, I., Lopez, A., & Gutierrez, O. (2015). Validación del
Modelo CLIMGEN en las estaciones de variables de clima ante escenarios de datos
faltantes con fines de modelación de procesos.
Fernandez, A. (2014). Análisis de Series de Tiempo.
Franzke, C. L., O’Kane, T. J., Berner, J., Williams, P. D., & Lucarini, V. (2014). Stochastic
Climate Theory and Modelling.
Franzke, C., O’Kane, T., Berner, J., Williams, P., & Lucarini, V. (2014). Stochastic
Climate Theory and Modelling.
Fundacíon Española para la ciencia y la Tecnología. (2004). Meteorología y Climatología.
Galbiati Riesco, J. (2012). Correlacion y regresión .
García, F. P. (2010). Modelación Hidrológica Estocástica: Desarrollo de un modelo de

generación sintética de Series Temporales .
Grupo Intergubernamental de expertos sobre el cambio climático. (2014). Mitigación del

cambio climático, Resumen para responsables de políticas.
Hagsand, O. (2014). CLIgen Manual.
IHS Global Inc. (2015). EViews 8 User’s Guide II.

Internacional Journey of Good Concience. (2012). Métodos No Paramétricos de uso
Común .
Kaenel, M., & Depsky, N. (2016). Filling Missing Data in Climatological Time-Series. 2.
Kirkut, A. C., Muños, E., & CarlosQuirós, J. (2002). Aspectos Conceptuales sobre Series
Temporales.
Kuna, H. D. (2014). Procedimiento para la identificación de Datos Anómalos.
Liu, L.-M., & Hadak, G. B. (1992). Forecasting and Time Series Analysis using SCA
STATISTICAL SYSTEM.
López, E. M. (2008). Regresión Múltiple.
Martinez, S. F. (1993). La Probabilidad Y la Causalidad.
Mauricio, J. A. (2007). Introducción al Análisis de Series Temporales .
Miguel Fernández, A. V. (1997). La Utilización de Modelos en Hidrología .
Molina, G., & Rodrigo, M. (2010). Estadistica descriptiva- Medidas de Dispersión.
Monsalve, G. (1999). Hidrología en la Ingenieria.
Montes, F. (2007). Procesos Estocásticos para Ingenieros: Teoría y Aplicaciones.
Moral, J. A. (2007). Análisis de Series Temporales.
NCSS Statistical Software. (2016). The Box-Jenkins Method.
Nelson, R. (2002). ClimGen - Climatic Data Generator User's Manual.
Nicks, A., Jane, L., & Gander, G. (1995). WEPP Model Documentation Chapter 2
WEATHER GENERATOR.
Peña, D., & Sanchez, I. (2012). El Analisis de Series Temporales.
Perez, G. (2015). Manual de Hidrología Aplicada.
Peters, N. E. (2011). Hydrplogyc Processes.
Polhemus, N. W. (2006). Transformaciones Box-Cox.
Posadas, A. M. (2003). Determinación de Errores y Tratam,iento de datos.
Programa de las Naciones Unidas para el Desarrollo. (2013). Tras las huellas del Cambio
Climático.
Richardson, C., & Wright, D. (1984). Variables WGEN: A Model for Generating Daily
Weather.
Rivera, R. D. (2008). Estimación estadística de valores falatantes en series históricas de

lluvia.
Rosa, E. d., & Blázquez, R. (n.d.). Procesos Estocásticos en la Ingeniería Civil.
Ruiz, E. (2015). Especificación, estimación y validación de Modelos ARIMa.
S.Izquierdo, J. P. (2006). Predicción de Procesos ARMA mediante modelos autorregresivos

y en el espacio de estados.
Sáenz, G. M. (1999). Hidrología en la ingenieria.
Salinas, P. J. (2012). Metodología de la Investigación Científica.
Suay, F. M. (2007). Procesos estocásticos para ingenieros: Teoría y aplicaciones.
US Army Corps of Engineers. (1971). HEC-4 Monthly Streamflow Simulation, User´s

Manual.
Valverde, K., Salas, M., & Solano, Q. (2002). Aspectos Conceptuales sobre Series de
Tiempo.
Vasquez, C. L. (2014). Estadística Aplicada.
Vilar, J. M. (1991). Estimación no paramétrica de la Función de Distribución.
Villavicencio, J. (2011). Introducción a las Series de Tempo.
Villazón, & Vallejos. (n.d.). Application of the WetSpa model to the Taquiña catchment
with low quality data, Cochabamba, Bolivia. 2007.
Villazón, M., & Medrano, S. C. (2015). Relleno de datos faltantes de precipitación para su
aplicación en modelos de simulación hidroloógica. Caso de Estudio: pilcomayo-
Bolivia.
Villazon, M., & Willems, P. (2010). Evaluation of Hourly Disaccumulation of

Precipitation data for Rainfall-runoff modeling.
Villazon, Vásquez, & Montenegro. (2012). Análisis de Variabilidad Climática y efectos de

Niño y Niña sobre la disponibilidad esperada de aguas en las principales ciudades
de Bolivia.
Water Resource Council. (1981). Guía de prácticas hidrológicas.

Webster, A. (2001). Estadística aplicada a los negocios y la economía.
Webster, A. (2001). Estadística Aplicada a los Negocios y la economía.

Análisis de Modelos Estadísticos y Estocásticos Aplicados A La Predicción y Completado de Datos Faltantes de Series Hidrometeorológicas Relevantes para El Diseño Hidráulico e Hidrológico.

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Análisis de Modelos Estadísticos y Estocásticos Aplicados A La Predicción y Completado de Datos Faltantes de Series Hidrometeorológicas Relevantes para El Diseño Hidráulico e Hidrológico.

Enviado por

Direitos autorais:

Formatos disponíveis

UNIVERSIDAD MAYOR DE SAN SIMÓN

FACULTAD DE CIENCIAS Y TECNOLOGÍA

ANÁLISIS DE MODELOS ESTADÍSTICOS Y ESTOCÁSTICOS

Proyecto de grado, Presentado para optar al Diploma académico de

Licenciatura en Ingeniería Civil.

Presentado por: MARTÍN IGNACIO ESCOBAR CABRERA.

Tutor: Ing. Msc. Roberto Méndez Torrico.

A mis padres Hernán Antonio Escobar Gómez Y Elva Ruth Cabrera

De manera más racional y menos sentimentalmente, debo dedicar

A los docentes que contribuyeron en la construcción de este trabajo,

El presente trabajo pretende afrontar un tema que si bien no es

La búsqueda es realizada aplicando diferentes métodos estadísticos y estocásticos, al

Las series climatológicas usadas, surgen de la red de instrumentos de medición que

Lo innovador del presente trabajo es la aplicación de modelos estocásticos en el relleno de

Uno de los problemas más comunes, en el momento en el que se ejecuta un estudio

 El periodo de registros es muy pequeño y no es representativo según los postulados

Ante estas consideraciones, contar con distintas técnicas de inferencia, completado y

Las estaciones meteorológicas en Bolivia, presentan información climatológica escasa, en

2.4 LIMITACIONES DEL ESTUDIO

Se ha usado programas que a pesar de entender su funcionamiento, no han sido realizados

El relleno anual no se contempla porque se puede derivar fácilmente de completados

La evaluación de los modelos se realizó usando como indicador el error, calculado en

3.1 Objetivo General

3.2 Objetivos Específicos

Se tomó conjuntos de datos de distintas estaciones dentro del territorio Boliviano, su

4.2 Determinación previa de anomalías en los datos

4.3 Proceso experimental

Se determinó escenarios hipotéticos de relleno, usando intervalos diarios y/o mensuales.

Se suprimió intencionalmente intervalos de mediciones con el fin de realizar rellenos y

Media del cuadrado de los errores relativos a la observación:

𝐷𝑜𝑛𝑑𝑒: 𝐼 = 𝑉𝑎𝑙𝑜𝑟 𝑖𝑛𝑓𝑒𝑟𝑖𝑑𝑜 𝑦 𝑂 = 𝑉𝑎𝑙𝑜𝑟 𝑂𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜

5.1 Fenómenos Meteorológicos

Las dificultades para producir modelos matemáticos, que representen el comportamiento y

 La variedad de escalas en la que estos se presentan; el comportamiento

5.2 Variables básicas y relevantes para el Diseño Hidrológico e

5.2.4 Presión atmosférica

5.2.5 Humedad Relativa

5.2.6 Velocidad del Viento

5.2.7 Horas de Sol por día

5.3 Términos y Conceptos básicos usados en el estudio

Un problema inacabable en la estadística y la estocástica y que comparten con otras áreas

5.3.8 Error Muestral

5.4 Descripción y formulación de los parámetros y estadísticos

5.4.1.1 Medidas de tendencia central

Su posición en una muestra ordenada de menor a mayor es:

𝑀𝐺 = 𝑛√𝑥1 ∗ 𝑥2 ∗ 𝑥3 ∗ 𝑥4 … … … .∗ 𝑥 𝐸𝑐. 5.4.4

5.4.1.2 Medidas de dispersión

𝑅𝑔 = 𝑥𝑚𝑎𝑥 −𝑥𝑚𝑖𝑛 𝐸𝑐. 5.4.5

5.4.2 Definición de Clase

5.5 Modelos Probabilísticos

5.5.1 Representación de los datos muéstrales

5.5.2 Distribución de Probabilidad

5.5.3 Otros Parámetros Estadísticos de Relevancia

5.5.3.3 Coeficiente de Variación

5.5.4 Modelos Regresivos: Regresión Lineal Y Regresión No Lineal

5.5.4.1 Regresión simple y Correlación

1. Variable independiente (Y)

𝑌 = 𝑓(𝑥) 𝐸𝑐. 5.5.6

El definir que variable es dependiente y cual independiente, depende de cuál de las 2 es de

5.5.4.2 Variable Dependiente

5.5.4.3 Variable Independiente

5.5.4.4 Identificación de la tendencia

5.5.4.5 Relación lineal