Curso POES - Geoestadística y Redes Neuronales - RA

Geoestadstica
GERENCIA GENERAL DE FORMACIN FAJA
Prefacio
Ser la Gerencia General creada por la Direccin Ejecutiva de Produccin Faja de Petrleos de Venezuela, S.A (PDVSA), pone en
nuestras manos el reto de formar tcnicamente a los hombres y mujeres de la Industria Petrolera que llevan a cabo los procesos
medulares del negocio asociado a la cadena de valor, esto cobra ms sentido, cuando visualizamos esta accin bajo los
preceptos humanistas y socialistas impartidos y divulgados por el Comandante Eterno Hugo Chvez y orgullosamente podemos
decir que, al ser su Legado seguimos las lneas trazadas por nuestro mximo Lder.
Siendo as, la responsabilidad se vuelve exponencialmente determinante, porque se trata del proceso de construir la Soberana
del Conocimiento dentro de Petrleos de Venezuela, S.A, enmarcado en el Socialismo y tomando como modelo la Gerencia
del Conocimiento. Este concepto es la carta de navegacin de los Programas de Formacin que viene aplicando y diseando la
Gerencia General de Formacin Faja (GGFF).
La GGFF tiene entre sus acciones estratgicas los procesos de socializacin del conocimiento, sumado al fortalecimiento
sociocultural, comunicacin tcnica, crecimiento personal, destacando la formacin sociopoltica. Ciertamente, lo que se busca
con este proceso continuo e integrado es internalizar en las trabajadoras y trabajadores petroleros el papel protagnico que
tienen, para lograr la revolucin intelectual dentro y fuera de la frontera de nuestro pas.
La misin de la Gerencia General de Formacin Faja Petrolfera del Orinoco Hugo Chvez es promover, ejecutar y garantizar la
formacin Tcnica integral especializada de los trabajadores en el rea Tcnico Artesanal y Profesional de los procesos
medulares de la Faja Petrolfera del Orinoco Hugo Chvez Fras, en concordancia con el Plan de la Patria, los lineamientos de
PDVSA y las necesidades de las organizaciones que conforman la Direccin Ejecutiva de Produccin de Faja; brindando
programas de formacin de excelencia, inclusivos, participativos y equitativos, orientados a mejorar la productividad y eficiencia.
Nuestra actividad es contagiosa y suma voluntades, porque entendemos que de la formacin profesional y artesanal depende el
xito del Plan Siembra Petrolera, en este sentido hemos dado una sobremarcha a nuevos procesos para captar, transformar,
procesar, usar, utilizar, divulgar, medir y registrar todos los recursos intelectuales, que a partir de este momento se vuelven
protagnicos para PDVSA.
Los Manuales son los productos tangibles de ese potencial de saberes, que sern las evidencias histricas de la maduracin que
significa registrar cada transferencia de conocimiento de los hombres y mujeres de la Nueva PDVSA.
Evidentemente, Tu conocimiento es nuestra mayor reserva, este es el horizonte que tenemos: lograr la formacin de
hombres y mujeres especialistas del mundo petrolero con conocimientos plenos, sustentados, validados, ejemplo para todas las
latitudes del globo terrqueo y con comprobada experiencia.
Instructor: Ing. Ricardo Ambrosio.

POES INTERNATIONAL LTD
El presente material ha sido compilado por el instructor con propsitos didcticos y est en proceso de
continua revisin.
3
Informacin de control
Identificacin
Geoestadstica Aplicada a la Industria Petrolera.
Creacin, revisin y
aprobacin
Responsable
Confidencialidad
Fecha
Elaboracin
Ricardo Ambrosio
Septiembre 2015
Revisin
Jos Gonzalez Aray
Septiembre del 2015
Aprobacin
Jos Gregorio Hurtado--
Septiembre del 2015
Firma
Los contenidos del Manual pertenecen a la Gerencia General de

Formacin Faja y se permite la reproduccin total o parcial de lo
documento solo para fines de estudios y de consulta atinente a la
Estratigrafa y sedimentologa propias de la Faja Petrolfera del
Orinoco.
Sobre el manual
Objetivo
Proveer al participante de una comprensin slida de los conceptos y mtodos bsicos de la

geoestadstica. Presentar los conceptos estadsticos que favorecen la correcta interpretacin y
aplicacin de los mtodos geoestadsticos elementales. El participante podr comprender la
importancia de la aplicacin de los mtodos geoestadsticos y su papel en el modelado de
yacimientos.
Alcance
Despus de este curso, el participante estar familiarizado con los conceptos de Estadstica
y Geoestadstica necesarios para aprovechar las herramientas bsicas de modelado
geoestadstico disponibles en los programas comerciales de modelado de yacimientos. El curso
no contempla adiestramiento especializado en el uso de dichos programas.
Audiencia
Dirigido a cualquier profesional del rea de petrleo o ciencias de la tierra que requiera
entender los mtodos bsicos de la geoestadstica y su papel en el modelado de yacimientos.
Recomendaciones
El manual ser utilizado como gua a lo largo del desarrollo del programa, es conveniente
que las secciones vistas cada da sean revisadas antes de la siguiente sesin. Posteriormente
el material puede ser utilizado como referencia para tpicos especficos a medida que las
actividades del participante lo requieran.
Convenciones
tipogrficas
En este manual las ecuaciones se presentan en letras cursiva.

La informacin destacada se presenta en tipo negrilla dentro de su respectivo contexto.
Este icono
Le ayuda a identificar
Informacin de destacada importancia dentro del contenido.
Puntos de especial inters sobre el tema en desarrollo.
Puntos de especial inters dentro de un tpico especfico del tema.

Informacin complementaria al tema en desarrollo.
Tabla de contenido
Mdulo I: Geoestadstica ...........................................................................................................9
Captulo I: Introduccin ........................................................................................................... 10
Objetivos ...................................................................................................................................14
Alcances y Expectativas.............................................................................................................15
Mapa Mental .............................................................................................................................16
Capitulo II: Fundamentos de Probabilidad y Estadstica ............................................................ 18
Probabilidades ...................................................................................................................................26
Variables Aleatorias ...........................................................................................................................36
Esperanza y Varianza .........................................................................................................................45
Covarianza y Correlacin ...................................................................................................................54
Distribuciones Especiales ..................................................................................................................59
Muestras y Poblacin ........................................................................................................................68
Introduccin a la Simulacin .............................................................................................................72
7
Tabla de contenido (cont.)

Captulo III: Geoestadstica ....................................................................................... 81
Variables Regionalizadas ............................................................................................... 83
Superficies de Tendencia ............................................................................................... 92
Interpolacin................................................................................................................ 100
Kriging .......................................................................................................................... 114
Variogramas ................................................................................................................ 120
Captulo IV: Elementos esenciales del Modelado de Yacimientos ............................ 150
Modelado Geomtrico ................................................................................................ 156
Reescalamiento de Registros de Pozos ....................................................................... 162
Modelado de Facies ..................................................................................................... 173
Modelado de Propiedades .......................................................................................... 179
Tabla de contenido (cont.)

Mdulo II: Introduccin a las redes neuronales ...................................................................... 189
Captulo I: Introduccin ......................................................................................................... 190
Captulo II: Tecnologas de aprendizaje automtico ................................................................ 196
Informacin, conocimiento y aprendizaje ...................................................................................207
Captulo III: Estructura tpica de las redes neuronales............................................................. 216
Perceptrn ...................................................................................................................................218
Aprendizaje de las redes neuronales ...........................................................................................225
Captulo IV: Fundamentos de estadstica Bayesiana ............................................................... 230
Conceptos Bsicos ........................................................................................................................231
Estadstica Bayesiana ...................................................................................................................233
Captulo V: Algoritmos aprendizaje automtico ..................................................................... 239
Mtodos de agrupamiento ..........................................................................................................245
Clasificador de Bayes....................................................................................................................253
Mapas auto-organizados..............................................................................................................260
Uso de redes neuronales para regresin .....................................................................................268
Uso de redes neuronales para el estudio de yacimientos ...........................................................274
9
Mdulo I
Geoestadstica
Capitulo I
Introduccin
Introduccin
La geoestadstica procura proveer una descripcin cuantitativa de

variables, generalmente naturales, distribuidas en el espacio o en el
espacio y el tiempo.
Reservas en depsitos minerales.

Profundidad y espesor de capas geolgicas.
Porosidad y permeabilidad en medios porosos.
Propiedades de suelos.
Densidad de vegetacin.
Presin, temperatura y velocidad del viento en la atmsfera.
12
Introduccin
Los fenmenos tienden a ser suficientemente complejos como para limitar
el uso de modelos simplistas como:
Valores constantes en el interior de polgonos.
Funciones matemticas.
Razones econmicas generalmente obligan a muestreos dispersos y escasos.
Si comparamos el muestreo geoestadstico relativo a volumen de un yacimiento

con una entrevista para medir variables sociales en hogares, el muestreo
geoestadstico equivaldra a entrevistar menos de 50 hogares sobre 50 millones de
hogares, cuando el estndar por diseo de muestra sera de aproximadamente
1500 hogares.
Los mtodos geoestadsticos procuran maximizar el aprovechamiento de los datos

disponibles.
13
Ejemplos
Mejora del muestreo.

Diseo restringido por consideraciones econmicas y operacionales.
Interpolacin.
Estimacin de valores de variables regionalizadas sobre localizaciones sin mediciones
Tpicamente sobre un mallado o modelo de celdas.
Integracin de informacin multivariada.

Interpolacin multivarada.
Honrar la informacin ya conocida.
Estimacin de indicadores.
Eventos representados por variables binarias.
Problemas de cambio de soporte.

Volumen sobre el cual la data es agregada o promediada.
Simulacin.
Imgenes que honran la verdadera fluctuacin del fenmeno.
14
Objetivos
Proveer una base estadstica suficiente para comprender los procesos geoestadsticos
tpicos.
Proveer una base geoestadstica suficiente para aplicar procesos y tomar decisiones
durante el procesos de modelado geoestadstico de yacimientos.
Atacar las fallas e interpretaciones errneas ms frecuentes durante la aplicacin de

mtodos geoestadsticos.
Mejorar la capacidad de los participantes para aprovechar la capacitacin en el uso de

programas de modelado de yacimientos, reduciendo la opacidad de los procesos.
Proveer a los participantes de una visin capaz de interpretar y evaluar los resultados
de un modelado geoestadstico.
Estimular la creatividad de los participantes para proponer soluciones a problemas

geoestadsticos.
15
Alcances y Expectativas
Este curso no contempla el entrenamiento en el uso de programas de modelado de yacimientos, sin

embargo, procura generar una base para interpretar adecuadamente las opciones provistas por estas
herramientas.
La base terica del curso desde el punto de vista matemtico y estadstico est dirigida a profesionales de
las reas de ciencias de la tierra, por lo cual numerosos detalles sern omitidos o discutidos de manera
informal.
A pesar de que el manejo de herramientas de programacin es invaluable al momento de proponer

soluciones innovadoras, el curso estimular slo el uso de hojas de clculo como una aproximacin a la
lgica de programacin necesaria.
Los tpicos asociados al modelado estadstico de yacimientos estn orientados a entender las base terica
y el funcionamiento de tareas especficas que o forman parte del flujos de trabajo tpicos.
Los mtodos estudiados estn asociados especficamente a tareas que involucran conceptos
principalmente geoestadsticos, no se discutirn detalles sobre otras disciplinas, el modelado de
yacimientos es una tarea intrnsecamente multidisciplinaria.
16
Mapa Mental
BaseLCC16
TopMCC25
TopLCC13
TopLCC16
BaseT3-1
TopT3-1
TopT3-2
29Ut021 [SSTVD]
29Ub14 [SSTVD]
SSTVD -14.11 GRTO 407.32 -0.04 PHIE_F 0.46 -0.09 VCLAV_F 1.10 0.3865 SW_F 1.0558
773
Descripcin
894
BaseMCC25
900
TopMCC25
TopMCC25
910
825
TopUCC14
TopUCC14
930
Procesamiento de
datos
875
940
900
Tidal Channel
-3.36
-3.22
-3.08
-2.94
-2.80
-2.66
-2.52
-2.38
-2.24
-2.10
-1.96
-1.82
-1.68
-1.54
-1.40
-1.26
-1.12
-0.98
-0.84
-0.70
-0.56
-0.42
-0.28
-0.14
0.00
0.14
0.28
0.42
0.56
0.70
0.84
0.98
1.12
1.26
1.40
1.54
1.68
1.82
1.96
2.10
2.24
2.38
2.52
2.66
2.80
2.94
3.08
3.22
3.36
Reescalamiento
Elementos de
probabilidad
TopUCC14
TopMCC16
TopMCC16
TopMCC16
950
925
960
Transformacin
TopLCC16
Tidal Channel
TopLCC16
TopLCC16
950
Tidal Flat
970
975
BaseLCC16
BaseLCC16
980
TopMCC16
BaseLCC16
TopMCC16
Tidal Flat
1000
Tidal Channel
990
Tidal Flat
999
1031
Muestras /
poblaciones
Modelado
geomtrico
Elementos de
estadstica
Orientacin
Resolucin
Condiciones
Fundamentos
Estadsticos /
Indicadores
Integracin
de datos
Modelado
Geoestadstico
de Yacimientos
Anlisis
integrado
Variables
secundarias
0,400
0,350
Mtodos
0,300
0,250
0,200
Aplicaciones
0,150
0,100
Condicionamiento por facies
0,050
0,000
1
Mapas
1,5
2,5
Mtodos
descriptivos
Mtodos
geoestadsticos
Modelado de
propiedades
Transformaciones
Kriging / Simulacin
Mtodos
predictivos
Variogramas
Modelado por indicadores
Modelado de
facies
Interpolacin
TopUCC14
920
BaseMCC25
Tidal Flat
Tidal Flat
TopUCC14
BaseMCC25
850
TopUCC14
1025
0,5
BaseMCC25
TopLCC13
800
BaseMCC25
Distribuciones
Environ
BaseMCC25
TopLCC13
Tidal Flat
TopMCC25
Variables
aleatorias
SSTVD -2.05 GRTO 416.93 -0.04 PHIE_F 0.44 -0.05 VCLAV_F 1.10 0.2831 SW_F 1.0652
Environments
TopLCC13
Kriging
Simulacin
Modelado por objetos

Modelado por geoestadstica
multipunto
17
TopMCC16
Temario
Fundamentos de probabilidad y estadstica.

Probabilidades.
Variables aleatorias y distribuciones.
Distribuciones especiales.
Geoestadstica.
Variables regionalizadas.
Correlacin espacial.
Modelado de variogramas.
Kriging.
Modelado geoestadstico de yacimientos.
Modelado geomtrico.
Datos de entrada.
Actividades tpicas del modelado de facies.
Actividades tpicas del modelado de propiedades.
18
Captulo II
Fundamentos de Probabilidad
y Estadstica
Tpicos a tratar
Experimentos y sucesos.
Probabilidades.
Definicin.
Funcin de probabilidad.
Eventos independientes.
Probabilidad condicional
Variables aleatorias y distribuciones.
Definicin y tipos de variables aleatorias.

Funcin de distribucin.
Esperanza y varianza de una variable aleatoria.
Media, mediana y moda.
Covarianza y correlacin.
Distribuciones especiales.
Distribucin Uniforme.
Distribucin Binomial.
Distribucin Normal e Intervalos de confianza.
Distribucin Log Normal.
Introduccin a la simulacin por mtodos de Montecarlo.
20
Experimentos y sucesos
Se utiliza el termino experimento para describir cualquier proceso cuyos resultados no se

conocen de antemano con certeza.
Frecuentemente la percepcin de aleatoriedad proviene de la imposibilidad de modelar en

detalle todas las condiciones que rigen el fenmeno en estudio, como por ejemplo, en el
caso del lanzamiento de una moneda.
21
La caracterstica de inters de un experimento reside en que cada uno de sus

posibles resultados puede ser especificado antes de realizar el experimento.
Se puede asignar probabilidades a las diversas combinaciones de resultados de

inters.
Es de importancia fundamental determinar, utilizando un criterio slido, cuales

son estas combinaciones interesantes.
22
Usualmente el criterio se basa en las decisiones que se tomarn a partir de los

resultados, las utilidades y los riesgos.
La cuantificacin de las probabilidades asociadas a los eventos de inters son

fundamentales para la planificacin de cualquier proyecto.
No basta con conocer los posibles resultados de un experimento, es necesario

cuantificar la incertidumbre para modelar escenarios.
23
Toma de decisiones basada en resultados inciertos de un experimento.

El modelado adecuado de las probabilidades, utilidades y prdidas permite planificar
decisiones acertadas.
Podra llover
Llover
SI
Seco
Resultado Incierto
No Llover
Escenarios Plausibles
NO
Toma de decisiones:
LLEVAR PARAGUAS
SI
NO
Mojado
Utilidades y Prdidas
Incmodo
Irrelevante
24
Conjuntos
Recordemos la unin e interseccin de conjuntos dado que nos referiremos a estos trminos
para entender la relacin entre eventos.
AB
ABC
AC
A
B
C
BC
AUBUC
25
Conjuntos
Recordemos la unin e interseccin de conjuntos dado que nos referiremos a estos trminos
para entender la relacin entre eventos.
Eventos disjuntos
A
B
Particin de un espacio muestral
D
Eventos exhaustivos y
mutuamente excluyentes
26
Probabilidades
Probabilidades
Interpretacin subjetiva
Probabilidad que una persona asigna a uno de los posibles resultados de un
proceso.
Basado en el juicio propio sobre la verosimilitud.
El juicio estar basado en las opiniones e informacin que tenga la persona sobre
el proceso.
Interpretacin frecuentista
Frecuencia relativa con la que se obtendra un resultado si un proceso se
repitiera un nmero grande de veces en condiciones similares.
28
Probabilidades
Axiomas
Para cualquier evento A, P(A) 0
La probabilidad de todo suceso es no negativa.
Dado un espacio muestral S, P(S) = 1

Un evento que ocurre con certeza tiene probabilidad = 1
Para cualquier sucesin de eventos disjuntos Ai:

La probabilidad de la unin de eventos disjuntos es la suma de la
probabilidad de cada evento.
P Ai P( Ai )
i
i
29
Probabilidad de la unin de eventos
La probabilidad de la unin de eventos , es igual a la suma de las probabilidades slo si los

eventos son disjuntos.
AB
AUBUC
ABC
AC
BC
P( A B C) P( A) P( B) P(C) P( AB) P( BC ) P( AC ) P( ABC )

30
Funcin de Probabilidad
Funcin que asigna un valor de probabilidad a cada resultado posible de un

experimento.
Se puede interpretar como la proporcin del espacio muestral asociada a cada
evento.
P(A)=0.25
P(B)=0.25
P(C) = 0.50
31
Funcin de Probabilidad
Supongamos un experimento sencillo en el cual se lanzan dos dados y se suma el

resultado.
Se puede determinar la probabilidad coma la cantidad de resultados favorables entre la cantidad

de resultados posibles.
P (x=12)
d1/d2
P (x=11)
P (x=10)
5/36
P (x=7)
10
P (x=6)
10
11
10
11
12
0,06
0,08
P (x=9)
0,03
0,11
P (x=8)
0,14
0,17
0,14
P (x=5)
0,11
P (x=4)
0,08
P (x=3)
P (x=2)
0,06
0,03
32
Eventos independientes
Dos sucesos A y B son independientes uno del otro si la ocurrencia o no de

cualquiera de ellos no tiene relacin ni influye sobre la ocurrencia del otro.
SI A y B son independientes conocer que ha ocurrido el evento A no aporta

ninguna informacin adicional sobre la probabilidad de ocurrencia de B (y
viceversa).
Esto equivale a decir que:

P(AB) = P(A) x P(B) si y slo si A y B son independientes.
El desconocimiento de esta relacin puede ocasionar graves errores durante

aplicacin de soluciones basadas en simulacin.
Eventos disjuntos son independientes?
33
Probabilidad condicional
Forma en que cambia la probabilidad de un suceso A dado que se conoce que un

suceso B ya ha ocurrido.
Simplemente se ajusta el espacio muestral a los casos en los que B ha ocurrido,

pues esto ya es seguro.
Esto equivale a decir que:

P(A|B) = P(AB)/P(B)
P(A)=P(A)/P(S)
AB
P(A|B)=P(AB)/P(B)
34
Ejemplo de eventos independientes
Dos sucesos A y B son independientes uno del otro si la ocurrencia o no de

cualquiera de ellos no tiene relacin ni influye sobre la ocurrencia del otro.
x50
P(Azul)=20/100
P(Verde) = 50/100
P(Amarillo) = 30/100
x30
x20
Muestra con / sin reemplazo
Muestreo con reemplazo.
Eventos independientes.
P(Azul | Verde) = 20/100
Sigue habiendo 20 azules en 100 totales.
Muestreo sin reemplazo.
Eventos condicionales.
P(Azul | Verde) = 20/99
Ahora sigue habiendo 20 azules pero solo

restan 99 totales.
35
Probabilidad Total
Probabilidad de obtener tres bolas del mismo color.

P(Az Az | Az) + P(Ve Ve | Ve) + P(Am Am | Am)
18 19 20
48 49 50
28 29 30
0.153
98 99 100 98 99 100 98 99 100
x50
Existen tres caminos exhaustivos y

mutuamente excluyentes para llegar al
resultado.
Los distintos caminos se suman.
De manera similar se manejan los escenarios

dentro de un modelo.
x30
x20
P(Azul)=20/100
P(Verde) = 50/100
P(Amarillo) = 30/100
Muestra sin reemplazo
36
Variables Aleatorias
Variables aleatorias
Es una funcin que asigna valores reales a los resultados de un experimento.
Es el mecanismo mediante el cual convertimos los resultados posibles de un

experimento en cantidades con las cuales podemos hacer clculos y operaciones.
0,375
0,375
0,125
x=0
0,125
x=1
x=2
El experimento puede ser lanzar una moneda tres

veces y contar el nmero de caras, ste genera 8
resultados posibles y 4 valores posibles de X.
X = 0 para los resultados +++
X = 1 para los resultados C++; +C+; ++C
X = 2 para los resultados CC+; +CC; C+C
X = 3 para los resultados CCC
x=3
38
Variables aleatorias
Tipos de Variables aleatorias:
Continuas:
Propiedades petrofsicas como porosidad y permeabilidad.
Discretas:
Binarias: dos resultados posibles.
Ordinales: Tienen orden, pueden tener medida.
Exceder o no un valor de corte.
Clasificacin de material de acuerdo al tamao de los poros.
Categricas: No tienen orden ni medida.
Slo sirven como etiqueta de clasificacin, inadecuadas para

operaciones matemticas.
Facies geolgicas.
39
-3.36
-3.15
-2.94
-2.73
-2.52
-2.31
-2.10
-1.89
-1.68
-1.47
-1.26
-1.05
-0.84
-0.63
-0.42
-0.21
0.00
0.21
0.42
0.63
0.84
1.05
1.26
1.47
1.68
1.89
2.10
2.31
2.52
2.73
2.94
3.15
3.36
Funcin de distribucin
Funcin de densidad f(x).

Funcin no negativa sobre la recta real tal que:
P( X A) f ( x)dx
A
f ( x)dx 1
40
Funcin de distribucin acumulativa F(x).
Funcin no decreciente definida para cada nmero real x tal que:
F ( x) P( X x)
f (t )dt
1
0,9
P( x 0,5) 0,70
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
-0,1
-3,5
-3
-2,5
-2
-1,5
-1
-0,5
0,5
1,5
2,5
3,5
41
-3.36
-3.15
-2.94
-2.73
-2.52
-2.31
-2.10
-1.89
-1.68
-1.47
-1.26
-1.05
-0.84
-0.63
-0.42
-0.21
0.00
0.21
0.42
0.63
0.84
1.05
1.26
1.47
1.68
1.89
2.10
2.31
2.52
2.73
2.94
3.15
3.36
Relacin entre F(x) y f(x)
F(x) = f(x)
f(x)
1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
-0,1
F(x)
-3,5
-3
-2,5
-2
-1,5
-1
-0,5
0
0,5
1
1,5
2
2,5
3
3,5
42
Percentiles y Escenarios
Los percentiles son aquellos valores de la variable aleatoria que se

obtienen de evaluar la inversa de la funcin de distribucin acumulativa en
los correspondientes valores de probabilidad.
El percentil 10% (0.10) es el valor x de la variable aleatoria tal que la

probabilidad de observar un valor menor o igual que x es 0.1.
Se puede obtener calculando F-1(t), y evaluando la funcin en el valor de

probabilidad indicado por el percentil, por ejemplo:
F-1(0.1)
43
Es comn utilizar los percentiles para definir escenarios:
Suponga que se tiene la distribucin de probabilidad de las reservas de

hidrocarburos en un yacimiento.
El percentil 0.1 (10%, p10) define un escenario pesimista: slo con 10% de
chance habr menos de esa cantidad de reservas.
El percentil 0.9 (90%, p90) define un escenario optimista: es factible, pero con
90% de chance habr una menor cantidad de reservas.
El percentil 0.5 (50%, p50) define el ms verosmil (most likely), con igual
chance de observar mayor o menor volumen de reservas.
44
Escenarios.
1
F(x)=0.9
0,9
0,8
0,7
0,6
F(x)=0.5
0,5
0,4
0,3
0,2
F(x)=0.1
0,1
0
P10
P50
P90
-0,1
-3,5
-3
-2,5
-2
-1,5
-1
-0,5
0,5
1,5
2,5
3,5
45
Esperanza y Varianza
Esperanza de una variable aleatoria
La valor de la esperanza de E(X) suele llamarse valor esperado de X media de X.
Caso Discreto.
E ( x) xP ( x)
x
Caso Continuo.
E ( x) xf ( x)dx
No es ms que el promedio ponderado de la variable aleatoria, utilizando como

ponderador el valor de probabilidad de cada elemento de x.
47
Esperanza de una variable aleatoria
La esperanza tambin puede ser interpretada como en centro de gravedad de la

variable aleatoria, donde la masa de cada elemento est asociada a su probabilidad
de ocurrencia.
El valor esperado representara el punto de equilibrio del sistema.
0,50
0,30
0,45
0,40
0,35
0,20
0,30
0,25
0,15
0,20
0,15
0,10
0,15
0,05
0,10
0,05
0,05
3,95
0,00
0
10
X=1
X=2
X=3
X=4
X=5
X=6
X=7
El valor esperado no es necesariamente

un valor posible de la variable
aleatoria
48
Varianza de una variable aleatoria
Suponga que X es una variable aleatoria con media mx = E(x)
La Varianza de X, Var(X) viene dada por:
Var ( X ) E[( X m x ) 2 ]
Var ( X ) E[ X 2 ] E 2 [ X ]
Es la distancia media de cada valor posible de x a la media m.
Est asociado con la variabilidad o dispersin de una variable aleatoria.
Cuantifica la incertidumbre sobre los valores posibles de una variable aleatoria una vez
conocida su media.
En lo sucesivo usaremos frecuentemente la interpretacin de varianza como

incertidumbre.
49
Varianza
Si una persona dispara numerosas veces a una diana, la varianza de la distancia al

centro de la diana estara asociada con su puntera.
Buena puntera Baja varianza
Mala puntera Alta varianza
Ejemplo de Dispersin
Ejemplo de Dispersin
-1
-1
-2
-2
-3
-3
-4
-4
-4
-3
-2
-1
-4
-3
-2
-1
50
Propiedades importantes
La esperanza es un operador lineal:

E(aX+b) = aE(X)+b
Esperanza de una funcin.

Eg ( x) g ( x) f ( x)dx
51
Propiedades importantes
Para constantes a y b cualesquiera.
Var(aX+b) = a2Var(X)
(1)
Si X1 Xn son variables aleatorias independientes.
Var(X1+ + Xn) = Var(X1) + + Var(Xn)
(2)
Var(a1X1+a2X2+ + anXn + b) = a12Var(X1)+ an2Var(Xn)
(3)
Si X1 y X2 no son independientes.
Var(X1+X2) = Var(X1) + Var(X2) + 2 Cov(X1, X2)
(4)
52
Desviacin estndar
La desviacin estndar contiene informacin similar a la varianza.
DesviacionEst ( x) Var ( x)
La desviacin estndar est en las mismas unidades que la variable aleatoria.
Usada para reescalar.
No es aditiva.
Las propiedades (1), (2) y (3) de la varianza NO aplican a la desviacin

estndar.
53
Media, Mediana y Moda

Moda: Valor ms frecuente.
til para seleccionar un mejor representante
en el caso de variables categricas.
120
Medidas de tendencia central
Mediana (P50): til para variables continuas u

ordinales discretas.
Resistente a valores extremos.
100
Moda
0,5
60
f ( x)dx
20
40
Media: Valor esperado.

til para variables continuas y como
proporcin en binarias, sensible a valores
extremos.
Frecuencia
80
0.5
40
Mediana
60
80
Media
100
120
140
160
180
1
xi
n i
La media NO es un indicador apropiado para

variables discretas categricas.
54
Covarianza y Correlacin
Covarianza y correlacin
Cantidades que permiten medir el nivel de asociacin entre dos variables

aleatorias.
Si se cuenta con informacin de la variable aleatoria x Cunta informacin tenemos

sobre y?
Con cuanta precisin se puede predecir la variable a aleatoria y a partir de x?
Cov( X , Y ) E[( X m x )(Y m y )]

Cov( X , Y ) E[ XY ] E( X ) E(Y )
( X ,Y )
Cov( X , Y )
XY
Cov( X , Y )
1 ( X , Y ) 1
56
Cov( X , Y ) E[( X m x )(Y m y )]
(X < mx)*(Y > my)
(X > mx)*(Y > my)
( - )*( + )
( + )*( + )
(X < mx)*(Y < my)
(X > mx)*(Y < my)
( - )*( - )
( + )*( - )
57
La covarianza no est acotada, por lo tanto es difcil interpretar la calidad de la

relacin lineal entre dos variables aleatorias a partir de esa cantidad.
El valor de la covarianza se ve afectado por las unidades y la magnitud de la variable

aleatoria.
El coeficiente de correlacin est acotado entre -1 y 1.
Grado de relacin lineal entre X y Y.
Pendiente de la recta asociada al signo de .
= 1 > Correlacin positiva perfecta

= -1 > Correlacin Negativa perfecta
= 0 > Ausencia de correlacin
y=x
R = 1
(x,y) =0.01
R = 0,4604
R = 0,0924
R = 0,0002
(x,y) =0.31
(x,y) =0.68
(x,y) =1
58
Correlacin
Dos variables independientes son incorrelacionadas.
Dos variables incorrelacionadas no son necesariamente independientes.
Existe una relacin perfecta entre las dos variables, pero sta no es lineal.
y = -1x2 - 3E-15x + 3
R = 1
(X,Y) = 0.08
59
Distribuciones Especiales
Distribuciones especiales
Distribucin Uniforme discreta.
La variable aleatoria X, toma k valores discretos distintos.
Todos los valores tienen la misma probabilidad de ocurrir.
f ( x) P( X x)
1
k
Probabilidad de Uniforme [1,6]

20%
16.7%
16.7%
16.7%
16.7%
16.7%
16.7%
15%
10%
5%
0%
x
61
Distribucin de Bernoulli.
La variable aleatoria X, slo toma valores 0 1.
Supongamos que x = 1 equivale a un xito en el experimento y ocurre con probabilidad p.
f ( x) p x (1 p)1 x
Media = p
Varianza = p(1-p)
Probabilidad de Bernoulli (p=0,35)

100%
80%
65.0%
60%
35.0%
40%
20%
0%
0
1
x
62
Distribucin Binomial.
Equivalente a sumar n experimentos Bernoulli con probabilidad p.
X corresponde al nmero de xitos obtenidos en n experimentos.
n
f ( x) p x (1 p) n x
x
Media = np
Varianza = np(1-p)
Probabilidad de Binomial (n=10, p=0.3)

30%
26.68%
23.35%
20.01%
20%
12.11%
10.29%
10%
3.68%
2.82%
0.90%
0.14%
0.01%
0.00%
10
0%
0
63
Distribucin Uniforme continua.
La variable aleatoria X toma cualquier valor en un intervalo [a ,b ].
Todos los sub-intervalos del mismo tamao tienen la misma probabilidad de ocurrir.
f ( x)
1
ba
Media = (a+b)/2
Varianza = (b-a)2/12
0.0
0.2
0.4
0.6
Histograma Uniforme [2,5]
Probabilidad
2.0
2.5
3.0
3.5
4.0
4.5
5.0
x
64
Distribucin Normal.
La variable aleatoria X toma cualquier valor real.
Es simtrica, y los valores cercanos a la media son los ms probables.
1 x m 2
1
f ( x)
exp

2
Media
0.12
Histograma Normal (m=20, s=3)
1
xi
n i
Varianza
0.06
s 2
1
( xi x ) 2
n 1 i
Desviacin Estndar
0.00
Probabilidad
10
15
20
25
30
s s 2
x
65
Distribucin Normal Tipificada (Estndar).
Usualmente se designa mediante f (x ).
Su media es m = 0 y su varianza 2 = 1.
0.5
Ejemplo: N(3,2) vs. N(0,1)
0.4
Una variable aleatoria .

X~Normal(m,)
se puede transformar en una variable.
Z~Normal(0,1)
mediante la operacin:
0.2
0.3
Normal(0,1)
zi
( xi m )
0.0
0.1
Normal(3,2)
-10
-5
10
66
Distribucin Log-Normal.
Una variable Log-Normal, es aquella cuyo logaritmo sigue una distribucin normal.
1 Ln( x) m 2
1 1
f ( x)
exp

2
2 x

0.2
0.4
0.6
Histograma LogNormal (m=0.15, s=0.7)
0.0
Probabilidad
10
15
x
67
La mediana una variable Log-Normal se puede calcular directamente al aplicar exp

(Y ) pero no la media.
Ln(X)
Media
Varianza
s2
S2
s2
M exp m
2
0.4
0.3
0.0
0.1
0.2
Probabilidad
0.3
0.2
0.1
0.0
Probabilidad
0.4
0.5
exp(Y)=X~Log-Normal
0.5
Y~Normal(0,1)
-4
-2
2
y
10
20
30
40
50
68
Muestras y Poblaciones
Muestras y poblaciones
La muestra es una porcin de la poblacin que ha sido seleccionada para su

estudio, debe ser representativa para ser til en la prediccin de los resultados
posibles.
Poblacin
Muestra
70
En caso de estudiar una variable cuyo comportamiento es distinto en diferentes

subpoblaciones es necesario entender cada caso por separado.
Cuando existen diferentes grupos, la media

total no es un buen indicador de tendencia
central.
71
Es necesario mantener un balance entre el tamao de la muestra y la explicacin

de la variabilidad mediante subpoblaciones.
Ms subpoblaciones pueden describir mejor la variabilidad de los datos, pero pueden

producir pobres predicciones.
Se debe buscar el equilibrio para evitar prdida de calidad en la inferencia:
Riesgo de sobreajuste.
Menor base para cada subpoblacin.
Mayor error muestral.
Este es el objetivo del modelado de facies que veremos ms adelante.
72
Introduccin a la simulacin
Introduccin a la Simulacin
Conceptos bsicos.
El proceso de simulacin por mtodos de Monte Carlo consiste en tomar

observaciones provenientes de una distribucin de probabilidad especfica.
A cada observacin tomada de la distribucin especificada se le llama

realizacin.
En realidad se simulan nmeros pseudo-aleatorios que provienen de un

proceso determinstico de acuerdo al estado de generador de nmeros
aleatorios.
El estado del generador de nmeros aleatorios se identifica con un valor

conocido como Semilla (seed).
La semilla puede guardarse para usarse para garantizar realizaciones

idnticas.
Garanta de que los resultados se puedan reproducir.
74
Simulacin de variables aleatorias provenientes de una distribucin Uniforme

Continua.
Daremos por hecho que siempre podremos disponer de realizaciones de una

variable aleatoria proveniente de la distribucin Uniforme continua[0,1].
U ~ Uniforme[0,1].
Simulacin x ~ Uniforme continua [a, b].
Simulacin de U (Uniforme [0,1]).
Transformacin de U.
1.- Escala: U*(b-a)
2.- Localizacin: x = U*(b-a)+a
75
Simulacin de variables aleatorias provenientes de una distribucin Uniforme

Discreta.
Simulacin x ~ Uniforme discreta [a, b].
Transformacin de U.
1.- Escala: U*(b-a+1).
2.- Localizacin: U*(b-a+1)+a.
3.- Truncamiento: x = Entero(U*(b-a+1)+a).
76
Simulacin de variables aleatorias provenientes de una distribucin Bernoulli (p).
Simulacin x ~ Bernoulli (p).
Transformacin de U.
1.- x = 1 si U p
2.- x = 0 si U > p
Desde el punto de vista de programacin, suponiendo que una variable

booleana tiene el comportamiento:
1 si verdadero.
0 si falso.
x = 1*(U p)
77
Simulacin de variables aleatorias provenientes de una distribucin Binomial(n, p).
Simulacin x ~ Binomial (n, p).
x=0
Para un entero i que toma valores de 1 hasta n.
yi = Bernoulli(p)
x = x + yi
X es la suma de n observaciones bernoulli (p).
78
Simulacin de variables categricas con P(X=xi) conocida.
Ejemplo: Simulacin x tal que:
P(x=1) = p1
P(x=2) = p2
P(x=3) = p3
Simulacin de U (Uniforme [0,1])
x = 1*(U p1) + 2*(p1 < U p1+p2) + 3*(p1+p2 < U)

P1
P1+ P2+ P3
P1+ P2
rea = P1
rea = P2
rea = P3
79
Simulacin de variables aleatorias provenientes de una distribucin Normal (mx, x).
Simulacin x ~ Normal (mx, x)
Simular dos realizaciones uniformes (0,1) independientes.
Simulacin de U1 (Uniforme [0,1]).
Simulacin de U2 (Uniforme [0,1]).
Aplicar frmula:
z 2 ln(U1 ) * Seno(2U 2 )
Donde z ~ Normal (mz=0, z=1)
Transformacin de z
1.- Escala: z* x
2.- Localizacin: x = z* x + mx
80
Simulacin mediante F-1(x).
til cuando se trata de una variable aleatoria para la cual no conocemos una
frmula previamente.
Supongamos que conocemos f(x)
Simulacin x ~ f(x)
Integrar f(x) para obtener F(x)
Invertir F(x) para obtener F-1(x)
Simulacin de U (Uniforme [0,1])
x = F-1(U)
81
Captulo III
Geoestadstica
Tpicos a tratar
Variables regionalizadas.
Estadstica vs. Geoestadstica.

Observaciones y mallado.
Interpolacin bsica.
Tipos de interpolacin.
Correlacin espacial.
Variogramas.
Conceptos y mtodos para el clculo de variogramas experimentales.
Modelado de variogramas.
Variograma terico.
Modelos autorizados.
Elipse de anisotropa.
Kriging y Simulacin
Caractersticas del kriging ante otros mtodos de interpolacin.
Tipos de kriging y prediccin mediante simulacin.
83
Variables Regionalizadas
Variables regionalizadas
En general, los fenmenos espaciales relacionados con el estudio de yacimientos

tienen las siguientes caractersticas.
Son nicos e irreproducibles.
Estn definidos en un espacio de 2 3 dimensiones.
Son demasiado complejos para una descripcin determinstica precisa.
Son observados a travs de un proceso de muestreo irregular.
stos fenmenos son variables regionalizadas.
Estn definidos en dos espacios:
Espacio geogrfico: localizacin x = (x1, x2, x3) (x,y,z)
Espacio de las propiedades: f, k, Vsh, Sw.
Se estudian como realizaciones de funciones aleatorias.
Z(x): Propiedad Z en la localizacin x.
85
Comparacin entre el punto de vista estadstico y geoestadstico.
40
Mapa de Observaciones
31 32
33
31
33
33 3333
30
26
25
35
32
27
29
39
39
36
37
3535
34
27
28
30
32
36
35
33
28
31
31
37
30
30
30
30 33
31
29
33 33
30
28 2828
32 33
33 33
33
28
28
29
28 24
28
27
2929
29
28
32
32
32
27 26
27
29
29
24
28 29
27
25
27
28
25
28
30
29 31
28
26
30
24
29
25
29
28
29
29
24
29
28
29
24
28
2424
28
30
28 27
27
27
28
26
23 23
26
25
26
29 28 28
20 22
27 28
28
24
10
38
30
2626
38
37
33
33 34
29
27
38
38
38
37
34
31
31
27
27
20
37
34
32
32
31
32
32
Las variaciones en los valores

de los datos no dependen de
su localizacin.
Z
0.15
2.70
0.88
3.25
1.65
1.64
3.88
2.62
4.02
4.07
4.19
3.90
1.30
2.61
0.87
1.45
0.26
4.02
2.79
3.10
10
20
30
34
34
3434
32
32 32
31
31 31
30
30
40
z(x) = Z(x=5, y=2) = 20

86
Conocemos su media, su desviacin y valores extremos.
Hasta ahora su comportamiento no guarda relacin con la distribucin espacial.
Histograma de z(x)
30
Percent of Total
Nmero de observaciones
20
10
160
Mnimo (Z)
20,41
Media (Z)
29,98
Mediana (Z)
29,16
Mximo (Z)
39,17
Desviacin Estndar (Z)
3,8
0
20
25
30
35
40
z(x)
87
Funcin de distribucin acumulativa de Z.
Identificacin de percentiles.
F(Z) - FDA Emprica
34.7
100%
90%
32.7
80%
P(25,4 < Z < 34.7) = 80%
70%
F(Z)
60%
29.2
50%
40%
27.5
30%
20%
Z(x) - Separado por Percentiles
25.4
10%
40
0%
20
22
24
26
28
30
32
34
36
38
40
35
Z
Z<=P(10% )
P(10% )<Z<=P(25% )
P(25% )<Z<=P(50% )
30
x2
25
Puede ayudar a Identificar visualmente tendencias y

valores atpicos.
Slo presenta informacin de los datos, an no se han
establecido premisas.
20
P(50% )<Z<=P(75% )
P(75% )<Z<=P(90% )
15
P(90% )<Z
10
5
0
0
10
15
20
25
30
35
40
x1
88
Estacionariedad
De manera sencilla, se puede decir que un conjunto de datos es estacionario si la

media de los datos es la misma a lo largo de toda del rea de estudio.
No existen subpoblaciones con medias significativamente distintas.
No presentan tendencias o variaciones graduales de la media de los datos

asociadas a la localizacin de las observaciones.
Histograma de X
0.0 0.1 0.2 0.3 0.4
Density
Variable Estacionaria
-3
-2
-1
89
Estacionariedad
Ejemplos de variables no estacionarias.
Subpoblaciones
Tendencias
Variable NO Estacionaria
400
200
Frequency
600
Porosidad Total
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0.35
Porosidad
90
Heterogeneidad
La heterogeneidad se puede definir como la variacin de las propiedades en el

cuerpo o volumen de material estudiado (por ejemplo: el yacimiento), en funcin
del espacio.
Si los yacimientos fueran homogneos, medir las propiedades en cualquier

localizacin del mismo una descripcin total de sus propiedades.
Para obtener una descripcin adecuada de un yacimiento, las variaciones de las

propiedades como funcin de la distancia deben ser correctamente representadas.
La heterogeneidad siempre est asociada a la escala en que se mide la propiedad

de inters.
Microscpica: Por ejemplo tamao y distribucin de granos, mineraloga.
Macroscpica: Por ejemplo, propiedades medidas en ncleos.
Megascpica: escala similar a la del modelo del yacimiento, registros de pozos.
Gigascpica: observacin de fenmenos entre pozos, fallas mayores, ssmica.
91
Anisotropa
Es una propiedad general de la materia, segn la cual sus propiedades o

caractersticas varan segn la direccin en que sean examinadas.
En el caso de que el medio examinado no presenta anisotropa, ste se considera

isotrpico, es decir, que las propiedades no varan segn la direccin en que se
examinen.
En el caso de un yacimiento, tpicamente la anisotropa del mismo viene dada por

dos elementos principales:
Procesos sedimentarios: direcciones de depositacin, variaciones de energa.
Procesos estructurales: direcciones de fallamiento o deformacin.
92
Superficies de Tendencia
La tendencia regional es un tipo de estructura espacial donde las propiedades cambian

sistemticamente con el espacio de las coordenadas.
De acuerdo al objetivo del estudio podemos querer analizar los efectos regionales o los
residuales.
Variacin sistemtica con las coordenadas
Variacin a partir de causas no sistemticas

Residuales
Tendencia
18
16
6
5
4
3
14
12
2
1
10
8
6
y = -2,3x + 15,4
4
2
0
0
0
-1
-2
-3
-4
-5
-6
-7
0
94
El anlisis de las tendencias regionales requiere proponer un modelo de la

variacin de la propiedad de acuerdo a las coordenadas geogrficas.
Frecuentemente, un modelo lineal es una representacin suficiente.
Superficie de ajuste
40
Tendencia polinmica de 1er grado en x1, x2.
20
10
0
z 0 1 x1 2 x2
x2
30
Aproximacin mediante un plano.
10
20
x1
30
40
95
El ajuste del modelo requiere la estimacin de los coeficientes i (coeficientes del

polinomio).
En general una superficie de tendencia puede ser de cualquier orden.

El orden es el mximo valor de la suma de las potencias para cada coordenada en cualquier trmino.
Ejemplo: Una superficie polinomial de 2do orden tendra la siguiente forma.
z 0 1 x1 2 x2 3 x1 4 x2 5 x1 x2
2
El orden de la funcin depender de la curvatura de la superficie y el nmero de mximos/mnimos que se

desea ajustar.
Usualmente es necesario algo de ensayo y error.
Una superficie de orden p puede representarse mediante la siguiente frmula general.
f ( x1 , x2 )
r s p
x x2
r ,s 1
96
El modelo es slo una expresin matemtica (determinstica).
Esta expresin predice valores de la variable analizada en cualquier localizacin no

observada slo con evaluar la frmula.
Esta prediccin slo puede honrar el comportamiento regional, los residuales sern
tratados como ruido aleatorio.
La varianza de los residuales determinar la incertidumbre sobre las predicciones

obtenidas.
Es muy importante mantener un balance entre el ajuste y la complejidad del

modelo (principio de parsimonia).
97
Ajuste de superficie de 1er orden (plano).
No es ms que ajustar el valor de Z(x) mediante un modelo lineal con x1 y x2 como

variables predictoras.
40
Superficie de orden=1
20
10
Intercepto
0
21,71
Coeficiente. x1
1
0,17
Coeficiente. x2
2
0,24
x2
30
Parmetro estimado
10
20
30
40
x1
98
Ajuste de superficie de 1er orden (plano).
z(x)
x1
x2
99
Los residuales son el resultado de remover la superficie de ajuste de las

observaciones originales.
Z(x) Polinomio(x) = Residuales(x)
40
30
Sin embargo, seguimos observando grupos (o clusters) de

mximos y mnimos.
20
Ya no parece tan clara la dependencia sistemtica de los

mximos y mnimos con los valores de las coordenadas x1 y x2.
10
Estos se observan debido a la continuidad espacial de la

propiedad.
En este punto la relacin no proviene de la localizacin (x) de
las observaciones, sino la cercana entre ellas.
x2
Residuales
10
20
x1
30
40
Residuales Positivos.
Residuales Negativos.
100
Interpolacin
Observaciones y mallado
Las observaciones representan datos medidos en ubicaciones frecuentemente irregulares.
El mallado o grid representa un arreglo regular que se desea poblar con valores de las
propiedades de inters.
10
9
8
7
6
5
4
3
2
1
0
0
10
102
Interpolacin
La interpolacin es un mtodo para estimar los valores de la propiedad en las localizaciones

no observadas como una combinacin lineal de valores conocidos.
En este sentido el kriging es un mtodo de interpolacin, pero utiliza ms informacin que

otros mtodos ms simples, aprovecha el modelo de la estructura espacial de los datos.
El kriging es considerado como ptimo debido a que minimiza la varianza de las estimaciones,
pero otras formas de interpolacin son frecuentemente ms rpidas y por lo tanto, pueden
ser tiles.
Existen otros mtodos de estimacin directa, incluso a partir de una sola observacin, pueden
ser muy rpidos, pero sufren de un muy bajo aprovechamiento de la informacin.
103
Interpolacin
Global
Estratificada
Considera slo las observaciones dentro de una poblacin homognea, de acuerdo a

una clasificacin (separacin en subgrupos) definida por el analista.
Local
Considera todas las observaciones disponibles en el rea de estudio.
Considera slo las observaciones pertenecientes a un rea de vecindad alrededor del

punto a estimar.
Mixta
Combinaciones de los casos anteriores.
Por ejemplo: Local dentro de estratos homogneos (caso de uso muy frecuente).
104
Interpolacin
Interpolacin Global/Local.
El valor a estimar es calculado como una

combinacin lineal de las observaciones
conocidas (muestra).
En el caso global, cada observacin
disponible es utilizada para cada
estimacin.
Global
Local
Observaciones
En el caso local, se define un radio r

(tpicamente), o n vecinos ms cercanos, y
slo se consideran los puntos dentro de la
vecindad.
Punto a estimar
105
Interpolacin
Interpolacin Estratificada.
Estrato A
Estrato B
Si las observaciones estn separadas en subgrupos,
estratos o clusters con comportamientos distintos (al
menos bajo suposicin), es conveniente utilizar
interpolacin estratificada.
Es necesario identificar el subgrupo asociado a cada
observacin.
Se calcula local o globalmente, pero siempre se tomarn
slo observaciones pertenecientes al mismo subgrupo.
Puntos a estimar.
Observaciones.
106
Interpolacin
La interpolacin estratificada, se concentra en las diferencias entre los grupos.
Porosidad en Arenas
Ejemplo de Distribucin de Facies

Percent of Total
20
15
10
0
0.1
0.2
0.3
Porosidad|Arena
Porosidad en Arcillas
25
Percent of Total
20
15
10
5
0
0.1
0.2
0.3
Porosidad|Arcilla
107
Interpolacin
Interpolacin por vecino ms cercano.
El valor estimado es calculado como igual al de su

vecino ms cercano.
dmin
Genera mapas abruptos.
Observaciones
Punto a estimar
108
Interpolacin
Interpolacin por vecino ms cercano.

Estimacin por Vecino ms cercano
20
10
0
x2
30
40
Residuales
10
20
30
40
x1
109
Interpolacin
Interpolacin como combinacin lineal de las observaciones adyacentes.

Estimacin por interpolacin
20
10
0
x2
30
40
Residuales
10
20
x1
30
40
R=7
110
Interpolacin
La interpolacin como una combinacin lineal.
Interpolacin Global
N
z * ( x0 ) i z ( xi )
N = Nmero total de observaciones.
i 1
El objetivo siempre es estimar los

coeficientes i
Interpolacin Local
n
z * ( x0 ) i z ( xi )
n = Nmero de observaciones
pertenecientes a la vecindad.
i 1
Cmo estimamos la varianza de

las estimaciones?
z * ( x0 ) i z ( xi )
r = Radio de vecindad.
xi r
No hay una respuesta terica

Este hecho refleja la importancia
del kriging
Interpolacin Estratificada
z * ( x0 Aj )
Como escoger n r ?
z( x )
xi A j
Aj= j-simo estrato/cluster.
111
Estimacin de i
Interpolacin
Existen muchas formas de calcular los coeficientes i para obtener predicciones razonables (y an se pueden
proponer mtodos).
La resolucin de las ecuaciones de kriging arroja coeficientes ptimos (de acuerdo a ciertos criterios), sin
embargo, modelar la estructura espacial de los datos puede ser complicado y tomar tiempo valioso.
Siempre se debe satisfacer la siguiente condicin:
i 1
N = Nmero de observaciones conocidas utilizadas en la estimacin
Para cada observacin a estimar.
112
Interpolacin
Ejemplo: Inverso de la distancia.
Los i son estimados de acuerdo a la siguiente proposicin.
1
di
1
j 1
di = Distancia del punto a estimar al -simo valor observado considerado
d2
di
1
dj
d3
1
d1
d1
d1
d2
d3
113
Interpolacin
Cul es el valor adecuado de R ? - Cmo evaluamos la estimacin?

Estimacin por interpolacin
R=4
R = 10
114
Kriging y simulacin
Kriging
La estimacin de valores de la propiedad analizada sobre las localizaciones no observadas, es

uno de los principales objetivos de la geoestadstica.
Los valores de una propiedad especfica son conocidos en ciertas localizaciones, pero se
necesitan en cada punto de un mallado para generar mapas continuos.
x2
Posiciones sobre Mallado

40
38
36
34
32
30
28
26
24
22
20
18
16
14
12
10
8
6
4
2
2
8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40
x1
Mallado
Posicin aleatoria
116
Kriging
Antes de la aplicacin de los mtodos geoestadsticos, los mapas de contornos eran dibujados
manualmente en base a la intuicin y el conocimiento de las condiciones locales.
Los mtodos geoestadsticos proveen una base slida para la prediccin, as como para la
evaluacin de los resultados obtenidos.
Propiedad Esimada
Varianza de las Estimaciones
117
Kriging
El mtodo de Kriging es considerado un Predictor Local ptimo.
La prediccin debe obtenerse de un promedio ponderado de observaciones conocidas.
La prediccin debe ser insesgada y exacta en las localizaciones conocidas.
Los grupos de observaciones cercanas (clusters) son reducidos a un slo punto equivalente,
de modo que el sobremuestreo en reas pequeas no sesgar el resultado.
Observaciones ms cercanas enmascaran puntos ms lejanos en la misma direccin.
118
Kriging
La estimacin del error est basada slo en la estructura espacial de los datos NO en los
VALORES DE LOS DATOS.
La varianaza del kriging es tan pequea como es posible.
Adems provee la varianza de las predicciones en cada observacin como parte del proceso
de estimacin de pesos.
La solucin depende del modelo de variabilidad espacial, por lo tanto la calidad del resultado
est directamente relacionada con la del modelo.
El mtodo de kriging genera mapas suaves y sin ruido.
Para honrar la heterogeneidad es necesario aplicar simulacin.
119
Covarianza espacial
Supongamos una funcin aleatoria estacionaria z.
Consideremos z(x) y z(x+h) como dos variables aleatorias.
Donde x en una localizacin y h un vector de desplazamiento.
z(x+h) representa el valor de z en una localizacin separada de x por un vector h.
Z(x)
x
h
Z(x + h)
x+h
La covarianza entre z(x) y z(x+h) vendra dada por:
C (h) E[Z ( x h)Z ( x)] E 2 [Z ( x)]
120
Variogramas
Covarianza espacial
Basado en la interpretacin que hemos dado a expresiones similares podemos

decir que la covarianza espacial nos habla de la cantidad de informacin que
tenemos para predecir Z(x+h) si conocemos Z(x).
C (h) E[Z ( x h)Z ( x)] E 2 [Z ( x)]
Es importante notar que h no representa una localizacin sino un vector de

desplazamiento.
Entonces C(h=0) representa la varianza estacionaria de Z(x).
122
Variograma
Bajo la suposicin de estacionariedad el semivariograma es una herramienta para

caracterizar la correlacin entre pares de puntos.
El semivariograma se calcula mediante la siguiente frmula:
2 (h) E{[Z ( x) Z ( x h)]2 }
Desde el punto de vista experimental equivale a:
(h)
1
[ z ( x) z ( x h)]2
2 N ( h) N ( h )
123
Variograma
El variograma no depende de los valores observados sino de la estructura espacial
de los datos.
Ubicacin
A
B
C
1
2
3
4
5
6
7
8
9
10
--+-- --+-- --+-- --+-- --+-- --+-- --+-- --+-- --+-- --+-- Media
1
2
3
4
5
6
7
8
9
10
5,5
1
6
2
7
3
8
4
9
5
10
5,5
1
8
5
2
3
9
7
10
6
4
5,5
Varianza
9,2
9,2
9,2
Min
1
1
1
Max
10
10
10
Comparacin de variogramas
18
16
14
Variograma
12
10
8
6
4
2
0
Distancia
Variograma A
Variograma B
Variograma C
124
Variograma
Comparacin.
Variograma vs. Distancia.
Valores vs. localizacin.

Comparacin de grficas
Comparacin de variogramas
12
18
16
10
8
12
Variable
Variograma
14
10
8
6
4
6
4
2
2
0
Variograma B
Ubicacin
Distancia
Variograma A
Variograma C
Variable A
Variable B
Variable C
125
10
Variograma
EL variograma para cada distancia h puede ser interpretado como la variabilidad

entre dos localizaciones separadas por esa distancia.
126
Variograma
El mtodo descrito supone inicialmente observaciones igualmente separadas sobre

un mallado.
h
En este caso, para cada direccin
mostrada habr siempre un punto a
distancia h, tal que siempre encontraremos
una observacin en x + nh a lo largo de la
direccin q.
127
Variograma
Cuando las observaciones estn distribuidas irregularmente es necesario garantizar

que estamos sacando buen provecho de la informacin disponible.
Podra haber huecos en la direccin q o

a distancia nh.
128
Variograma
Definimos valores de tolerancia, tal que podamos encontrar puntos que satisfacen un criterio.
Tolerancia Dh (distancia).
Tolerancia Dh
h=1
Dh = 0.5
Bin
x1
h-Dh
x2
h+Dh
x3
x4
x5
x6
129
Variograma
Definimos valores de tolerancia, tal que podamos encontrar puntos que satisfacen un criterio.
Tolerancia Dq (azimut).
Tolerancia Dq
Puntos
descartados
q Dq
Puntos
aceptados
Dq
q Dq
q
Puntos
aceptados
Puntos
descartados
Tolerancia
Lateral
130
Variograma
Aplicando estas condiciones sobre cada una de las observaciones de la muestra podemos
mejorar el aprovechamiento de la informacin.
Es importante establecer un balance entre buena cobertura y precisin.

q
Bin
h
2h
131
Variograma
Variograma h=8
5
45
Variograma h=5
10
15
20
135
45
Variograma h=2
10
15
20
135
45
10
15
20
135
Semivariograma
Semivariograma
Semivariograma
10
15
20
Distancia
10
15
20
Distancia
10
15
20
Distancia
132
Variograma
Sea n el mximo nmero de lags (distancias h) consideradas.
La mayor separacin no debera exceder la mitad de la mxima distancia entre pares de

puntos en la muestra.
Para escoger el tamao del lag h existen distintos criterios, como utilizar la distancia promedio
entre observaciones.
Frecuentemente se requiere de ensayo y error para conseguir el tamao ptimo del lag.
La curva cuenta con suficientes puntos como para ser ajustada con precisin.
Los puntos que guan la curva son promedios de suficientes pares de puntos como para
evitar un comportamiento errtico.
133
Variograma
En la prctica lo ms conveniente es utilizar tantos lags (h) como sea posible (es decir una
distancia h pequea) pero procurando que en cada ventana (Bin) tenga suficientes puntos
para una estimacin robusta (no menos de 100 observaciones).
Siempre se debe mantener un balance entre robustez y resolucin.
El ngulo q debera coincidir con la direccin de anisotropa de la propiedad.
En este sentido puede ser til el mapa de variograma.
134
Mapa de Variograma
Este mapa muestra, a partir del centro, el valor del variograma en diferentes direcciones y
distancias.
No es realmente un mapa, dado que las posiciones no son coordenadas.
Muestra las direcciones de anisotropa.

Mapa de Variograma
var1
5
5
dy
4
0
-5
1
-10
-10
-5
dx
135
Modelos de Variograma
No decreciente.
Constante o asinttico en su valor mximo.
Su forma refleja la velocidad de prdida de informacin en la distancia.
Casos a considerar:
Variograma con tendencia.
Crece indefinidamente.
Remover tendencias.
Efecto hole.
Valores bajos (huecos) de valores altos.
Considerar como respuesta slo si hay una explicacin fsica razonable, no

confundir con fluctuaciones.
136
Ajuste del Variograma

Modelos autorizados ms comunes:
Esfrico.
Exponencial.
Gaussiano.
Algunos modelos autorizados
Rango
1,2
Sill
1
Este modelo debe elegirse de

acuerdo a la calidad del ajuste,
resultados de experiencias previas
y el conocimiento de las
condiciones del rea.
0,8
0,6
0,4
0,2
Nugget
0
0
250
500
Esfrico
750
Exponencial
1000
1250
1500
Una vez seleccionado el modelo

se deben estimar los parmetros:
Rango
Sill (meseta)
Nugget (pepita)
Gaussiano
137
Modelos autorizados ms comunes (ecuaciones normalizadas -> Rango =1; Sill = 1):
Esfrico.
(h) 1.5h 0.5h3 si h 1

( h) 1
si h 1
Exponencial.
(h) 1 e h
Gaussiano.
(h) 1 e
h2
138
Modelos autorizados ms comunes:
Esfrico.
(h) sill * (1.5h 0.5h3 ) si h rango

(h) sill
si h rango
Exponencial.
(h) sill * (1 e h / rango)
Gaussiano.
(h) sill * (1 e
( h / rango) 2
)
139
El ajuste de los parmetros puede hacerse mediante la estimacin por mnimos cuadrados o
mediante ajuste manual, en ningn caso se recomienda el ajuste no supervisado.
10
45
Valor
Modelo
Exponencial
Nugget
0 (igual para todo q )
Rango
q.45 = 15.3 / q.135 = 8
Anisotropa
0.52
Sill
Proporcional a la
varianza de Z
4.2 (igual para todo q)
30
135
semivariance
Caracterstica
20
10
20
30
distance
140
Tipos de Kriging Univariado
Kriging Simple.
Variable estacionaria.
Media conocida.
Kriging Ordinario (forma ms frecuentemente usada).
Variable estacionaria.
Media desconocida.
Kriging universal.
Variable no estacionaria.
Media desconocida.
Modelada como una funcin determinstica suave.
m(x) es estimada localmente.
141
Tipos de Kriging multivariados
Kriging con Deriva Externa.
Variable no estacionaria.
Media desconocida.
Cokriging.
Utiliza la data de diferentes atributos para cada estimacin.
Requiere el clculo y estimacin de variogramas cruzados.
m(x) es estimada localmente como un escalamiento de otra variable disponible sobre toda el
rea de estudio.
Modelo de estructura espacial bivariado.
Muy poco utilizado por su complejidad.
Cokriging co-localizado (Collocated Cokriging) Simplificacin del Cokriging.
Utiliza la variable secundaria slo en su localizacin ms cercana al punto a estimar.
Requiere conocer el coeficiente de correlacin entre la variable a estimar y la variable secundaria.
Tiende a sobrestimar la varianza de las estimaciones.
Se recomienda reducir por un factor constante para usar en simulacin.

142
Simulacin
Aprovecha que la salida del kriging provee tanto la estimacin como la varianza del error
(media y varianza).
Valores
Simulados
143
Kriging vs Simulacin
EL kriging tiende generar resultados suaves y sin ruido.
La textura no es la de la propiedad.
La simulacin honra las fluctuaciones del fenmeno.
Produce realizaciones, que permiten entender mejor la variabilidad.
Generalmente se supone distribucin normal.
144
Simulacin
Realizacin 1
Realizacin 2
Realizacin 3
Realizacin 4
145
Impacto de los parmetros geoestadsticos

Modelo de Variograma
Algunos modelos autorizados

Rango
1,2
Sill
1
0,8
0,6
0,4
0,2
Nugget
0
0
250
500
Esfrico
750
Exponencial
1000
1250
1500
Gaussiano
Natera, A. (2013). UCV.
146

Rango del Variograma
0,400
0,350
0,300
0,250
0,200
0,150
0,100
0,050
0,000
0
0,5
1,5
2,5
147

Tasa de Anisotropa
0,400
0,300
0,200
rm/rM = 0.3
0,100
0,000
0
0,5
1,5
0,400
0,300
0,200
rm/rM = 0.5
0,100
0,000
0
0,5
1,5
0,400
0,300
0,200
rm/rM = 0.7
0,100
0,000
0
0,5
1,5
148

Direccin de Anisotropa
1
0,5
0
-1
-0,5
0,5
0,5
0,5
-0,5
-1
1
0,5
0
-1
-0,5
-0,5
-1
1
0,5
0
-1
-0,5
-0,5

-1
149

Efecto Nugget
1,200
1,000
0,800
0,600
0,400
0,200
0,000
0
0,5
1,5
2,5
150
Captulo IV
Elementos esenciales del modelado de
yacimientos
Tpicos a tratar
Modelado geoestadstico.
Modelado geomtrico.
Definicin del volumen de inters.

Resolucin horizontal y disposicin de las celdas del modelo.
Resolucin vertical.
Datos de entrada.
Flujo de trabajo tpico.
Reescalamiento de pozos.
Modelado de facies.
Guas.
Curva de proporcin vertical.

Mapas de probabilidad de facies.
Variables secundarias.
Simulacin de indicadores.
Modelado de propiedades.
Transformaciones tpicas.
Flujo de trabajo.
152
Flujo de trabajo
153
Flujo de trabajo
154
Modelado geomtrico
Forma del yacimiento.
Establecer rea de inters.
Separacin de unidades estratigrficas.
Separacin de bloques.
Identificacin de saltos de falla.
Determinar tipos de contactos.
Insumos.
Conceptualizacin geolgica.
Distribucin espacial de observaciones.
Ubicacin en los pozos de las superficies que definen la unidades estratigrficas.
Ssmica.
Interpretacin de superficies y fallas.
155
Modelado geomtrico
rea de inters:
Inters para los objetivos del estudio.
Disponibilidad de datos.
156
Modelado Geomtrico
Modelado geomtrico
Superficies.
Zonas verticales o unidades estratigrficas.
Unidades de inters.
Todo anlisis se har separadamente para cada unidad.
Las superficies se generan mediante la

interpolacin de las profundidades
interpretadas en pozos.
Se puede la interpretacin ssmica de los
horizontes para guiar las superficies en
localizaciones no observadas.
Las superficies deben ser suaves para
evitar problemas geomtricos.
158
Modelado geomtrico
La resolucin del modelo debe poder capturar la heterogeneidad lateral.
Debe evitar la prdida de informacin.
Debe ofrecer flexibilidad para nuevas localizaciones.
Pueden considerarse entre 5 y 7 celdas entre pozos.
Orientacin de celdas.
De acuerdo la direccin de mayor continuidad espacial, basado en el criterio dominante

entre los procesos sedimentarios o estrcturales.
159
Modelado geomtrico
Unidades estratigrficas.
El modelo debe estar separado en unidades estratigrficas.
Unidades geolgicas separadas por sellos impermeables.
Unidades cuyos procesos o ambientes no pueden modelados de manera conjunta.
Identificar tipos de contactos.
160
Modelado geomtrico
Resolucin vertical.
La resolucin vertical se define en base a tres criterios principales:
Mayor resolucin para modelar mayor heterogeneidad.
Mayor resolucin en zona de mayor inters, mejor calidad de propiedades.
Menor espesor significativo de facies de inters.
Verificar mediante control de calidad de pozos reescalados.
Usualmente la mnima resolucin no es menor de 2ft.
161
Modelado geomtrico
Menor espesor significativo de facies de inters.

Des criptivos
Es pesor de c apas
N
150
Mnimo
2,50
Media
29,3298
Mx imo
52,06
A pesar de que el espesor

mnimo es de 2 podra ser
conveniente modelar capas de
7-8.
Capas ms delgadas tienen

muy poca oportunidad de
ocurrir.
162
Reescalamiento de Registros de Pozos
Reescalamiento de pozos
Llevar los registros de pozos a la resolucin del modelo geocelular.
Se procura minimizar la prdida de informacin.
Se debe ejecutar un control de calidad de los resultados y de ser necesario debe

revisarse la resolucin del modelo.
Proceso tpico.
Reescalamiento de los indicadores de facies.
Sesgo para evitar la desaparicin sistemtica de facies minoritarias.
Reescalamiento de propiedades petrofsicas.
Volumen de arcilla.
Porosidad.
Permeabilidad.
Saturacin de agua:
Ponderado por porosidad.
164
Tanto para variables continuas como discretas debemos hallar un valor representativo en cada
celda para los valores medidos en pozos dentro de la misma.
Observacin
Perdida
Promedio No
Representativo
165
Llevar los registros de pozos a la resolucin del modelo geocelular.
Para cada celda del modelo que ha sido

intersecada por un pozo se asigna un valor
nico de las propiedades.
Este valor nico debe ser el mejor
representante de los valores contenidos en
la celda.
Una vez reescalados los pozos, las celdas
con datos se convierten en la mnima
unidad muestral.
166
Reescalamiento de facies.
Existen tres criterios.
Pozo
Most of (moda).
Mid point pick (punto medio).
Random pick (muestreo aleatorio).
Celda
Arena
Arena
Arena
Resultante = Arena
Arcilla
Arcilla
Arena
Resultante = Arena
Arena
167
Reescalamiento de facies.
Existen tres criterios.
Most of (moda).
Mid point pick (punto medio).
Valor que ms se repite.
Valor al centro vertical de la celda.
Random pick (muestreo aleatorio).
Valor en una localizacin vertical aleatoria dentro de la celda.
168
169
Reescalamiento de propiedades.
Promedio de la propiedad dentro la celda de inters.
Considerar slo las observaciones de la facie asignada a la celda.
La saturacin de agua debe reescalarse ponderada por la porosidad.
Pozo
Phie
Sw
Arena
0,21
0.38
Arena
0,24
0.45
Arena
0,19
0.48
Arcilla
0,08
0.55
Arcilla
0,07
0.60
Arena
0,20
0.64
Arena
0,27
0.71
Celda
Phie Celda
Sw Celda
Arena
0.213
0,436
0.235
0,68
Arena
170
Tipos de promedio.
De acuerdo a las caractersticas de las propiedades petrofsicas pueden utilizarse

diferentes tipos de promedios para encontrar un valor representativo de la propiedad en
cada celda.
Aritmtica
1
ma xi
n
Adecuada para porosidad y
saturacin.
Puede generar resultados muy
optimistas para la permeabilidad,
sin embargo es correcta para
capas homogneas con flujo
paralelo a las capas.
Geomtrica
Harmnica
mg xi
1
n
1
1
mh
xi
n
Sensible a valores bajos.
Adecuado para permeabilidad en

capas heterogneas con elevada
aleatoriedad y distribucin lognormal.
Adecuado para permeabilidad

en capas homogneas con flujo
predominantemente vertical.
171
Tipos de promedio.
De acuerdo a las caractersticas de las propiedades petrofsicas pueden utilizarse

diferentes tipos de promedios para encontrar un valor representativo de la propiedad en
cada celda.
Aritmtica
1
ma xi
n
Adecuada para porosidad y
saturacin.
Puede generar resultados muy
optimistas para la permeabilidad,
sin embargo es correcta para
capas homogneas con flujo
paralelo a las capas.
Geomtrica
Harmnica
mg xi
1
n
1
1
mh
xi
n
Adecuado para permeabilidad en

capas heterogneas con elevada
aleatoriedad y distribucin lognormal.
Adecuado para permeabilidad

en capas homogneas con flujo
predominantemente vertical.
172
173
Modelado de Facies
Modelado de facies
Mtodos de modelado.
Modelado por simulacin de indicadores.
Modelado por objetos.
Principalmente para ambientes fluviales.
Geoestadstica multipunto.
Kriging.
Imgenes de entrenamiento.
Todos honran la informacin de los pozos.
175
Modelado de facies
Mtodos de modelado.
Modelado por simulacin de indicadores.
Kriging
Aplica las ecuaciones de kriging y la simulacin secuencial para generar el modelo de facies.
Cada celda se simula como una observacin tipo bernoulli a partir de la probabilidad obtenida
por la solucin del kriging.
Modelo basado principalmente en el modelo de estructura espacial de los datos.
176
Modelado de facies
Informacin gua.
La curva de proporcin vertical puede ayudar a ajustar el valor de probabilidad de

observar una facie en una profundidad especfica.
177
Modelado de facies
Informacin gua.
El mapa de proporcin o probabilidad de una facie puede ayudar a ajustar el valor de

probabilidad de observar una facie en una localizacin especfica.
178
Modelado de facies
Informacin gua.
El atributo ssmico est disponible en toda el rea de estudio.
El valor del atributos ssmico en la localidad a estimar puede ayudar a ajustar la

probabilidad de observar una facie especfica.
Efecto del atributo ssmico en la probabilidad de facies
37%
39%
49%
53%
59%
62%
Probabilidad
63%
61%
51%
47%
41%
38%
70%
30%
72%
28%
79%
21%
80%
20%
87%
13%
91%
100%
100%
100%
100%
100%
9%
179
Modelado de Propiedades
Modelado de propiedades
El modelado de propiedades petrofsicas se realiza tpicamente mediante interpolacin y

simulacin secuencial gaussiana.
Las estimaciones siempre son condicionales en las facies.
Requiere la elaboracin y ajuste de los variogramas.
Variogramas de las propiedades dentro de cada facies y unidad estratigrfica.
Distintas propiedades pueden requerir distintos mtodos.
181
182
Para el modelado de propiedades petrofsicas es esencial aplicar transformaciones a los datos

para garantizar la calidad de los resultados.
Dichas transformaciones deben aplicarse antes de calcular los variogramas experimentales.
Transformaciones tpicas.
Truncamiento.
Truncamiento de entrada: Ajuste de datos anmalos observados.
Truncamiento de salida: Depuracin de valores simulados.
Remocin de tendencia.
Clculo y sustraccin de funciones matemticas de tendencia para procurar

estacionariedad.
Normalizacin.
Logaritmo: aplica tpicamente a la permeabilidad.
Normal scores: transformacin a distribucin normal.

183
Truncamiento.
Analizar la distribucin de probabilidad de los datos de entrada.
Determinar los valores extremos aceptables para la distribucin.
Descartar valores atpicos o fuera del rango de valores observados.
Truncamiento de datos de entrada.
Registros de pozos.
Ignorar los valores descartados tanto para el clculo de los variogramas como para
el proceso de interpolacin.
Truncamiento de salida.
Si algn valor generado por la simulacin se encuentra fuera del rango de valores
aceptables, descartar y repetir.
184
Tendencias.
Determinar los modelos matemticos que explican las variaciones sistemticas de la

propiedad asociadas a las coordenadas x1, x2, x3.
Remover la tendencia a cada observacin para continuar el modelado con los efectos no
sistemticos debidos a otras causas.
Residuales
Tendencia
18
16
6
5
4
3
14
12
2
1
10
8
6
y = -2,3x + 15,4
4
2
0
0
0
-1
-2
-3
-4
-5
-6
-7
0
185
Normalizacin.
Transformar los datos para que su distribucin se aproxime a una distribucin normal.
Logaritmo.
Aplica tpicamente a la permeabilidad dada su distribucin log-normal.
Probabilidad
0.0 0.1 0.2 0.3 0.4 0.5
Probabilidad
10
20
30
40
50
0.0 0.1 0.2 0.3 0.4 0.5
-4
-2
186
Normalizacin.
Transformar los datos para que su distribucin se aproxime a una distribucin normal.
Normal Scores.
Forzar a los datos a una distribucin normal a travs de la funcin de

distribucin acumulativa.
F(U)
F(Z)
0,9
0,9
0,8
0,8
0,7
0,7
0,6
0,6
0,5
0,5
0,4
0,4
0,3
0,3
0,2
0,2
0,1
0,1
0
0
0,2
0,4
0,6
0,8
-3
-2,5
-2
-1,5
-1
-0,5
0,5
1,5
2,5
187
3,5
Una vez que las propiedades han sido analizadas y se garantizan las condiciones para la
aplicacin del kriging se procede al poblar las celdas vacas de acuerdo a la propiedad.
Porosidad.
Simulacin secuencial gaussiana.
De haber atributos ssmicos correlacionados, se pueden utilizar como variables

secundarias.
Por ejemplo, aplicar Collocated Cokriging.
Permeabilidad.
Simulacin secuencial gaussiana.
Utilizar la porosidad ya poblada como variable secundaria.
En caso de conocerse una funcin matemtica determinstica que relacione la

porosidad y la permeabilidad, el poblamiento se puede hacer mediante dicha
funcin usando la porosidad simulada en todas las celdas.
188
Saturacin de agua.
La saturacin de agua tiene caractersticas particulares dado que viene dada por la
diferenciacin de fluidos por su densidad.
No debe ser estimada mediante simulacin porque no debe tener mayores

fluctuaciones.
Puede ser estimada slo con el modelo de tendencia en profundidad.
Puede ser interpolada mediante inverso de la distancia.
La saturacin de agua debe presentar variaciones principalmente verticales.
Sus variaciones no son paralelas a las superficies, los fluidos se adaptan a la forma
del recipiente.
Al ser interpolada deben considerarse las distancias horizontales ignorando las

deformaciones del subsuelo.
Si la distribucin del fluido no est asociada a la separacin por densidad, sino que guarda una
relacin estricta con otras propiedades ser necesario analizar la relacin con las otras
variables y considerar una funcin matemtica o aplicar mtodos de estimacin usando
variables secundarias.
189
Mdulo II
Introduccin a las redes
neuronales
Captulo I
Introduccin
Introduccin
Existen tareas que, aunque sean naturales para nosotros, no podramos

explicar paso a paso y en detalle como las realizamos.
Por ejemplo: reconocer una cara en un foto, sin importar su posicin o

tamao, incluso que sea una foto de hace aos.
Existen otras tareas que estn fuera de nuestro alcance debido a su

complejidad o volumen de datos o variables involucrados.
Por ejemplo: datos meteorolgicos, o genmicos.
192
Introduccin
En la actualidad los mtodos de aprendizaje automtico se usan en

diversos campos como:
Vehculos auto-guiados.
Reconocimiento de imgenes.
Reconocimiento de voz.
Deteccin de fraude.
Biologa.
Comercio electrnico.
Robtica.
Redes sociales.
Video juegos.
Muchos otros.
Ciencias de la tierra.
En este sentido es importante entender

que no es una herramienta exclusiva para
las ciencias de la tierra
Es una herramienta que evoluciona

rpidamente y que puede aplicarse a
cualquier rea del conocimiento
193
Objetivos
Ofrecer una introduccin a la importancia y utilidad de las redes neuronales.
Proveer una comprensin elemental del funcionamiento de algunos algoritmos

populares de redes neuronales y aprendizaje automtico.
Mejorar la capacidad de los participantes para aprovechar la capacitacin en el uso

de programas o herramientas basadas en redes neuronales, reduciendo la
opacidad de los procesos.
Proveer a los participantes de una visin capaz de interpretar y evaluar los

resultados de la aplicacin de algunos mtodos basados en aprendizaje
automtico.
Estimular la creatividad de los participantes para proponer soluciones a problemas

donde el uso de herramientas de aprendizaje automtico sea recomendable.
194
Alcances y Expectativas
Este curso no contempla el entrenamiento en el uso de programas, sin embargo, procura

generar una base para iniciarse en el uso de estas herramientas.
La base terica del curso desde el punto de vista matemtico, estadstico y computacional
est dirigida a profesionales de las reas de ciencias de la tierra, por lo cual numerosos
detalles sern omitidos o discutidos de manera informal.
Los tpicos asociados al uso de redes mtodos de aprendizaje automtico estn orientados a
entender las base terica y el funcionamiento de tareas especficas que o forman parte del
flujos de trabajo tpicos.
195
Mapa Mental
Aprendizaje
automtico
Inteligencia
artificial
reas
relacionadas
Regresin
Contexto
Redes
neuronales
Fundamentos
Modelos de
aprendizaje
Mtodos de
aprendizaje
Estructura de
las redes
neuronales
Mtodos de
agrupamiento
Mtodos
Clasificacin
Clasificacin
Supervisada
Tipos de
soluciones
Clasificacin
No
supervisada
196
Captulo II
Tecnologas de aprendizaje
automtico
Aprendizaje Automtico
(Machine learning)
Las tecnologas de aprendizaje automtico comprenden diferentes metodologas, mediante

las cuales se pretende programar o automatizar el proceso de convertir experiencia en
conocimiento o experticia.
En este contexto las tecnologas de aprendizaje automtico comprenden tres niveles.
Inteligencia artificial
Aprendizaje automtico (machine learning) Parte de la Inteligencia artificial
Conjunto de disciplinas que tienen como objetivo imitar el pensamiento inteligente

e incluso el comportamiento inteligente.
Tiene como objetivo modelar procesos de aprendizaje para resolver problemas
especficos y generalmente, obtener informacin de datos empricos.
Redes neuronales Parte del Aprendizaje automtico.
Tiene el mismo objetivo pero basa sus procesos en modelos de neuronas

inspirados en el sistema nervioso biolgica.
198
Inteligencia artificial
La inteligencia artificial en su concepcin ms

amplia trata de imitar la inteligencia humana.
Las aplicaciones de la inteligencia artificial van

desde la medicina hasta los videojuegos.
Hay diferentes tipos de inteligencia artificial
Aprendizaje.
Comportamiento.
Sistemas que piensan como humanos.

Sistemas que actan como humanos.
Lgica (ideal).
Sistemas que piensan de manera

racional.
Sistemas que actan racionalmente.
Alan Turing propuso que una forma de medir la

habilidad de una mquina para exhibir un
comportamiento inteligente
Esta sera que un humano evaluara una
conversacin entre un humano y una
computadora capaz de imitar respuestas
humanas
El xito de la mquina sera no poder ser
distinguida del humano
199
Aprendizaje automtico
El aprendizaje automtico es una rama de la

inteligencia artificial, pero no busca imitar el
comportamiento humano, sino formas
inteligentes de convertir la informacin en
conocimiento.
Recibe como insumo datos que son

interpretados como experiencia y genera
como salida algn nivel de experticia que es
usado para realizar otras tareas.
En el contexto de las ciencias de la tierra

usualmente la tarea ser predecir el valor de
una propiedad del subsuelo.
Clasificacin (variables categricas)
Regresin (variables continuas).

200
Redes neuronales artificiales
Las redes neuronales artificiales, son un

enfoque del aprendizaje automtico inspirado
en la forma en que funciona el sistema
nervioso biolgico.
Esencialmente es un sistema interconectado

de nodos o neuronas que colaboran para
producir una respuesta.
Los parmetros de la red reaccionan a los

estmulos (datos de entrada) y se ajustan para
producir respuestas que minimicen alguna una
medida de error o riesgo.
201
Enfoques de aprendizaje automtico

Algunos enfoques comunes del aprendizaje automtico contemplan modelos como:
rboles de decisin: decisiones secuenciales y posibles resultados.
Algoritmos genticos: imitan el proceso de seleccin natural.
Redes neuronales: imitan una red nerviosa biolgica.
Algoritmos de agrupamiento (clustering): clasificacin de elementos en subgrupos o

clusters.
Redes bayesianas: representan relaciones probabilsticas entre variables aleatorias.
202
Modelado estadstico vs Aprendizaje

automtico
Modelado estadstico
Originada como una rama de las matemticas.
Construccin de modelos basados en ecuaciones

matemticas como formalizacin de las relaciones entre
variables.
Mayor carga de trabajo para el analista.
Frecuentemente depende de suposiciones rgidas sobre

la distribucin y varianza de los datos.
Interpretacin ms directa de los resultados.
Originado como una rama de las ciencias de la

computacin e inteligencia artificial.
Construir sistemas que aprenden de los datos en

lugar de ejecutar instrucciones programadas de
manera explcita.
Menor carga de trabajo para el analista.
Suposiciones ms flexibles sobre las caractersticas

de los datos.
Interpretacin opaca - Caja negra
OBJETIVO COMN: APRENDER DE LOS DATOS OBSERVADOS PARA PREDECIR POSIBLES

RESULTADOS
203
Modelado estadstico
Prediccin del consumo de un carro (millas por galn) en funcin del los caballos de fuerza
(hp) y el peso (wt, en miles de libras).
Frmula matemtica cerrada para efectuar la prediccin.
Interpretacin directa.
Por cada 1000 libras que

aumenta el peso del carro su
rendimiento disminuye en 3,77
millas por galn
35,0
30,0
=37,980,0323,77
Prediccin
1/MPG
25,0
20,0
15,0
Prediccin
10,0
5,0
mpg
Modelo
204
Modelado estadstico
El modelo de regresin lineal requiere comprender las relaciones entre las variables, este
modelo en s mismo representa un hiptesis sobre la relacin entre las variables.
El modelo lineal tiene tpicamente la forma = +
Para el ejemplo anterior la forma sera = + 1 + 2
(1)
El subndice i vara de 1 a n, donde n es el total de datos (casos)
Una vez propuesto, el modelo no cambia con los datos, la informacin contenida en los datos
se utiliza para estimar los parmetros b0, b1 y b2.
Una vez estimados lo parmetros la interpretacin es directa:
b0 representa el intercepto.
b1 representa el efecto de la variable a hp en la estimacin del valor de mpg.
b2 representa el efecto de la variable a wt en la estimacin del valor de mpg.
Para estimar una nueva observacin basta con evaluar la frmula (1).
205
Cuando se utilizan los mtodos de aprendizaje automtico los parmetros del

modelo estn asociados con el algoritmo de aprendizaje, no directamente con la
relacin de entre los datos.
No se plantea una hiptesis sobre la relacin entre los datos de entrada y salida,
aunque es conveniente verificar que exista alguna relacin de informacin.
El modelo no recibe una estructura formal de la relacin entre las variable como la
frmula del modelo de regresin.
El propio modelo aprende de los datos observados y actualiza la relacin entre la

entrada y la salida.
Los parmetros del modelo no necesariamente pueden interpretarse de manera

directa.
206
Redes neuronales
Una red neuronal es un procesador distribuido naturalmente propenso a almacenar

conocimiento derivado de la experiencia y mantenerlo disponible para ser usado.
Se asemeja al cerebro humano en dos aspectos fundamentales:

El conocimiento es adquirido por la red a travs de un proceso de aprendizaje.
La fuerza o magnitud de la conexin entre las neuronas o nodos, llamados pesos

sinpticos, se utilizan para almacenar el conocimiento.
La estructura bsica de los nodos de una red puede representarse como un grafo (simplificado)
x1
Pesos
sinpticos
Procesamiento
Salida
w1
Entrada
wp
xp
207
Informacin, conocimiento y
aprendizaje
Importancia de imitar la inteligencia
La ventaja de utilizar mtodos de aprendizaje automtico radica en la posibilidad de resolver

problemas para los cuales no tenemos una secuencia de pasos definida, ya sea debido a su
complejidad o a que no entendemos claramente cmo se llevan a cabo en nuestro propio
cerebro.
Escribir un programa es como dar instrucciones a una persona que piensa muy rpido, pero
carece totalmente de creatividad y su interpretacin de nuestras rdenes es estrictamente
literal.
Literal
Inteligente
=
Pero no podemos describir en
detalle el proceso mediante el
cual establecemos la relacin
entre la entrada y la salida
209
Por que es til el aprendizaje automtico
Tareas inteligentes
Tareas que ejecutamos de manera rutinaria pero que no podemos describir paso a paso
con el detalle necesario para elaborar un programa.
Tareas que sobrepasan las capacidades humanas
Anlisis de conjuntos de datos extremadamente complejos, donde la capacidad humana

de encontrar sentido o informacin significativa se ve sobrepasada.
Por ejemplo: reconocimiento del lenguaje hablado.
Por ejemplo: prediccin climtica, anlisis de datos genmicos.
Adaptabilidad
Los programas usualmente son rgidos y una vez escritos e instalados no cambian, sin
embargo, algunas tareas pueden cambiar en el tiempo, o cambiar de acuerdo al usuario
o al entorno. En este sentido las herramientas de aprendizaje automtico interactan con
el ambiente y se adaptan de acuerdo a la experiencia de manera natural.
Por ejemplo: deteccin de correos no deseados.

210
Informacin y conocimiento
En el contexto del aprendizaje automtico, la informacin se refiere tpicamente a

los datos suministrados a un sistema para tratar de responder una pregunta
especfica.
Los datos de entrada representan a experiencia y los de salida la experticia o

conocimiento.
Capacidad de resolver un problema especfico o responder a una pregunta

especfica a partir de la informacin recibida.
X1
X2
Relacin
Salida
10
15
11
?
211
Aprendizaje
Para una red neuronal el proceso de aprendizaje es un poco ms especfico.
El aprendizaje es el proceso mediante el cual los parmetros libres de una red

neuronal se adaptan, mediante un proceso continuo de estimulacin generada
por su entorno. El tipo de aprendizaje depende de la forma en que los cambios
ocurren en la red.
La definicin de aprendizaje implica la siguiente secuencia de eventos.
La red es estimulada por su entorno.
La red sufre cambios como resultado de los estmulos.
La red responde a su entorno de una manera nueva, de acuerdo a los cambios

ocurridos en su estructura interna.
212
Tipos de Aprendizaje
La clasificacin del aprendizaje depende del tipo de tarea que se pretende ejecutar,
por lo existen diversos paradigmas de aprendizaje que pueden generar una
clasificacin.
Aprendizaje supervisado vs No supervisado.
Aprendizaje pasivo vs activo.
Depende de la iniciativa que puede tomar el estudiante para obtener

informacin.
Aprendizaje en lnea vs aprendizaje por lotes.
Depende de la disponibilidad de casos de entrenamiento con respuestas

conocidas.
Depende de si la interaccin con el entorno debe producir respuestas en

tiempo real o luego de haber procesado (entrenado) con grandes volmenes
de informacin.
En este curso trataremos siempre aprendizaje pasivo por bloques.

213
Aprendizaje supervisado vs no supervisado

No supervisado
Supervisado
El sistema se entrena con datos de entrada

asociados a respuestas conocidas.
El sistema se entrena slo con datos de

entrada.
El sistema debe determinar nuevas

respuestas en funcin de las clases /
respuestas ya observadas.
El sistema clasifica los datos de entrada

en funcin a los patrones encontrados
como diferenciacin de subgrupos o
identificacin de datos anmalos.
La interpretacin de la salida tiende a ser

directa, ya que se conocen los posibles
valores salida.
La interpretacin no es directa, el
analista debe buscar sentido a los
subgrupos identificados por el sistema.
214
Aprendizaje pasivo vs activo

Activo
Pasivo
El sistema recibe y procesa la informacin

disponible pero no puede promover
nuevas formas de adquirir informacin.
El sistema no puede preguntar, no puede
generar situaciones de prueba para probar
sus hiptesis.
Por ejemplo: un sistema de identificacin
de correos no deseados que se alimenta
cada vez que el usuario marca (o no) un
correo como no deseado.
El sistema puede promover formas

distintas de recibir informacin.
El sistema puede generar situaciones

para probar sus hiptesis.
Por ejemplo: un sistema de

identificacin de correos no deseados
que puede escribir un correo con
caractersticas especficas para que el
usuario lo clasifique como deseado o
no, y as identificar una caracterstica.
215
Aprendizaje en lnea vs por lotes

Por lotes
En lnea
El sistema interacta con el entorno de

manera regular y temprana.
El sistema puede procesar un gran

volumen de datos antes de interactuar.
Este sistema cometer muchos errores

antes de aprender, pues va haciendo
experiencia a medida que interacta.
Este sistema no sacar conclusiones

hasta haber obtenido algn nivel de
experticia de la informacin disponible.
En lo sucesivo hablaremos slo de sistemas pasivos, que aprenden por lotes

216
Captulo III
Estructura tpica de las redes
neuronales
Estructura tpica de las redes neuronales
Una red neuronal est conformada por un conjunto de unidades de procesamiento que
se comunican enviando seales a travs de conexiones ponderadas.
Cada unidad realiza una tarea relativamente simple:
Recibir una seal de una fuente externa.
Utilizar la seal para computar una salida que es propagada hacia otras unidades.
En este sentido es importante identificar tres tipos de unidades:
Unidades o nodos de entrada: reciben seales desde exterior de la red.
Unidades o nodos de salida: generan una salida / respuesta fuera de la red.
Unidades o nodos ocultos: la seales que reciben y propagan se mantienen dentro

de la red.
218
Perceptrn
Perceptrn
El perceptrn es una de las redes neuronales ms antiguas y simples, lo que la hace

perfecta para comprender la estructura tpica de la red aunque su aplicacin ya no es
comn debido a sus limitaciones.
Supongamos en caso ms sencillo:
Dos nodos de entrada.
Un nodo de salida.
Esta red puede clasificar dos clases.
Entrada (xi)
x1
Pesos
Sinpticos (wi)
Procesamiento
Combinacin de
entrada y pesos
w1
w2
x2
1
Sesgo
( + q)
Funcin de activacin
1
> 0
=
1
Salida
Resultado
de f(s)
Funcin de
Activacin
Cmputo del nodo
= + q
Sesgo
q: Es un valor de corte
La salida de la red es un valor {+1, -1}

Combinacin lineal de las
entradas y los pesos
220
Perceptrn
Cmo hace la red para clasificar los casos?
= + q
as que 1 1 + 2 2 + q =
1
> 0
as que la recta 1 1 + 2 2 + q = 0 define la
1
salida
2 =
2 1
O lo que es lo mismo usa la recta
En este caso usamos la funcin signo como funcin de activacin, pero

existen otras como la sigmoidal, muy frecuentemente utilizada.
221
Perceptrn
Cmo hace la red para aprender de los casos observados (entrenamiento)?
Si la respuesta arrojada por la red para un caso de entrenamiento es correcta no hay

cambios en los parmetros de la red.
Si la respuesta arrojada por la red es distinta de la respuesta conocida introducida

en el entrenamiento se actualizan los parmetro aditivamente.
+ 1 = + ()
= d x
El cambio es el mismo valor de entrada con el signo correcto
q + 1 = q + q ()
q = d x
El cambio es directamente la respuesta correcta
Mostrar ejemplo de perceptrn (opcional)

222
El Perceptrn
Ejemplo perceptrn ( 1 )
2,5
R1
R2
1,5
El estado inicial de la red clasifica los puntos A y B

mediante la recta R1.
A y B son clasificados correctamente.
C es introducido y clasificado incorrectamente

d(xC) = 1 ; y(xC) = -1
La red se actualiza R1 -> R2
Ahora C es clasificado correctamente.
R3
D
-2
-1,5
-1
d(xC) = 1
y(xC) = -1
d(xD) = 1
y(xD)
0 = -1
B
-2,5
0,5
-0,5
0
-0,5
0,5
1,5
2,5
D es introducido y clasificado incorrectamente.

d(xD) = 1 ; y(xD) = -1
La red se actualiza R2 -> R3
Ahora D es clasificado correctamente.
-1
223
El Perceptrn
Ejemplo perceptrn ( 2 )
2,5
Si tratamos de entrenar la red con el punto E tal que:

D(xE) = -1
La red falla.
1,5
-1
+1
La configuracin de los datos de entrenamiento no puede

ser modelada con una recta.
Es necesario un modelo ms complejo.
0,5
B
-2,5
-2
-1,5
Para esto se agregan ms nodos y capas a la red.
-1
-0,5
0,5
1,5
2,5
-0,5
-1
224

La red gana flexibilidad y capacidad de procesamiento en la medida que se incluyen
neuronas en una capa oculta.
El comportamiento de los nodos en la capa oculta no se ve reflejado en la entrada ni

en la salida de la red, por lo que opera como una caja negra para el usuario.
Entrada
Capa oculta
Procesamiento
Salida
Un exceso de neuronas ocultas puede

generar sobreestimacin, limitando la
capacidad de la red para generalizar.
x1
xp
Un dficit de neuronas en la capa

oculta puede disminuir la robustez del
sistema, limitando la capacidad del
sistema de ajustarse a los datos
(ejemplo visto en el perceptrn de
una sola neurona).
225
Aprendizaje de las redes neuronales
Las redes neuronales tienen su forma especfica de representar el aprendizaje.
Recordemos que:
El aprendizaje de las redes neuronales ocurre a travs de la adaptacin de sus

parmetros internos en la medida que el sistema interacta con su entorno.
El conocimiento de la red se almacena en los pesos sinpticos que son una medida
de la fuerza de la conexin entre dos nodos o neuronas de una red.
El modelo de aprendizaje de la red puede interpretarse como la forma en que cambian

los pesos sinpticos como respuesta a su entorno (data).
227
En el ejemplo del Perceptrn vimos que el aprendizaje del sistema viene dado por el
ajuste (aditivo) de los pesos sinpticos.
Diferentes modelos de aprendizaje consisten en diferentes formas de calcular Dw
Aprendizaje por correccin de error:
El objetivo es minimizar la diferencia entre el valor de entrenamiento y la respuesta

del sistema.
Aprendizaje Hebbiano:
h: tasa de aprendizaje
h: tasa de aprendizaje
Refuerza la conexin entre neuronas que se activan de manera simultnea.
Aprendizaje competitivo:
Ajusta el peso de las neuronas para especializarlas en reconocer estmulos especficos.
Veremos este modelo en ms detalle al estudiar los mapas auto-organizados.

228

Correccin de error
Regla delta
Optimizacin del error
Hebbiano
Inspirado por procesos biolgicos

Refuerzo de la conexin entre neuronas activadas
simultneamente
229
Otros parmetros de las redes neuronales.
El diseo de las redes neuronales contempla otros parmetros relacionados

especficamente con el proceso de aprendizaje.
Tasa de aprendizaje [0-1]: controla el tamao de los cambios en los pesos sinpticos
y el sesgo, puede reducir la velocidad de aprendizaje de la red para evitar saltos.
Momento [0-1]: incluye una fraccin del valor anterior de los pesos sinpticos.
Promedia el valor actual con el valor anterior.
Principalmente se usa para evitar la convergencia a mnimos locales del error.
230
Captulo IV
Fundamentos de estadstica
Bayesiana
Conceptos bsicos
Verosimilitud: credibilidad de un elemento en un contexto.
Desde el punto de vista estadstico la verosimilitud cuantifica la probabilidad que un

conjunto de datos provenga de una distribucin especfica.
Supongamos 10 observaciones de provenientes de una distribucin de bernoulli
1 1 1 1 1 0 0 0 0 0 - > promedio = 0,5
1 1 1 1 1 1 1 1 1 0 - > promedio = 0,9
Si decimos que esas observaciones provienen de una distribucin de Ber(x|p=0,5)
Cul de los dos resultados es ms verosmil?
Cul es ms creble como resultado de muestrear esa distribucin?
232
Conceptos bsicos
Parmetros: es un ndice numrico que define las caractersticas de una poblacin.
Como ya vimos anteriormente una distribucin de probabilidad se define en dos pasos
Definicin del tipo de distribucin:
Brenoulli, binomial, normal, exponencial, etc.
Determinacin de los parmetros de distribucin.
p (probabilidad de xito) para la distribucin Bernoulli.
p (probabilidad de xito) y n (nmero de intentos) para la distribucin binomial.
Media (centro) y varianza (dispersin) para la distribucin normal.
Debemos recordar que cuando obtenemos el promedio de un conjunto de datos

provenientes de una distribucin normal, estamos tratando de estimar la media (el
parmetro). Este es un objetivo esencial de la inferencia estadstica.
233
Estadstica Bayesiana
De manera informal se pueden usar las probabilidades para expresar informacin o

incertidumbre acerca de cantidades o eventos desconocidos, pero el uso de las
probabilidades para expresar informacin se puede hacer de manera formal.
La estadstica Bayesiana proporciona una manera natural de actualizacin de las

creencias a medida que se observa nueva informacin.
La metodologa Bayesiana se fundamenta en dos fuentes de informacin:
Previa: Especificacin de un modelo de probabilidad que incluya un conocimiento

previo sobre los parmetros del modelo. Distribucin de probabilidad de los
parmetros.
Verosimilitud: probabilidad de los datos observados dados los parmetros (previa).
La actualizacin de la previa de acuerdo a la verosimilitud genera una estimacin de la

distribucin de los parmetros del modelo o distribucin posterior.
234
La diferencia fundamental entre la estadstica frecuentista (clsica) y la estadstica

bayesiana radica en el punto de vista.
Frecuentista
Bayesiana
La probabilidad se encuentra en la naturaleza, los

parmetros son valores constantes pero
desconocidos.
La probabilidad se encuentra en el observador, los

parmetros se modelan como aleatorios para dar
cuenta de nuestra incertidumbre sobre ellos.
Slo considera la informacin contenida en los

datos, los parmetros no tienen distribucin.
Tambin considera informacin previa de os

parmetros, que pudiera ser subjetiva.
La diferencia entre ambas visiones es similar a comparar estos dos enunciados

Cul es la probabilidad de la
trayectoria de la pelota pase por el
aro?
La trayectoria de la pelota es
aleatoria, el aro es constante, no
sabemos si la pelota lo atravesar
Cul es la probabilidad de que el aro

se encuentre en la trayectoria de la
pelota?
Una vez lanzada la pelota su

trayectoria no es aleatoria, queda
por ver si el aro estar en su camino
235
Teorema de Bayes: Consideremos una particin de un espacio muestral S

P(A1)=0.25
P(A2)=0.25
| =
( )
( )
Probabilidad del evento B

dado un elemento de la
particin
=
P(A3) = 0.50
= 1 B 2 3
| =
( )
()
Probabilidad un elemento de
la particin dado que ocurri
el evento B
= (| )
| =
( )
(| )
236
Para entender por qu es til el teorema de Bayes veamos el siguiente ejemplo:
Se desea evaluar una prueba diagnstica para determinar la presencia de una

enfermedad especfica en un paciente.
De los experimentos realizados se sabe:
Prueba positiva dado paciente enfermo
Prueba positiva dado paciente no enfermo
Pero al momento de aplicar la prueba en un hospital lo que queremos saber es:
Diagnstico correcto
Diagnstico correcto
El teorema de Bayes permite calcular la probabilidad de los elementos de la particin (Enfermo / No enfermo)
a partir de la probabilidad condicional del evento (resultado de la prueba + / -)
La probabilidad de estar enfermo es el parmetro de inters / el resultado de la prueba son los datos
237
+ = 0,9
= 0,85
Cul es la probabilidad de que un paciente al que la prueba le resulta positiva

efectivamente est enfermo?
Supongamos 2 escenarios
1.- Enfermedad poco comn P(enfermedad)=0,05
Previa
2.- Enfermedad comn P(enfermedad)= 0,2
Previa
| + = +
Escenario 1: 0,9
Escenario 2:
0,9
0,9 0,2 +0,1 0,8
+
+
0,045
0,05 +0,1 0,95

0,9
()+
0,05 = 0,045+0,095 = 0,32
0,2 =
0,18
0,18+0,08
= 0,69
( )
()
La probabilidad de que el paciente

est enfermo (previa) se actualiza
con los datos
238
De manera anloga podemos actualizar la distribucin de probabilidad del parmetro de

una distribucin a partir de los datos.
Una variable aleatoria sigue una distribucin f(x|) y nuestro inters es estimar el
parmetro .
Se sugiere una distribucin previa ().
Actualizamos la informacin sobre la distribucin del parmetro utilizando la relacin:
(|x) (|) ()
La distribucin posterior de q es proporcional a:

El producto de la verosimilitud de los datos
Por la distribucin previa de q
La distribucin posterior podra ser la nueva previa ante una actualizacin de los datos, modelando
as un proceso de aprendizaje
239
Captulo V
Algoritmos de aprendizaje
automtico
Tipos de mtodos de aprendizaje

automtico
Los algoritmos de aprendizaje automtico se pueden clasificar de acuerdo

al tipo de tareas que pueden realizar, siendo una clasificacin comn:
Clasificacin:
Mtodos no supervisados.
Mtodos supervisados.
Regresin:
Mtodos supervisados (aunque hay estudios al respecto, no es comn usar mtodos no

supervisados para regresin).
Mtodos duales:
Algoritmos que pueden ser utilizados tanto para regresin como para clasificacin.
241
Clasificacin vs regresin
Clasificacin
La salida esperada corresponde a etiquetas,

clases o niveles:
Variables discretas.
Tpicamente variables categricas.
Pueden ser variables ordinales.
Supervisados:
Regresin
La salida corresponde a valores

numricos de una variable de salida:
Tpicamente variables continuas.
Tpicamente son mtodos supervisados:
Para una variable continua los posibles valores

de salida son infinitos.
Se alimenta el sistema con data de

entrenamiento que relaciona los datos de
entrada con su clasificacin correcta.
No supervisados:
No se conocen a priori las clases a la que

pertenecen las observaciones.
El sistema diferencia grupos de acuerdo a sus

caractersticas o patrones.
242
Clasificacin
Supongamos que deseamos clasificar las siguientes observaciones
No supervisada: No hay etiquetas previas

Vertebrados
>4
patas
0
patas
2
patas
Invertebrados
Pelos / plumas
Vertebrados
Sin Pelos / Plumas
Invertebrados
Supervisada: (etiquetas: Vertebrados / Invertebrados)
4
patas
243
Clasificacin
Se recomienda usar los mtodos supervisados para clasificar sobre tipos ya definidos:
Por ejemplo, queremos identificar facies geolgicas, y ya sabemos que queremos separar arenas de
arcillas.
Se recomienda usar mtodos no supervisados cuando queremos separar patrones an no

definidos:
Requerimos observaciones ya clasificadas.
Por ejemplo, queremos identificar facies geolgicas de acuerdo a un conjunto de atributos, pero no
sabemos exactamente cuntos tipos o cules tipos esperamos encontrar.
Nada no impide ejecutar una clasificacin por etapas, por ejemplo:
Supervisada: para separar arenas de arcillas.
No supervisada: slo sobre las arenas, para verificar si hay distintos tipos de arena que puedan ser de
inters de acuerdo a sus propiedades.
Como en todos los mtodos estadsticos la calidad de la solucin depende mucho ms de que
la pregunta planteada sea adecuada.
244
El problema vs la herramienta
Consideremos una aplicacin mvil de asistente de ruta:
La aplicacin ejecuta un algoritmo inteligente que nos ayuda a decidir la ruta ptima para
llegar del punto A al punto B.
Sin embargo, la aplicacin nos preguntar qu solucin deseamos
Ruta ms corta en distancia.
Ruta ms corta en tiempo (trfico).
Ruta ms econmica (evadir peajes).
Los mtodos basados en

inteligencia artificial no
reemplazan la inteligencia
humana para plantear la
pregunta correcta
245
Algoritmos de agrupamiento
Algoritmos de agrupamiento / clustering
Los mtodos tradicionales de agrupamiento no pertenecen a la categora de

mtodos de aprendizaje automtico, sin embargo, son extremadamente tiles y
ofrecen una plataforma sencilla para entender el proceso de clasificacin no
supervisada y el procesamiento requerido para llevar a cabo estas tareas.
En todos los casos el objetivo es separar las observaciones en grupos tales que:
Maximizar la similitud de los elementos dentro de cada grupo.
Maximizar las diferencias entre elementos pertenecientes a grupos distintos.
En este contexto veremos dos de los mtodos ms populares:
Agrupacin por k-medias:
Cada uno de los k-grupos se asocia a un centroide (media) - Muy sencillo de aplicar.
Agrupacin jerrquica:
Ramificacin de las observaciones en base a su disimilitud.
247
K-medias vs agrupacin jerrquica

K-medias
Jerrquico
Cada grupo se asocia un centroide y cada

elemento pertenece a al grupo cuyo centroide es
ms cercano (celdas de Voronoi).
Dos forma de clasificar:
Aglomerativo:
El analista debe decidir a priori cuantos grupos

desea encontrar
Jerrquico
K-medias
Total
Rama1
Rama 1.1
Divisivo:
Rama2
Cada observacin es un grupo y

se agrupan por similitud hasta
obtener un solo grupo.
Todas las observaciones
pertenecen al mismo grupo y se
separan por disimilitud hasta ser
cada una un grupo.
El analista decide un punto de corte

para obtener la cantidad de grupos
deseada.
Los elementos de una rama pertenecen

al mismo grupo que la rama madre.
Rama 1.2
248
Ejemplo 1 de clasificacin
Supongamos que se desea clasificar 57 observaciones cuyas variables estn

relacionadas con caracterstica animales.
El conjunto de datos consta de las siguientes 13 variables:
Variable
Caracterstas
Pelo
Tiene pelos
Plumas
Tiene plumas
Huevos
Pone huevos
Leche
Produce leche
Vuela
Vuela
Acutico
Vive en el agua / Cerca del agua / Se alimenta en el agua
Depredador
Es depredador
Espina Dorsal
Posee espina dorsal
Respira aire
Respira aire / respira fuera del agua
Venenoso
Produce veneno
Aletas
Tiene aletas
Cola
Tiene cola
Nmero de patas
Nmero de patas (0 a 10)
Variables binarias
Entero ordinal
249
Cada observacin est descrita por 13 variables:
El conjunto de observaciones existe en un espacio de 13 dimensiones.
En este espacio se pueden definir distancias
por ejemplo: Distancia euclidiana entre dos puntos P y Q
Rbalo
Jabal
D21
Bfalo
D31
D32
Bagre
D41
D42
D43
Guepardo
D51
D52
D53
D54
Guepardo
Bagre
Bfalo
As que se define una matriz de distancias:
Jabal
13
=1
Rbalo
Matriz de distancias:
Matriz cuadrada de NxN
N=cantidad de observaciones.
Simtrica.
Cada celda contiene la distancia entre dos
observaciones en un espacio M dimensional
(M variables)
La matriz de distancias se puede definir con
diferentes tipos de distancia o medidas de
disimilitud.
0
250
Una vez que tenemos la matriz de distancia el mtodo organiza las observaciones de acuerdo
a sus distancias. La herramienta para visualizar esta organizacin se llama dendograma
Al cortar a mayor altura
obtendremos menos grupos,
pero ms diferentes
Es responsabilidad del
analista definir la cantidad de
grupos y su interpretacin
Bichos
Terrestres
Aves
Acuticos
Reptiles /
Anfibios
Arcnidos
Moluscos
Crustceos
Gusanos
Insectos
Aves
Peces
4 grupos
8 grupos
Mamferos
terrestres
251
Relaciones entre las variables
Utilicemos otro ejemplo para entender el procesamiento que debe darse a las
variables para obtener una clasificacin adecuada.
Se desea clasificar unas ciudades de EEUU de acuerdo a su nivel criminalidad.
Se cuenta con datos de robos y asesinatos por cada 100.000 habitantes.
Ntese que los grupos clasificados se

distribuyen en franjas horizontales
La clasificacin slo est diferenciando la tasa

de robos, mas no la asesinatos
Esto se debe a la diferencia en la escala de los

datos
Entre un par de ciudades la diferencia en la

tasa de robos puede ser de cientos, mientras
que en la tasa de asesinatos slo es de
unidades
252
Relaciones entre las variables
Este problema se puede atacar mediante un proceso de reescalamiento de los

datos:
= max()
= ( ) () Transformacin de localizacin y escala: valores x con media = 0 y desviacin = 1
Re escalamiento por el mximo: valores x acotados a un mximo de 1
Ahora s observamos patrones dependientes

de las dos variables.
El manejo de variabilidad relativa de las

variables es fundamental para obtener una
prediccin de calidad con cualquier mtodo.
253
Clasificador de Bayes
El clasificador de Bayes es uno de los mtodos de clasificacin supervisada ms

sencillos, se basa en el proceso de actualizacin previa -> posterior estudiado en
secciones anteriores.
Permite clasificar casos de variables categricas a partir de variables que pueden

ser continuas o discretas.
Supone que las variables independientes (de entrada) son independientes entre s.
Esto puede suponer una limitacin para el mtodo.
El modelo es matemtica y computacionalmente sencillo, lo cual puede ser una

ventaja ante grandes volmenes de datos.
Las variables que no aportan informacin son ignoradas, por lo que es un buen
mtodo para probar gran cantidad de variables.
255
En su forma ms sencilla en clasificador de Bayes funciona de acuerdo a los

siguientes pasos:
Toma como previa de los datos la proporcin en que las clases de entrenamiento son
observadas.
Actualiza la previa en funcin a las variables de inters observadas (verosimilitud).
Obtiene una distribucin posterior de cada clase de acuerdo a las variables de entrada.
Clasifica cada nueva observacin en funcin de la clase con mayor probabilidad posterior.
256
Veamos un ejemplo sencillo:
(rojo) = 6/20
(azul) = 14/20
Contamos con 20 observaciones:

6 Rojo
14 Azul
Queremos poder clasificar un nuevo punto como rojo

o azul (la x dentro del crculo).
La distribucin previa es la proporcin de puntos del

mismo color:
(rojo) = 6/20
(azul) = 14/20
Supongamos que la probabilidad de que un nuevo

punto sea azul o rojo depende de la cantidad de
vecinos de ese color en un radio de vecindad
(variable explicativa).
257
Veamos un ejemplo sencillo:
f(x|rojo) = 2/6
La verosimilitud la definiremos como la probabilidad de

que n vecinos sean de un color dada la tasa de puntos de
ese color.
f(x|azul) = 1/14
f(x|azul) = Vecinos azules / total de puntos azules.

f(x|rojo) = Vecinos rojos / total de puntos rojos.
f(x|azul) = 1/14
f(x|rojo)= 2/6
La probabilidad posterior es proporcional al producto

de la verosimilitud por la previa.
(rojo|x) = f(x|rojo)(rojo) = 2/6 x 6/20 = 0,1

(azul|x) = f(x|azul)(azul) = 1/14 x 14/20 = 0,05
Dado que (rojo|x) > (azul|x) el nuevo punto ser

clasificado como rojo.
258
Ahora veamos un ejemplo de lo que el mtodo es capaz de lograr.
Se desea reconocer dgitos escritos a mano y clasificarlos de acuerdo al valor representado.
Las clases a identificar son los nmeros de 0 a 9.
Cada observacin est representada por una cadena binaria de 16 dgitos que ordenados en una
matriz de 16x16 representan el nmero trazado a mano (16 variables explicativas).
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
1
1
1
0
1
1
0
0
0
0
0
0
0
0
0
0
1
1
1
0
1
1
0
1
0
0
0
0
0
0
0
1
1
1
0
0
1
1
1
1
1
0
0
0
0
0
1
1
1
0
0
0
1
1
1
0
0
0
0
0
0
0
1
1
0
0
0
0
1
1
1
0
0
0
0
0
0
1
1
1
0
0
0
0
1
1
1
1
0
0
0
0
1
1
1
0
0
0
0
0
1
1
1
1
0
0
0
1
1
1
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
1
1
0
1
1
1
1
1
0
0
0
0
0
0
0
0
1
1
0
0
1
1
1
0
0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
1
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
1
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
1
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
1
0
1
1
0
0
0
1
1
1
0
0
0
0
0
1
1
0
1
1
0
0
1
1
1
1
1
0
0
0
0
1
1
0
1
1
0
0
1
1
1
1
1
0
0
0
0
1
1
0
1
1
0
1
1
0
0
1
1
0
0
0
1
1
1
0
1
1
1
1
1
0
0
1
1
1
0
0
1
1
1
0
0
1
1
1
0
0
0
0
1
1
0
0
1
1
1
0
0
1
1
1
0
0
0
0
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
1
1
1
1
0
1
1
1
1
0
0
0
0
0
0
1
1
1
0
0
0
0
0
1
1
1
0
0
0
0
0
1
0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
1
1
1
1
1
1
1
0
0
0
0
0
0
0
1
1
1
1
1
0
0
1
1
0
0
0
0
0
0
1
1
1
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
1
1
1
0
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
0
1
1
0
0
0
0
0
0
0
1
1
0
1
1
0
0
0
1
0
0
0
0
0
0
1
1
0
0
1
0
0
0
0
1
0
0
0
0
0
0
1
1
0
1
1
0
0
0
0
1
0
0
0
0
0
0
1
0
0
1
1
0
0
0
0
1
0
0
0
0
0
1
1
0
0
1
1
0
0
0
0
1
1
0
0
0
0
1
1
0
0
1
1
0
0
0
0
1
1
0
0
0
0
1
1
0
0
1
1
0
0
0
0
1
1
0
0
0
0
1
0
0
0
1
1
0
0
0
0
0
1
0
0
0
1
1
0
0
0
1
1
0
0
0
0
0
1
0
0
1
1
1
0
0
0
1
1
0
0
0
0
0
1
1
0
1
1
0
0
0
0
1
1
0
0
0
0
0
1
1
1
1
1
0
0
0
0
1
0
0
0
0
0
0
0
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
1
1
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
0
0
0
0
0
0
0
0
0
1
1
0
1
1
1
0
0
0
0
0
0
0
1
1
0
0
1
0
1
1
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
1
1
0
1
1
1
1
1
0
0
0
0
0
0
0
1
1
0
0
0
0
1
1
1
0
0
0
0
0
0
0
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
0
1
0
0
0
0
1
1
1
0
0
0
0
0
0
0
0
1
1
0
0
0
1
1
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
0
0
0
0
0
0
0
1
1
1
1
1
1
0
0
1
1
0
0
0
0
0
0
0
1
1
1
1
0
0
0
1
1
0
0
0
0
0
0
0
1
1
1
1
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
1
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
1
0
1
1
1
1
1
1
1
1
1
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
1
1
0
0
0
0
0
0
1
0
0
0
1
1
1
0
0
0
0
0
0
0
0
0
1
0
0
0
0
1
1
1
0
0
0
0
0
0
0
0
1
0
0
0
0
1
1
1
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
1
1
0
1
1
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
1
1
0
0
1
1
1
1
1
0
0
0
1
0
0
0
1
1
1
0
1
1
1
1
1
1
0
0
1
0
0
0
0
1
1
1
1
1
0
0
1
1
0
0
1
0
0
0
0
0
1
1
0
0
0
0
0
1
1
0
1
0
0
0
0
0
1
1
0
0
0
0
0
0
1
0
1
1
0
0
0
0
1
1
1
0
0
0
0
0
1
1
1
1
0
0
0
1
1
1
1
0
0
0
0
0
1
1
0
1
1
0
0
1
1
1
1
1
0
0
0
0
0
1
0
1
1
1
1
1
1
1
1
1
0
0
0
0
0
1
0
0
1
1
1
1
1
0
0
1
1
0
0
0
1
1
0
0
0
0
0
0
0
0
0
1
1
1
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
0
0
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
1
1
0
0
0
1
1
1
0
0
0
0
0
0
0
0
1
0
0
0
0
0
1
1
1
0
0
0
0
0
0
0
1
0
0
0
0
1
1
1
1
0
0
0
0
0
0
0
1
0
0
0
0
0
1
1
1
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1
1
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
1
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
1
1
0
1
1
1
1
1
1
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
1
1
1
1
0
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
1
1
1
1
1
1
1
1
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
1
1
0
0
0
0
1
1
1
1
1
0
0
0
0
0
1
1
1
0
0
1
1
1
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
1
1
0
1
1
1
0
0
0
0
0
0
0
0
0
1
1
1
0
0
1
1
1
0
0
0
0
0
0
0
0
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
1
1
1
1
1
1
1
1
0
0
0
0
0
El clasificador de Bayes se
entren con 1500 dgitos
escritos a mano
Previa
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
259
Una vez entrenado el sistema se clasificaron 93 observaciones no presentes en la

data de entrenamiento.
Comparemos la respuesta real vs la prediccin generada por el sistema.
Matriz de confusin
Respuesta Correcta /
Instancia real
Salida de la clasificacin
0
1
2
3
4
5
6
7
8
9
0
100%
0%
0%
0%
0%
0%
0%
0%
0%
0%
1
2
3
4
5
6
7
8
9
0% 0% 0% 0% 0% 0% 0% 0% 0%
100% 0% 0% 0% 0% 0% 0% 0% 0%
10% 60% 0% 10% 0% 10% 0% 10% 0%
15% 0% 77% 0% 0% 0% 0% 0% 8%
25% 0% 0% 63% 0% 13% 0% 0% 0%
0% 0% 0% 0% 92% 8% 0% 0% 0%
0% 0% 0% 0% 0% 100% 0% 0% 0%
0% 0% 0% 0% 0% 0% 100% 0% 0%
11% 0% 0% 0% 0% 0% 0% 89% 0%
0% 0% 0% 0% 0% 0% 0% 29% 71%
85% de clasificacin correcta
Los nmeros 2 y 4 son los que

representan mayor dificultad
La matriz de que representa en las filas

las instancias reales (respuesta correcta),
y la salida del sistema en las columnas, se
llama matriz de confusin
260
Mapas auto-organizados
Los mapas auto-organizados son un tipo de red neuronal cuya representacin de la

respuesta es espacial.
Permite visualizar en un plano la clasificacin.
Tpicamente se utiliza para clasificacin no supervisada.
X1
X2
X3
X4
X5
Xn
Todos los valores de entrada se

proyectan sobre la red,
organizados de acuerdo a sus
caractersticas.
La red es un arreglo de nxm
nodos que se especializan en
reconocer diferentes
observaciones.
Se generan reas de o patrones
similares en un mapa.
262
Alimentemos un mapa auto-organizado de 10x10 nodos con un mallado de

1a10x1:10 en desorden.
Mallado ordenado
Mallado en desorden
263
A medida que la red aprende, cada neurona se especializa agrupando casos

similares.
Inicio
1000 Iteraciones
1000 Iteraciones
Variacin de propiedades en el mapa
20 Iteraciones
264
Los mapas auto-organizados se basan en un tipo particular de aprendizaje:
Aprendizaje competitivo
Al inicio todas las neuronas tienen pesos sinpticos aleatorios:
Los pesos sinpticos son vectores de la misma dimensin de los que conforman los
datos.
Cada observacin se presenta a la red y se compara con cada neurona (similitud)
La neurona que ms se parece al dato de entrada se activa (gana).
La neurona que se activa ante un estmulo (ganadora) es premiada alterando sus

pesos sinpticos.
El cambio en los pesos sinpticos hace que la neurona se parezca ms al dato

que la activ (promedio ponderado).
Se establece una vecindad donde las neuronas cercanas a la vencedora tambin

son premiadas, pero en menor proporcin.
Las distintas reas de la red se especializan en reconocer patrones distintos.

265
xi
Ejemplo: Los datos tienen

la forma (x1i, x2i, x3i)
Los pesos sinpticos de

deben tener misma forma
que los datos (x1, x2, x3)
Inicialmente los pesos
sinpticos son aleatorios
Cada observacin se
presenta a la red y se
compara su similitud el
peso de todas neuronas
La neurona ms similar al
valor de entrada se activa
(neurona ganadora)
El peso sinptico de la ganadora

se ajusta para aproximarse ms a
valor de la entrada que la activa
Ejemplo: promedio ponderado
El cambio se propaga
radialmente en una vecindad
Qu pasa al presentar una
nueva observacin?
266
Veamos como el mapa auto-organizado clasifica las especies animales:

No voladoras
Rapia
Aves
Acuticas
Insectos
Mapa de distancia entre vecinos

U-matrix
Reptiles
Voladores
Raro
Terrestres
Acuticos
Mamferos
267
Veamos como varan las propiedades en el mapa:
Pelo
Vuela
Caracterstico los mamferos terrestres
Caracterstico de aves e insectos

Ntese que la variacin no es
lineal en el mapa
Bpedo
Caracterstico de las aves

(referido a los casos observados)
Aunque tanto los insectos como las aves vuelan, slo las aves son bpedas
El mapa es bidimensional, pero la clasificacin es n-dimensional
268
Regresin con redes neuronales
Uso de la redes neuronales para regresin
El principal uso de las redes neuronales para resolver problemas de regresin se basa
en la dificultad que enfrentan los mtodos estadsticos tradicionales para modelar
relaciones no lineales.
Veamos por ejemplo el caso de una relacin claramente no lineal:
La siguiente frmula: = 1 seno(22 ) +
Podemos ver claramente que la relacin entre las variables es no lineal:
= 0,19
30
20
20
10
10
0
0
0,2
0,4
0,6
0,8
-10
-10
-20
-20
-30
= 0,14
30
Donde k es una constante, x1, x2 son independientes y error ~ Normal
-30
x1
0,2
0,4
0,6
0,8
x2
270
No podemos resolver este problema mediante regresin lineal.
Pero podemos entrenar una red neuronal para que encuentre le patrn que
relaciona la entrada con la salida de los datos.
La red se entren con 50 observaciones para predecir 450.
Valor real (No usado en entrenamiento) vs Estimado por la red

Cross validacin
Distribucin de los errores (estimado-real)
30
20
10
0
-10
-20
-30
Estimado
Real
Media = -0,2 / Desviacin estndar = 1,75

271
El resultado se logr con una red multicapa de 5 nodos en la capa oculta:
Esta red en su estructura es similar al

perceptrn pero con una capa oculta de
5 neuronas.
La red slo recibi como insumo los

valores de entrada y de salida.
No se incluy ninguna hiptesis sobre la

relacin entre los datos.
El entrenamiento de la red se ve
reflejado en los valores finales de los
pesos sinpticos y valores del sesgo.
Fue necesario iterar encontrar la

cantidad de nodos en la capa oculta
requeridos para resolver el problema.
Entrada
Salida
Capa oculta
272
Resultado con una red de 1 nodo oculto:

30
20
10
0
-10
Slo se ha detectado el
componente sinusoidal
-20
-30
Estimado
Real
273
Resultado con una red de 3 nodos ocultos:

30
20
10
0
Subestimacin
sistemtica
-10
-20
-30
Estimado
Real
274
Dado que los parmetros internos de la red neuronal no tienen

necesariamente una interpretacin directa del analista, no es fcil decidir
qu parmetros ajustar para obtener un mejor resultado.
Con frecuencia se usa la fuerza bruta, es decir, se itera sobre distintos
niveles de los parmetros hasta obtener la mejor capacidad predictiva.
Esta aproximacin tiene un alto costo computacional.
Siempre es necesario realizar una cross-validacin y validar la respuesta

contra datos conocidos no usados durante el entrenamiento.
En general esperamos que los errores no tengan patrones, tpicamente

deben ser simtricos.
Esperamos minimizar alguna medida de error, por ejemplo, la suma de los
errores al cuadrado.
Este mtodo se puede utilizar de manera anloga para efectuar clasificacin

supervisada.
275
De acuerdo al tipo de red pueden variar los parmetros.
Los ms frecuentemente ajustados:
Nmero de capas ocultas.
Nmero de nodos ocultos.
Tasa de aprendizaje.
Cantidad de veces que se pasarn los datos durante en entrenamiento.
El exceso de complejidad en la red puede causar

sobreestimacin y problemas de la red para generalizar.
En es caso se observar un muy buen ajuste a los datos de

entrenamiento pero una pobre prediccin de los datos nuevos.
Es como si la red aprendiera los datos de memoria, incluyendo el ruido.
276
Consideraciones generales
Para todos los mtodos de estimacin se deben tomar en cuenta algunas

medidas para promover el mejor desempeo de los mismos.
Aunque con los mtodos de aprendizaje automtico no todos estos pasos son
siempre necesarios, son buen prctica, y favorecen un mejor entendimiento.
Utilizar variables que tengan sentido: es recomendable utilizar como variables

explicativas aquellas que por su interpretacin fsica puedan ofrecer informacin
sobre la variable dependiente, aunque no conozcamos la relacin existente entre las
variables.
Explorar las variables: tratar de entender las relaciones que puedan existir entre las
variables o transformaciones de las mismas.
Identificar grupos: a veces las relaciones entre las variables pueden ser distintas
dependiendo de si las observaciones pertenecen sub-poblaciones, en este caso es
conveniente identificar los grupos y luego aplicar los mtodos de regresin dentro de
cada grupo.
277
Uso de las redes neuronales en el

estudio de yacimientos
Clasificacin y Regresin en el estudio de

yacimientos
Durante el estudio de los yacimiento existen tres tipos de tareas que pueden
desarrollarse con el apoyo de algoritmos de aprendizaje automtico.
Identificacin de facies geolgicas: si las facies an no han sido identificadas es

posible utilizar mtodos de clasificacin no supervisada para entender qu
grupos distintos se pueden observar. Una vez identificados los grupos se deben
analizar sus propiedades para reconocerlos y describirlos.
Clasificacin de facies geolgicas: utilizar las variables que mejor describen las
facies identificadas para clasificar los tipos en localidades no observadas. Esto
puede llevarse a cabo con mtodos de clasificacin supervisada.
Estimacin de registros: se pueden utilizar mtodos de regresin para estimar

registros de pozos a partir de variables secundarias.
Las variables secundarias pueden ser otros registros de pozos o atributos

ssmicos.
279

yacimientos
El uso de redes neuronales para la estimacin de registros de pozos a partir

de atributos ssmicos es uno de los ms comunes.
Para este caso es importante considerar los siguientes previos:

Integracin de registros ssmicos y de pozos.
Muestreo y conversin tiempo / profundidad.
Normalizacin:
Garantizar que la variabilidad de las variables.
independientes es comparable.
Por ejemplo: = ()
Particin de los datos:
Datos para entrenamiento.
Datos para validacin.
Seleccin del tipo de red neuronal a utilizar:
MLFN (Multilayer Feedforward network).

PNN (Probabilistic Neural Network).
La seleccin depender de la disponibilidad en el software.
280

yacimientos
El uso de redes neuronales para la clasificacin de facies.
Matriz de distancias
Pasos sugeridos para clasificar facies mediante Mapas autoorganizados:

Seleccin de atributos ssmicos y entrenar el mapa autoorganizado.
Utilizar la matriz de distancia entre vecinos o distancia
unificada (U-Matrix) para identificar la cantidad de
grupos.
Separar los grupos segmentando sobre sus distancias en
el mapa, por ejemplo, k-medias.
Clasificar nuevas observaciones, por ejemplo, de acuerdo
al vecino ms cercano.
Relacionar cada observacin con su coordenada
geogrfica, generar mapas e interpretar.
3 grupos claros separables por

k-medias
281
Ideas Finales
La estadstica es la nica ciencia incapaz de demostrar nada.
La estadstica es una ciencia aplicada, nada ms que un conjunto de

herramientas orientadas a mejorar nuestra capacidad de sacar
provecho de la informacin contenida en un conjunto de datos.
Como ciencia aplicada es muy dependiente de las caractersticas
especficas del problema, y no debe ser aplicada ciegamente como
receta, el sentido comn y la interpretacin correcta son
indispensables.
282
Ideas Finales
No existen modelos estadsticos correctos, simplemente, algunos son tiles.
Los modelos estadsticos son representaciones imperfectas y simplistas de la

realidad, las predicciones de cualquier variable sern diferentes de la realidad no
observada, pero esperamos que las caractersticas principales de los fenmenos
analizados sean honradas.
283
Ideas Finales
GRACIAS!
284
Glosario de Trminos
Glosario de Trminos
1.
Variable aleatoria: funcin que asigna un nmero real X(s) a cada resultado posible s
experimento concreto.
S en un
2.
Funcin de probabilidad: funcin definida sobre la recta real, acotada en el intervalo [0,1], cuyo valor es la
probabilidad del suceso {X = x} .
3.
Funcin de distribucin acumulativa: funcin definida sobre la recta real, acotada en el intervalo [0,1],
cuyo valor es la probabilidad del suceso {X x} .
4.
Esperanza: media de la distribucin de una variable aleatoria, centro de masa de la distribucin.
5.
Varianza: medida de la dispersin de una variable aleatoria alrededor de su media.
6.
Covarianza: medida de la tendencia de dos variables aleatorias a variar de manera conjunta en lugar de
independientemente.
7.
Coeficiente de correlacin: indicador normalizado de la covarianza, acotado en el intervalo [-1,1].
8.
Simulacin por mtodos de Monte Carlo: proceso de simulacin basado en la toma de observaciones
provenientes de una distribucin de probabilidad especfica.
9.
Realizacin: se llama realizacin a cada observacin tomada de una distribucin especfica mediante el
algoritmo de simulacin.
10.
Semilla: valor asociado al estado del generador de nmero aleatorios, permite generar realizaciones
idnticas y reproducir resultados basados en simulacin estocstica.
286
Glosario de Trminos (cont)

11.
Variable regionalizada: conjunto de valores de una funcin aleatoria para cada valor de la localizacin de
la propiedad en el espacio.
12.
Estacionariedad: estabilidad u homogeneidad de una propiedad a lo largo del rea medida.
13.
Heterogeneidad: variacin de las propiedades en el cuerpo o volumen de material estudiado en funcin

del espacio.
14.
Anisotropa: propiedad general de la materia, segn la cual sus propiedades o caractersticas varan segn
la direccin en que sean examinadas.
15.
Interpolacin: mtodo de estimacin de los valores de una variable regionalizada en localizaciones no

observadas como una combinacin lineal de los valores de las observaciones conocidas.
16.
Kriging: mtodo de estimacin de los valores de una variable regionalizada en localizaciones no

observadas como una combinacin lineal de los valores de las observaciones conocidas, donde los pesos
son calculados utilizando informacin de la covarianza espacial, se considera ptimo por minimizar la
varianza de las estimaciones.
17.
Variograma: funcin que cuantifica la covarianza espacial de una variable para cada distancia definida
entre pares de puntos.
18.
Sill o meseta: parmetro del variograma asociado a la variabilidad total de la variable, valor mximo
alcanzado, o asinttico del variograma.
19.
Nugget o pepita: parmetro del variograma asociado a la variabilidad a distancias pequeas, valor del
intercepto del variograma.
287

20.
Rango: distancia a la cual el variograma alcanza el sill o meseta, a distancias mayores al rango la variable
se considera incorrelacionada.
21.
Reescalamiento: proceso de reduccin de la resolucin de una variable, usualmente aplicado para mejorar
el desempeo computacional de los modelos.
22.
Facies: cuerpo de roca con caractersticas especficas, las caractersticas pueden estar asociadas a aspectos
observacionales, genticos, ambientales o composicionales.
23.
Porosidad: indicador de la capacidad de la roca para almacenar fluidos, relacin entre el volumen poroso y
el volumen total de la roca.
24.
Permeabilidad: indicador de la capacidad de un medio poroso para permitir el trnsito de fluidos.
25.
Saturacin de fluidos: indicador de la proporcin de volumen que ocupa un fluido especfico en el espacio
poroso de la roca, relacin entre el volumen del fluido y el volumen poroso total de la roca.
26.
Atributos ssmicos: medidas o transformaciones basadas en la ssmica orientadas a resaltar o cuantificar

caractersticas de inters para la interpretacin.
27.
Inteligencia artificial: rea de las ciencias que estudia el diseo de sistemas capaces de resolver problemas
por s mismos usando como paradigma la inteligencia humana
28.
Aprendizaje automtico: rama de la inteligencia artificial que trata de crear programas capaces de
generalizar comportamientos a partir de informacin suministrada a modo de ejemplos
29.
Redes neuronales: paradigma de aprendizaje y procesamiento automtico inspirado en la forma como

funciona el sistema nervioso biolgico
288

30.
Neurona: unidad de procesamiento que se comunica enviando seales a travs de conexiones ponderadas
31.
Clasificador de Bayes: clasificador probabilstico basado en el teorema de Bayes, mtodo de clasificacin

supervisado.
32.
Mapa auto-organizado: tipo de red neuronal entrenada mediante aprendizaje no supervisado que
permite una visualizacin discreta del espacio de las observaciones en un mapa
33.
Peso sinptico: peso de la conexin existente entre cada par de neuronas de una red.
289
Bibliografa
Bibliografa
M. DeGroot. Probabilidad y estadstica. Addison-Wesley 1975.
Ch. Grinstead, J. Snell. Introduction to probability. American Mathematical Society, 1997.
C. Deutsch. Geostatistical reservoir modeling. Oxford University Press 2002.

M. Kelkar, G. Perez. Applied Geostatistics for reservoir characterization. SPE 2002.
J. Chils, P. Delfiner. Geostatistics, modeling spatial uncertainty. Wiley 1999.
N. Cressie. Statistics for spatial data. Wiley 1991.
A. Natera. Validacin de un algoritmo simulador de datos bidimensionalmente georeferenciados. Tesis UCV
2013.
M. Martnez. Elaboracin de un algoritmo para generar mapas de heterogeneidad a partir de datos petrofsicos
de un yacimiento. Tesis UCV 2013.
M. Corrales. Implementacin de un algoritmo para la simulacin estocstica de modelado de facies, basado en
el mtodo de geoestadstica multipunto. Tesis UCV 2014.
S. Haykin. Neural Networks, Macmillan 1994.
B. Krse, P. Van der Smagt. Introduction to neural networks. University of Amsterdam 1996.
Sh. Swartz, B. David. Understanding Machine learning, from theory to algorithms. Cambridge 2014.
J. Hair. Multivariate Data Analysis. Pearson 2009.
291

Curso POES - Geoestadística y Redes Neuronales - RA

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Curso POES - Geoestadística y Redes Neuronales - RA

Enviado por

Direitos autorais:

Formatos disponíveis

Geoestadstica

GERENCIA GENERAL DE FORMACIN FAJA

Instructor: Ing. Ricardo Ambrosio.

Geoestadstica Aplicada a la Industria Petrolera.

Jos Gonzalez Aray

Septiembre del 2015

Jos Gregorio Hurtado--

Septiembre del 2015

Los contenidos del Manual pertenecen a la Gerencia General de

Proveer al participante de una comprensin slida de los conceptos y mtodos bsicos de la

En este manual las ecuaciones se presentan en letras cursiva.

Puntos de especial inters dentro de un tpico especfico del tema.

Tabla de contenido (cont.)

Tabla de contenido (cont.)

La geoestadstica procura proveer una descripcin cuantitativa de

Reservas en depsitos minerales.

Razones econmicas generalmente obligan a muestreos dispersos y escasos.

Si comparamos el muestreo geoestadstico relativo a volumen de un yacimiento

Los mtodos geoestadsticos procuran maximizar el aprovechamiento de los datos

Mejora del muestreo.

Integracin de informacin multivariada.

Problemas de cambio de soporte.

Atacar las fallas e interpretaciones errneas ms frecuentes durante la aplicacin de

Mejorar la capacidad de los participantes para aprovechar la capacitacin en el uso de

Estimular la creatividad de los participantes para proponer soluciones a problemas

Este curso no contempla el entrenamiento en el uso de programas de modelado de yacimientos, sin

A pesar de que el manejo de herramientas de programacin es invaluable al momento de proponer

Condicionamiento por facies

Modelado por indicadores

Modelado por objetos

Fundamentos de probabilidad y estadstica.

Variables aleatorias y distribuciones.

Definicin y tipos de variables aleatorias.

Se utiliza el termino experimento para describir cualquier proceso cuyos resultados no se

Frecuentemente la percepcin de aleatoriedad proviene de la imposibilidad de modelar en

La caracterstica de inters de un experimento reside en que cada uno de sus

Se puede asignar probabilidades a las diversas combinaciones de resultados de

Es de importancia fundamental determinar, utilizando un criterio slido, cuales

Usualmente el criterio se basa en las decisiones que se tomarn a partir de los

La cuantificacin de las probabilidades asociadas a los eventos de inters son

No basta con conocer los posibles resultados de un experimento, es necesario

Toma de decisiones basada en resultados inciertos de un experimento.

Particin de un espacio muestral

Dado un espacio muestral S, P(S) = 1

Para cualquier sucesin de eventos disjuntos Ai:

Probabilidad de la unin de eventos

La probabilidad de la unin de eventos , es igual a la suma de las probabilidades slo si los

P( A B C) P( A) P( B) P(C) P( AB) P( BC ) P( AC ) P( ABC )

Funcin que asigna un valor de probabilidad a cada resultado posible de un

Supongamos un experimento sencillo en el cual se lanzan dos dados y se suma el

Se puede determinar la probabilidad coma la cantidad de resultados favorables entre la cantidad

Dos sucesos A y B son independientes uno del otro si la ocurrencia o no de

SI A y B son independientes conocer que ha ocurrido el evento A no aporta

Esto equivale a decir que:

El desconocimiento de esta relacin puede ocasionar graves errores durante

Eventos disjuntos son independientes?

Forma en que cambia la probabilidad de un suceso A dado que se conoce que un

Simplemente se ajusta el espacio muestral a los casos en los que B ha ocurrido,

Esto equivale a decir que:

Ejemplo de eventos independientes

Dos sucesos A y B son independientes uno del otro si la ocurrencia o no de

Muestra con / sin reemplazo

Muestreo con reemplazo.