Você está na página 1de 96

UNIVERSIDAD NACIONAL DE CAJAMARCA

FACULTAD DE INGENIERA

ESCUELA PROFESIONAL DE INGENIERA DE


MINAS
ASIGNATURA:
GEOESTADISTICA
ORRILLO MENDOZA,
ROBERTO CARLOS
MENDOZA SANCHEZ JUAN
CARLOS
HUAMAN GUTIERREZ
IGNACIO.
VASQUEZ MACEDO, MICHAEL
COTRINA ANGULO, HANSELL

Cajamarca Abril del


CAPTULO III:
ANLISIS DE DATOS Y
VARIOGRAFA

Cajamarca, 30 de mayo del 2016.


INTRODUCCIN
En la siguiente presentacin se desarrollar el captulo III, correspondiente a: Anlisis de datos y
variografa.

Para ello explicaremos el:


Anlisis de datos mediante histogramas.
Modelado de Histogramas, distribucin normal, distribucin lognormal, distribucin
exponencial.
Mtodo de la transformada inversa.
Mtodo de Montecarlo.
-Variografa
Interpretacin y aplicaciones
Modelado de variogramas
INTRODUCCIN
En la siguiente presentacin se desarrollar el captulo III, correspondiente a: Anlisis de datos
y variografa.

Para ello explicaremos el:


Anlisis de datos mediante histogramas.
Modelado de Histogramas, distribucin normal, distribucin lognormal, distribucin
exponencial.
Mtodo de la transformada inversa.
Mtodo de Montecarlo.
-Variografa
Interpretacin y aplicaciones
Presentacin de casos reales en diversos yacimientos mineros
Modelado de variogramas
HISTOGRAMA

Es un resumen grfico de los valores producidos


por las variaciones de una determinada
caracterstica, representando la frecuencia con
que se presentan distintas categoras dentro de
dicho conjunto.
El histograma representa grficamente las
frecuencias de ocurrencia en funcin del valor.
Consiste en dividir el rango de los valores en
intervalos (generalmente, con el mismo ancho) y
visualizar la proporcin de datos que caben
dentro de cada intervalo.
El histograma es una herramienta til para detectar valores atpicos. Cabe destacar
que un dato atpico no es forzosamente falso y nunca debe ser eliminado sin razn.
Podra reflejar el comportamiento verdadero de la variable regionalizada y eliminarlo
impedira prever la ocurrencia de tales valores en las zonas no muestreadas.
La visualizacin del histograma de los datos
tambin es un primer medio de verificar su
homogeneidad. Eventualmente, una divisin
del campo en varias sub-zonas ser necesaria.
As, por ejemplo, un histograma multimodal
puede conducir a la identificacin, entre los
datos, de varias poblaciones susceptibles de
estar geogrficamente separadas.
A veces, tal separacin est impuesta por
consideraciones fsicas, que impiden mezclar
todos los datos: presencia de un obstculo
natural (falla, ro...), particin de una zona
mineralizada segn la caracterizacin
mineralgica o el tipo de roca, etc.
Elaboracin
Construccin

Paso 1: Preparacin de los datos


Como en todas las herramientas de anlisis de datos, el primer paso consiste en recoger
estos de forma correcta o asegurarse de la adecuacin de los existentes.
Los datos deben ser:
- Objetivos: Basados en hechos, no en opiniones.

Exactos: Debemos asegurarnos que la variabilidad en el proceso de recogida de datos


(variabilidad de la medida) no desvirta la variabilidad del proceso en estudio.
Completos: Se debe registrar toda la informacin relevante asociada a cada toma de datos
(mquina, hora del da, empleado, etc) en previsin de los diferentes anlisis que pueden
ser necesarios.
Representativos: Deben reflejar todos los diferentes hechos y circunstancias que se
producen en la realidad.
Paso 2: Determinar los valores extremos de los datos y en el recorrido
Identificar en la tabla de datos originales el valor mximo, el valor mnimo y el
recorrido (R = Vmax - Vmin).
Ejemplo: Datos sobre la cantidad exacta de caf contenido en paquetes de 250
gramos. (120 unidades medidas)

Recorrido total = mximo mnimo = 258 grs-243grs. = 15 grs.


Paso 3: Definir las "clases" que contendr el Histograma
Clases: Son los intervalos en que se divide la caracterstica sobre la que se han
tomado los datos. El nmero de clases es igual al de barras del Histograma.
a) Definir el nmero de clases que debe tener el Histograma segn la tabla siguiente:
Numero recomendado de clases en un histograma
b) Obtener la amplitud del intervalo de cada clase.
Todas las clases tendrn el mismo intervalo.
No habr solapamiento entre distintas clases.
La amplitud aproximada del intervalo se halla dividiendo el recorrido por el nmero de
clases.
Esta amplitud se redondea posteriormente a un nmero o cifra decimal conveniente para
el manejo de las clases y la graduacin del eje horizontal del Histograma (1, 2, 5, 10,
etc).
En el ejemplo de los paquetes de caf hay 120 datos, necesitamos entonces
aproximadamente 8 clases para el histograma.
Amplitud aproximada de cada clase 15gr./8=1.875 grs.
Amplitud elegida como conveniente en este caso: 2 grs.
Paso 4: Construir las clases anotando los lmites de cada una de ellas
Los lmites de la primera clase incluirn el valor mnimo de los datos.
Para evitar que algunos datos coincidan con los lmites de los intervalos, definir stos
de forma que tengan una cifra ms detrs de la coma.
Si, por ejemplo, los datos tienen dos cifras detrs de la coma (3,55; 3,83; 3,64; 3,73;
3,78, etc), se definirn las clases hasta la tercera cifra detrs de la coma (3,545-
3,555; 3,555-3,565, etc).

Ejemplo: Como el valor menor en nuestros datos es 243


grs., empezaremos el primer intervalo en 242.5 grs. y
construiremos ocho clases con 2 grs. de amplitud
Paso 5: Dibujar el Histograma
Dibujar las barras verticales correspondientes a cada clase. Su base est situada en
el eje horizontal y su altura corresponder a la frecuencia de la clase representada.
Paso 6: Rotular el Grfico
Cuando proceda, poner el ttulo, las condiciones en que se han recogido los datos,
los lmites de tolerancia nominales, etc. Estas notas ayudan a los dems a interpretar
el grfico y sirven de recordatorio de la fuente de los datos.
Ejemplo: Resultados de las mediciones del contenido de caf (120 paquetes
medidos)
DESAGRUPAMIENTO

Para calcular el histograma y las estadsticas


elementales, es frecuente considerar una variable
de ponderacin o desagrupamiento, de modo de
corregir los efectos provocados por las
irregularidades de la malla de muestreo. La idea es
asignar a los datos espacialmente agrupados, en
parte redundantes, un ponderador ms pequeo
que a los datos aislados, los cuales son
representativos de una porcin ms extensa del
campo.

Ubicacin de datos (cruces) y ponderacin por el mtodo de las celdas. Cada

celda tiene una ponderacin total de 1/16, la cual se reparte entre los datos

pertenecientes a esta celda.


DESAGRUPAMIENTO

Para determinar la variable de


ponderacin, se puede utilizar el
llamado mtodo de las celdas. Esta
tcnica consiste en dividir la zona de
estudio en celdas rectangulares
idnticas y en atribuir a cada dato un
ponderador inversamente proporcional
al nmero de datos presentes en la
celda a la cual pertenece.

Ubicacin de datos (cruces) y ponderacin por el mtodo de las celdas. Cada

celda tiene una ponderacin total de 1/16, la cual se reparte entre los datos

pertenecientes a esta celda.


DESAGRUPAMIENTO

La puesta en marcha del mtodo requiere


definir previamente el tamao de la celda
elemental. Usualmente, se prueba varios
tamaos y se examina su impacto en el valor
de la media ponderada. La figura da un
ejemplo con los datos de concentracin de
cobalto, donde se ha escogido utilizar celdas
cuadradas.

Ubicacin de datos (cruces) y ponderacin por el mtodo de las celdas. Cada

celda tiene una ponderacin total de 1/16, la cual se reparte entre los datos

pertenecientes a esta celda.


DISTRIBUCIONES DE
PROBABILIDAD
DISTRIBUCIONES CONTINUAS
Distribucin normal

Una variable aleatoria continua, X, sigue una distribucin normal de media y desviacin
tpica , y se designa por N(, ), si se cumplen las siguientes condiciones:

1. La variable puede tomar cualquier valor: (-, +)

2. La funcin de densidad, es la expresin en trminos de ecuacin matemtica de


la curva de Gauss:

2
1 x
1
2

f ( x) e
2
DISTRIBUCIN LOGNORMAL

En el campo industrial, la ley lognormal, puede recibir justificaciones teoricas como las
caractersticas de un material (resistencia, dureza, etc.) que puede resultar de la combinacin
multiplicativa de factores elementales. Tambin en el campo econmico la ley lognormal se
encuentra con frecuencia (distribucin de salarios, ventas, etc.).
Distribucin ji Cuadrada

K=1 K=5
K=50
Distribucin exponencial: Exp()

Se utiliza con frecuencia para modelizar la duracin (vida de personas o animales o


Componentes fsicos ,duracin de huelgas ,recesiones econmicas, llamadas telefnicas ,o el
tamao de yacimientos, etc.)

=1/
=1/

f ( x ) e x
0, x 0
Distribucin t de student
DISTRIBUCIN GAMMA.
Este tipo de distribucin es utilizada, por ejemplo, en el clculo de probabilidades
relativas a la duracin de partes elctricas, las cuales, pocas veces tienen vidas
muy cortas, muchas tienen vidas cercanas al promedio, y muy pocas vidas
bastante largas. Otro ejemplo es el de una pieza metlica cuando es sometida a
cierta fuerza de compresin, hasta romperse, por lo tanto el tiempo que
transcurre antes que la pieza se rompa, puede asociarse a una Distribucin
Gamma.
Distribuciones discretas
Distribucin Binomial

Parmetros de la Distribucin Binomial


DISTRIBUCIN DE POISSON.

La distribucin de Poisson representa la probabilidad de que un evento aislado ocurra un nmero


especfico de veces en un intervalo de tiempo o espacio dado. La ocurrencia de eventos slo se ver
afectada por la casualidad o por el azar; por lo tanto, la posicin de un evento no servir para predecir la
localizacin de cualquier otro evento especfico. Adems, los datos acerca de un intervalo de tiempo o
espacio tampoco facilitan la prediccin del nmero de eventos que se presentarn en otro evento
3.3 Simulaciones de distribuciones:
Teorema del lmite central. Mtodo de
la transformada inversa. Mtodo de

Capitulo Montecarlo

III
3.3 SIMULACIONES DE DISTRIBUCIONES

Son ordenadores que pueden utilizarse para simular probabilidades y variables


aleatorias numricamente. Este tipo de simulaciones tienen muchas aplicaciones
SIMULACIONES DE DISTRIBUCIONES

Aproximar cantidades que resultan difciles de


calcular matemticamente.
Simular grficamente sistemas fsicos o biolgicos
complejos.
Muestrear aleatoriamente grandes conjuntos de
datos en busca de errores o informaciones
especficas, etc.
Implementar algoritmos complejos para procesar
imgenes, reconocer sonidos y escritura manual, etc.
Simular soluciones mediante inteligencia artificial.
Encriptar datos o generar clases.
Resolver enigmas o descifrar cdigos mediante
pruebas secuenciales de soluciones aleatorias.
3.3 SIMULACIONES DE DISTRIBUCIONES
Hoyen da, prcticamente todos los lenguajes de programacin disponen de un generador de
nmeros pseudoaleatorios que permiten generar una secuencia , , de nmeros aleatorios
aproximadamente independientes y que siguen, tambin aproximadamente, la distribucin
Uniforme

A. Simulacin de distribucin continua B. Simulacin de distribucin discreta


3.3.1 TEOREMA DEL LMITE CENTRAL

Elteorema del lmite central indica que, en condiciones muy generales, si es la suma de
n variables aleatorias independientes, entonces la funcin de distribucin de se
aproxima bien a una distribucin normal (tambin llamada distribucin gaussiana).

El teorema asegura que esto ocurre cuando la suma de estas variables aleatorias e
independientes es lo suficientemente grande.
Sedefine como la de n variables aleatorias, independientes, idnticamente distribuidas y
con una medida y varianza finitas ()

es n.

varianza n. Pr( ) indica probabilidad y lim se


refiere a lmite matemtico.
Ejemplo

En una asignatura del colegio la probabilidad de que te saquen a la pizarra en cada


clase es del 10%. A lo largo del ao tienes 100 clases de esa asignatura. Cul es la
probabilidad de tener que salir a la pizarra ms de 15 veces?
solucin
Se a aplicar el Teorema Central del Lmite
"Salir a la pizarra", le damos el valor 1 y tiene una probabilidad del 0,10
"No salir a la pizarra", le damos el valor 0 y tiene una probabilidad del 0,9

m = 0,10
= 0,10 * 0,90 = 0,09

Por tanto, la suma de las 100 variables se distribuye segn una normal
cuya media y varianza son:
Media: n * m = 100 * 0,10 = 10
Varianza: n * s2 = 100 * 0,09 = 9
Para calcular la probabilidad de salir a la pizarra ms de 15 veces, calculamos el valor
equivalente de la variable normal tipificada:

Luego:

P (X > 15) = P (Y > 1,67) = 1 - P (Y < 1,67) = 1 - 0,9525 = 0,0475

Es decir, la probabilidad de tener que salir ms de 15 veces a la pizarra a lo largo


del curso es tan slo del 4,75%.
3.3.2 MTODO DE LA TRANSFORMADA INVERSA

Transformada inversa

Es un mtodo para la generacin de nmeros


aleatorios de cualquier distribucin de
probabilidad se conoce la inversa de su funcin de
distribucin
3.3.2 MTODO DE LA TRANSFORMADA INVERSA

Si deseamos generar los valores de la variables


aleatorias a partir de cierta estadstica de poblacin
cuya funcin de densidad este dada por F(x), y vamos
a utilizar el mtodo de la transformada inversa,
debemos en primer lugar obtener la funcin de la
distribucin acumulada F(x), de la distribucin que se
Puesto que F(x) est definida en el intervalo (0;1) , se puede
va a simular
generar un
.
numero aleatorios de distribuidos
uniformemente r y tratar de determinar el valor de la
variable aleatoria para la cual su distribucin acumulada es
igual a r, es decir, el valor simulado de la variable aleatoria
que sigue una distribucin de probabilidad F(x)
r = F(x).
3.3.2 MTODO DE LA TRANSFORMADA INVERSA

Sigue por lo tanto, que para cualquier valor particular de r, que


generamos, por ejemplo , siempre es posible encontrar el valor de x,
en este caso , que corresponde a debido a la funcin inversa de F, si
es conocida. Esto es:

Donde (x) es la transformacin inversa de r sobre el intervalo unitario


en el dominio de x.

Ntese que (r) siempre ser definida desde 0 < r < 1 y que el rango
de F es .
3.3.2 MTODO DE LA TRANSFORMADA INVERSA
Aqu la funcin de distribucin de
Donde esta igualdad cumple con probabilidad es
los siguientes puntos
Se asume los que X solamente
puede tomar los siguientes
valores

Por lo tanto el algoritmo


general sera como sigue:
Aplicacin del mtodo de la transformada inversa.
Hallar el generador de variaciones aleatorias cuya funcin de densidad de probabilidad es :

solucin
Sea RND un nmero aleatorio uniforme en (0,1) dado, entonces:

Al integrar se tiene:
Por lo que el generador, hallado por el mtodo
de la transformacin inversa es:

Es decir,
3.3.3 MTODO DE MONTE CARLO
Las simulaciones de Monte Carlo es una
tcnica que combina conceptos estadsticos
(muestreo aleatorio) con la capacidad que
tiene los ordenadores para generar nmeros
pseudoalatorios y automatizar clculos

El mtodo se llamo as en referencia a casino


de Monte Carlo (principado de Monaco) por
ser la capital de juego de azar al ser la
ruleta un generador simple de nmeros
aleatorios. El nombre y el desarrollo
sistemtico de los mtodos de Monte Carlo
datan aproximadamente de 1944 y se
3.3.3 MTODO DE MONTE CARLO

El anlisis de riesgo se puede


realizar cualitativa y
cuantitativamente. El anlisis de
riesgo cualitativo generalmente
incluye la evaluacin instintiva o
por corazonada y se caracteriza
por afirmaciones como eso parece
muy arriesgado o probablemente
buenos resultados.
El anlisis de riesgo cuantitativo
trata de asignar valores numricos
a los riesgos, utilizando datos
empricos o cuantificado
3.3.3 MTODO DE MONTE CARLO
Ejemplo:
En la imagen inferior se muestra un anlisis histrico de 200 das sobre el nmero
de consultas diarias realizadas a un sistema de informacin empresarial (EIS)
residente en un servidor central. La tabla incluye el nmero de consultas diarias
(0 a 5) junto con las frecuencias absolutas (nmero de das que se producen 0,
1,5 consultas), las frecuencias relativas (10/200 = 0,05,
...), y las frecuencias relativas acumuladas.

Solucin
Denotando por X a la variable aleatoria que representa el nmero diario de
consultas al EIS, sabemos que:
Cuando se conozca la distribucin de probabilidad asociada a una variable
aleatoria discreta, ser posible usar la columna de frecuencias relativas
acumuladas para obtener los llamados intervalos de nmeros aleatorios
asociados a cada suceso. En este caso, los intervalos obtenidos son:

0,00 , 0,05) para el suceso 0

[0,05 , 0,15) para el suceso 1

[0,15 , 0,35) para el suceso 2

[0,35 , 0,65) para el suceso 3

[0,65 , 0,85) para el suceso 4


El grfico siguiente nos muestra cada
[0,85 , 1,00) para el suceso 5
una de las probabilidades sobre el
nmero de consultas
Asignamos pues la funcin
ALEATORIO a una casilla (la
G1 en el caso de la imagen):

Seleccionando la celda y arrastrando con el


ratn desde el borde inferior derecho de la
misma podemos obtener un listado completo de
nmeros pseudo-aleatorios:

Finalmente, usando la
funcin PROMEDIO ser
posible calcular la media
de los valores de la
columna H
En este caso, hemos obtenido un valor
estimado que corresponde exactamente con
el valor real anteriormente calculado va la
definicin terica de la media. Sin embargo,
debido a la componente aleatoria intrnseca
al modelo, normalmente obtendremos
valores cercanos al valor real, siendo
dichos valores diferentes unos de otros
(cada simulacin proporcionar sus propios
resultados).
INTERPRETACION Y
APLIICACIONES DE
VARIOGRAMAS
EL VARIOGRAMA
El variograma es la herramienta geoestadstica bsica. Permite
analizar el comportamiento espacial de los parmetros
geolgicos y expresa la correlacin espacial entre los valores
muestreados.
Sean x y (x + h) dos puntos en el espacio:
*La definicin terica de la funcin variograma (h) es la esperanza
matemtica siguiente:

*Sin embargo, en la prctica siempre se utiliza el algoritmo


siguiente:
* Esta ecuacin es la que hay que adaptar en cada situacin
prctica (mallas regulares e irregulares en el espacio de n
dimensiones, n = 1, 2, 3). Las propiedades de (h), que se
deducen fcilmente de la definicin son:

* La ltima relacin proviene del hecho que si dos leyes z1 y


z2 estn a la distancia h, entonces (z1 -z2)2 = (z2 - z1)2
Clculo del variograma para una lnea muestreada regularmente

Sean N datos z1, z2, . . . , zN y sea b la equidistancia entre ellos:


a) Sea h = b: Segn el algoritmo de clculo se tiene:

b) Sea h = 2b:

c) Sea h = 3b:
Sea en general h = kb (k = 0, 1, 2, . . . , N-1):

Luego estos valores (b), (2b), (3b), (4b). se lleva a un


grfico .
COMPONENTES DE UN VARIOGRAMA
1.- EFECTO PEPITA (Co)
Por lo general, el variograma no tiende a cero, el efecto pepita es
una discontinuidad de salto en el origen conocido tambin como
efecto nugget, representa la discontinuidad en el semivariograma
para distancias que sean menores que la menor distancia dada
entre los puntos muestrales. Esta discontinuidad se puede dar
tambin debido a errores en la medicin o a una pobre precisin
analtica.
2.- SILL (C)
El sill conocido tambin como La Meseta es el valor mximo que
alcanza el semivariograma cuando la variable es estacionaria.
Tericamente, la meseta coincide con el valor de la varianza y por
tanto un buen estimador de la misma ser la varianza experimental
de los datos.
3.- RANGO (a)
Conocido tambin como Alcance, el Rango es la distancia a la cual
el variograma se estabiliza y las muestras se relacionan
espacialmente.
APLICACIN DEL VARIOGRAMA

Las aplicaciones de los variogramas en el campo minero-


geolgico es de suma importancia por ejemplo para analizar
la variabilidad de un yacimiento minero, para estimacin de
recursos mineros, determinacin de leyes medias para ver la
heterogeneidad de un yacimiento entre otras cosas.
En el siguiente ejemplo construiremos un variograma para su
posterior anlisis.
* La siguiente figura muestra un sondaje en el depsito de cobre de
Puentes de Garca Rodrguez (Espaa). Se trata de un sondaje
vertical con N = 12 muestras. La distancia es irregular cuyos datos
estn mostrados en el cuadro.
Luego se determina el rango de las
muestras:
MODELADO DE VARIOGRAMAS.

Variograma
experimental

Variograma terico
AJUSTE DE UN VARIOGRAMA A UN MODELO
TERICO.
El objetivo de ajustar un modelo terico es
disponer de una ecuacin, la cual se utilizar en
los clculos posteriores.
Despus del anlisis variogrfico disponemos de
una interpretacin de los Variogramas
experimentales, de sus caractersticas
(anisotropas, alcances, mesetas, efectos de
pepita)
El variograma terico

Corresponde a
una ecuacin
que se ajusta al
variograma
experimental:
MODELO ESFERICO.

Este modelo tiene


un comportamiento
lineal en el origen y
alcanza la meseta a
una distancia igual
al rango a.
MODELO EXPONENCIAL.

Donde c es la meseta
o varianza y a es
prcticamente el
rango, esto es, la
distancia en la que el
valor del variograma
alcanza el 95 % del
valor de la meseta. El
modelo es asinttico
y tiene un
comportamiento
MODELO GAUSIANO.
MODELO SENO CARDINAL.
Ilustracin

442 440344224309339934713460 38
33753378373355338733763376335 3240
336833573365353340332292390 2382
10
Clculo del Semivariograma

(100) 38 37 37 35 ... 37 36
2 2 2

(200) 38 35 35 30 ... 39 36
2 2 2

El semivariograma experimental se calcula


mediante la suma de los cuadrados de las
diferencias entre observaciones que se encuentran
a una distancia h (en el ejemplo 100, 200, 300, etc)

Ejercicio: calcular el valor del variograma emprico a


distancia 100
CONCLUSIONES:

La distribucin de las leyes en un yacimiento minero pueden tener forma normal o lognormal.
La Simulaciones de distribuciones consiste en simular variables aleatorias que siguen ciertas distribuciones probabilsticos el cual nos ayudan a modelar
matemticamente y dar respuestas aproximadas para un problema.

El modelo terico es el que proporciona una mejor estimacin y


precisin de datos.

Você também pode gostar