Você está na página 1de 51

UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL

ESCOLA DE ENGENHARIA

Programa de Pós-Graduação em Engenharia de Minas, Metalúrgica e Materiais

Laboratório de Pesquisa Mineral e Planejamento Mineiro

Flávio Azevedo Neves Amarante

Relatório Técnico para Introdução á Geoestatística

PORTO ALEGRE

2016
ÍNDIDE DE ILUSTRAÇÕES

Figura 1-1: Localização da área de estudo, da região de Walker Lake. ...................... 1


Figura 1-2: Mapa de localização das amostras. .......................................................... 2
Figura 2-1: Exemplo de Histograma de uma variável V. ............................................. 4
Figura 2-2: Exemplo de gráfico q-q plot ...................................................................... 7
Figura 2-3: Exemplo de um gráfico de dispersão (Scatterplot).................................... 8
Figura 2-4: Ilustração do método dos polígonos. ...................................................... 10
Figura 2-5: Exemplo de h-scatterplot. ....................................................................... 12
Figura 2-6: Ilustração da tolerância para h na seleção de pares de dados. .............. 13
Figura 2-7: Exemplo de modelo clássico de variograma. .......................................... 14
Figura 2-8: Sistema de equações da krigagem ordinária. ......................................... 16
Figura 3-1: Mapa de localização das amostras de Cobalto, a esquerda, e Niquel, a
direita. ....................................................................................................................... 19
Figura 3-2: Histograma de frequência e acumulado do cobalto. ............................... 20
Figura 3-3: Histograma de frequência e acumulado do níquel. ................................. 20
Figura 3-4: Gráfico q-q plot para níquel e cobalto. .................................................... 21
Figura 3-5: Gráfico Scatterplot para níquel e cobalto. ............................................... 22
Figura 3-6: Gráfico dos intervalos dos dados estimados por regressão e o erro
associado. ................................................................................................................. 23
Figura 3-7: Mapa dos polígonos de influência. .......................................................... 24
Figura 3-8: Histograma dos dados desagrupados..................................................... 25
Figura 3-9: Variograma Omini-direcional. .................................................................. 26
Figura 3-10: Variograma azimute 0º e range 58 m. ................................................... 27
Figura 3-11: Variograma azimute 22,5º e range 40 m. .............................................. 28
Figura 3-12: Variograma azimute 45º e range 32 m. ................................................. 28
Figura 3-13: Variograma azimute 67,5º e range 26 m. .............................................. 29
Figura 3-14: Variograma azimute 90º e range 33 m. ................................................. 29
Figura 3-15: Variograma azimute 112,5º e range 36 m. ............................................ 30
Figura 3-16: Variograma azimute 135º e range 44 m. ............................................... 30
Figura 3-17: Variograma azimute 157,5º e range 62 m. ............................................ 31
Figura 3-18: Krigagem de cobalto com grid 5x5 m2. ................................................. 32
Figura 3-19: Krigagem de cobalto com grid 10x10 m2. ............................................. 33
Figura 3-20: Histograma do modelo estimado com grid 5x5 m2. ............................... 34
Figura 3-21: Histograma do modelo estimado com grid 10x10 m2. ........................... 34
Figura 3-22: Mapas da variância gerada pela krigagem dos blocos de 5x5 m2 a
esquerda e 10x10 m2 a direita. .................................................................................. 35
Figura 3-23: Histograma da variância gerado pela krigagem 5x5 m2. ....................... 35
Figura 3-24: Histograma da variância gerado pela krigagem 10x10 m2. ................... 36
Figura 3-25: Histograma do erro da validação cruzada. ............................................ 37
Figura 3-26: Scatterplot entre os dados reais e os dados estimados. ....................... 38
Figura 3-27: Comparação visual entre as amostras e a krigagem 5x5. .................... 39
Figura 3-28: Comparação visual entre as amostras e a krigagem 10x10. ................ 40
Figura 3-29: Swathplot entre krigagem de blocos 5x5 e declusterização. Em A
swathplot no eixo X e em B swathplot no eixo Y. ...................................................... 41
Figura 3-30: Swathplot entre krigagem de blocos 10x10 e declusterização. Em A
swathplot no eixo X e em B swathplot no eixo Y. ...................................................... 42
ÍNDIDE DE TABELAS

Tabela 3-1: Comparação entre Co e Ni. .................................................................... 21


Tabela 3-2: Comparação entre dados agrupados e desagrupados da variável cobalto.
.................................................................................................................................. 24
Tabela 3-3: Comparação entre as médias agrupadas e desagrupadas. ................... 25
Tabela 3-4: Resumo dos dados dos modelos dos variogramas. ............................... 27
ÍNDICE DE EQUAÇÕES

Equação 2-1 ................................................................................................................ 4


Equação 2-2 ................................................................................................................ 5
Equação 2-3 ................................................................................................................ 6
Equação 2-4 ................................................................................................................ 6
Equação 2-5 ................................................................................................................ 8
Equação 2-6 ................................................................................................................ 9
Equação 2-7 ................................................................................................................ 9
Equação 2-8 ................................................................................................................ 9
Equação 2-9 ................................................................................................................ 9
Equação 2-10 ............................................................................................................ 12
Equação 2-11 ............................................................................................................ 14
Equação 2-11 ............................................................................................................ 15
Equação 2-12 ............................................................................................................ 15
Equação 2-13 ............................................................................................................ 15
Equação 2-14 ............................................................................................................ 16
Equação 2-15 ............................................................................................................ 16
Equação 2-16 ............................................................................................................ 17
Equação 2-17 ............................................................................................................ 17
Equação 3-1 .............................................................................................................. 22
Equação 3-2 .............................................................................................................. 22
Equação 3-3 .............................................................................................................. 22
Equação 3-4 .............................................................................................................. 22
Equação 3-5 .............................................................................................................. 26
SUMÁRIO

1. INTRODUÇÃO ..................................................................................................... 1

1.1 - Banco de dados ............................................................................................... 1

1.2 - Objetivos.......................................................................................................... 3

2. REVISÃO BIBLIOGRÁFICA ................................................................................. 4

2.1 - Análise Univariada ....................................................................................... 4

2.1.1 – Histogramas ............................................................................................. 4

2.1.2 – Medidas de localização ............................................................................ 4

2.1.3 – Medidas de dispersão .............................................................................. 5

2.1.4 – Medidas de Forma ................................................................................... 6

2.2 - Análise Bivariada ............................................................................................. 6

2.2.1 – Gráfico q-q plot ......................................................................................... 7

2.2.2 – Gráfico de dispersão ................................................................................ 7

2.2.3 – Coeficiente de Correlação ........................................................................ 8

2.2.4 – Regressão Linear ..................................................................................... 9

2.3 – Desagrupamento ............................................................................................ 9

2.3.1 – Método dos polígonos ............................................................................ 10

2.3.1 – Método das células móveis .................................................................... 10

2.4 - Continuidade Espacial ................................................................................... 11

2.4.1 - Variograma ............................................................................................. 12

2.5 - Estimativa ...................................................................................................... 14

2.5.1 – Krigagem ordinária ................................................................................. 15

2.6 - Validação ....................................................................................................... 17

2.6.1 - Validação cruzada................................................................................... 17

2.6.2 - Análise Visual.......................................................................................... 17


2.6.3 - Análise de deriva (swathplot) .................................................................. 18

3. RESULTADOS E DISCUSSÕES ....................................................................... 19

3.1 - Análise Univariada ......................................................................................... 19

3.2 - Análise Bivariada ........................................................................................... 21

3.3 – Análise do desagrupamento ......................................................................... 23

3.4 – Continuidade Espacial .................................................................................. 26

3.5 – Estimativa do depósito .................................................................................. 31

3.6 – Validação ...................................................................................................... 36

4. CONCLUSÃO .................................................................................................... 43

REFERENCIAS BIBLIOGRÁFICAS .......................................................................... 44


1

1. INTRODUÇÃO
O trabalho apresentado a seguir trata sobre um estudo dos conhecimentos de
estatística e geoestátistica aplicados a um banco de dados modificado. O banco de
dados original foi gerado na região de Walter Lake em Nevada. (Figura 1-1).

Figura 1-1: Localização da área de estudo, da região de Walker Lake.

Fonte: Isaaks & Srivastava 1989.

1.1 - BANCO DE DADOS


O banco de dados utilizado foi retirado de um modelo digital de elevação de
terreno na área de Walter Lake no estado de Nevada nos Estados Unidos da America.

Segundo Isaaks & Srivastava (1989), o banco de dados Walker Lake possui
três variáveis (V, U e T) medidas nos 78.000 pontos do grid retangular 260 x 300,
chamado de “exhaustive data set”. Para o propósito do estudo foram escolhidos 470
pontos para compor um banco de dados (“sample data set”), onde V e U receberam
referência de concentração em ppm e o grid recebeu unidade métrica se tornando 260
x 300 m2.
2

A amostragem das 470 amostras foi dividida em três etapas (Figura 1-2), na
primeira foram coletadas 195 amostras locadas em um grid pseudo regular de 20 x 20
m2, onde foram analisados apenas os teores de V, na segunda etapa foram
amostradas 150 amostras próximas aos locais onde foi encontrado alto teor de V em
um grid 10 x 10 m2 com o objetivo de cobrir locais com alta concentração de V, e na
terceira etapa foram adicionadas amostras 5 m a leste e 5 m a oeste das amostras
que apresentaram altos teores de V nas campanhas anteriores. A terceira etapa teve
como objetivo delinear as anomalias e adicionou 125 amostras ao banco de dados em
linhas leste-oeste. As amostras de V foram obtidas em todas as etapas, mas as
amostras de U foram coletadas apenas na segunda e terceira etapa da amostragem.

Neste estudo o banco de dados será utilizado substituindo as variáveis V e U


por Co (cobalto) e Ni (Níquel) respectivamente.

Figura 1-2: Mapa de localização das amostras.


3

1.2 - OBJETIVOS
Esse trabalho busca gerar estimativas e previsões para o banco de dados utilizado,
principalmente através objetivos:

 Análise exploratória dos dados através do uso de distribuição de frequências,


histogramas e resumos estatísticos.
 Descrição da continuidade espacial das variáveis estudadas
 Estimativa através do uso de modelos Krigados
 Validação dos modelos Krigados
4

2. REVISÃO BIBLIOGRÁFICA
Nesta parte do trabalho será realizada uma breve revisão dos conceitos de
estatística e geoestatística utilizados durante o trabalho.

2.1 - ANÁLISE UNIVARIADA


2.1.1 – Histogramas
A distribuição de valores contínuos é tipicamente descrita por um histograma,
onde o alcance dos valores dos dados é descrito em um número de classes específico
com largura e proporção relativa de dados iguais dentro de cada classe e expressa
na altura das barras do histograma (Goovaerts, 1997). A Figura 2-1 exibe um exemplo
de histograma de teores.

Os histogramas podem também ser apresentados de forma acumulada,


mostrando os valores dispostos de maneira crescente a sua proporção de ocorrência
acima de um limite inferior de interesse.

Figura 2-1: Exemplo de Histograma de uma variável V.

Fonte: Isaaks&Srivastava, 1989

2.1.2 – Medidas de localização


Média: é a soma aritmética dos dados amostrados dividido pela quantidade de
dados existente, dada pela equação:

= ∑ (2-1)

Em que хi seriam os dados amostrados e n a quantidade de dados existente.


5

Mediana: é o ponto de localização do centro da distribuição dos dados, quando


ordenados de forma crescente ou decrescente. Metade dos dados estão abaixo da
mediana e metade dos dados estão acima.

A média e a mediana são medidas de localização de centro de distribuição, mas


enquanto a média é sensível a valores erráticos altos a mediana depende apenas da
quantidade de valores que estão abaixo ou acima dela.

Moda: A moda é o valor mais frequente. No histograma a moda é a classe com


a barra mais alta.

Mínimo e Máximo: São definidos respectivamente pelo menor e maior valor no


banco de dados.

Quartis: Os quartis inferior e superior dividem os dados em quatro partes de


maneira similar a mediana que divide os dados em duas partes. Estando os dados
ordenados de forma crescente, o quartil inferior corresponde ao valor do primeiro um
quarto dos dados e o quartil superior corresponde ao terceiro um quarto dos dados.

2.1.3 – Medidas de dispersão


Variância: é a média do quadrado da diferença entre os dados e a sua média.
Como é uma medida de dispersão da diferença de valores quadráticos, ela é muito
sensível a valores elevados. A variância, s2, é dada por:

= ∑ ( − ) (2-2)

Em que хi seriam os dados amostrados, m a sua média dos dados e n a quantidade


de dados.

Desvio Padrão: é a raiz quadrada da variância. O desvio padrão, s, é mais


utilizados que a variância já que sua unidade é a mesma da variável que está sendo
descrita.
6

2.1.4 – Medidas de Forma


Coeficiente de assimetria (coefficient of skewness): A ferramenta responsável
por resumir a simetria do histograma é conhecida como Coeficiente de assimetria, que
é definida por:

∑ ( )
= s
(2-3)

O Coeficiente de assimetria, CS, é ainda mais sensível a valores altos erráticos


do que a média e a mediana, já que a diferença entre cada dado e a sua média está
elevada ao cubo. A simetria do histograma pode ser descrita através da comparação
da média e da mediana. Um histograma que apresenta uma assimetria positiva possui
concentração de valores extremos na direita de modo que a mediana é menor que a
média e CS maior do que zero. Se a concentração de valores extremos estiver para a
esquerda do histograma a média será maior que a mediana, apresentando uma
assimetria negativa e CS menor do que zero. Em uma situação em que a média seja
igual a mediana temos um histograma simétrico com CS igual a zero.

Coeficiente de Variação: O Coeficiente de Variação é usado com uma


alternativa da descrição de assimetria de uma distribuição, sendo frequentemente
usado em distribuições com valores positivos e com assimetria também positiva.
Fornece indicação de problemas nas estimativas. Coeficiente de variação com valores
maiores do que um indicam a presença de valores extremos errático. O Coeficiente
de Variação é definido como a razão do desvio padrão pela média:

s
= (2-4)

2.2 - ANÁLISE BIVARIADA


Nos bancos de dados de ciências da terra geralmente nos deparamos com a
necessidade de comparar duas distribuições, já que algumas das características mais
importantes nas geociências estão nas relações e dependências entre as variáveis
(Isaaks & Srivastava, 1989). Nesse capítulo descreveremos as ferramentas essenciais
da Análise Bivariada que busca descrever as relações e dependências de
multivariáveis.
7

2.2.1 – Gráfico q-q plot


A correlação entre duas variáveis pode ser descrita pelo gráfico q-q plot, onde
os quantis de uma distribuição x são plotados no eixo x e os quantis de uma
distribuição y são plotados no eixo y do gráfico. Se os quantis de duas distribuições
idênticas fossem plotados em um q-q plot obteríamos uma reta do tipo x=y, já em
distribuições muito similares, obtemos as diferenças nas distribuições pelos desvios
da reta x=y. A Figura 2-2 é uma ilustração do uso do gráfico q-q plot.

Figura 2-2: Exemplo de gráfico q-q plot

Fonte: Isaaks&Srivastava, 1989.

2.2.2 – Gráfico de dispersão


O método mais comum para dispor dados bivariados é o gráfico de dispersão
ou Scatterplot, onde duas variáveis são dispostas em um gráfico x-y de modo que
uma variável corresponde a coordenada x e a outra variável corresponde a variável y,
e deste modo, permite uma percepção qualitativa do quanto duas variáveis estão
relacionadas. O Scatterplot também permite a identificação de dados irregulares. A
Figura 2-3 é uma ilustração do uso de um Scatterplot, onde é possível identificar dados
irregulares.
8

Figura 2-3: Exemplo de um gráfico de dispersão (Scatterplot).

Fonte: Isaaks&Srivastava, 1989.

2.2.3 – Coeficiente de Correlação


O Coeficiente de Correlação é o parâmetro estatístico mais utilizado para
resumir a relação entre duas variáveis. O Coeficiente de Correlação, , é calculado
pela equação:

∑ ( )( )
= (2-5)

Onde a variável n representa o número de dados, xi,...,xn os valores para a


primeira variável, sendo mx a sua média e o seu desvio padrão, e yi,...,yn os valores
para a segunda variável com my a sua média e o seu desvio padrão. O numerador
da equação é chamado de covariância que ao ser dividido pelos desvios padrões das
duas variáveis resulta no coeficiente de correlação que sempre seja um valor entre -1
e +1, fornecendo um índice independente da magnitude dos valores apresentados.

O coeficiente de correlação é uma medida da aproximação dos dados


amostrais de uma linha reta. Se = +1, então o gráfico de dispersão dos dados
amostrais será uma linha reta com inclinação positiva (correlação positiva), se = −1
o gráfico de dispersão será um alinha reta com inclinação negativa (correlação
negativa) e se = 0 não há correlação entre as variáveis.
9

2.2.4 – Regressão Linear


A relação entre duas variáveis nos permite estimar uma variável se uma das
duas é conhecida. Uma forma de estimar a variável desconhecida é a regressão linear,
onde assumimos que a dependência entre as variáveis pode ser descrita por uma
equação da reta:

= + (2-6)

A inclinação da reta a e a constante b são dadas pelas equações:

= = − (2-7)

A inclinação da reta, a, é igual ao coeficiente de correlação multiplicado pela


diferença entre os desvios padrões, sendo sy o desvio padrão da variável que
desejamos encontrar e sx o desvio padrão da variável que conhecemos. A constante
b pode ser calculada com as médias das duas variáveis, mx e my.

A equação da reta obtida pela regressão linear permite estimar a variável y a


partir de uma variável x conhecida. Além disso, é possível determinar o intervalo que
contém o valor de y. A equação 2-8 a seguir define o intervalo, com sua respectiva
confiança:

( )²
± ∝
; ∗ ∗ 1+ +∑ ∗
(2-8)

∑ (∑ ) (∑ )
= (2-9)

Em que t é igual a distribuição t-student e é a variância do erro da regressão.

2.3 – DESAGRUPAMENTO
Os projetos de exploração mineral buscam caracterizar a ocorrência mineral da
melhor forma o possível a fim de beneficiar o empreendimento. Desta forma, ocorre
um adensamento amostral natural nos locais que apresentam maiores teores
processo conhecido como clusterização ou agrupamento preferencial. A amostragem
preferencial ocorre sempre quando a localização das amostras não é regular ou
aleatoriamente distribuída.
10

O agrupamento preferencial impacta diretamente no resultado estatísticos dos


dados, gerando uma má apreciação dos dados e tornando necessário o uso de
métodos de desagrupamento ou declusterização a fim de alcançar uma representação
mais real. Os principais métodos utilizados no desgrupamento buscam atribuir pesos
as amostras para obter uma estimativa com maior precisão.

2.3.1 – Método dos polígonos


O método de desagrupamento dos polígonos atribui pesos as amostras
proporcionalmente a área do Polígono de Voronoi. Cada amostra possui um polígono
de influência em que é mais próxima a ela do que qualquer outra amostra. A Figura
2-4 demonstra o polígono de influência de uma amostra. Ao utilizar o peso das
amostras proporcionalmente a área do polígono realizamos o desagrupamento
necessário. Amostras agrupadas tendem a receber pesos pequenos referentes aos
seus polígonos de influência pequenos, já amostras espaçadas com grandes
polígonos de influência tendem a receber pesos grandes.

Figura 2-4: Ilustração do método dos polígonos.

Fonte: Isaaks & Srivastava, 1989.

2.3.1 – Método das células móveis


O método das células móveis consiste na divisão da área estudo em regiões
retangulares denominadas células. As amostras recebem peso inversamente
11

proporcional a quantidade de amostras dentro da célula, deste modo, amostras


agrupadas irão receber pesos menores já que as células a qual pertencem terão
muitas amostras.

2.4 - CONTINUIDADE ESPACIAL


A continuidade espacial existe na maioria dos bancos de dados geológicos, de
modo que dois dados próximos possuem maior chance de se parecerem do que dois
dados distantes entre si. Segundo Isaaks & Srivastava (1989), as ferramentas usadas
para descrever uma relação entre duas variáveis também servem para descrever a
relação entre uma variável e a mesma variável a uma distância próxima.

A relação espacial entre dados pode ser exibida através de um h-scatterplot,


onde serão plotados todos os pares de medidas de uma mesma variável separadas
por uma dada distancia h em uma direção particular θ (Goovaerts, 1997). O formato
da nuvem de pontos em um h-scatterplot descreve o quanto os dados são contínuos
separados a uma certa distância em uma direção particular. Caso os dados separados
de uma distância h forem muito similares, os pares serão plotados próximos a linha
x=y. Com o aumento da distância os dados se tornam menos similares e a nuvem de
pontos se torna mais dispersa (Figura 2-5). Apesar dos h-scatterplot terem muita
informação é mais comum o uso do variograma ou semi-variograma para descrever a
continuidade espacial.
12

Figura 2-5: Exemplo de h-scatterplot.

Fonte: Isaaks&Srivastava, 1989.

2.4.1 - Variograma
O variograma descreve como os dados estão relacionados pela distância. A
equação do semi-variograma , γ(h), é dada pela média quadrática da diferença entre
dois pontos separados de uma distância h:

(ℎ) = ∑ [ ( )− ( + ℎ)]² (2-10)

Segundo Goovaerts (1997), o semi-variograma mede a dissimilaridade média


entre dados separados por um vetor h. O valor dado por ele a um dado atraso h pode
ser interpretado como o momento de inércia do h-scatterplot.
13

Encontrar pontos separados exatamente por uma distância fixa h em uma


direção determinada se torna muito difícil, tornando necessário a aplicação de uma
tolerância para a distância e para a direção a fim de obter um número suficiente de
pontos utilizados no cálculo do variograma. A Figura 2-6 é um exemplo onde a
tolerância de +-1m foi dada a distância e +-20º de tolerância a direção de h.

Figura 2-6: Ilustração da tolerância para h na seleção de pares de dados.

Fonte: Isaaks & Srivastava, 1989.

O variograma tem como características principais descritas na Figura 2-7:

Range (alcance): Da mesma forma que a distância entre os pares aumenta, o


valor correspondente do variograma também aumenta. O alcance do variograma é a
separação máxima na qual o variograma ainda apresenta continuidade espacial, a
distância na qual o variograma alcança o patamar.

Sill (Patamar): É o nível de estabilização do variograma, deixando de


apresentar dependência entre os pares.

Nugget Effect (Efeito pepita): é o valor inicial do variograma, que representa a


diferença da medida ocasionada por erros na amostragem, de análise e a
variabilidade de pequenas escalas ou diferenças discrepantes entre amostras
separadas por distancias muito pequenas.

Contribuição (Partial sill): é a diferença entre o sill e o nugget effect, ou seja, o


quanto de informação os pares de amostras estão fornecendo.
14

Figura 2-7: Exemplo de modelo clássico de variograma.

Os modelos variográficos, gerados através do ajuste de uma curva aos pontos


do variograma experimental, mais utilizados são o esférico, o gaussiano e o
exponencial. A utilização desses modelos conhecidos é importante para as
estimativas por krigagem ordinária que exige que o variograma seja positivamente
definido, garantidos pelos três modelos.

2.5 - ESTIMATIVA
Os estudos geoestatísticos em sua grande maioria não se limitam à obtenção
de um modelo de continuidade espacial, busca também predizer valores em pontos
não amostrados. A estimativa de valores não amostrados leva em consideração as
informações obtidas anteriormente com o objetivo de obter uma malha de pontos
interpolados que permitam visualizar o comportamento da variável na região através
de mapas de isolinhas ou de superfícies. Os métodos geralmente envolvem
combinações lineares ponderadas (Equação 2-11). O principal método de
interpolação usado para a estimativa de valores é a krigagem.

=∑ (2-11)

Em que vi seriam os valores de dados disponíveis e wi os pesos concedidos a


cada dado.
15

O termo krigagem é derivado do nome Daniel G. Krige, que foi o pioneiro a


introduzir o uso de médias móveis para evitar a superestimação sistemática de
reservas de mineração (Delfiner e Delhomme, 1975).

Para Sinclair & Blackwell (2004), krigagem é um termo genérico aplicado a uma
gama de métodos de estimativa que depende da minimização do erro da estimação,
normalmente através do procedimento dos mínimos quadrados.

A krigagem é considerada um bom estimador linear a partir de dados


conhecidos, onde todos os tipos de estimadores por krigagem são variações da
regressão linear básica Z*(u) dado por:

∗( )− ( ) = ∑∝( )
∝( )[ ( ∝) − ( ∝ )] (2-12)

Em que λ∝(u) são os pesos a serem determinados, z(u∝) valores dos dados nas
posições u∝ e m(u) a esperança matemática, média dos valores de Z. O objetivo dos
métodos de krigagem é a minimização da variância do erro s2R, dada por:

s ( )= { ∗ ( ) − ( )} (2-13)

A variância do erro é minimizada por:

{ ∗ ( ) − ( )] = 0 (2-14)

2.5.1 – Krigagem ordinária


Os métodos de krigagem ordinária são conhecidos na literatura como
interpoladores do tipo BLUE (best linear unbiased estimator), melhor estimador não
enviesado. Recebe esse nome porque suas estimativas são feitas por combinações
lineares, o erro de estimativa esperado é zero e busca minimizar a variância dos erros
de estimativa.

Segundo Isaaks & Srivastava (1989), a grande importância da krigagem


ordinária está no fato de que jamais saberemos a média do erro residual, mR, e não
temos como garantir que será exatamente 0. Nem podemos saber s2R, portanto não
podemos minimiza-la. A alternativa é construir um modelo probabilístico onde o viés
e o erro da variância podem ser calculados, os pesos para as amostras podem ser
16

escolhidos para assegurar que a média do erro para o modelo seja exatamente zero
e o erro da variância do modelo seja minimizado.

Para que a estimativa obtida não seja tendenciosa, a soma dos pesos das
amostras deve ser igual a um (equação 2-15)

∑ =1 (2-15)

Sendo μ o parâmetro de Lagrange, a minimização do erro da variância


necessita que:

∑ ∁ + =∁ (2-16)

Ao satisfazer as duas equações o conjunto de pesos minimiza a variância do


erro e iguala a média do erro a zero.

O sistema de equações conhecido como krigagem ordinária pode ser escrito


através de uma matriz apresentada na equação da Figura 2-8, onde a matriz da
covariância C leva em consideração as distâncias entre as amostras, e provê
informações a respeito da clusterização das mesmas que recebem pesos menores. A
matriz w é o conjunto de pesos que devem ser encontrados que anulam a média do
erro e minimizam a variância. A matriz D representa a relação da distância entre o
ponto estimado e as amostras conhecidas, sendo que amostras mais próximas
possuem peso maior.

Figura 2-8: Sistema de equações da krigagem ordinária.

Fonte: Isaaks&Srivastava, 1989.

Para encontrar os pesos ambos os lados da equação da Figura 2-8 devem ser
multiplicados pela matriz inversa de C.

A variância minimizada do erro, também chamada de variância da krigagem


ordinária ou variância da estimativa é dada pela equação:
17

= − (∑ + ) (2-17)

Ou em termos das matrizes definidas anteriormente como:

= − ∗ (2-18)

2.6 - VALIDAÇÃO
2.6.1 - Validação cruzada
A validação cruzada ajuda a tomar a decisão entre diferentes procedimentos de
pesos, entre diferentes estratégias de busca e entre diferentes modelos de
variogramas (Isaaks & Srivastava, 1989). São usados geralmente para comparar
distribuições dos erros estimados ou residuais de diferentes procedimentos de
estimativa. Desta forma, geralmente é usado como uma ferramenta preliminar antes
das estimativas finais serem calculadas.

Segundo Deutsch & Journel (1998), o exercício da validação cruzada busca


detectar o que pode dar errado, mas não garante que a visualização será um sucesso.

Na validação cruzada dados reais de uma localização real são separados um por
vez e reestimados pelos dados vizinhos restantes. Cada dado é então recolocado no
banco de dados após o a reestimativa. O procedimento é repetido para todos os dados
do banco de dados gerando um novo conjunto de dados estimados que podem ser
comparados com os dados originais.

2.6.2 - Análise Visual


A inspeção visual parte da comparação por sobreposição de imagens dos valores
amostrados das imagens dos valores obtidos pela estimativa por krigagem (Hartman
et al, 1992).

A análise visual dos dados pode revelar erros óbvios de localização dos dados ou
chamar a atenção para dados errôneos. Dados coletados em malha irregular podem
fornecer informações sobre a coleta de dados.
18

Áreas com uma malha concentrada de pontos podem indicar regiões de interesse
inicial, e a localização dos valores máximos e mínimos pode revelar certa tendência
dos dados.

2.6.3 - Análise de deriva (swathplot)


As variações dos teores médios das amostras e da composição nos modelos
podem ser comparadas sob a forma de perfis de grades do modelo (swathplot) que
podem incluir campos de teores principais e também de teores derivados (Hartman et
al, 1992).

O swathplot ou análise da deriva é uma ferramenta usada na validação que


consiste na comparação de dois conjuntos de dados. Essa técnica permite identificar
diferenças obtidas ao usar métodos diferentes de estimativa a partir da divisão dos
teores em faixas geradas em diversas direções pelo depósito. A partir dessas fatias,
são feitos os cálculos estatísticos para extrair as médias das propriedades de
interesse.

O uso mais comum para o swathplot é a comparação entre variações de teor


do modelo de krigagem ao modelo declusterizado. Apesar do modelo declusterizado
não promover estimativas confiáveis para teores em escalas regionais, em escalas
maiores, representa um estimador não enviesado para a distribuição de teores. Desta
forma, se a krigagem não for enviesada a tendência é que os teores apresentem
flutuações locais no gráfico da análise de deriva, mas com a tendência geral similar a
distribuição do modelo declusterizado.

A validação ocorre, no caso os métodos de estimativas utilizados forem


adequados, com teores dos dados da declusterização e os teores dos dados da
krigagem apresentando o mesmo comportamento dentro das janelas.
19

3. RESULTADOS E DISCUSSÕES
3.1 - ANÁLISE UNIVARIADA
O uso de dados pode nos dizer muito se trabalhado de maneira organizada.
(Isaaks & Srivastava, 1989). A análise univariada utiliza de ferramentas para coletar,
organizar e interpretar dados a fim de obter uma maior compreensão do que os
mesmos representam.

A Figura 3-1 mostra a localização das amostras de Cobalto e Níquel onde é


possível observar uma região de altos teores na direção norte-sul da região oeste do
mapa, com os maiores valores concentrados no quadrante noroeste do mapa.

Figura 3-1: Mapa de localização das amostras de Cobalto, a esquerda, e Niquel, a direita.

A utilização de histogramas é uma forma comum de apresentar o conjunto de


amostras, o conjunto utilizado é composto de 470 amostras de Co, sendo a Figura 3-2
o histograma de frequência e acumulado da variável cobalto. Os teores de Co variam
de 0 a 41,26 ppm, com média aritmética 11,75 ppm, mediana de 11,43 ppm e variância
65,56 ppm2. O histograma de frequência do cobalto apresenta uma assimetria
positiva, ou seja, média é maior que a mediana.
20

Figura 3-2: Histograma de frequência e acumulado do cobalto.

O conjunto das amostras de níquel é composto de 275 amostras representadas


na Figura 3-3 pelos seus histogramas de frequência e acumulado. Os teores de Ni
variam de 0 a 14 ppm, com média aritmética 1,63 ppm, mediana de 0,86 ppm e
variância 4,29 ppm2. O histograma de frequência do níquel apresenta uma assimetria
positiva, ou seja, média é maior que a mediana.

Figura 3-3: Histograma de frequência e acumulado do níquel.

Podemos observar que o quartil superior do cobalto é igual a 17,26 ppm e o


quartil superior do níquel é igual a 2,24 ppm, valores muito distantes dos valores
máximos de Co de 41,25 ppm e Ni de 14,01 ppm. O Coeficiente de variação
apresentou valores de 0,69 para cobalto e 1,27 para o níquel, indicando a presença
de valores extremos que podem impactar nas estimativas finais. A Tabela 3-1 a seguir
exibe a comparação entre os dados estatísticos de Co e Ni.
21

Tabela 3-1: Comparação entre Co e Ni.

Co Ni
n 470 275
m 11,75 1,63
σ 8,10 2,07
CV 0,69 1,27
min 0 0
Q1 4,98 0,22
M 11,43 0,86
q3 17,27 2,24
max 41,26 14,01

3.2 - ANÁLISE BIVARIADA


Na seção anterior foi apresentada a análise univariada do banco de dados, mas
as ferramentas utilizadas servem apenas para descrever variáveis individuais. Nessa
seção temos interesse em discorrer a respeito dos relacionamentos e dependências
do conjunto de dados utilizando ferramentas de análise bivariadas.

O gráfico q-q plot da Figura 3-4 permite realizar uma primeira comparação
visual entre os quantis de Ni e Co com o objetivo de identificar uma semelhança na
distribuição. A reta vermelha onde Ni=Co representa uma situação onde a distribuição
é idêntica, os desvios dos quantis de Co evidenciam a diferença de distribuição. A
semelhança da distribuição parece ocorrer de modo parcial.

Figura 3-4: Gráfico q-q plot para níquel e cobalto.


22

A utilização mais comum para apresentar os dados bivariados é através de um


gráfico de dispersão, onde as variáveis são plotadas em um gráfico XY gerando uma
nuvem de pontos de cada par de variáveis. Na Figura 3-5 a seguir apresenta o gráfico
de dispersão para Co e Ni, além disso, é possível identificar a reta de regressão linear
e o coeficiente de correlação de 0,51, obtidos através do software SGeMS. A equação
da reta obtida através da regressão linear é dada por:

= 0,1511 − 0,608 (3-1)

Essa equação permite prever os teores de níquel (variável y) a partir de teores


de cobalto (variável x) amostrados.

Figura 3-5: Gráfico Scatterplot para níquel e cobalto.

O intervalo de confiança para y’ como estimativa, com confiança de 80%, para


teores de Ni estimados a partir dos teores de cobalto é dado por:

, ( , ∗ , ) , ∗ ,
= (3-2)

= 1,73159 (3-3)

( , )
± 1,281 ∗ 1,732 ∗ 1 + + , ∗ ,
(3-4)

Para cada valor de y’ estimado terá um valor x utilizado na regressão e cada


valor terá um erro associado. A figura 3-6 apresenta o gráfico dos dados estimados
por regressão e o intervalo de erro aceitável.
23

Figura 3-6: Gráfico dos intervalos dos dados estimados por regressão e o erro associado.

3.3 – ANÁLISE DO DESAGRUPAMENTO


O desagrupamento pelo método dos polígonos foi realizado no software
SGems. A Figura 3-7 apresenta o resultado do processo de declusterização pelo
método dos polígonos onde foi utilizado de um grid de com 260 células no eixo X e
300 células no eixo Y, tendo cada célula 1m2 de área. Foi selecionado um raio de 30m
para a busca da amostra mais próxima, dando o valor encontrado a célula.

O histograma dos dados desagrupados pelo método dos pológonos para a


variável Co é apresentado na Figura 3-8, a variância dos dados é 43,95 ppm2 e a
média é 7,47 ppm.

O desagrupamento pelo método das células móveis utilizou de vários testes de


pesos e tamanhos de células para obter a que apresentava menor média global. Ao
contrário do método dos polígonos onde obtivemos um único resultado pelo software
SGeMS, o método das células móveis gerou inúmeros pesos a serem analisados.

Utilizando o software SGeMS foram testadas quarenta dimensões para células


quadradas entre 5x5 m2 e 50x50 m2. A menor média global encontrada para o cobalto
foi de 7,86 ppm nas células de dimensões 18,5x18,5 m2 e variância de 48 ppm2.
24

Figura 3-7: Mapa dos polígonos de influência.

Uma grande diferença é perceptível entre os resumos estatísticos entre os dados


agrupados e desagrupados pelo método dos polígonos. Ao compararmos os dados
da Tabela 3-2 nos deparamos com o grande impacto causado pelo agrupamento de
dados, gerado por um adensamento amostral de uma região de alto teor que leva a
uma superestimava.

Tabela 3-2: Comparação entre dados agrupados e desagrupados da variável cobalto.

Parâmetro Agrupado Polígonos


m 11,75 7,47
σ 8,10 6,63
CV 0,69 0,89
min 0,00 0,00
Q1 4,98 1,91
M 11,43 6,06
Q3 17,27 11,64
max 41,26 41,26
25

A Tabela 3-3 apresenta a comparação entre as médias obtidas pelos métodos


de desagrupamento e os dados agrupados para a variável cobalto. Podemos observar
uma grande diferença de 4,28 ppm entre os valores da média encontrada pelo
desagrupamento pelo método dos polígonos e da média dos dados agrupados de
11,75 ppm. A diferença dos valores da média obtido pelo método das células móveis
e das amostras grupadas também é espressiva de 3,89 ppm. Ao compararmos os
métodos de desagrupamento podemos observar que a média dos dados possui
valores com pequena diferença entre si. Para validação das estimativas será utilizado
do swathplot ou análise de deriva, discutido mais à frente.

Tabela 3-3: Comparação entre as médias agrupadas e desagrupadas.

Parâmetro Co - Agrupado Co - Polígonos Co - Células móveis


m 11,75 7,47 7,86
σ 8,10 6,63 6,93
CV 0,69 0,89 0,88

Figura 3-8: Histograma dos dados desagrupados.


26

3.4 – CONTINUIDADE ESPACIAL


Para o estudo de continuidade espacial foram modelados variogramas em oito
direções obtendo o alcance em cada direção.

O modelamento do variograma omni-direcional da variável cobalto (Figura 3-9)


foi realizado com lag de 10m, múltiplo da malha de sondagem, tolerância de 5m e
número de lags igual a 20. O modelo escolhido para ajustar a curva aos pontos do
variograma foi o esférico. Com o variograma podemos inferir um efeito pepita de
24ppm2 e sill de 41,56 ppm2 dos dados de variância de 65,56ppm2 obtidos
anteriormente. O range obtido pela variograma foi de 36m.

Figura 3-9: Variograma Omini-direcional.

A partir dos dados obtidos no variograma omini-direcional e os parâmetros


usados, foram modelados oito variogramas direcionais variando de 0º a 157,5º, com
tolerância angular de 22,5º e largura da banda de 5m. As figuras 3-10 a 3-17
apresentam os variogramas direcionais obtidos. O variograma na direção 157,5º
apresentou o maior range de 62 m e o variograma na direção 67,5º apresentou o
menor range de 26 m. A equação que descreve o modelo de continuidade espacial
para o cobalto é dada por:

, º , º
(ℎ) = 24 + 41,5584 ∗ ℎ( ; ) (3-5)
27

A Tabela 3-4 apresenta as direções dos azimutes e os respectivos alcances


dos variogramas. A direção de range maior indica a direção preferencial de correlação
entre as amostras, sendo utilizada para a interpolação dos dados na krigagem.

Tabela 3-4: Resumo dos dados dos modelos dos variogramas.

Azimute Dip Alcance Tolerância


0 0 58 22,5
22,5 0 40 22,5
45 0 32 22,5
67,5 0 26 22,5
90 0 33 22,5
112,5 0 36 22,5
135 0 44 22,5
157,5 0 62 22,5

Figura 3-10: Variograma azimute 0º e range 58 m.


28

Figura 3-11: Variograma azimute 22,5º e range 40 m.

Figura 3-12: Variograma azimute 45º e range 32 m.


29

Figura 3-13: Variograma azimute 67,5º e range 26 m.

Figura 3-14: Variograma azimute 90º e range 33 m.


30

Figura 3-15: Variograma azimute 112,5º e range 36 m.

Figura 3-16: Variograma azimute 135º e range 44 m.


31

Figura 3-17: Variograma azimute 157,5º e range 62 m.

3.5 – ESTIMATIVA DO DEPÓSITO


A estimativa do depósito utilizou de dois grids criados com blocos de 5x5 m2 e
10x10 m2. O elipsoide de busca foi estabelecido com eixo maior continuidade de 62
m, o eixo menor continuidade de 26 m, azimute de 157,5º e busca por no mínimo 3
amostras e máximo de 20 amostras. A busca por octantes utilizou de no máximo 2
amostras por octante e no mínimo 1 por octante. As estimativas obtidas estão
representadas nas figuras 3-18 e 3-19, onde foram estimados 3120 blocos para o grid
5x5 m2 e 780 blocos para o grid 10x10 m2.
32

Figura 3-18: Krigagem de cobalto com grid 5x5 m2.


33

Figura 3-19: Krigagem de cobalto com grid 10x10 m2.

As figuras 3-20 e 3-21 apresentam os histogramas de frequência para a


estimativa realizada nos grids com blocos 5x5 m2 e 10x10 m2 respectivamente. O
histograma do grid 5x5 apresenta média aritmética de 7,54 ppm, mediana de 6,53
ppm e variância 34,35 ppm2. O histograma do grid 10x10 apresenta média aritmética
7,58 ppm, mediana de 6,62 ppm e variância 36,65 ppm2. Os histogramas das duas
estimativas apresentaram assimetria positiva. Ao compararmos as duas estimativas
podemos constatar que elas são semelhantes entre si, não apresentando grande
diferença nos resultados obtidos nas estimativas.
34

Figura 3-20: Histograma do modelo estimado com grid 5x5 m2.

Figura 3-21: Histograma do modelo estimado com grid 10x10 m2.

Os mapas das variâncias gerados pelo processo de krigagem é apresentado


na Figura 3-22. A partir dos mapas podemos constatar que, assim como era esperado,
as zonas onde ocorre o maior adensamento de amostras a variância é menor e locais
onde ocorrem poucas amostras a variância apresenta valores mais elevados,
reforçando que o erro associado a lugares com mais informação tende a ser menor.
Ao compararmos os histogramas dos mapas de variâncias apresentados nas 3-22 e
35

3-23 é possível identificar que o aumento dos blocos do grid de krigagem gera uma
diminuição na média e um aumento na variância.

Figura 3-22: Mapas da variância gerada pela krigagem dos blocos de 5x5 m2 a esquerda e 10x10 m2
a direita.

Figura 3-23: Histograma da variância gerado pela krigagem 5x5 m2.


36

Figura 3-24: Histograma da variância gerado pela krigagem 10x10 m2.

3.6 – VALIDAÇÃO
A validação do modelo de estimativa por krigagem verifica de o modelo
proposto está adequado. A validação é obtida ao compararmos os dados estimado
com os dados verdadeiros. Para isso foi gerado através da ferramenta X-validation do
software SGeMS o histograma de erros da validação cruzada (Figura 3-25). A média
do histograma de erros apresentou valor de 0,088, demonstrando alta confiabilidade
na estimativa, já que o valor está próximo de zero.
37

Figura 3-25: Histograma do erro da validação cruzada.

O scatterplot pode ser utilizado para comparar os valores reais e estimados,


dessa forma podemos verificar a correlação entre os dados. Quanto maior a
correlação entre os dados melhor é a qualidade da estimativa. Na Figura 3-26
podemos observar que ocorre uma alta correlação ente os dados com coeficiente de
correlação de 0,787, afirmando que os parâmetros utilizados na krigagem foram bem
selecionados e que a qualidade da krigagem é aceitável e a estimativa possui um bom
grau de confiabilidade.
38

Figura 3-26: Scatterplot entre os dados reais e os dados estimados.

Outra ferramenta de validação muito utilizada é a inspeção visual onde são


comparados por sobreposição de imagens dos valores amostrados dos valores
obtidos pela estimativa por krigagem. Observando as figuras 3-26 e 3-27 podemos
destacar que os teores das amostras e os valores estimados obedecem ao mesmo
padrão espacial e os valores dos blocos e das amostras são condizentes.
39

Figura 3-27: Comparação visual entre as amostras e a krigagem 5x5.


40

Figura 3-28: Comparação visual entre as amostras e a krigagem 10x10.

O swathplot é uma ferramenta usada na validação que consiste na comparação


de dois conjuntos de dados. Essa técnica permite identificar diferenças obtidas ao usar
métodos diferentes de estimativa. Para isso o depósito estimado é dividido em janelas
ao longo dos eixos X e Y. O uso mais comum consiste na comparação entre os teores
obtidos pela declusterização com os teores obtidos pela estimativa de blocos. Caso
os métodos de estimativas utilizados forem adequados é esperado que os teores dos
dados da declusterização e os teores dos dados da krigagem apresentem o mesmo
comportamento dentro das janelas.

Como podemos observar os gráficos swatplot das figuras 3-28 e 3-29 os dados
da declusterização e da krigagem ordinária no grid 5x5 m2 e no grid 10x10 m2
apresentam a mesma tendência dentro das janelas ao compararmos. Podemos
observar pelas figuras uma pequena superestimativa de 50 a 100 mts.
41

Foram utilizados nos gráficos swatplots de vinte janelas para a direção X e para
a direção Y.

Figura 3-29: Swathplot entre krigagem de blocos 5x5 e declusterização. Em A swathplot no eixo X e
em B swathplot no eixo Y.
42

Figura 3-30: Swathplot entre krigagem de blocos 10x10 e declusterização. Em A swathplot no eixo X
e em B swathplot no eixo Y.
43

4. CONCLUSÃO
Este relatório técnico trabalhou os principais assuntos desenvolvidos na disciplina
Introdução a Geoestatística, gerando estimativas e previsões a partir de um banco de
dados conhecido e apresentado na disciplina, através da utilização duas variáveis
Cobalto e Níquel.

Inicialmente foram utilizadas de ferramentas estatísticas na análise univariada que


permitiu identificar parâmetros e tendências das variáveis e que reaproveitados
posteriormente no desenvolvimento do trabalho. Para identificar as relações e
dependências entre as variáveis estudadas utilizamos de ferramentas da análise
bivariada, sendo obtido uma equação da reta que descreve a relação entre o cobalto
e o níquel.

Os métodos de desagrupamento foram muito importantes já que os dados


utilizados não foram obtidos de maneira regular, ocorrendo regiões com maior
densidade de dados e outras com menor quantidade, atrapalhando no resultado
estatístico dos dados.

O modelamento dos variogramas permitiu identificar características de


continuidades espaciais no banco de dados, que apresentou uma direção de maior
continuidade espacial no azimute de 157,5º, que influenciou diretamente na krigagem
ordinária.

A estimativa dos valores foi realizada por meio da interpolação por krigagem
ordinária, que obteve resultados satisfatórios comprovados na última etapa do
trabalho a validação do modelo gerado. Nessa etapa de validação os três métodos
utilizados apresentaram resultados satisfatórios. A média dos erros da validação
cruzada foi próxima a zero e o scatterplot dos valores reais e estimados apresentou
boa correlação, a inspeção visual apresentou o mesmo padrão espacial para dados e
estimativas e os swathplots apresentaram a mesma tendência para os valores
comparados.
44

REFERENCIAS BIBLIOGRÁFICAS
COSTA, J.F.C.L.; SOUZA, L. E. de. Introdução a Geoestatística. 2016. Notas de Aula.

DELFINER, P.; DELHOMME, J.P. Optimum interpolation by Kriging. In: DAVIS, J.C.;
McCULLAGH, M.J. (Ed). Display and analysis of spatial data. New York: John
Wiley. p. 96-114.1976.

DEUTSCH, C.V.; JOURNEL, A.G. GSLIB - Geostatistical Software Library and User’s
Guide: Oxford University Press.1992. 363 p.

GOOVAERTS, P. 1997. Geoestatics for natural resources evaluation. New York:


Oxford University Press. 483 p.

HARTMAN, H.L.; BRITTON, S.G.; GENTRY, D.W.; et al., eds. SME Mining
Engineering Handbook, 2nd edn. Littleton: Society for Mining, Metallurgy, and
Exploration, 1992. 1840 p.

ISAAKS, E.H.; SRIVASTAVA, M.R. 1989. An Introduction to Applied Geostatistics.


New York: Oxford University Press. 553 p.

SINCLAIR, J.A.; BLACKWELL, G.H. 2006. Applied Mineral Inventory Estimation.


Cambridge : Cambridge University Press. 377 p.

Você também pode gostar