Escolar Documentos
Profissional Documentos
Cultura Documentos
CORPO GEOLÓGICO: CORPO GEOLÓGICO ALONGADO NA DIREÇÃO NORTE-SUL NO FLANCO OESTE E PEQUENOS CORPOS
ARREDONDADOS NO FLANCO LESTE.
Au = 0.0757 . Cu – 0.1007 | r2 = 0.53 (PARA A REGIÃO DE MÁXIMA CORRESPONDÊNCIA, FORA DA FALHA DO CONTROLE DE
FORMAÇÃO DOS CORPOS)
MÍNIMO DE OCTANTES NÃO VAZIOS -3, MÍNIMO DE 1 DADO POR OCTANTE, MÁXIMO DE 1 DADO POR OCTANTE
INTRODUÇÃO
Como todo modelo matemático, a geoestatística utiliza uma variável como um artifício
matemático que abstrai a ideia de que vários valores podem ser assumidos dentro de condições de
contorno definidas. Esta variável representa uma característica a ser analisada na área, como por
exemplo, número de pessoas acima de vinte anos, teor de contaminantes em um rio ou um tipo de
rocha considerada no depósito. Em alguns modelos em que usamos variáveis aleatórias, apenas alguns
valores podem ser assumidos dentro de sua definição física. O teor é uma variável aleatória que pode
assumir apenas valores fracionários entre 0 e 1. A massa pode apenas ser calculada para valores acima
de 0. Entre as classificações previstas, podemos ter variáveis contínuas, quando seus valores se
modificam dentro de um conjunto real, discretas, quando seus valores modificam dentro de um
conjunto inteiro ou categóricas, quando assumem apenas valores distintos no universo. Quando podem
ser consideradas somáticas, a representação de variáveis pode ocorrer através de combinações lineares
delas, sendo representativo o uso de estatísticas tais como a média aritmética.
No entanto, apenas estabelecer variáveis que reflitam a realidade do problema a ser modelado
não garante que tenhamos informação sobre os dados dispostos em uma região. É necessário utilizar
operações que reduzam uma quantidade grande de dados e transponham informação segundo critérios,
para locais próximos das regiões de amostragem, cobrindo uma região de incerteza do fenômeno. O
processo de operação das variáveis em geoestatística advém do conhecimento de momentos, que se
caracterizam como medidas dependentes do conjunto de dados e que representam propriedades do
conjunto. A vantagem de se utilizar uma estimativa ao invés de uma metodologia de interpolação é a
utilização de momentos permite a reprodutibilidade espacial dos dados associada ao comportamento
destes e não somente à sua disposição espacial.
Por meio dessas operações ocorre perda de informação geral dos dados, mas em contrapartida a
análise se torna legível e de fácil compreensão. O momento de primeira ordem, também conhecido
como esperança matemática, é uma prova de que ao tomarmos uma estatística de um fenômeno
ganhamos uma informação para um conjunto de dados, mas perdemos sentido sobre as características
de dispersão dos mesmos. A interpretação física do momento de primeira ordem pode ser representada
como o ponto de uma barra ao qual conseguimos equilibrá-la perfeitamente. No caso de dados
simetricamente dispostos, a média dos valores constituí no ponto central da barra. Se, no entanto, a
barra apresentar um abaulamento maior na região de início, o ponto médio será deslocado para uma
região mais próxima da base.
Outro momento estatístico que por analogia podemos fazer com um sistema físico é a variância.
Se pensarmos na distribuição de peso em uma barra, quanto mais longínqua for a posição com o seu
centro de massa, mais fácil é a torque e a rotação dessa barra em um eixo. A variância seria a
desestabilização dos pontos e sua dispersão ao longo de um centro.
A variância pode ser representada pelo somatório da diferença das n realizações possíveis para a
variável pela sua média, elevado ao quadrado, como na seguinte fórmula:
n
σ ( Zi ) =∑ ( z i−m )2
2
i=1
Devido ao ganho de informação sobre as propriedades dos dados, consequentemente ocorre
perda de outras características que seriam também importantes, o que determina a necessidade de que
a utilização conjunta de momentos matemáticos para uma melhor interpretação do fenômeno. Como
exemplo, citaríamos o caso em que duas pessoas consomem cigarros em um dia. Um deles utiliza uma
quantidade de 30 cigarros diários, enquanto outro não fuma. Em média as duas pessoas seriam
consideradas fumantes, utilizando 15 cigarros por dia. De nada garantiria saber a média dos dados sem
saber associar sua dispersão. As características da utilização de momentos como ferramentas significa
também dizer que a utilização do modelo é afetada por valores extremos, que são suavizados na maioria
dos processos geoestatísticos, tais como a krigagem.
Considerando a função aleatória abaixo, podemos determinar a sua variância segundo a fórmula
abaixo:
u
λi Z (¿ ¿i)
n
Y =∑ ¿
i=1
u
λi Z (¿ ¿i)−μ
n
∑¿
i=1
¿
¿
Var (Y )=E ¿
u
u
Z (¿ ¿ j)
Z (¿¿ i)¿
¿
¿
u
Z (¿¿ i)
¿ ∀ i∈ D
n
∑ λ j λi E ¿
j=1
n
Var (Y )=∑ ¿
i=1
u
¿
u
Z (¿¿ j)
u
Z (¿¿ i)
¿ ∀ i∈ D
Z (¿ i¿),¿ ← E ( Y )=E ¿
n
∑ λ j λi Cov ¿
j=1
n
Var ( Y )=∑ ¿
i=1
Ou seja, quando se estabelece o valor esperado da variável aleatória como uma constante,
podemos definir as variações da função aleatória em qualquer ponto do domínio pela utilização da
covariância entre as amostras separadas. Ao assumirmos constância nas estatísticas individuais de cada
variável, podemos definir por meio de estatísticas bipontuais os valores desconhecidos entre os pontos
amostrados.
A utilização da geoestatística permite obter informações pelo resumo dos valores amostrados no
espaço ou pela estimação em regiões entre as medidas realizadas. Além disso, funções de recorrência
podem ser utilizada na transformação de dados estimados, e análises podem ser realizadas não somente
com a variável preditora . No entanto, como a geoestatística utiliza de funções relacionadas ao conjunto
de dados, a garantia de um modelamento adequado somente é possível se os valores amostrados são
consistentes. Portanto, a garantia de um menor erro de amostragem é decisiva no modelamento, pois se
está incorreta, subsequentemente os valores estimados também estarão.
Como característica do processo de estimação na geoestastística, utiliza-se de ponderadores
lineares que calculam pesos para a colaboração dos valores amostrados em volta do valor a ser estimado
n
( Z =∑ ρi Z(ui)
¿
i=1
)
Entre as aplicações práticas da geoestatística podemos averiguar seu uso na estimação de teores
em depósitos minerais, na agricultura, em etapas de amostragem em usinas, no âmbito ambiental, ou
em todas as práticas que envolvam análise espacial de dados.
Antes que qualquer análise geoestatística seja realizada, é importante definir uma condição de
equiprobabilidade dos dados para que possam ser tratados de forma adimensional. A condição de que
as amostragens não sejam enviesadas no conjunto de dados analíticos requer antes que os dados não
sejam enviesados de forma espacial, e isso somente é possível quando se formata geometricamente
uma malha regular.
Uma malha é uma orientação geométrica constituída de nós e células. Cada local amostrado
pode ser considerado como um nó desta célula que é distribuído nas arestas de um polígono. Quando
essas células possuem dimensão regular, tal como um quadrado então ela inevitavelmente garante
distribuição uniforme da informação.
Nó a ser ponderado
A cada ponto mais próximo do ponto a ser ponderado existe uma reta que o liga com seus
vizinhos. A interseção do plano horizontal com o plano perpendicular à metade da distância entre os
pontos forma uma reta como demonstrado na figura a seguir.
A região delimitada por dentro de todas essas retas forma um polígono regular convexo,
denominado de polígono de Voronoi.
Uma propriedade que auxilia no desenho manual dos polígonos é que o centro do círculo
circunscrito entre três pontos vizinhos é um vértice do polígono de Voronoi. Algumas etapas podem ser
simplificadas, porque não há necessidade do cálculo das retas que ligam os pontos e as perpendiculares
situadas na sua distância média.
Outro algoritmo que também auxilia no processo de desagrupamento e que funciona melhor em
ambiente tridimensional é a declusterização por células. Neste caso o grid é dividido em N partes iguais,
e o peso para cada amostra será o valor do produto das N células por n amostras contidas em cada
célula.
1
ponderador=ρ=
N .n
O processo de desagrupamento por células é uma metodologia interativa ao qual se determina
vários tamanhos de células diferentes, até se obter um tamanho ótimo que minimiza a média global dos
dados.
MAPA DE ISOVALORES
Outra forma inicial de verificação do comportamento dos dados é a utilização de um mapa de isovalores
que mostra regionalmente como é a distribuição geral da variável. Com ele é possível identificar regiões
de maior ou menor recorrência de valores altos ou baixos, ou um comportamento que possa definir o
controle geológico do ambiente e que pode ser utilizadas como característica de inferência da
continuidade espacial dos dados. O mapa abaixo demonstra regiões de concentração da radiação gama
no sítio do Jambuaçu. É possível notar que o flanco leste apresenta uma concentração muito mais
acentuada que a do no noroeste. O importante a se pensar é que as técnicas de interpolação lineares
utilizadas pelos mapas de isocontorno geram estimativas piores que a dos mapas utilizando as técnicas
geoestatísticas. A utilização de isolinhas para verificação da disposição espacial dos dados deve ser
apenas intuitiva e não qualitativa.
Figure 2 - Mapa de isocontornos1
1 http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0102-261X2010000200009
A média ponderada é o caso mais particular de uso como estimação do valor esperado da variável. Pode
também ser descrita como:
n
Z =∑ ρi z i
i=1
A mediana é o valor assumido pela realização que corresponde a aproximadamente 50% da frequência
acumulada de um conjunto de dados.
(∑ ) { (∑ ) }
n n
Mediana z i = z i∨Prob z i =0,5
i=1 i=1
A média é uma estatística sensível à utilização de valores extremos, mas o mesmo não é
observado para a mediana que é mais sensibilizada pelo número de dados disponíveis. Em alguns casos
de distribuições assimétricas, a mediana é um estimador de tendência central preferível à utilização da
média geométrica.
MEDIDAS DE DISPERSÃO
As medidas de dispersão demonstram quão diferenciado ou amplo é o comportamento dos
dados. Entre as medidas de dispersão mais comuns podemos citar a variância, o desvio padrão e o
intervalo de dados.
A variância é uma medida de dispersão centrada no valor médio dos dados. Ela pode também
ser calculada por:
n n 2
σ (z i )=∑
2
i=1
( 1
z i −∑ z i
i=1 n
)
A variância é uma estatística que não produz um valor na mesma unidade do conjunto de dados.
Para uma análise da variabilidade de uma forma mais funcional, geralmente utiliza-se do desvio padrão,
que consiste na raiz quadrada da variância dos dados.
√∑ (
n n 2
σ ( z i )=±
i=1
z i−∑ zi
1
i =1 n
)
MEDIDAS DE POSIÇÃO
Dentre as medidas de posição que mais se destacam são os quartis e os percentis. Os quartis são
as medidas que dividem igualmente a distribuição de dados em uma frequência acumulada relativa de
25%. O primeiro quartil corresponde a 25% da frequência, o segundo quartil igual a 50%, o terceiro
corresponde a 100%.
(∑ ) { }
n n
Q1
i=1
z i = z i∨Prob (∑ )
i=1
z i =0,25
(∑ ) { (∑ ) }
n n
Q2 z i = z i∨Prob z i =0,50
i=1 i=1
( ){ (∑ ) }
n n
Q3 ∑ z i = z i∨Prob z i =0,75
i=1 i=1
( ){ (∑ ) }
n n
Q4 ∑ z i = z i∨Prob z i =1,00
i=1 i=1
Atenção deve ser dada para o modelo e o conjunto de dados quando ajustada uma reta de
regressão. Dizer que a alternância da variável independente gera uma realização da variável dependente
está errado, pois na verdade apenas estima-se o valor médio como resposta do modelo. O verdadeiro
valor para uma dada mudança na variável independente só ocorre no ponto amostrado. Um intervalo de
segurança para o modelo de regressão pode ser ajustado para o nível de confiabilidade a ser julgado
pelo modelador. O gráfico abaixo demonstra os limites determinados para a aceitação do modelo. Nota-
se que vários pontos são estatisticamente inaceitáveis para a contribuição do valor médio. Estes valores
devem ser analisados de forma que possam ou não ser incorporados no modelo.
Outro gráfico que também possui importância para a descrição da variável aleatória é o
chamado Q-Q plot. Este gráfico constitui na ordenação dos percentis em um eixo cartesiano,
demonstrando uma série de pontos que representam o comportamento da distribuição dos dados. Uma
relação diretamente proporcional indica que as distribuições de probabilidade das duas variáveis são
semelhantes. Variáveis que possuem boa correlação linear e histogramas semelhantes podem até
mesmo ser caracterizadas como um mesmo fenômeno, e utilizadas conjuntamente na avaliação de um
fenômeno espacial. No caso, por exemplo, de possuirmos análises de cobre de um mineral de calcocita e
um de cuprita, apesar de serem diferentes minérios, se apresentarem o mesmo comportamento e
distribuição dos dados e submetidos às mesmas condições técnicas podem ser tratados como apenas
um minério.
ESTATÍSTICA PONTUAL BIVARIADA
Cov ( X , Y )
ρ=
σ X σY
O coeficiente de correlação é uma medida que varia entre 0 quando não existe similaridade
entre as amostras e 1 quando existe completa similaridade entre as amostras. A correlação é, no
entanto, uma medida de dependência linear, e não deve ser utilizados para modelos cuja dependência
dos valores médios apresenta diferentes comportamentos.
Uma medida de similaridade do teor de um dado elemento neste depósito é maior na direção horizontal
que na vertical.
A geoestatística como uma ferramenta bipontual de análise, que associa modelos a vetores,
utiliza da correlação espacial para medir padrões de continuidade em uma direção. A ferramenta
estatística utilizada para isso é a covariância, mas não calculada entre espécies diferentes, mas da
mesma variável espaçada em um lag com direção e sentido. Outra medida de continuidade espacial
utilizada é o variograma, mas que, no entanto, não mede a similaridade entre variáveis, mas a
dissimilaridade entre elas. Ao retornar a diferença quadrática entre as variáveis espaçadas por um lag, o
variograma é ortogonal à covariância.
O modelamento da continuidade espacial pelo uso de covariâncias implica que o domínio possui
uma média constante e igual às médias locais, o que não ocorre pelo modelamento da continuidade com
o uso dos variogramas. No entanto, as duas funções são automaticamente convertidas em uma e em
outra pela diferença da variância dos dados, também chamada de variância à priori dos dados.
1
γ (h) = E ( Z i−Z i+h )2
2
C(h)=E ( Z i . Zi +h )−m
Assim podemos realizar uma figura esquemática do comportamento de uma função variograma.
A representação abaixo é uma demonstração da classe de variogramas permissivos, considerados
aqueles que estabilizam segundo um valor fixo da variância dos dados.
Muitas vezes a função variograma pode apresentar dispersão infinita do fenômeno. Fenômenos
tais como movimento Browniano permitem tipos de modelo não permissíveis. No entanto, para
fenômenos geológicos, fenômenos de dispersão infinita são fisicamente ainda indeterminados.
Quando realizamos o cálculo dos valores de variograma, de forma vetorial, somente é possível
caracterizar a dissimilaridade entre os dados se considerarmos uma malha regular. Na verdade, para fins
práticos, é necessário atribuir um relaxamento na captura dos dados para que possa ser caracterizado o
fenômeno, utilizando de um variograma experimental com diferenças em suas dimensões.
Uma figura representativa do variograma experimental está demonstrada abaixo. Ao estipular
valores de tolerância para o vetor considerado, o campo de procura já não é mais um segmento de reta,
mas um cone ou cilindro dependendo do tamanho do lag considerado.
A utilização de uma tolerância angular é importante, pois para regiões de maior proximidade,
diferenças pequenas de posição podem produzir variações angulares grandes. Ao estipular que nas
zonas de procura mais próximas os pontos são mais confidentes com a direção do variograma, o
comportamento do fenômeno é mais bem reproduzido.
MODELOS DE VARIOGRAMA
MODELO ESFÉRICO
O modelo esférico também é chamado de “ forma ideal” por Matherow é representado pela
equação abaixo:
γ ( h )=
{(
C
3 h 1 h3
−
2 a 2 a3 )tal que h ≤ a
MODELO EXPONENCIAL
O modelo exponencial tem um crescimento mais lento na proximidade da origem, mas possuí
uma assíntota no que se refere ao patamar. O modelo exponencial pode ser representado pela equação
abaixo:
(
γ ( h )=C 1−exp ( ha ))
Algum cuidado deve ser levado em consideração com os softwares de geoestatística quando
relacionado ao range do variograma exponencial. Em alguns casos considera-se que o valor do range é o
que alcança 95% do patamar, isto porque na verdade o modelo possui alcance infinto. A função
exponencial é assíntota e não alcança nunca a variância à priori dos dados.
MODELO GAUSSIANO
O modelo gaussiano é relacionado com a seguinte fórmula:
(
γ ( h )=C 1−exp ( ))
−h 2
a
2
O modelo gaussiano atribui uma continuidade muito maior para os dados mais próximos, o
que no processo de krigagem acentua o efeito de screening, permitindo que dados vizinhos recebam um
peso muito maior do que dados mais afastados na mesma direção, sendo que esses pesos possam ser
negativos.
EFEITO DE ANISOTROPIA
O modelo de variograma é respectivo a uma dada direção no espaço. No entanto, nada
garante, sem verificação, que o mesmo modelo de variograma representa todas as direções espaciais.
Quando um modelo de variograma é equivalente em todas as direções ele é chamado de
omnidirecional.
O modelo de anisotropia zonal deve ser tratado com cuidado. Se de alguma forma em direções
diferentes não se alcança a variabilidade dos dados, por algum motivo pode ser que domínios
estacionários diferentes possam estar sendo tratados como um mesmo domínio. Dessa forma para a
utilização de metodologias de krigagem é melhor segregar regiões de mesmo comportamento e modelá-
las diferentemente.
O objetivo da krigagem é encontrar os ponderadores das amostras que reduzem ao máximo o erro de
estimação do valor médio do bloco. Para isso se minimiza a variância do erro segundo as equações
abaixo:
n 2
(
σ ε =E Z u−∑ λ i Z i
2
i=1
)
n n n
2
(
σ ε =E Z u −2 Z u ∑ λi Z i + ∑ ∑ λ i λ j Z i Z j
2
n n n n
σ 2 ε =( E ( Z u2 ) −m 2)−2 ∑ λ i ( E ( Z i Z u )−m2 )+ ∑ ∑ λi λ j ( E ( Zi Z j )−m 2 ) ← m=const . , ∑ λ i=1
i=1 j =1 i=1 i=1
n n n n
σ 2 ε =Cov(Z u , Z u)−2 ∑ λi Cov ( Zu , Z i )+ ∑ ∑ λi λ j Cov ( Z i , Z j ) ← m=const . , ∑ λ i=1
i=1 j =1 i=1 i=1
A variância do erro é então encontrada pela minimização de cada ponderador, pela utilização de uma
derivada parcial para cada variável.
( ))
n n
δ σ2 ε
=
δ
δ λ1 δ λ 1 j=2
(
−2 λ1 Cov(Z u , Z 1)+ λ1 ∑ λ j Cov ( Z 1 , Z j ) + λ 1 ∑ λ i Cov ( Z i , Z 1) + λ1 λ1 Cov ( Z 1 , Z 1 )
i=2
n n
δ σ2 ε
δ λ1
=−2 Cov( Z u , Z 1)+ ( ∑ λ j Cov ( Z 1 , Z j ) +∑ λ i Cov ( Z i , Z 1) + 2. λ 1 Cov ( Z 1 , Z 1)
j=2 i=2
)
n n
δ σ2 ε
δ λ1
=−2 Cov(Z u , Z 1)+ ( ∑ λ j Cov ( Z 1 , Z j ) +∑ λ i Cov ( Z i , Z 1)
j=1 i=1
)
Como Cov ( Z1 , Z j )=Cov ( Z i , Z 1)
n
δ σ2 ε
δ λ1
=−2 Cov ( Z u , Z 1 ) +2 (∑
j=1
)
λ j Cov ( Z 1 , Z j ) =0
n
Cov ( Zu , Z 1 ) =
( ∑ λ j Cov ( Z 1 , Z j )
j=1
)
n n n
i=1
(
∑ Cov ( Z u , Z i )= ∑ ∑ λ j Cov ( Z n , Z j )
i=1 j=1
) ∀ i≤ n
O resultado gerado se transforma em um sistema de equações lineares em que a estimativa de cada ponto
é dada pelos ponderadores otimizados.
[ ] [ ][ ]
Cov ( Z u , Z 1 ) λ1 Cov ( Z1 , Z 1 ) … Cov ( Z 1 , Z n )
… =… … … …
Cov ( Z u , Z n ) λn Cov ( Z n , Z 1 ) … Cov ( Z n , Z n )
As matrizes obtidas no sistema de krigagem geram dois propósitos que são a essência do
método.
[ ] [ ][ ]
Cov ( Z u , Z 1 ) λ1 Cov ( Z1 , Z 1 ) … Cov ( Z 1 , Z n )
… = … … … …
Cov ( Z u , Z n )
D = Matriz de distâncias correlacionadas
λ n Cov ( Z n , Z 1 ) … Cov ( Z n , Z n )Matriz de declusterização
É formada uma matriz que correlaciona os pesos com a distância vetorial dos pontos, chamada
de matriz de distâncias e uma segunda matriz, chamada de declusterização, em que os pontos que se
encontram aglomerados ganham menores pesos com a proximidade entre si.
Para que a matriz de krigagem seja fiel ao processo de estimação espacial, é necessário
acrescentar a condição de que a soma dos pesos seja igual a 1. Essa é uma condição de não viés, tal que:
n
E ( Z¿ u )=E (∑ )
i=1
λi Z i
Z
λ i E (¿¿ i)
n
∑¿
i=1
E ( Z¿ u )=¿
n n
μ=
( i=1
)
∑ λ i μ ↔ ∑ λ i=1
i=1
n n n n
σ 2 ε =Cov(Z u , Z u)−2 ∑ λi Cov (Zu , Z i )+ ∑ ∑ λi λ j Cov ( Z i , Z j ) −μ
i=1 j =1 i=1
(∑ )
i=1
λi−1
Na verdade o processo de krigagem determina que a soma dos pesos deva totalizar uma
unidade, mas não coloca condições de que os valores dos ponderadores tenham que ser positivos. A
este efeito denomina-se screen effect, e ocorre por amostras que se encontram na mesma direção de
procura, mas com diferenças de distância.
Além disso, quanto mais amostras redundantes estiverem em uma mesma direção,
menor será o peso atribuído a elas.
Outra metodologia utilizada é a validação cruzada. O processo consiste em retirar uma amostra
do local e estimá-la a partir da krigagem. Se os valores corresponderem adequadamente, então a
validação é pelo menos uma boa indicação de que o modelo variográfico e as premissas utilizadas se
adéquam ao modelo.
É de se esperar que as diferenças entre os valores retroavaliados seja a mínima possível, e sem
um viés sistemático, demonstrando um erro com média próxima de zero e variância pequena.
METODOLOGIA
Nevada, EUA
3 http://www.nbmg.unr.edu/GeneralGeology/docs/GeologyOfNevadaArticle.pdf
Nevada. O processo genético do depósito foi influenciado por mudanças abruptas na profundidade do
fundo do lago, volume e mudança da composição química e variações de fluxo de entrada e saída do
lago. A superfície do lago apresenta em torno de 15,000 hectares, com um volume de aproximadamente
3.5 bilhões dee metros cúbicos e uma profundidade máxima de 33m. A diferença característica das
dimensões planares em contrapartida da profundidade do lago demonstram que o tratamento dos
dados estatísticos pode ser realizado em uma análise bidimensional. O depósito tem características de
21 vezes a alcalinidade da água do mar apresentando uma concentração extensiva de íons sódio,
potássio, magnésio e cálcio. Quanto a classificação estratigráfica do depósito podemos ordená-lo como:
4 http://www.walkerlakenv.org/articles%201.htm
Relatos demonstram que o depósito de Walker Lake foi sondados pela USGS e esperado
econtrar uma quantidade de sedimentos grande de sedimentos, mas apenas poucos foram encontrados,
demonstrando períodos de seca descorrelacionados com o clima local. No começo dos anos de 1870,
uma quantidade pequena de prata e ouro foi retirada de veios de granito associados ao depósito. A mina
mais importante foi Big Indian Mine. Em 1920 foi encontrado ouro em Cat Crrek associado a zonas de
falha onde foram disseminadas piritas e calcopiritas.
Os dados apresentados no exercício correspondem ao depósito de Walker Lake que possui como
recurso metálico, minerais associados ao ouro e ao cobre. Foram realizadas 470 amostragens que se
encontra clusterizadas nas regiões que de maior conteúdo metálico, resultando em uma malha irregular.
A foto abaixo demonstra um mapa bidimensional da área com a disposição geométrica da retirada dos
testemunhos.
Figure 11 -Mapa Cobre Figure 12 - Mapa Ouro
Realizou-se o histograma acumulado dos valores extremos para as duas variáveis consideradas:
Por análise gráfica dos percentis podemos verificar que os valores extremos das duas variáveis
são:
Verifica-se por uma visualização dos mapas que os teores de maior valor se encontram no flanco
oeste em direção aproximadamente norte- sul. Parece haver correspondência entre os valores de ouro e
de cobre. São encontradas amostras com conteúdo metálico de ouro igual a zero e, portanto, as
amostras nestes locais devem ser certificadas quanto o valor mensurado, pois os padrões de similaridade
espacial indicam correspondência dos elementos sob um mesmo controle geológico.
A estatística univariada utilizada neste momento não possui sentido físico, mas apenas
comparativo, pois a distribuição de amostras está clusterizada, o que não permite uma atribuição de
pesos correta pelo domínio espacial.
Estatística univariada do Cobre Estatística univariada do Ouro
Média 4.352987 Média 0.604081
Erro padrão 0.138325 Erro padrão 0.046276
Mediana 4.24 Mediana 0.3193
Moda 0 Moda 0
Desvio padrão 2.998823 Desvio padrão 0.767406
Variância da Variância da
amostra 8.992939 amostra 0.588911
Curtose -0.11765 Curtose 7.101364
Assimetria 0.46064 Assimetria 2.29561
Intervalo 15.281 Intervalo 5.1901
Mínimo 0 Mínimo 0
Máximo 15.281 Máximo 5.1901
Soma 2045.904 Soma 166.1223
Contagem 470 Contagem 275
A distribuição de dados de cobre apresenta assimetria positiva, o que não parece ser
uma realidade de corpos metalogenéticos de baixo conteúdo metálico. Atribui-se essa inconformidade
aos dados alocados com viés espacial, e por isso é necessário utilizar de técnicas de declusterização para
certificar dos parâmetros dos dados.
σ ( Au) 0.767
CV = = =1.270=127,03
m( Au) 0.604
Apesar do valor residual médio pequeno apresentado pelo ouro, a variação grande
apresentada pelo elemento torna-o mais errático que o cobre. Ao verificarmos em mapa a distribuição
das variáveis, a impressão deixada pela variação pequena esquematizada pela forma gráfica na verdade
não condiz com a ordem de grandeza das unidades tomadas.
O valor das estatísticas retornadas pelo conjunto de interações está demonstrado abaixo. As células que
retornaram o menor valor de média foram as que geraram a dimensão de 14.5 x 14.5
ESTATÍSTICA DECLUSTERIZADA COBRE
MÉDIA CÉLULAS MÓVEIS 2.96731
VARIÂNCIA 6.62678
MÍNIMO 0
MÁXIMO 15.281
SOMA 2045.9
ASSIMETRIA 0.955917
CURTOSIS 0.868289
Quanto ao melhor processo de descluterização para o caso do cobre o valor retornado para o
coeficiente de variação dos polígonos de Thyssen foi 0.867 em contrapartida do coeficiente de variação
pelas células móveis de 0.891. Opta-se, portanto, utilizar a estatística determinada pela área de
influência.
ESTATÍSTICA BIVARIADA DOS DADOS
Para a análise bivariada dos dados de ouro e cobre, as amostras que não apresentavam valores
conjuntamente foram excluídas, logo os procedimentos somente tem influência na região dos corpos
mineralizados. O gráfico de Q-Q plot apresenta um comportamento dos dados bilinear, o que mostra que
os histogramas dos elementos metálicos são diferentes, o que sugere controles de formação geológica
diferenciados.
Quanto à relação entre as variáveis notamos que a regressão linear é pobre para o conjunto de
dados contidos no corpo mineral. Valores outliers fora do nível de aceitação de 90% das amostras indica
haver formas diferenciadas de controle geológico em regiões diferenciadas. O coeficiente de
determinação é de 0.27.
Para a análise subsequente dos dados, os valores que se encontraram no limite superior do nível
de aceitação foram separados no banco de dados dividindo em dois domínios de correlação entre as
variáveis. Pelo mapa esquemático abaixo parece haver uma região no interior do corpo geológico do
flanco oeste em que as variações de teor de cobre e ouro variam diferentemente do restante do corpo.
Em algumas partes dos corpos menores do flanco leste também parece haver uma discordância entre a
correlação das variáveis. Questiona-se o fato de que poderia haver uma estrutura geológica que
controlasse a formação do corpo na direção norte – sul e propõe-se analisar um mapa estrutural para a
certificação dos resultados.
O valor de regressão para os dados da região de maior correspondência dos valores está
modelada abaixo:
Optou-se pelo modelamento da continuidade espacial pelo uso da função variograma. Os dados
de entrada para o cálculo do variograma experimental do cobre estão demonstrados abaixo. A busca foi
preferenciada nas direções de aparente maior e menor continuidade, principalmente a N-S e L-O. O
espaçamento dos lags foi observado no mapa como aproximadamente aquele com maior frequência das
distâncias entre as amostras.
As direções de maior e menor continuidade espacial foram determinadas no modelo, tal que o
valor do maior range encontrado foi de 67m, enquanto o de menor continuidade foi 30m na direção
perpendicular à de 167.5o. A continuidade espacial parece ter demonstrado uma similaridade com o
controle geológico da falha demonstrada
Foi realizada a krigagem ordinária do cobre optando por uma estratégia de busca que
correspondesse às direções de máxima e mínima continuidade dos dados. A melhor forma de se evitar
ponderadores negativos foi utilizando uma divisão por octantes e reduzindo os eixos de procura o
suficiente para incorporar apenas dados dentro do domínio de influência da continuidade espacial.
VARIÁVEIS VALORES
MÍNIMO DE DADOS 1
MÁXIMO DE DADOS 10
OCTANTES
MÍN OCT. VAZIOS 3
MÍN DE DADOS POR OCTANTE 1
MÁX DE DADOS POR OCTANTE 1
RANGE MÁXIMO 60
RANGE MÍNIMO 20
ROTAÇÃO EM Z 160
O valor do suporte utilizado para a avaliação foi de 10x10. O mapa gerado pela krigagem
está demonstrado abaixo juntamente com o mapa de valores de soma dos ponderadores:
Foi realizada a validação cruzada dos dados obtendo uma média de 0.043 do erro.