Você está na página 1de 21

UNIVERSIDADE FEDERAL DO RIO GRANDE DO SUL ESCOLA DE ENGENHARIA - PPGEM

Roberto Quadros Menin

MMD00073 - Introduo Geoestatstica

Porto Alegre, 2012

Roberto Quadros Menin

MMD00073 - Introduo Geoestatstica Relatrio apresentado como requisito para obteno de aprovao na disciplina Introduo Geoestatstica no Programa de Ps Graduao em Engenharia de Minas, Metalrgica e de Materiais, na Universidade Federal do Rio Grande do Sul. Prof. PhD. Joo Felipe Coimbra Leite Costa

Porto Alegre, 2012

RESUMO

O objetivo deste relatrio apresentar a distribuio estimada dos teores da Varivel 5 para toda a rea em estudo, bem como seus respectivos dados estatsticos, utilizando a tcnica de krigagem ordinria, com o auxlio dos softwares SGeMS e GsLib.

Palavras chave: Relatrio. Estimada. Estatsticos. Krigagem. Software.

SUMRIO

1 2 2.1 2.2 2.3

INTRODUO.............................................................................................. 4 OBJETIVO GERAL...................................................................................... 5 Objetivos especficos........................................................................................ 5 METODOLOGIA.......................................................................................... 6 RESULTADOS.............................................................................................. 7

2.3.1 HISTOGRAMA................................................................................................7 2.3.2 MAPA DE LOCALIZAO..........................................................................8 2.3.3 DESAGRUPAMENTO AMOSTRAL............................................................9 2.3.4 ANLISE BIVARIADA................................................................................10 2.3.5 VARIOGRAMA..............................................................................................11 2.3.6 KRIGAGEM....................................................................................................14 2.3.7 ANLISE DE DERIVA.................................................................................17 3 CONCLUSES E RECOMENDAES...........................................................19 REFERNCIAS........................................................................................................20

1 INTRODUO

A denominao para Geoestatstica dar-se ao grupo de tcnicas estatsticas utilizadas na anlise e estimativa de valores, gerados a partir da colheita de dados em campanhas de sondagem. Segundo Isaaks&Srivastava (1989, p.3) Geoestatstica oferece uma forma de descrever a continuidade espacial que uma caracterstica essencial de muitos fenmenos naturais e proporciona adaptaes de tcnicas clssicas de regresso para tirar proveito desta continuidade. A geoestatstica nos mostra que os dados, obtidos atravs da amostragem, no so independentes, existe uma continuidade espacial/temporal do fenmeno. Atravs disso, desta continuidade podemos gerar estimativas de valores para locais no amostrados com uma grande confiabilidade, podendo, assim, transformar, o conhecimento fsico de um fenmeno em uma quantificao do mesmo. A quantificao de um depsito mineral no determinada de forma exata, pois envolve determinadas incertezas relacionadas geologia e ao mtodo empregado. A geoestatstica com base em princpios tericos bem fundamentados permite a obteno de um modelo de depsito considerando suas particularidades, levando-se em conta a anisotropia da mineralizao do depsito e o desagrupamento de valores amostrais prximos.

2 OBJETIVO GERAL

Atravs do banco de dados fornecido, temos como objetivo geral apresentar um estudo geoestatstico aplicado. Tendo como meta principal os seguintes quesitos: Anlise estatstica preliminar; Anlise da continuidade espacial; Previses; Simulaes.

2.1 OBJETIVO ESPECFICO O presente trabalho tem como objetivo especfico ilustrar a geoestatstica aplicada a amostra de nmero 5, apresentar a distruibuio estimadas de seus teores e posteriormente utilizaremos a amostra nmero 3 do banco de dados fornecido, para verificar a existncia ou no de uma relao entre as amostras. O Dataset utilizado contm 1000 pontos de amostragem, realizados em uma rea de 1990m X 1990m, totalizando 3,96 Km. Para melhor visualizao, utilizamos como parmetros de X e Y mnimos 0 e 2000.

Figura 1. Mapa de localizao das amostras

2.2 METODOLOGIA

Para desenvolver a anlise geoestatistica dos dados utilizaremos um pacote de programas, criado junto universidade americana de Stanford. O GSLIB (Geoestatistical Software Library) foi criado sob a direo do Prof. Andr G. Journel. Para realizao da rotina de trabalhos, cada programa deve ser executado e editado separadamente, atravs de um arquivo de parmetros prprio, de acordo com as caractersticas do depsito. A exemplo disso ilustramos a figura do arquivo de parmetros para execuo do programa Locmap que visa criar um mapa de localizao das amostras como demonstrado acima nos objetivos especficos:

Figura 2: Arquivo de parmetros do programa locmap.

Os demais programas utilizados so listados abaixo. Sucintamente descreveremos suas funes, de forma que qualquer pessoa possa aplicar a sua necessidade. locmap Mapa de localizao dos dados em duas dimenses; histplt Criao de histogramas e histogramas acumulados; declus Desagrupamento de Clulas; scatplt Diagrama de disperso (scatterplot); kt3d Krigagem em 3-D; pixelplt mapa de pixel em 2-D; Para o modelamento da continuidade espacial dos dados, ou seja, a variografia, utilizado o software SGeMS (Stanford Geostatistical Earth Modeling Software). Com ele podemos estipular se existe uma continuidade, atravs da medida em oito direes utilizando um intervalo de 22,5 entre direes e tolerncia angular de 22,5, com intuito de obter a equao de continuidade espacial da nossa varivel. Atravs do software SGeMS tambm

podemos desenvolver praticamente as mesmas rotinas e resultados geoestatsticos como os obtidos atravs das ferramentas provenientes do pacote GSLIB como Histogramas, Scatterplot, realizar krigagem, declusterizao entre outros.

2.3 RESULTADOS

2.3.1 HISTOGRAMA (histplt)

Atravs da utilizao da rotina estatstica histplt do pacote de programas do Gslib, foi gerado o histograma aplicado, que nada mais do que a representao grfica de uma distribuio de frequncias, demonstrado em um grfico do tipo barras vertical. O histograma nos fornece a mdia, a mediana, o coeficiente de variao, os quartis entre outros parmetros.

Figura 3 Histograma da Varivel 5.

A partir do histograma gerado, verificamos que as amostras caracterizam uma assimetria positiva, ou seja, o coeficiente de assimetria (skewness) maior que zero. Devemos ter cuidado ao analisar um histograma, pois os dados obtidos como a mdia, desvios, e assimetria so altamente influenciadas por valores extremos da amostra. Neste caso, com um coeficiente de variao de valor 1,23, podemos dizer que poder haver alguma dificuldade para estimativas locais devido a valores amostrais extremos.

2.3.2 MAPA DE LOCALIZAO (locmap)

Temos como procedimento de anlise estatstica, a partir dos dados recebidos, gerar um mapa de localizao das amostras com intuito de verificar e observar sua distribuio espacial e de teores com os dados de mdia e coeficiente de variao. Para podermos identificar se os dados possuem alguma amostragem preferencial fazemos um detalhamento da distribuio das amostras em um plano XY da varivel de interesse nmero 5 juntamente com a imagem do parmetro utilizado apenas para representar o seu uso, de acordo com as figuras abaixo.

Figura 4 - Parmetros utilizados no LOCMAP para amostra 5.

Figura 5 - Mapa de Localizao da Amostra 5.

Como podemos verificar com este mapa de localizao, a amostra 5 no possui nenhum agrupamento preferencial significativo.

2.3.3 DESAGRUPAMENTO AMOSTRAL (declus)

Quando calculamos as variveis estatsticas, atravs do histograma, no levado em considerao que possa existir um agrupamento preferencial em zonas de alto ou baixo teor, ou seja, as estatsticas podem ser facilmente tendencionadas por valores extremos, j que considerado que todas as amostras esto distribudas uniformemente no espao. A fim de verificar se existe ou no algum valor extremo que possa estar alterando o resultado final dos dados como a mdia, desvio ou coeficiente de assimetria, de corrigir este efeito que o agrupamento amostral causa utilizou-se a ferramenta declus do software Gslib90. Atravs da utilizao do declus podemos proporcionar menos peso para quem estiver mais prximo e mais peso para que estiver mais afastado de uma determinada amostra. Com esta rotina os valores extremos no tero tanta influencia direta, causando a reduo do erro associado a ele.

Figura 6 Histograma Desagrupado Varivel 5.

Podemos verificar atravs da obteno do histograma desagrupado que as medidas estatsticas no variaram aps a declusterizao, logo, percebemos que no h um

agrupamento preferencial de amostras, que no existe agrupamento de valores extremos que possam tornar tendenciosa nossa anlise.

2.3.4 ANLISE BIVARIADA

A seguir iremos apresentar dados referentes anlise bivariada de amostras, onde correlacionaremos amostra de interesse nmero 5, com a amostra nmero 3. Este mtodo nos permite a determinao da correlao entre as duas variveis, sendo muito til quando o banco de dados possui uma varivel que no foi amostrada em todos os pontos onde outra varivel foi, logo para o caso de haver uma correlao entre as duas, podemos inferir uma tendncia da varivel que falta atravs das medidas j existentes da outra varivel. Para tanto, utilizaremos a ferramenta Scatter-plot, do software SGeMS demonstrado abaixo:

Figura 7 Grfico de disperso (scatter-plot) dos teores 5 e 3.

O CV o parmetro estatstico com maior frequncia de utilizao para sumarizar a


1 n i 1 ( xi mx )( yi my ) relao entre as variveis. Sendo ele calculado pela frmula: n .

x y

Assim como a mdia, a v arincia entre outros parmetros estatsticos, o coeficiente de

variao, tambm chamado por coeficiente de correlao de Pearson, sensvel a pontos plotados afastados do aglomerado principal dos pontos. Uma boa relao entre as variveis pode ajudar a inferir uma varivel em um ponto desconhecido, desde que a outra varivel seja conhecida. Pois atravs da regresso linear, uma previso simples dos dados, assumimos que uma varivel est dependente da outra, podendo ser descrita pela equao da reta: y ax b . Como podemos observar atravs do grfico de disperso nosso valor de a, ou do coeficiente angular, de -0,3669 e o coeficiente linear, ou b, de 63,66. O grfico de disperso dos teores das variveis Cinco e Trs nos mostra que o coeficiente de correlao entre as duas variveis negativo de -0,9814. De acordo com Isaaks&Srivastava (1989, p.30)

Duas variveis so negativamente correlacionadas se os valores maiores de uma varivel tendem a ser associados com os valores menores do outra. Em banco de dados geolgicos, as concentraes de dois elementos principais so muitas vezes negativamente correlacionadas; num calcrio, por exemplo, um aumento na quantidade de clcio geralmente resulta em uma diminuio na quantidade de magnsio.

2.3.5 VARIOGRAMA (SGeMS)

O nosso prximo passo, essencial no estudo geoestatstico, a definio de um modelo variogrfico que represente a variabilidade do fenmeno que estamos interessados. A variografia um procedimento utilizado para medir a continuidade espacial do banco de dados. Utilizaremos os variogramas produzidos atravs do software SGeMs. O intuito realizar nossas estimativas atravs de uma elipse de busca que possui como azimute a nossa direo de maior alcance, e consequentemente a 90 a direo de menor alcance. Requisitamos uma busca em 8 direes diferentes de azimutes que variaram entre 0 e 157,5. A idia base ajustar o variograma a uma curva que honre a maior parte possvel dos pontos no grfico. A seguir mostraremos o variograma obtido atravs do omni direcional, o qual utilizamos para definir o nosso nugget effect, ou efeito pepita. Podemos dizer que quanto maior o nosso efeito pepita, maior ser a perda da continuidade espacial, ou seja, no h um controle dos processos fsicos e qumicos sobre o depsito. Devemos utilizar o menor nugget effect possvel, pois quanto mais ele influenciar no nosso variograma, mais futuramente a nossa krigagem converter para uma mdia aritmtica.

Figura 8 Variograma Omni Direcional da varivel 5.

Para a construo do variograma omni direcional para determinao do efeito pepita utilizamos o 20 lags com espaamento de 50, totalizando 1000 metros, ou metade da malha, a fim de evitarmos o efeito de borda. Verificamos ento que a maior continuidade estava por volta de 500 metros. Aplicamos um refinamento utilizando oito lags com espaamento de 60 metros, largura de banda de 1000metros e tolerncia 180 para indicar o omni direcional. Com isso o melhor nugget effect que adequou-se ao variograma foi de 280.

Em seguida procedemos com a construo dos variogramas em oito direes. Utilizamos o mesmo nmero de 20 lags com espaamento de 50m e tolerncia igual a metade do valor do lag, 25m. A largura de banda utilizada foi de 25 metros e tolerncia de 35. Para modelarmos adequadamente a curva foram utilizadas duas estruturas que foram ajustadas por curvas esfricas. A soma do nugget effect com a contribuio do Sill nas duas estruturas deve ser igual a varincia, ou seja o valor onde o semivariograma se estabiliza. O range (alcance) da estrutura 2 deve ser sempre superior que o da 1.

Figura 9 Variograma de maior continuidade espacial (45).

Figura 10 Variograma de menor continuidade espacial (135).

Percebemos, aps construo dos variogramas, que a direo de maior continuidade foi no azimute 45, e o de menor continuidade foi em 135, aps isso efetuamos um refinamento dos parmetros utilizados. Utilizamos 12 lags com espaamento de 60 metros, tolerncia do lag com valor igual a metade do valor do lag (30 metros), largura de banda 30 e sua tolerncia em 35, com intuito de determinar com maior preciso as contribuies e ranges que sero futuramente utilizados na krigagem. Listamos na tabela abaixo, os parmetros obtidos atravs dos variogramas das direes principais.

Medida dos variogramas das direes principais


Efeito Pepita 280

Estrutura 1
Contribuio do Sill Alcance Mximo Alcance Mdio 235 80 80

Estrutura 2
Contribuio do Sill Alcance Mximo Alcance Mdio 160 570 350

2.3.6 KRIGAGEM

O objetivo da krigagem de estimar os teores nas regies onde no se tem amostragem a partir do conhecimento prvio da continuidade espacial do fenmeno. Diferentemente dos interpoladores clssicos, que atribuem pesos a um n de grid conforme a distncia geomtrica deste n a amostra, a krigagem atribui os pesos conforme a distncia estatstica dos ns do grid a amostra, ou seja, recebem maiores pesos os ns nas direes de menor variabilidade do fenmeno em questo, onde os teores que sero utilizados para estimar o teor de um bloco esto inseridos no elipside de busca citado anteriormente. O mtodo utilizado foi de Krigagem ordinria (Ordinary Kriging), pois a krigagem simples necessita da mdia do depsito, mas o depsito em questo no possui mdia constante.

Atravs dos parmetros gerados pelo variograma das direes principais, foi feito a estimativa. Abaixo apresentamos o mapa de distribuio dos teores estimados e da varincia, atravs da rotina pixelplt e visualizado no GSview.

Figura 11 Mapa de distribuio dos teores estimados por OK Varivel 5

Figura 12 Mapa da varincia por OK Varivel 5.

Para evidenciar as zonas de maior variabilidade plotamos mapas de distribuio da varincia. Para tal utilizamos a rotina pixelplot do GSLib com o banco de dados do arquivo de sada da krigagem. Podemos observar que o mapa de distribuio apresenta teores muito semelhantes ao mapa de localizao das amostras gerados pela rotina locmap, com isso podemos dizer que as estimativas condizem com os valores verdadeiros. O mtodo da krigagem tem a caracterstica de suavizar as distribuies dos dados, diminuindo assim a sua varincia. Para anlise estatstica dos dados estimados pela krigagem construmos um novo histograma, apresentado abaixo:

Figura 13 Histograma dos dados estimados, varivel 5.

Como podemos verificar, atravs dos dados gerados com o histograma estimado, 25999 dados foram estimados e representados, significando que um valor foi descartado por estimativa inexistente. A figura acima, histograma dos dados estimados, pode ser considerado uma validao da estimativa, sendo assim esperado que a mdia dos dados estimados esteja prxima dos reais. A mdia dos dados reais de 21.05 enquanto a mdia dos estimados de 21,168. Outra observao muito importante que agora a mediana esta mais prxima da mdia, mas ainda menor, pois existem mais dados com valores baixos do que altos, servindo tambm como validao pois a estimativa permanece com distribuio parecida em relao a proporo dos valores.

2.3.7 ANLISE DE DERIVA

A anlise de deriva realizada comparando as mdias locais entre os dados verdadeiros e os dados estimados. Estas mdias so feitas entre faixas de espaamento, aqui utilizamos um espaamento de duzentos metros, assim na determinao da mdia no modelo de blocos em cada faixa espaamento utilizamos 2560 blocos (10% do total) Para tal foi utilizado o software Microsoft Excel e os bancos de dados das variveis originais e estimadas com a adio das coordenadas cartesianas a este ltimo feita pela rotina do GSLib, addcord. O que se espera como validao dos dados estimados que as curvas aqui plotadas possuam a mesma tendncia, ou seja, em zonas de teor mais elevado as mdias aumentem, e em zonas de baixo elas diminuam. O que consideramos o comportamento da curva. Para fins de comparao apresentaremos abaixo, lado a lado, o mapa de localizao de amostras e o mapa da distribuio dos teores estimados pela krigagem.

Figura 14 Mapa de localizao e Mapa de distribuio de teores estimados por krigagem.

Podemos perceber que a distribuio dos teores estimados seguiu a tendncia dos teores amostrados, ou seja, os pontos azuis no mapa de localizao das amostras foram representados por regies em azul no mapa de distribuio dos teores. Reparamos tambm que os pontos com altos teores existentes no mapa de localizao das amostras foram suavizados no mapa de estimativa, caracterstico da krigagem.

Em seguida apresentaremos os grficos obtidos para a anlise de deriva.

Figura 15 Grfico da Anlise de deriva em X, varivel 5.

Figura 16 Grfico da Anlise de deriva em Y, varivel 5.

Atravs dos grficos de anlise de deriva apresentados, tanto dados quanto estimativas seguem uma mesma tendncia. No eixo X notamos que por volta de 1200 metros os teores foram superestimados, enquanto em torno dos 1500 metros foram subestimados. J no eixo Y percebemos uma suavizao da curva de estimativa em relao a curva de dados, em torno dos 700 metros os teores foram superestimados, por sua vez nos 1250 metros foram subestimados.

3 CONCLUSO

Aps a anlise dos dados verificamos que no h como classificar os blocos diferentemente de medido, devido a alta densidade e continuidade amostral, pois temos um variograma muito contnuo. Conclumos tambm ao decorrer do trabalho que para uma varivel que possui um comportamento menos errtico, as estimativas mostram-se mais fceis do que quando trabalhamos com uma varivel mais errtica. Apesar de o histograma apresentar um cv de 1,23 que talvez indicasse que teramos certas dificuldades para estimativas locas por causa dos valores extremos, os valores acabaram sendo suavizados pela krigagem ordinria. Ainda assim mantiveram seu padro, confirmado posteriormente pela anlise de deriva nos eixos X e Y.

REFERNCIAS

Deutsch, C. e Journel, A., GSLIB Geostatistical Software Library and User's Guide (1998) New York Oxford University Press; ISAAKS, E. H.; SRIVASTAVA, R. M., An introduction to Applied Geostatistics. 1989, OXFORD UNIVERSITY. SOUZA, L. E, Introduo ao GSLib. 2002, Texto didtico