Você está na página 1de 23

Sumrio

Introduo, 9
Breve histrico da Geoestatstica, 9 Objetivos, 12 Organizao do livro, 12

1 Conceitos Bsicos, 19
1.1 Fenmeno espacial, 19 1.2 Amostra e mtodos de amostragem, 20 1.3 Inferncia espacial, 21 1.4 Variveis aleatria e regionalizada, 24 1.5 Desagrupamento, 26

2 Clculo e Modelagem de Variogramas Experimentais, 33


2.1 Estatsticas espaciais, 33 2.2 Clculo de variogramas experimentais, 36 2.3 Tipos de variogramas, 41 2.4 Anisotropias, 43 2.5 Comportamento do variograma prximo origem, 47 2.6 Consideraes nais, 52

3 Estimativas Geoestatsticas, 55
3.1 Transformao de dados, 56 3.2 Estimativas geoestatsticas, 62 3.3 Krigagem no linear, 83 3.4 Interpolao de variveis categricas, 106 3.5 Consideraes nais, 117

4 Coestimativas Geoestatsticas, 121


4.1 Cokrigagem, 123 4.2 Krigagem com deriva externa, 135 4.3 Consideraes nais, 141

5 Simulao Estocstica, 145


5.1 Erro de suavizao, 147 5.2 Mtodos de simulao estocstica, 147 5.3 Mtodos sequenciais de simulao, 148 5.4 Consideraes sobre os mtodos de simulao estocstica, 173

Anexo A Fundamentos Matemticos e Estatsticos, 175


A.1 Mtodos grcos de apresentao de dados, 175 A.2 Estatstica descritiva, 177 A.3 Estatstica bivariada, 179 A.4 Distribuies tericas de probabilidades, 182 A.5 Derivadas, 184 A.6 Integral, 184 A.7 Matrizes, 185 A.8 Sistemas de equaes lineares, 188 A.9 Software, 192

Anexo B Arquivos de Dados, 195 Sobre os autores, 216

Geoestatstica: conceitos e aplicaes

do corpo de minrio; avaliao e mapeamento de incertezas; parametrizao das reservas minerais em curvas teor/tonelagem, bem como varincia global do depsito mineral. Como fontes introdutrias so recomendados os livros de Clark (1979), Rendu (1981), Armstrong (1998), Brooker (1991), Clark e Harper (2000), Andriotti (2003), Landim (2003), Druck et al. (2004) e Olea (2009). Devem ser citados tambm diversos textos que tratam de aplicaes da Geoestatstica, como Journel e Huijbregts (1978), Valente (1982), Guerra (1988), Isaaks e Srivastava (1989), Deutsch e Journel (1992), Cressie (1993), Samper-Calvete e Carrera-Ramrez (1996), Goovaerts (1997), Hohn (1999), Olea (1999), Yamamoto (2001a), Soares (2006), Webster e Oliver (2007) e Oliver (2010). Um extenso estudo bibliomtrico sobre textos, tanto em livros como em artigos, relativos Geoestatstica apresentado por Hengl, Minasny e Gould (2009). Nesse trabalho, como referncia origem geogrca dos autores, a Amrica do Sul, so destaques as regies de So Paulo/Brasil e Santiago/Chile (Hengl; Minasny; Gould, 2009, p. 508).

O BJETIVOS
O principal objetivo deste livro, baseado na experincia dos dois autores, mostrar de maneira clara, simples e objetiva a metodologia geoestatstica em suas diversas aplicaes. Dedica-se principalmente anlise de dados geolgicos controlados pela sua distribuio espacial, mas pode perfeitamente ser utilizada em outras reas que disponham tambm de dados georreferenciados. A teoria geoestatstica foi baseada na literatura corrente, que foi referenciada com a maior preciso possvel, indicando autor, ano e pgina.

O RGANIZAO

DO LIVRO

Geoestatstica: conceitos e aplicaes est organizado em cinco captulos. Evidentemente, o texto no tem a pretenso de cobrir todas as tcnicas e campos de aplicao da Geoestatstica, mas introduzir conceitos e tcnicas fundamentais atualmente em uso. O Cap. 1 aborda conceitos bsicos envolvendo amostra e populao (fenmeno espacial), mtodos de amostragem, o problema da inferncia espacial (Fig. 2) e a natureza das variveis aleatrias contnuas e discretas. importante ressaltar que o estudo geoestatstico tem incio com a coleta de uma amostra, que ser usada para inferir as caractersticas da populao ou do fenmeno espacial de interesse da pesquisa. A amostragem deve ser feita em disposio regular ou o mais prximo disso, mas podem ocorrer amostragens preferenciais em zonas de maior interesse que acabam produzindo agrupamentos de pontos. Esses agrupamentos devem ter seus efeitos atenuados para no distorcer as estatsticas globais, tais como o histograma e o variograma. Assim, so apresentadas duas tcnicas de desagrupamento de amostras (polgonos e clulas). Atualmente, os conceitos da Geoestatstica podem ser aplicados tanto a variveis contnuas como a discretas. Nesse sentido, abre-se uma gama de aplicaes envolvendo

12

Geoestatstica: conceitos e aplicaes

40

?
20

20

40

Amostragem

40

40

40

20

20

20

0 0
3,13712

0 20
16,09888

0 0 20
14,39134

40

40

0
25,82543 4,14811

20
15,40782

40
26,66753

29,06064 2,95726

Estimativa espacial

40

40

40

20

20

20

20
16,09888

40

0 0 20
14,94972

0 40

20
15,40782

40
26,66753

3,13712

29,06064 2,95726

26,94217 4,14811

Inferncia espacial

Fig. 2 Esquema mostrando o processo de inferncia do fenmeno espacial com base na amostragem (seo 1.3) variveis discretas, pois elas so frequentemente observadas nos pontos de amostragem em que so feitas medidas de variveis contnuas. O Cap. 2 voltado ao clculo e modelagem de variogramas experimentais, e introduz os conceitos de estacionaridade, hiptese intrnseca, clculo de variogramas expe-

Introduo

13

rimentais, modelos tericos de variogramas, anisotropias e graus de continuidade na origem. Uma sntese do procedimento de clculo e modelagem de variogramas experimentais pode ser vista na Fig. 3. O variograma depende fundamentalmente da direo e da distncia, as quais permitem calcular o variograma experimental e vericar a hiptese intrnseca (Fig. 3C,D). O Cap. 3 apresenta tcnicas geoestatsticas de estimativa e interpolao para variveis aleatrias contnuas e discretas (Fig. 4). Os mtodos geoestatsticos de estimativa foram divididos em krigagem linear e no linear. As tcnicas da krigagem simples, da mdia e ordinria foram includas como tcnicas lineares, pois fazem uso da varivel contnua na escala original de medida. Mtodos que fazem uso da transformao no linear de dados foram classicados como krigagem no linear: krigagem multigaussiana, krigagem lognormal e krigagem indicadora. Alm disso, este captulo apresenta uma seo especial
A
Y 50

B
40 Gama(h) 10 8 6 Direo e distncia 20 4

30

E
2

10 Comportamento prximo origem 0 0 10 20 30 40 50 X Z(x+h) Z(x+h)

0 0 5 10 15 20 25 h

Modelo terico Alta continuidade

Z(x)

Z(x)

H
8,07 Variograma 6,46 4,84 3,23 1,61 0,00 0 5 10 15 20 25 Distncia

Fig. 3 Sntese do procedimento de clculo e modelagem de variogramas experimentais: A) mapa de pontos; B) variogramas experimentais

calculados para as direes de 45 (vermelho) e 135 (azul); C) vetores usados no clculo do variograma experimental para a direo de 45; D) vetores usados no clculo do variograma experimental para a direo de 135; E) destaque para o comportamento prximo origem, com alta continuidade; F) interpretao geomtrica de Journel (1989) para a direo de 135; G) interpretao geomtrica de Journel (1989) para a direo de 45; H) modelos tericos ajustados aos variogramas experimentais (seo 2.6)

14

Geoestatstica: conceitos e aplicaes

Variveis regionalizadas

Contnuas

Discretas

% 20
15 10 5 0

%
80 60 40 20 0

% 30
25 20 15 10 5

0,08

6,25

12,42

18,58

24,75

30,92 45,20

47,36

49,52

51,68

53,84

56,00

0,03

7,98

15,93

23,88

31,83

39,79

Tipos

Zgauss

Znegativo

Zlog

Dados originais

Transformao dos dados

Codificao binria

Gaussiana

Logartmica

Indicadora

Krigagem ordinria

Krigagem multigaussiana

Krigagem lognormal

Krigagem indicadora

Equaes multiqudricas

Fig. 4 Esquema ilustrando o processo de estimativa geoestatstica ou interpolao de variveis regionalizadas

(seo 3.1)
sobre interpolao de variveis categricas baseada em equaes multiqudricas, pois o clculo de variogramas experimentais depende fortemente dos tipos e sua distribuio no espao amostral. O Cap. 4 trata das coestimativas geoestatsticas, como a cokrigagem ordinria, cokrigagem colocalizada e krigagem com deriva externa. Essas tcnicas utilizam diferentes conguraes de pontos de amostragem, que devem ser consideradas para fazer o melhor uso da informao disponvel. A krigagem com deriva externa deveria ser abordada no Cap. 3, porm tratada no Cap. 4 por compartilhar das mesmas amostras para o seu teste. Quando trataram da krigagem com deriva externa, no Cap. 4, os autores se depararam com diculdades na obteno do variograma residual. Desse modo, com base no clculo do variograma da mdia com os dados de deriva externa, uma nova aproximao foi proposta para o clculo do variograma residual. A sntese dos procedimentos de coestimativas geoestatsticas encontra-se na Fig. 5. O Cap. 5 aborda a simulao estocstica, notadamente os mtodos sequenciais, entre os quais so consideradas a simulao gaussiana sequencial, com opo tanto pela krigagem simples como pela ordinria, e a simulao indicadora sequencial, para variveis contnuas

Introduo

15

A
Y: Norte Y: Norte
50

B
Y: Norte
0 10 20 30 40 50 X: Leste 50 50

40

40

40

30

30

30

20

20

20

10

10

10

10

20

30

40 50 X: Leste

10

20

30

40 50 X: Leste

VP
Cokrigagem ordinria

D
Cokrigagem colocalizada Krigagem com deriva externa

Variogramas diretos e cruzados

VS1

Variograma direto Primria ou secundria

Variograma residual

E
Variograma
25 20 15 10 5 0 0 5 10 15 20 25 Distncia

F
25 20 15 10 5 0 0 5 10 15 20 25 Distncia

G
Variograma residual
0,5 0,4 0,3 0,2 0,1 0,0 0 5 10 15 20 25 Distncia

Covariograma

30

30

H
Y: Norte Y: Norte
50 50

I
Y: Norte
0 10 20 30 40 50 X: Leste 50

40

40

40

30

30

30

20

20

20

10

10

10

10

20

30

40 50 X: Leste

10

20

30

40 50 X: Leste

Fig. 5 Sntese dos mtodos de coestimativas geoestatsticas: A) mapa de localizao de pontos com heterotopia parcial; B) mapa de localizao

de pontos com isotopia; C) mapa de localizao de pontos da varivel secundria sobre os ns de uma malha regular; D) correlao entre a varivel primria e a varivel secundria; E) modelos de variogramas diretos (vermelho = varivel primria; verde = varivel secundria) e cruzado (vermelho); F) covariograma da varivel primria (vermelho) e covariograma cruzado calculado por modelo de Markov 1 (azul); G) variograma residual; H) resultado da cokrigagem ordinria; I) resultado da cokrigagem colocalizada; J) resultado da krigagem com deriva externa (seo 4.3)
e discretas (Fig. 6). A opo pela krigagem ordinria para a simulao gaussiana sequencial foi includa, pois a interpretao dos pesos da krigagem ordinria como probabilidades condicionais permite a determinao da funo de distribuio acumulada condicional,

16

Geoestatstica: conceitos e aplicaes

Y: Norte

Y: Norte

Y: Norte

40 30 20 10 0 0

12 20 9 16 1
10

2 5 11 4 10
20

13 15 18 6 24
30

17 14 21 8 7

22 23 19 25 3

40 30 20 10 0

7 12 23 20 9
0 10

17 10 21 1 15
20

18 6 13 16 5
30

4 2 25 22 3

24 19 14 8 11

40 30 20 10 0

24 14 11 4 23
0 10

3 18 13 5 16
20

21 12 17 15 8
30

20 22 25 6 10

1 2 7 9 19

Y: Norte

50

50

50

50 40 30 20 10 0

10 6 19 14 12
0 10

15 5 1 11 21
20

25 23 8 13 18
30

4 22 24 17 2

20 3 9 16 7

40 50 X: Leste

40 50 X: Leste

40 50 X: Leste

40 50 X: Leste

Definio dos caminhos aleatrios para as realizaes

Simulao gaussiana sequencial

Simulao indicadora sequencial

Krigagem simples

Krigagem ordinria

Varivel contnua

Varivel categrica

A
Variograma Variograma
1,29 1,03 0,77 0,52 0,26 0,00 0 5 10 15 20 25 Distncia 1,29 1,03 0,77 0,52 0,26 0,00

B
Variograma
0,30 0,25 0,20 0,15 0,10 0,05 0,00

C
Multiqudrica
0 5 10 15 20 25 Distncia 10 8 6 4 2 0

10

15

20 25 Distncia

20

40

60

E
FDAC FDAC
1,0 0,8 0,6 0,4 0,2 0,0 -2,5 -1,8 -1,1 -0,3 0,4 1,1 Escores normais 1,0 0,8 0,6 0,4 0,2

F
FDAC
1,0 0,8 0,6 0,4 0,2

80 100 Distncia

H
FDAC
-1,4 -0,8 -0,1 0,5 Y(x) 1,0 0,8 0,6 0,4 0,2 0,0 I II III IV V Tipos var. categrica

0,0 -2,0 -1,5 -1,0 -0,5 0,0 0,5 Y(x)

0,0 -2,0

I
Y: Norte Y: Norte
50 40 30 20 10 0 50 40 30 20 10 0

J
Y: Norte
50 40 30 20 10 0

L
50 40 30 20 10 0

10

20

30

40 50 X: Leste

10

20

30

40 50 X: Leste

10

20

30

40 50 X: Leste

Y: Norte

20

40

60

80 100 X: Leste

Fig. 6 Sntese dos mtodos sequenciais de simulao estocstica. Denio dos caminhos aleatrios para as realizaes (topo); variograma

da varivel transformada para escores normais (A e B); variograma indicadora da mediana (C); ncleo multiqudrico com constante nula (D); funes de distribuio acumulada condicional (E, F, G e H); resultado da simulao gaussiana sequencial opo por krigagem simples (I); opo por krigagem ordinria (J); resultado da simulao indicadora sequencial varivel contnua (K) e varivel categrica (L) (seo 5.4)

que pode ser amostrada por Monte Carlo. No caso de variveis discretas, as realizaes da simulao indicadora sequencial podem ser ps-processadas para determinao da imagem mais provvel, assim como da zona de incerteza mapeada por meio da varincia da proporo mais provvel.

Introduo

17

Conceitos Bsicos

O estudo geoestatstico tem como ponto de partida um conjunto de observaes que constituem uma amostra. As observaes, de natureza quantitativa ou qualitativa, so usadas para inferir as propriedades do fenmeno espacial em estudo. Na realidade, o fenmeno espacial desconhecido representa a populao da qual uma amostra foi extrada. Nesse sentido, este captulo tem a nalidade de introduzir os conceitos bsicos empregados no estudo geoestatstico.

1.1 F ENMENO

ESPACIAL

A Geoestatstica tem por objetivo a caracterizao espacial de uma varivel de interesse por meio do estudo de sua distribuio e variabilidade espaciais, com determinao das incertezas associadas. O fenmeno espacial o conjunto de todos os valores possveis da varivel de interesse, que dene a distribuio e variabilidade espaciais dessa varivel dentro de um dado domnio em 2D ou 3D. Representa, portanto, em termos estatsticos, a populao que o conjunto de todos os valores do qual uma amostra pode ser extrada. Para ns de ilustrao de um fenmeno espacial, considerar uma varivel de interesse que apresente a distribuio e variabilidade espaciais conforme apresentado na Fig. 1.1. Dentro do domnio de 50 por 50 conhece-se o valor da varivel em qualquer ponto. preciso lembrar, po0
0,07663 15,50000

50

30,92337

40

30

20

10

rm, que, na prtica, nada ou pouco se sabe sobre o fenmeno espacial a ser estudado. Assim, a Fig. 1.1 tem a nalidade didtica de mostrar como se apresenta um fenmeno espacial em toda a sua extenso, conhecido como domnio de denio.

10

20

30

40

50

Fig. 1.1 Distribuio e variabilidade espaciais de uma varivel de

interesse caracterizando um fenmeno espacial em 2D (Arquivo completo 1, disponvel em: <http://lig.igc.usp.br/geoestatistica/anexob/ download/Bell.txt>)

Quando se decide estudar um fenmeno espacial do qual se tem pouco conhecimento sobre a varivel de interesse, necessria uma amostragem, pois impossvel analisar todo o conjunto de valores.

1.2 A MOSTRA

E MTODOS DE AMOSTRAGEM

A amostra um subconjunto de valores do fenmeno espacial que, se representativa, deve reproduzir a distribuio e variabilidade espaciais tanto em tamanho, isto , nmero de pontos de dados, como em termos de distribuio dos pontos no domnio a ser estudado. Qualquer estimativa baseada em pontos amostrais est, porm, sujeita a uma incerteza, e, nesse sentido, a metodologia geoestatstica se destaca ao oferecer a incerteza associada estimativa. A amostragem feita com base em um planejamento, que deve denir a coleta das unidades de amostragem de forma aleatria simples, aleatria estraticada ou sistemtica.

1.2.1 Amostragem aleatria simples


Em Estatstica, quando se fala em amostragem aleatria, a populao constituda por N unidades numerada sequencialmente e, assim, n unidades sero sorteadas sem reposio. A componente aleatria , portanto, o nmero sequencial escolhido entre 1 e N. Nos estudos geoestatsticos, as observaes so feitas em pontos de amostragem localizados dentro da regio de estudo e, dessa maneira, a componente aleatria so as coordenadas geogrcas a serem escolhidas casualmente. A Fig. 1.2 apresenta um mapa com cem pontos esco50
29,06064

lhidos aleatoriamente da populao original (Fig. 1.1).

40

1.2.2 Amostragem aleatria estraticada


A amostragem aleatria estraticada feita em estratos. Isso signica subdividir a regio em estudo em clulas
16,09888

30

de dimenses xas nas direes leste-oeste e norte-sul. Dentro de cada clula, as coordenadas geogrcas de um ponto so escolhidas aleatoriamente e o ponto se-

20

10

lecionado. Assim, ao nal desse processo, o nmero de unidades selecionadas ser igual ao nmero de clulas.

0 0 10 20 30 40 50

3,13712

Para o exemplo da Fig. 1.1, a regio de estudo foi subdividida em cem clulas de dimenses 5 5 e, dentro de cada clula, foi escolhido um ponto, resultando no mapa de localizao da Fig. 1.3.

Fig. 1.2 Mapa de localizao dos cem pontos de amostragem esco-

lhidos aleatoriamente (Arquivo 1, Anexo B)

1.2.3 Amostragem sistemtica


A amostragem sistemtica feita sobre os ns de uma malha regular denida com base em uma origem escolhida aleatoriamente. Teoricamente, a componente aleatria seria dada

20

Geoestatstica: conceitos e aplicaes

pela escolha do ponto de origem, mas isso no o que ocorre na prtica, pois a malha regular denida inicialmente pelo responsvel pela amostragem para otimizar a coleta das unidades dentro da regio de estudo. A amostragem sistemtica em uma malha regular de 10 10 para o fenmeno espacial mostrado na Fig. 1.1 resulta no mapa de localizao de pontos mostrado na Fig. 1.4.

50

25,82543

50

26,66753

40

40

30
14,39134

30
15,40782

20

20

10

10

0 0 10 20 30 40 50

2,95726

0 0 10 20 30 40 50

4,14811

Fig. 1.3 Mapa de localizao dos cem pontos da amostragem alea-

Fig. 1.4 Mapa de localizao dos cem pontos da amostragem siste-

tria estraticada (Arquivo 2, Anexo B)

mtica (Arquivo 3, Anexo B)

1.2.4 Consideraes sobre os mtodos de amostragem


Comparando-se os trs mtodos, verica-se que a amostragem aleatria simples a que oferece o pior resultado, haja vista reas com pontos agrupados e reas no amostradas; a amostragem aleatria estraticada melhor que a anterior, mas ainda tem problemas na distribuio espacial dos pontos de amostragem; a amostragem sistemtica , sem dvida, a que oferece o melhor resultado. Entretanto, nem sempre ela possvel, pois depende de uma srie de fatores, tais como: acesso, acidentes geogrcos (rios, lagos, topograa), vegetao etc. Muitas vezes, a amostragem feita ao longo de estradas, picadas e, portanto, resulta em uma distribuio semirregular. Independentemente, porm, do mtodo de amostragem, a Geoestatstica tem por objetivo extrair o mximo da informao disponvel na amostra coletada.

1.3 I NFERNCIA

ESPACIAL

O processo de reproduo das caractersticas do fenmeno espacial baseado em pontos amostrais denominado interpolao ou estimativa. A interpolao ou estimativa de um ponto no amostrado feita por meio do ajuste de funes matemticas locais (pontos mais prximos ao ponto no amostrado) ou globais (todos os pontos amostrais).

Conceitos Bsicos

21

Clculo e Modelagem de Variogramas Experimentais

Como denir e prever o comportamento espacial de uma varivel regionalizada {Z ( ), = 1, n} coletada em n pontos distribudos em uma determinada regio? Pretende-se responder a essa questo neste e no prximo captulo por meio da metodologia geoestatstica, com exemplos ilustrando aplicaes. Para entender a variao espacial do processo aleatrio subjacente, deve-se levar em considerao a possibilidade de que o valor de cada ponto no espao est relacionado, de algum modo, com valores obtidos de pontos situados a certa distncia, sendo razovel supor que a inuncia tanto maior quanto menor for a distncia entre os pontos, conforme interpretao de Soares (2006, p. 18). Isso signica que a inferncia da continuidade espacial de uma varivel regionalizada pode ser feita com valores amostrais tendo como base a estatstica de dois pontos. Aplicando-se as denies da funo covarincia e funo variograma, verica-se que elas dependem apenas de dois pontos 1 e 2 , situados a uma distncia h = 1 2 , ento cada par de pontos considerado uma realizao diferente, o que torna possvel a inferncia estatstica dessas funes (Journel; Huijbregts, 1978, p. 32). Para determinao do modelo de correlao espacial da varivel regionalizada, calcula-se experimentalmente essa correlao usando os pontos amostrais e, em seguida, ajusta-se um modelo terico. Esse modelo terico permite determinar o valor da correlao espacial para qualquer distncia dentro do espao amostrado. Neste captulo ser apresentado como se calcula o modelo de correlao espacial, que a ferramenta bsica da Geoestatstica para estimativas e simulaes estocsticas.

2.1 E STATSTICAS

ESPACIAIS

Segundo Soares (2006, p. 18), o conjunto de variveis aleatrias {Z ( ) , = 1,n} correlacionadas entre si constitui uma funo aleatria cuja amostragem fornece uma realizao z ( ). Por isso, de acordo com ele, com uma nica realizao torna-se impossvel determinar as estatsticas no ponto dessa funo, tais como mdia e varincia. Para ele, a soluo consiste em assumir diversos graus de estacionaridade da funo aleatria, como, por exemplo, admitindo que as variveis aleatrias tenham a mesma mdia: E [Z ( 1 )] = E [Z ( 2 )] = = E [Z ( n )] = E [Z ( )] = m

Desse modo, a mdia m passa a ser independente da localizao e obtida como mdia aritmtica das realizaes das variveis aleatrias (Soares, 2006, p. 18): m = E [Z ( )] = 1 n
n

Z ( )
=1

Julgar, porm, que essa hiptese esteja correta signica supor que a mdia das amostras seja representativa da rea estudada, isto , que os valores so homogneos (Soares, 2006, p. 18). A homogeneidade espacial raramente ocorre, sendo necessria a vericao da distribuio e variabilidade espaciais da funo aleatria, como ser visto neste captulo. A varincia associada mdia calculada como:
A
N225 N-S N45

Vr [Z ( )] = E [Z ( ) m]2 A hiptese de estacionaridade de 2 ordem, alm de denir que a esperana matemtica, E [Z ( )], existe e no depende do suporte , dene tambm que a correlao entre duas variveis aleatrias depende somente da distncia espacial,
E-W

h, que as separa e independente da sua localizao (Journel; Huijbregts, 1978, p. 32). Em Estatstica, a covarincia uma medida da relao mtua entre duas variveis aleatrias distintas, por exemplo, X e Y . Em Geoestatstica, a covarincia mede a relao entre valores da mesma varivel, obtidos em pontos separados por uma distncia h, conforme uma determinada direo. Isso signica que, ao alterar a direo, a covarincia tambm pode

N30

N120

se alterar e, nesse caso, h indicao de presena de fenmeno espacial anisotrpico (Fig. 2.1B). Existem casos em que a covarincia a mesma em qualquer direo e, por isso, o fenmeno espacial isotrpico (Fig. 2.1A). Assim, para detectar se o fenmeno espacial apresenta anisotropia ou no, a covarincia calculada para vrias direes. Geralmente, quando o fenmeno em estudo est distribudo em 2D, calculam-se as covarincias em quatro direes horizontais: 0, 45, 90 e 135.

Fig. 2.1 Esquema ilustrando fenmenos espaciais: A) isotr-

Para fenmenos espaciais 3D, alm das direes horizontais, calculam-se as covarincias para a direo vertical ou

pico e B) anisotrpico

inclinada, conforme a estrutura geolgica do corpo em profundidade. A covarincia de uma varivel regionalizada para pontos separados por uma distncia h pode ser calculada como: C (h) = E {[Z ( + h) m] [Z ( ) m]} em que h representa um vetor entre dois pontos 1 e 2 no espao tridimensional. fcil vericar que a covarincia para distncia nula (h = 0) igual varincia da varivel regionalizada Z ( ).

34

Geoestatstica: conceitos e aplicaes

Estimativas Geoestatsticas

Todo o processo de inferncia espacial tem incio com a coleta de uma amostra composta por n pontos de dados. esperado que essa amostra seja representativa do fenmeno em estudo, em termos da distribuio e variabilidade espaciais. Krigagem um processo geoestatstico de estimativa de valores de variveis distribudas no espao e/ou tempo, com base em valores adjacentes quando considerados interdependentes pela anlise variogrca. Pode ser comparado com os mtodos tradicionais de estimativa por mdias ponderadas ou por mdias mveis, mas a diferena fundamental que somente a krigagem apresenta estimativas no tendenciosas e a mnima varincia associada ao valor estimado. O termo traduo do francs krigeage e do ingls kriging foi cunhado pela Escola Francesa de Geoestatstica em homenagem a Daniel G. Krige, engenheiro de minas sul-africano e pioneiro na aplicao de tcnicas estatsticas em avaliao mineira. Abrange uma famlia de algoritmos conhecidos, entre outros, como krigagem simples, krigagem da mdia, krigagem ordinria e krigagem universal. O estimador mais usual a krigagem ordinria, cuja traduo, do francs krigeage ordinaire, deveria ser krigagem normal (Soares, 2006, p. 69). A traduo para krigagem ordinria, porm, est consagrada no Brasil e, assim, ser a usada nesta obra. Estimativas geoestatsticas so, em geral, superiores aos demais mtodos de interpolao numrica, pois fazem uso da funo variograma, que no simplesmente uma funo da distncia entre pontos, mas depende da existncia ou no do efeito pepita, da amplitude e da presena de anisotropia. Na impossibilidade de obteno de um modelo de correlao espacial, mtodos de interpolao no estoNo Variograma? Sim Krigagem Anlise variogrfica Amostra

csticos, que no necessitam do variograma, podem ser considerados (Fig. 3.1). A estimativa geoestatstica tem por objetivo a modelagem do fenmeno espacial em estudo, ou seja, determinar a distribuio e variabilidade espaciais da varivel de interesse.

Interpolao

Fig. 3.1 Interpolao ou krigagem, dependendo da obteno de

variograma

Os valores obtidos nos pontos amostrais so usados na interpolao ou estimativa geoestatstica para fornecer uma grade regular 2D ou 3D, dependendo da dimensionalidade do fenmeno espacial. A modelagem da distribuio e variabilidade espaciais
50 102,99165

da varivel de interesse feita geralmente em malhas regulares, que permitem analisar a inferncia espacial com maior preciso. Em Geoestatstica, trabalha-se com funes locais, pois ela , por excelncia, um mtodo local de estimativa.

40

30 83,00352 20

Nesse sentido, pontos distantes situados alm do alcance do variograma no deveriam ser considerados, mas a krigagem tem um mecanismo interno de atenuao da inuncia desses pontos e, portanto, podem ser deixados como pertencentes vizinhana. As Figs. 3.2 e 3.3 ilustram exemplos em 2D e 3D, respectivamente, para a estimativa geoestatstica de um ponto no amostrado, com base nos pontos vizinhos prximos.
N

10

10

20

30

40

50

63,01539

Fig. 3.2 Localizao de vizinhos mais prximos (dois pontos por

quadrante) para estimativa do ponto no amostrado

E 10,40000

5,32000

483,

38 03 445, 68 4 0 6, 3 6 8, 33 9 329, 8 33 193,

3 0 8, 02 270, 8 6 , 231

38

98 154, 63 63 291, 116,

0,24000

Fig. 3.3 Localizao de pontos vizinhos prximos para interpolao do ponto no amostrado (dados 3D)

3.1 T RANSFORMAO

DE DADOS

As variveis regionalizadas podem ser contnuas ou discretas (Fig. 3.4). As variveis contnuas podem apresentar comportamentos distintos revelados pela forma do histograma. Se a distribuio tiver assimetria positiva, h necessidade de transformao dos dados para evitar a inuncia dos poucos valores altos na estimativa de pontos da vizinhana, caracterizada por baixos valores. Transformaes de dados so, em diversas circunstncias, necessrias para a estimativa geoestatstica e, aqui, sero analisadas as principais, como a gaussiana, a logartmica e a indicadora, conhecida tambm como indicativa e indicatriz.

56

Geoestatstica: conceitos e aplicaes

Variveis regionalizadas

Contnuas

Discretas

% 20
15 10 5 0

%
80 60 40 20 0

% 30
25 20 15 10 5

0,08

6,25

12,42

18,58

24,75

30,92 45,20

47,36

49,52

51,68

53,84

56,00

0,03

7,98

15,93

23,88

31,83

39,79

Tipos

Zgauss

Znegativo

Zlog

Dados originais

Transformao dos dados

Codificao binria

Gaussiana

Logartmica

Indicadora

Krigagem ordinria

Krigagem multigaussiana

Krigagem lognormal

Krigagem indicadora

Equaes multiqudricas

Fig. 3.4 Esquema ilustrando o processo de estimativa geoestatstica ou interpolao de variveis regionalizadas

As estimativas geoestatsticas para os dados transformados so obtidas por meio das krigagens multigaussiana, lognormal e indicadora. Para dados com distribuio normal ou que apresentem assimetria negativa, no h necessidade de transformao dos dados, e a krigagem ordinria aplicada diretamente sobre os dados originais. Para as variveis regionalizadas discretas, h necessidade de se fazer a codicao binria, e cada tipo que compe a varivel discreta interpolado usando as equaes multiqudricas, conforme proposta de Yamamoto et al. (2012). No usada a krigagem indicadora, por causa da necessidade de um variograma para cada tipo da varivel discreta. Mesmo que seja possvel, quando houver grande quantidade de informao os variogramas no sero iguais entre si, em termos de efeito pepita, patamar e amplitude. Por isso, cada tipo sendo estimado por um variograma diferente resultar em valores cuja soma no ser, necessariamente, igual a 1, condio essencial quando se estima probabilidades. Dessa forma, a soluo a obteno de um variograma nico, tal como se faz no processo da krigagem da varivel indicadora da mediana. Mas isso impossvel no caso de variveis discretas, pois elas esto decompostas em k tipos.

Estimativas Geoestatsticas

57

Coestimativas Geoestatsticas

No estudo de um fenmeno espacial, diversas variveis podem ser amostradas simultaneamente nas mesmas localizaes ou por mtodos distintos de pesquisa em diferentes pontos. Algumas dessas variveis podem estar subamostradas e outras, superamostradas. Contudo, se essas variveis subamostradas e superamostradas apresentarem alguma correlao, ento as variveis superamostradas podem ser utilizadas para fazer uma melhor estimativa das variveis subamostradas (Isaacks; Srivastava, 1989, p. 400). Denomina-se corregionalizao a existncia de duas ou mais variveis regionalizadas medidas sobre um mesmo campo aleatrio (Olea, 1999, p. 209). Geralmente, o padro de amostragem da varivel mais bem amostrada mais regular que o da varivel subamostrada (Olea, 1999, p. 401). Para essas situaes, a Geoestatstica proporciona um conjunto de ferramentas para coestimativas. Neste captulo, sero vistos os mtodos conhecidos genericamente como cokrigagem, a cokrigagem ordinria e a cokrigagem colocalizada, bem como um tipo especial de krigagem denominado krigagem com deriva externa. So denominadas variveis primrias aquelas de interesse na pesquisa, mas subamostradas, e variveis secundrias aquelas que podem ser usadas para melhorar a estimativa das variveis primrias. Segundo Wackernagel (1995, p. 144), as variveis primria e secundria podem ser medidas nos mesmos pontos ou em pontos diferentes, congurando trs situaes (Fig. 4.1): isotopia: as variveis primria e secundria foram medidas nos mesmos pontos de amostragem; heterotopia total: as variveis primria e secundria foram medidas em diferentes localizaes; heterotopia parcial: as variveis primria e secundria compartilham alguns pontos comuns. Para ns de ilustrao das tcnicas geoestatsticas de coestimativas, deve-se ter conjuntos de dados contendo variveis primria e secundria que sejam correlacionadas entre si. O ponto de partida, nesse caso, foi o Arquivo completo 1 (disponvel em: <http://lig.igc.usp.br/geoestatistica/anexob/download/Bell.txt>; Fig. 1.1), cuja informao foi considerada como varivel primria. Com base nesse arquivo, foi obtida uma amostra com 289 pontos, a qual foi usada para deteriorar a informao original de forma controlada e, assim, gerar a varivel secundria apresentando correlao com a primria. Nesse processo, duas variveis secundrias com alta e mdia correlao foram geradas.

A 50 50 Y Y

B 50 Y 10 20 30 40 50 X

40

40

40

30

30

30

20

20

20

10

10

10

10

20

30

40

50 X

10

20

30

40

50 X

Fig. 4.1 Amostragens possveis para as variveis primria e secundria: A) isotopia; B) heterotopia parcial; C) heterotopia total. Crculo =

varivel primria; sinal de mais = varivel secundria


A varivel com alta correlao foi obtida graas ao ajuste de equaes multiqudricas (Hardy, 1971, p. 1.907-1.908) usando uma constante elevada (C2 = 100) que deteriora a preciso da interpolao. A outra varivel secundria, com mdia correlao, foi sintetizada por meio do ajuste de uma superfcie de tendncia de grau 5 aos pontos da amostra. A varivel primria e as duas variveis secundrias geradas formam conjuntos completos (Fig. 4.2) compostos por 2.500 pontos distribudos em uma malha regular de 50 por 50, os quais constituem os dados sintticos deste captulo (Arquivo completo 2, disponvel em: <http://lig.igc.usp.br/geoestatistica/anexob/download/bellTrend289.txt>).
A 0,07663 50 15,50000 B 30,92337 1,44682 50 17,77124 C 34,09566 3,40956 50 40 15,98290 28,55625

40

40 30 20 10

30

30 20 10

20

10

10

20

30

40

50

10

20

30

40

50

10

20

30

40

50

Fig. 4.2 Base de dados completa: A) varivel primria (VP); B) varivel secundria com alta correlao (VS1 ); C) varivel secundria com

mdia correlao (VS2 ) (Arquivo completo 2, disponvel em: <http://lig.igc.usp.br/geoestatistica/anexob/download/bellTrend289.txt>)

A Fig. 4.3 mostra as correlaes entre a varivel primria e as variveis secundrias com alta ( = 0,916) e mdia correlao ( = 0,724). A varivel secundria com alta correlao foi denominada VS1 e a com mdia correlao, VS2 .

122

Geoestatstica: conceitos e aplicaes

A 30,92 VP Coef. correlao = 0,916

B 30,92 VP Coef. correlao = 0,724

24,75

24,75

18,58

18,58

12,42

12,42

6,25

6,25

0,08 1,45

7,98

14,51

21,04

27,57

34,10 VS1

0,08 3,41

8,44

13,47

18,50

23,53

28,56 VS2

Fig. 4.3 Diagramas de disperso mostrando a correlao entre as variveis primria e secundria: A) alta correlao

(VS1 ) e B) mdia correlao (VS2 )


Desses conjuntos completos possvel extrair amostras aleatrias estraticadas. Entretanto, como cada tcnica requer uma congurao dos pontos da varivel secundria, essas amostras sero extradas quando forem necessrias para ilustrar o procedimento.

4.1 C OKRIGAGEM
A cokrigagem um procedimento geoestatstico pelo qual se pode estimar diversas variveis regionalizadas em conjunto com base na correlao espacial entre si. , portanto, uma extenso multivariada do mtodo da krigagem quando, para cada local amostrado, obtm-se um vetor de valores em lugar de um nico valor. A cokrigagem um procedimento verdadeiramente multivariado de estimativa porque o modelo trata com dois ou mais atributos dentro do mesmo campo aleatrio (Olea, 1999, p. 209). Uma de suas mais frequentes aplicaes ocorre quando a amostragem de uma varivel primria insuciente e o objetivo melhorar a sua estimativa, o que feito utilizando-se a correlao da varivel primria com variveis secundrias mais densamente amostradas. Ela tambm utilizada quando a varivel primria exibe uma baixa autocorrelao espacial e as variveis secundrias apresentam uma alta continuidade. Normalmente, o estudo feito considerando uma varivel primria e apenas uma secundria. Para n variveis primrias e secundrias, sero necessrios n(n + 1)/ 2 variogramas e covariogramas cruzados. No caso de mais de duas variveis secundrias, o sistema de cokrigagem torna-se extremamente instvel em termos numricos. Fundamental na utilizao da cokrigagem a vericao prvia da correlao existente entre a varivel primria e as variveis secundrias, a qual deve ser alta para que as estimativas sejam consistentes (Watanabe et al., 2009). Quando os pontos de amostragem so totalmente coincidentes (isotopia), no se obtm uma melhoria substancial na aplicao da cokrigagem em relao krigagem ordinria. Por

Coestimativas Geoestatsticas

123

Simulao Estocstica

A krigagem proporciona a estimativa Z ( o ) em um ponto no amostrado o com base na informao dos n pontos vizinhos. Essa estimativa feita minimizando-se a varincia do erro de estimativa, como visto no Cap. 3. Na realidade, porm, a minimizao da varincia do erro envolve a suavizao das disperses reais (Journel; Huijbregts, 1978, p. 493). Essa suavizao ocorre mesmo que as estimativas sejam condicionais aos pontos amostrais, ou seja:
( o ) = Z ( o ) ZKO

Entretanto, esse condicionamento no garante que as estimativas resultantes (por exemplo, calculadas sobre os ns de uma malha regular) no estejam suavizadas. Na verdade, todos os algoritmos de interpolao tendem a suavizar a variabilidade espacial do atributo (Goovaerts, 1997, p. 370). A suavizao se caracteriza pela subestimativa de valores altos e superestimativa de valores baixos (Goovaerts, 1997, p. 370). Alm disso, segundo esse autor, a suavizao no uniforme, pois zero nos pontos amostrais e vai aumentando medida que se distancia dos pontos de dados. A suavizao pode ser facilmente vericada comparando-se o histograma amostral com o histograma das estimativas por krigagem ordinria. Por exemplo: para a amostra com os dados da distribuio lognormal (Arquivo 12, Anexo B) (Fig. 5.1), verica-se uma discreta
A 50 % 40 30 30 20 20 10 10 0 0,10 0 0,17 40 % 1,83 3,57 5,31 7,04 8,78 Zlog B

1,60

3,03

4,46

5,88

7,31

Teor mdio do bloco

Fig. 5.1 A) Histograma amostral da distribuio lognormal e B) histograma das estimativas por krigagem ordinria

sobre os ns de uma malha regular

99,99 Diagrama P-P % Acumulada 99,95 99,90 99,50 99,00

suavizao, a qual mostra que os valores baixos e altos no foram reproduzidos, ou seja, a perda das caudas inferior e superior da distribuio. Alm disso, pode-se representar as curvas acumulativas em escala de logprobabilidade aritmtica, as quais devem mostrar quo diferentes so essas distribuies (Fig. 5.2). Nessa gura, verica-se que a distribuio das estimativas est suavizada, ou seja, com menor varincia, por causa da inclinao da curva. O diagrama P-P (probabilidade-probabilidade) no canto superior esquerdo da gura conrma que essas duas distribuies so diferentes. O efeito de suavizao das estimativas, alm disso, pode ser vericado comparando-se o variograma experimental com o variograma das estimativas (Fig. 5.3). Como pode ser observado nessa gura, o variograma das estimativas apresenta uma continuidade muito maior que o variograma amostral e um pa0,10 1,0 10 (Zlog)+(Teor mdio do bloco)

95,00 90,00 80,00 70,00 60,00 50,00 40,00 30,00 20,00 10,00 5,00

1,00 0,50 0,10 0,05 0,01 0,01

tamar bem menor, reetindo a perda da varincia. A consequncia que o efeito de suavizao da krigagem no reproduz adequadamente as caractersticas da amostra usada para fazer as estimativas em pontos no amostrados. Assim, o processo de

Fig. 5.2 Comparao das curvas acumulativas da distribuio amostral

(cruz vermelha) com a distribuio das estimativas por krigagem ordinria (crculo verde)

inferncia do fenmeno espacial em estudo no pode ser realizado com exatido, porque no permite concluir corretamente sobre a distribuio e variabilidade espaciais da varivel de interesse. De acordo com Olea (1999, p. 141), a simulao estocstica foi a soluo adotada pela Geoestatstica para resolver o problema da suavizao da krigagem. Entretanto, segundo ele, a simulao no a soluo perfeita: ganha-se em
Variograma 4,59

preciso global em detrimento da preciso local. Na realidade, as realizaes no esto isentas de erros na reproduo da realidade e, em mdia, os erros da simulao estocstica so maiores que os da krigagem (Olea, 1999, p. 141). A simulao estocstica tambm foi a soluo adotada pelos geoestatsticos para modelar a incerteza associada estimativa (Deutsch, 2011, p. 5-1), uma vez que a varincia de krigagem foi reconhecida apenas
0 5 10 15 20 25 Distncia

3,67

2,75

1,84

0,92

0,00

como um ndice de congurao espacial dos pontos vizinhos prximos (Journel; Rossi, 1989, p. 783). Na verdade, o conjunto de realizaes {Z ( ), = 1,L} proporciona uma medida visual e quantitativa da incerteza espacial (Goovaerts, 1997, p. 372).

Fig. 5.3 Variograma experimental (asteriscos) e variograma das esti-

mativas (crculos). O modelo de correlao espacial est representado por linha contnua (Arquivo 12, Anexo B)

146

Geoestatstica: conceitos e aplicaes

Anexo

F UNDAMENTOS M ATEMTICOS

E STATSTICOS

A utilizao de tcnicas geoestatsticas requer o conhecimento de alguns fundamentos matemticos e estatsticos que so imprescindveis para o melhor entendimento dos conceitos empregados nessa metodologia. A seguir sero expostos, de maneira resumida, alguns desses conceitos. Para mais detalhes, podem ser consultados Waltham (2000), Davis (2002; Caps. 2 e 3) e Borradaire (2003), entre outros.

A.1 M TODOS

GRFICOS DE APRESENTAO DE DADOS

Como visto no Cap. 1, as variveis podem ser consideradas como categricas/discretas e contnuas, ambas apresentando distribuies de valores e usadas para uma anlise exploratria dos dados. A anlise estatstica tem por objetivo resumir a informao disponvel. Nesse sentido, os grcos mais usuais para a apresentao de dados so o histograma, a curva de distribuio acumulada e a distribuio espacial de pontos. Para ilustrar os conceitos estatsticos, o arquivo fornecido por Goovaerts (1997, p. 4-6) ser considerado. Na realidade, os dois arquivos, denominados prediction e validation, foram aglutinados em um nico arquivo, doravante chamado juradata.txt. O histograma um grco de barras, que so proporcionais s frequncias de classes. O intervalo de valores entre o mnimo e o mximo dividido em um nmero de classes, as quais acumulam as contagens dos valores encontrados no arquivo de dados. Para o exemplo dos dados do arquivo juradata.txt contendo diversas variveis contnuas e discretas, foi feita a representao da varivel cobalto em histograma (Fig. A.1).
0 1,55 5,36 9,17 12,98 16,79 20,60 Co 10 20 15 30 % 25 5

Fig. A.1 Histograma da distribuio de frequncias da varivel co-

balto Fonte: Goovaerts (1997, p. 4-6).

Anexo

B
35.50 36.50 36.50 36.50 36.50 37.50 37.50 37.50 38.50 38.50 39.50 40.50 40.50 40.50 41.50 42.50 42.50 43.50 43.50 44.50 44.50 44.50 45.50 46.50 46.50 46.50 47.50 47.50 48.50 49.50 49.50 49.50 49.50 49.50 18.633 10.203 20.833 17.994 16.965 9.572 9.060 20.438 9.944 19.060 18.798 15.452 9.343 18.134 12.556 17.751 12.291 14.738 18.282 12.184 17.043 23.920 20.300 17.220 14.630 24.501 12.367 13.942 20.191 21.283 27.551 28.740 28.244 23.388

A RQUIVOS
Arquivo 1

DE

D ADOS

Amostra=amostraAleatoria.txt - amostragem aleatoria simples: Bell.txt


3 X Y Zgauss 12.50 23.50 48.50 8.50 23.50 47.50 10.50 17.50 44.50 14.50 19.50 42.50 2.50 41.50 6.50 20.50 42.50 30.50 48.50 1.50 12.50 46.50 1.50 39.50 16.50 24.50 12.50 18.50 19.50 20.50 34.50 5.50 43.50 31.50 44.50 47.50 2.50 33.50 22.50 31.50 29.50 30.50 28.50 17.50 10.50 29.50 29.50 37.50 8.50 37.50 24.50 28.50 49.50 7.50 28.50 49.50 0.50 5.50 3.50 33.50 35.50 48.50 1.50 19.50 48.50 5.50 14.50 14.50 15.50 15.50 15.50 16.50 16.50 17.50 18.50 21.50 21.50 22.50 23.50 25.50 25.50 26.50 26.50 27.50 27.50 28.50 28.50 28.50 29.50 29.50 29.50 30.50 30.50 31.50 31.50 31.50 32.50 33.50 33.50 34.50 35.50 18.177 15.447 8.948 15.608 19.116 17.935 10.676 6.793 12.910 14.980 15.350 14.696 13.170 15.138 15.036 14.677 16.141 18.828 20.753 18.834 15.927 13.367 19.249 16.634 15.498 8.613 15.904 14.213 20.735 25.660 21.094 14.375 17.480 20.842 12.823 17.50 6.50 27.50 32.50 41.50 4.50 7.50 30.50 8.50 32.50 25.50 1.50 6.50 25.50 42.50 0.50 38.50 24.50 49.50 8.50 26.50 31.50 45.50 6.50 18.50 30.50 11.50 15.50 5.50 4.50 31.50 32.50 33.50 36.50

0.50 0.50 0.50 1.50 2.50 2.50 3.50 3.50 3.50 4.50 4.50 4.50 5.50 6.50 7.50 7.50 7.50 9.50 9.50 10.50 10.50 10.50 11.50 11.50 12.50 12.50 13.50 13.50 13.50 13.50 13.50

8.738 11.160 19.399 9.697 11.953 18.864 8.973 6.499 13.656 3.137 6.561 14.841 21.668 14.743 17.048 13.165 15.479 15.341 23.290 29.061 11.066 22.317 26.852 12.303 16.677 15.031 12.741 18.058 17.102 16.089 12.641