Escolar Documentos
Profissional Documentos
Cultura Documentos
Geoestatística Básica e Aplicada PDF
Geoestatística Básica e Aplicada PDF
Fevereiro - 2004
Uberlndia - MG
SUMRIO
1. INTRODUO........................................................................................................... 2
2. ANLISE EXPLORATRIA DE DADOS............................................................. 3
2.1. Distribuio de freqncias e histograma............................................................... 3
2.2. As estatsticas............................................................................................................. 3
2.3. Outras anlises descritivas........................................................................................ 7
2.4. Amostragem........................................................................................................................................... 7
2.5. Exemplos de anlise exploratria aplicando o programa GS+............................. 8
3. PRINCPIOS DA ANLISE GEOESTATSTICA.................................................. 14
3.1. Um breve histrico.................................................................................................... 14
3.2. Estacionaridade......................................................................................................... 15
3.3. Krigagem universal................................................................................................... 20
4. ANLISE DA DEPENDNCIA ESPACIAL............................................................ 21
4.1. Autocorrelao e Autocorrelograma....................................................................... 21
4.2. Semivariograma......................................................................................................... 25
4.3. O uso do software GS+ na determinao do semivariograma.............................. 36
4.4. Exemplos de aplicao............................................................................................... 41
5. KRIGAGEM................................................................................................................. 50
5.1. O interpolador........................................................................................................... 50
5.2. A krigagem no programa GS+................................................................................. 52
6. SEMIVARIOGRAMA CRUZADO E COKRIGAGEM.......................................... 55
6.1. Semivariograma cruzado.......................................................................................... 55
6.2. Co-krigagem.............................................................................................................. 56
6.3. Varincia da estimativa............................................................................................ 60
6.4. Nmero de vizinhos das estimativas........................................................................ 62
6.5. O uso do programa GS+ na determinao do semivariograma cruzado,
da co-krigagem e no mapeamento da varivel....................................................... 64
6.6. Exemplos de aplicao no GS+................................................................................ 67
7. VALIDAO DE MODELOS DE SEMIVARIOGRAMAS................................... 70
8. BIBLIOGRAFIA RECOMENDADA......................................................................... 74
1. INTRODUO
2.2. As estatsticas
O clculo de estatsticas como a mdia, a varincia, o desvio padro, o coeficiente
de variao, valor mnimo, valor mximo, coeficiente de assimetria e coeficiente de
curtose, colaboram na descrio da varivel. Passaremos a rever rapidamente estas
estatsticas.
- A mdia aritmtica ( X )
A mdia aritmtica uma medida de posio bastante utilizada na estatstica e tem
como caractersticas principais facilidade de clculo, a sua adaptabilidade ao tratamento
algbrico e, tambm, geralmente, uma medida no tendenciosa, precisa, eficiente e
suficiente.
Vale ressaltar que nem sempre a mdia aritmtica a medida de posio que melhor
representa uma varivel, por exemplo, em dados com assimetria direita acentuada a moda
ou a mdia geomtrica pode representar melhor a varivel em estudo.
A frmula para o clculo da mdia :
n
x
i =1
i
X=
n
em que: X a mdia aritmtica; xi cada valor observado; n o nmero total de
observaes.
s
CV (%) = 100
X
x
i =1
t
i
Mt =
n
Note que se t=1 temos a mdia aritmtica, ou seja, a mdia aritmtica igual ao
primeiro momento em relao origem.
O momento de ordem t centrado em uma constante K , com K 0 definido como:
n
(x
i =1
i K)t
M tK =
n
aritmtica) e, se t =2 e K = X , temos M 2X = m2 = 2.
Vamos definir agora o coeficiente de assimetria (Cs) e o coeficiente de curtose
(Ck).
O coeficiente de assimetria utilizado para caracterizar como e quanto
distribuio de freqncias se afasta da simetria, sendo que: se Cs > 0 temos a distribuio
assimtrica direita; se Cs < 0 a distribuio assimtrica esquerda; e se Cs = 0 a
distribuio simtrica.
O momento centrado na mdia de ordem 3 pode ser utilizado como medida de
assimetria, entretanto, mais conveniente a utilizao de uma medida admensional e que
ser chamada de coeficiente de assimetria:
m3
Cs =
(m 2 ) 3
2.4. Amostragem
Um requisito bsico na amostragem para fins de anlise de dependncia espacial
utilizando mtodos geoestatsticos que as observaes, ou seja, que as amostras sejam
referenciadas. No necessrio utilizar coordenadas geogrficas, mas algum tipo de
referenciao deve existir.
Exemplos de referenciaes so: a) amostras coletadas ao longo do tempo cada
observao referenciada com relao ao tempo (Ex: Estudo da precipitao anual na
regio X); b) amostras coletadas ao longo de uma linha reta em uma certa cultura agrcola
cada observao refernciada por um nico ponto no espao (Ex: amostras coletadas
em transees); c) amostras coletadas em uma rea cada observao ser identificada
por um par ordenado de coordenadas pertencente ao espao (Ex: amostras coletadas em
uma rea X).
Figura 2. Janela inicial do GS+ com exemplo de arquivo de dados contento as coordenadas
(x,y) e 4 variveis para a anlise.
Pode-se ainda trabalhar com duas variveis simultaneamente. Neste caso seleciona-
se uma varivel Z2 como covarivel. Voltaremos ao assunto no tpico de semivariograma
cruzado.
Voltando Figura 2 vamos descrever os procedimento da anlise exploratria de
dados.
A barra de ferramenta apresenta os seguintes smbolos que so destinados a este tipo
de anlise:
Planilha
ativa Principais Posio das observaes
Estatstica Anlise grfica selecionadas por quartil
s histograma
mdia
Desvio padro
varincia
mnimo
mximo
Nmero de dados e
Dados perdidos
histograma
Coeficiente de assimetria
Figura 4. Estatsticas da varivel usatpd. e erro padro
Coeficiente de curtose e
erro padro
Como uma anlise geral desses dados verifica-se que a umidade de saturao do
solo no plantio direto (usatpd) apresentou mdia de 44,0069 (cm3/100cm3), com uma
disperso mdia em torno desse valor de 4,3190 (cm3/100cm3) e, portanto, uma
variabilidade de 9,81%, deste modo nota-se que as observaes se dispersam relativamente
pouco em torno da mdia. O menor valor observado (36,27 cm3/100cm3) e o maior valor
observado (54,810 cm3/100cm3) reforam a idia de baixa variabilidade das observaes e
tambm mostram que, provavelmente, no temos valores discrepantes que poderiam ser
atribudos a erros de determinao, digitao ou de amostragem. O histograma mostra uma
tendncia dos dados simetria e este fato tambm pode ser verificado por meio dos
coeficientes de assimetria e curtose associados aos seus respectivos erros padro, que so
respectivamente: 0,460,30 e 0,340,50, ou seja, assimetria e curtose prximos de zero
indicando distribuio normal aproximada dos dados.
Note ainda que existe a possibilidade de se fazer anlises com dados transformados.
Um detalhamento da distribuio da varivel pode ser obtida clicando o cone do
Histograma
freqncia simples
Grfico de freqncia
acumulada
Grfico da distribuio
normal
Uma outra anlise utilizada no GS+ a localizao espacial dos pontos amostrados
com relao a intervalos de ocorrncia. Este mapa obtido por meio do cone . Veja o
exemplo na Figura 6.
do solo. Uma justificativa para tal fato a facilidade computacional que viabilizou alguns
clculos relativamente trabalhosos nesta metodologia.
No Brasil destaca-se trabalhos pioneiros nesta rea desenvolvidos pelos
pesquisadores Sidney Rosa Vieira, Paulo Libardi e Klaus Reichardt. Ainda na dcada de
80.
Atualmente a aplicabilidade e a utilizao da geoestatstica como metodologia de
anlise de dados no espao ou no tempo esta difundida em vrios ramos da cincia,
envolvendo reas de cincias humanas, biolgicas e exatas.
Em linhas gerais podemos dizer que a geoestatstica est interessada em determinar
a dependncia espacial das observaes de uma varivel e recebeu tal denominao devido
aos trabalhos desenvolvidos por Krige na frica do Sul. Este pesquisador homenageado
com o nome do mtodo de interpolao utilizado na geoestatstica, a krigagem.
Outras metodologias e alternativas de anlise de dependncia espacial so descritas
em Papadakis (1937), Bartlett (1978), Zimmerman e Harville (1991), Cressie e Hartfield
(1996), Duarte (2000), entre outros autores.
3.2. Estacionaridade
Antes de iniciarmos a discusso sobre a estacionaridade da varivel vamos adotar
uma simbologia para a varivel em estudo. Ao falarmos da varivel Z(t) estaremos falando
de ocorrncias da varivel Z com uma referenciao t, que pode ser uma posio no tempo
(unidimensional, por exemplo: t1, t2, ...,tk) ou no espao (unidimensional, por exemplo: x1,
x2, ..., xn; ou bidimensional, por exemplo; (x1,y1),(x1,y2), ..., (xn, yn))
Diz-se que um processo (ou uma varivel) estacionria se o desenvolvimento
desse processo no tempo ou no espao ocorrer de maneira mais ou menos homognea, com
oscilaes aleatrias contnuas em torno de um valor mdio, em que nem a amplitude
mdia e nem as oscilaes mudam bruscamente no tempo ou no espao. Como exemplo de
processo estacionrio pode-se citar as oscilaes da tenso em uma rede eltrica.
Note que as caractersticas de um processo estacionrio independe da origem
adotada.
Pode-se definir uma funo aleatria Z(t) como estacionria, se todos os momentos
estatsticos so invariantes para toda mudana de origem.
Estatisticamente pode-se dizer que, se o processo estacionrio de ordem k, ento:
E[Z(t)] = m1(t) = constante t
E[Z2(t)] = m2(t) = constante t
. . .
. . .
. . .
E[Zk(t)] = mk = constante t
28
26 A
24
Y
22
20
18
0 10 20 30 40 50
X
29
27 B
25
23
Y
21
19
17
15
0 10 20 30 40 50
X
30
25 C
20
Y
15
10
5
0 10 20 30 40 50
X
cov[ Z ( t ), Z ( t + h )] = E [( Z ( t ) z( t ) ).( Z ( t + h ) Z ( t + h ) )]
Se a varivel Z estacionria, esta funo poder ser estimada por:
n( h )
[ Z ( ti ) Z ] [ Z ( t i + h ) Z ]
cov( Z ( t ), Z ( t + h )) = i =1 , pois
n( h ) 1
neste caso a mdia de Z(t) ser igual mdia de Z(t+h).
Uma propriedade da covarincia diz que "se duas variveis aleatrias so
independentes ento a covarincia entre elas igual a zero". Portanto, ao analisarmos a
varivel Z nas posies t e t+h, com h=1,2,...k, espera-se que o valor da covarincia comece
alto e depois tenda a zero, sendo que quanto maior for o valor da covarincia maior ser a
relao espacial e para covarincia zero teremos independncia. A Figura 9 ilustra uma
funo covarincia.
3
covarincias
-1
0 100 200 300 400 500 600
distncias (m)
cov[ X ,Y )]
( x , y ) = que pode ser estimada por:
x y
n
[ X X ] [Y Y ]
i =1
r( x , y ) = n 1
SxS y
Neste caso quanto mais prximo de 1 ou de -1, maior a relao entre as variveis e
quanto mais prximo de 0, menor a relao linear entre X e Y.
A funo autocorrelao definida como sendo a razo entre a covarincia dos
valores assumidos pela varivel Z, nas posies t e t+h e a varincia dessa varivel Z, em
funo da distncia h, no caso de varivel estacionria de segunda ordem. Desta forma tem-
se:
cov[Z (t ), Z (t + h)] Cov[ Z (t ), Z (t + h)]
( h) = =
Var[ Z (t )] 2
Trabalhando-se com dados amostrais (h) pode ser estimado por r(h):
n( h )
[ Z ( t i ) Z ] [ Z ( ti + h ) Z ]
i =1
n( h ) 1
r( h ) =
s2
em que:
(h) a autocorrelao entre os valores da varivel Z, separados pela distncia h
(autocorrelao populacional);
Cov [Z(t), Z(t+h)] a covarincia entre a varivel Z(t) e a varivel Z(t+h);
Var[Z(t)] = 2 a varincia populacional, ou seja, a covarincia entre Z(t) e Z(t+h) quando
h=0;
r(h) a autocorrelao amostral para a distncia h;
n(h) o nmero de pontos amostrais separados pela distncia h;
Z o valor mdio (mdia amostral) da varivel Z(t);
s2 a varincia amostral de Z(t).
1
0.8
0.6
0.4
r(h)
0.2
0
-0.2
-0.4
0 100 200 300 400 500 600
distncia (m)
1.2
1
0.8 A
0.6
r(h)
0.4
0.2
0
-0.2
0 5 10 15 20
h
1.2
1 B
0.8
0.6
r(h)
0.4
0.2
0
-0.2
-0.4
0 5 10 15 20
h
4.2. Semivariograma
a) Definio do semivariograma
O semivariograma definido como:
1
(h) = {Var[ Z (t ) Z (t + h)]}
2
Note que Var[Z(t) Z(t+h)] a varincia dos dados separados por uma distncia h,
mas, na expresso acima, esta varincia est sendo divida por dois, ento se utiliza o
prefixo semi para distinguir da varincia e da vem o nome semivarincia para (h) e
semivariograma para o grfico de (h) em funo de h.
^ [ z(t + h) Z (t )]
i =1
2
(h) =
2n( h )
em que n(h) o nmero de pares separados pela distncia h.
Relembrando a condio de estacionaridade, temos que a utilizao do
semivariograma exige que pelo menos a hiptese intrnseca seja atendida, ou seja, exige a
condio de estacionaridade mais fraca quando comparada com a autocorrelao.
b) Caracterizao do semivariograma
Analisando a expresso da funo semivarincia, pode-se imaginar que quanto mais
prximos estiverem os pontos amostrados, maior ser a semelhana entre eles e, portanto,
menor a semivarincia; e quanto mais distantes estiverem os pontos amostrados menor ser
a semelhana e, consequentemente, maior a disperso (varincia). Na teoria temos que para
a distncia h=0 a semivarincia (0) = 0 e, a semivarincia (h) cresce com o incremento
de h, at atingir um valor constante para (h) que corresponde s variaes aleatrias, ou
seja, variaes que no so justificada pela semelhana de um ponto com outro.
A distncia h a partir da qual (h) se torna aproximadamente constante chamada
de alcance da dependncia espacial (a) sendo que as medies realizadas a distncias
maiores que a, tem distribuio espacial aleatria e, portanto, so independentes entre si. O
valor de (h) constante chamado de patamar (C).
A utilizao de dados amostrais na estimativa da semivarincia e na construo do
semivariograma, revela que, freqentemente, para h = 0 a semivarincia (0) difere de zero.
A impossibilidade de se fazer reamostragem exatamente sobre um ponto j amostrado
(nestes casos pode ocorrer variaes a distncias menores do que a menor distncia de
amostragem) e erros como erros de amostragem, erros de anlise de laboratrio, etc., so
justificativas dessa descontinuidade na origem. Quando (0) 0, surge um novo termo no
semivariograma chamado de efeito pepita (C0) e, neste caso, o patamar dado por:
C0 + C.
(A) (B)
a
INDEP
a INDEP.
DEP. DEP.
C0
Figura 11. Semivariogramas: (A) sem efeito pepita; (B) com efeito pepita
20
15 A
gama (h)
10
0
0 5 10 15 20
h
20
15
gama (h)
10
B
5
0
0 5 10 15 20
h
20
15 C
gama (h)
10
0
0 5 10 15 20
h
10
8
D
gama (h)
6
4
2
0
0 5 10 15 20
h
40
30 E
gama(h)
20
10
0
0 5 10 15 20 25 30
h
Figura 12. Semivariogramas: A) Com patamar; B) Efeito pepita puro; C) sem patamar
D)Cclico e E) Com estruturas entrelaadas
d) Isotropia e anisotropia
Note que h um vetor e, consequentemente, o semivariograma depende da
magnitude e da direo de h. Quando o semivariograma idntico para qualquer direo de
h ele chamado de isotrpico e quando o semivariograma apresenta os parmetros C, C0, a
e/ou modelo diferenciado dependendo da direo de h, ele chamado anisotrpico
(podemos classificar a anisotropia em anisotropia geomtrica ou anisotropia zonal). Se o
semivariograma anisotrpico ele deve sofrer transformaes antes de ser usado. Vieira
(1995) alega que, em geral, a preciso da interpolao ou o tipo de hiptese satisfeita, no
so afetados se, ao invs de se preocupar com a escolha de mtodo de transformao de
anisotropia, apenas limitar a faixa de distncia na qual se utiliza o semivariograma. As
principais direes de h que so examinadas so: 0o (na direo X), 90o (na direo Y), 45o
e 1350 (nas duas diagonais principais).
Quando os dados forem coletados em uma transeo (linha), o semivariograma
unidimensional e nada pode ser dito sobre anisotropia.
30
25
y = x2
20
15
Y
10
5
0
-5 0 1 2 3 4 5 6
X
15
y = 2.0286x + 1.4286+ei
10
Y
0
0 1 2 3 4 5 6
X
desse critrio na seleo do modelo preferido, por ser este mais sensvel e mais robusto
quando comparado com o coeficiente de determinao (R2).
Observao: Em muitos casos (talvez na maioria dos casos) a sensibilidade de quem est
trabalhando com os dados e o conhecimento sobre a varivel de fundamental importncia
na opo do modelo de semivariograma. s vezes prefervel selecionar um modelo com
R2 um pouco menor ou RSS um pouco maior que o sugerido pelo programa, mas que
represente melhor os dados. De maneira geral, quanto mais simples puder ser o modelo
ajustado, melhor, e tambm no se deve dar importncia excessiva a pequenas flutuaes.
C
C 0 + h 0ha
( h) = a
C 0 + C h>a
Neste caso C/a o coeficiente angular para 0< h < a
3 h 1 h 3
C + C 0ha
(h) = 0 2 a 2 a
C0 + C h>a
[
(h) = C0 + C 1 e[ 3( h / a )] ] 0<h<d
[
(h) = C 0 + C 1 e [ 3( h / a )
2
] 0hd
v) modelos sem patamar
( h ) = C0 + Ah B 0<B<2
Os parmetros A e B so constantes que definem o modelo, sendo que B tem que ser
estritamente maior que zero e menor que dois para garantir a condio de positividade
definida condicional.
Figura 15. Modelos de semivariograma: (A) com patamar; (B) sem patamar.
Exibe o
semivar.
Varincia
amostral
Semivar.
escalonado
Semivariograma
isotrpico
Semivariogramas
anisotrpicos
Figura 16. Anlise da semivarincia
Note que a Figura 17 apresenta ainda a opo model e a opo expand. O resultado
da execuo dessas funes so apresentados nas Figuras 18 e 19.
A Figura 18 exibe as opes de modelos de semivariogramas.
Amplitude Coef.
efetiva (exp Relao Determinao e
Efeito patamar amplitude entre C e
modelos e gaussiano). soma de quadrados
pepita patamar de erros
Observaes:
a) O programa no apresenta o modelo de efeito pepita puro. Para obter este modelo
utilize o modelo linear com C0 = C0 +C.
b) A amplitude efetiva utilizada no GS+ para determinar a amplitude de dependncia
espacial dos modelos exponencial e gaussiano, devido a formula de clculo desses
modelos no programa, A0 A (Estes modelos no GS+ no consideram o fator
multiplicativo 3).
c) A inclinao no modelo linear e linear com patamar (coeficiente angular) e dado pela
relao entre C e A0, ou seja, C/A0.
d) A relao entre C e C0+C nos d uma idia do grau de dependncia espacial da varivel,
sendo que quanto mais prximo de 1, maior a dependncia espacial. Note que
C0 C
= 1 e o primeiro termo j foi discutido no item grau de dependncia
C0 + C C0 + C
espacial, classificando a dependncia como fraca, moderada e forte.
e) R2 (coeficiente de determinao) e RSS (soma de quadrados de resduos) nos informa
sobre a qualidade do ajuste do modelo.
f) No ajuste do modelo a sensibilidade do usurio muito mais importante do que os
valores de R2 e RSS e, portanto, tentativas de ajustes diferentes ao proposto pelo
programa devem ser utilizadas, mesmo que isso cause queda no valor de R2 e acrscimo
no valor de RSS.
g) O programa no apresenta a opo de ajuste de modelo sem patamar diferente do linear.
Neste caso, sugere-se que se copie as semivarincias calculadas para outro programa e
que o grfico seja feito neste outro programa, por exemplo, O Excel.
Semivariograma
experimental e
modelo ajustado
Parmetros do
modelo
ajustado
b) Semivarincia e semivariograma
Os valores das distncias h, das semivarincias ((h)) e nmeros de pares(n(h)) utilizados
no clculo so apresentados abaixo.
4.000
semivarincia
3.000
2.000
1.000
0.000
0 100 200 300 400 500
h (m)
b) Semivariograma
O modelo proposto pelo GS+ foi:
Comparando os dois modelos verifica-se ligeiro aumento de r2, mantendo-se o mesmo valor
de RSS, desta forma o modelo proposto no exemplo 1 poderia ser utilizado.
As descries e discusses seguem o padro do exemplo 1.
Lembre-se que o modelo adotado foi o exponencial e portanto o alcance efetivo ser de
40,80 m no primeiro caso e de 120 m no segundo caso.
Outros modelos poderiam ser sugeridos neste caso.
3) A seguir apresentamos as coordenadas X (m), Y (m) e a varivel silte (%) em uma rea
experimental.
X 0 0 0 0 0 0 0 0 10 10 10 10 10 10 10 10
Y 0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70
PBPD 12.77 12.84 11.39 12.30 12.43 12.43 12.45 12.74 11.39 12.32 12.16 11.49 10.39 11.32 11.24 12.49
X 20 20 20 20 20 20 20 20 30 30 30 30 30 30 30 30
Y 0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70
PBPD 11.25 11.97 12.38 12.85 12.55 12.49 12.58 12.82 12.49 11.67 11.59 12.72 11.12 11.18 11.53 11.48
X 40 40 40 40 40 40 40 40 50 50 50 50 50 50 50 50
Y 0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70
PBPD 11.81 11.19 11.46 11.44 12.39 12.17 11.69 12.32 11.58 11.11 11.55 10.79 11.13 11.29 12.62 12.01
X 60 60 60 60 60 60 60 60 70 70 70 70 70 70 70 70
Y 0 10 20 30 40 50 60 70 0 10 20 30 40 50 60 70
PBPD 12.66 11.49 11.25 12.87 12.77 11.95 11.96 11.11 10.81 11.65 12.36 11.90 12.16 12.56 12.54 11.46
Realizar a anlise dos dados e verificar se existe dependncia espacial para essa varivel.
SOLUO:
a) Anlise descritiva
O resultado das principais estatsticas dessa varivel apresentado a seguir:
Nota-se que a rea apresenta, em mdia, 11,92% de silte, com disperso mdia em torno
desse valor de 0,6302%. Esta disperso em torno da mdia representa uma variabilidade de
5,29% (CV=5,29%), mostrando que os dados tm uma baixa disperso. Os coeficientes de
assimetria e curtose com os respectivos erros padro indicam tendncia simtrica dos
dados, mas a curva do tipo platicrtica, diferindo da curva normal (mesocrtica). Com base
em uma anlise visual do histograma, verifica-se uma distribuio de freqncias bimodal
para esta varivel.
b) Anlise do semivariograma
A seguir mostrado o semivariograma dessa varivel:
O modelo apropriado para descrever o comportamento espacial dessa varivel foi o modelo
de efeito pepita puro. Nota-se que as semivarincias experimentais esto em torno da linha
paralela ao eixo x, ou seja, C0 + C = 0,397. Conclui-se, portanto, que a distribuio espacial
do silte nesta rea experimental aleatria e as amostras, para a malha amostrada (com
distncia entre pontos de 10 m), so independentes.
Realizar a anlise dos dados e verificar se existe dependncia espacial para essa varivel.
Soluo:
a) Anlise descritiva
As estatsticas e o histograma da varivel umidade foram:
Verifica-se que este solo apresentou, na poca de coleta, umidade mdia de 26, 24 g de
gua/100g de solo, com desvio padro de 2,020 g/100g, o que representa uma variabilidade
de 7,7%, considerada uma baixa variabilidade dos dados em torno do valor mdio. Os
histogramas, associado assimetria e curtose dos dados, mostram que os dados se
distribuem segunda a curva normal.
b) Anlise do semivariograma
O semivariograma desta varivel :
Nota-se que a varivel umidade do solo apresenta dependncia espacial, que pode ser
descrita pelo modelo exponencial com alcance de 81 m, ou seja, amostras de umidade do
solo selecionadas a distncias inferiores a 81 m esto correlacionadas entre si. A relao
entre o efeito pepita e o patamar de 13,63%, indica que a dependncia espacial forte.
5. KRIGAGEM
5.1. O interpolador
O semivariograma a ferramenta da geoestatstica que permite verificar e modelar a
dependncia espacial de uma varivel. Uma aplicao imediata do semivariograma a
utilizao das informaes geradas por ele na interpolao, ou seja, na estimativa de dados
e posterior mapeamento da varivel. O interpolador que utiliza o semivariograma em sua
modelagem chamado de krigagem. O nome krigagem uma homenagem ao engenheiro
sul-africano D. G. Krige.
Para a aplicao da krigagem assume-se: que sejam conhecidas as realizaes z(t1),
z(t2), ..., z(tn) da varivel Z(t), nos locais t1, t2, ..., tn; que o semivariograma da varivel j
tenha sido determinado; e que o interesse seja estimar um valor z* na posio t0.
O valor estimado z*(t0) dado por:
n
z * (t 0 ) = i z (t i )
i =1
i =1
(t , t
i =1
i i j ) + = (t i , t 0 )
Observaes:
i) A matriz A simtrica e possui diagonal principal igual a zero, ou igual ao valor do
efeito pepita.
ii) Os valores 1 que aparecem nas matrizes A e b so conseqncia do multiplicador de
Lagrange.
iii) O sistema deve ser resolvido para cada estimativa z* e para cada variao do
nmero de amostras envolvidos na estimativa.
Mtodo de
krigagem
Modelo de
semivariograma
Arquivo e tipo de
arquivo para gravar a vizinhos
krigagem
A krigagem pode ser expressa por meio de mapas, sendo necessrio para isto, ativar o cone
map, tendo como resultado a Figura 21.
1
11(h) = E { Z 1( t 1i + h) - Z 1( t 1i ) }2 B
2
1
22 (h) = E { Z 2 ( t 2j + h) - Z 2 ( t 2j ) }2 C
2
ii) O semivariograma cruzado entre Z1(t1i) e Z2(t2i), igual ao semivariograma cruzado entre
Z2(t2j) e Z1(t1i):
1
12 (h) = 21( h ) = E {[ Z 1( t 2i + h) - Z 1( t 1i )][ Z 2 ( t 2j + h) - Z 2 ( t 2j )]}
2
D
1 n(h)
12 (h) = [ Z 1( t 1i + h) - Z 1( t 1i )][ Z 2 ( t 2j + h) - Z 2 ( t 2j )] E
2n(h) i=1
onde n(h) o nmero de valores de Z1 e Z2 separados por um vetor h.
Pode-se notar que o semivariograma um caso particular do semivariograma
cruzado, quando as duas variveis so idnticas.
O semivariograma cruzado s ser calculado usando as informaes existentes para
posies geogrficas coincidentes. Isto significa que Z1 e Z2 tem que ser, necessariamente,
definidos para os mesmos locais, e as informaes excedentes no so consideradas no
clculo.
Um semivariograma cruzado com caractersticas que podem ser identificadas como
ideais, teria aparncia do semivariograma simples (de uma nica varivel, ou seja, patamar
definido, semivarincia crescente para pequenas distncias, modelo esfrico), porm, com
significados diferentes, pelo simples fato de envolver o produto das diferenas de duas
variveis diferentes. Por exemplo, ao contrrio do semivariograma, no obvio que o valor
do semivariograma cruzado para h=0, deva ser nulo. Assim, alm de espaos menores do que
distncia de amostragem, acumulado no mesmo parmetro, est falta de correlao entre as
duas variveis. O alcance aqui representa apenas o final ou a distncia mxima de
dependncia espacial entre as variveis. J o patamar do semivariograma cruzado, se existir,
deve aproximar-se do valor da covarincia entre as duas variveis. Assim, quando as duas
variveis forem de correlao inversa, isto , quando aumenta uma a outra diminui, a
covarincia ser negativa e, conseqentemente, o semivariograma cruzado ser negativo. Os
modelos utilizados para o semivariograma cruzado so os mesmos j discutidos para o
semivariograma simples.
6.2. Co-krigagem
A krigagem um caso particular do mtodo co-krigagem. Uma vez que exista a
dependncia espacial para cada uma das variveis Z1 e Z2, e que tambm exista dependncia
espacial entre Z1 e Z2, ento possvel utilizar a co-krigagem para estimar valores.
Suponha que se queira estimar valores, Z2*, para qualquer local, t0, e que a estimativa
deva ser uma combinao linear de ambos Z1 e Z2, ou seja,
n n
1 2
z*2 (t0 )= 1i z 1( t 1i ) + 2j z 2 ( t 2j ) F
i= 1 i= 1
n1 n2
Z *2 (to )= 1i Z 1( t 1i ) + 2j Z 2 ( t 2j ) G
i= 1 i= 1
Para que o estimador seja timo, ele no pode ter tendncia e tem que ter varincia
mnima. Em outras palavras, para que o estimador seja o melhor possvel, necessrio que ele
no superestime nem subestime valores, e que a confiana nas estimativas seja mxima.
O raciocnio bsico para deduo do sistema de equaes da co-krigagem idntico
ao da krigagem, com uma diferena que, neste caso, envolve duas variveis, e por isto envolve
equaes mais longas, com subscritos, complicando um pouco mais a situao. Porm, o
raciocnio e, por conseguinte, a lgebra envolvida, so o mesmo.
Para que a estimativa no tenha tendncia, qualquer que seja a distribuio dos pesos,
a soma daqueles associados com a varivel estimada deve ser igual a 1, e a soma daquelas
associadas outra varivel, tem que ser nula.
O sistema co-krigagem e a varincia da estimativa podem ser escritos em termos de
semivariograma, usando a hiptese de estacionaridade de ordem 2. Assim, o sistema da co-
krigagem, em termos de semivariograma fica:
n1 n2
1i 12 ( t 1i ,t 1k ) + 2j 12 ( t 1k ,t 2j ) - 1 =
i= 1 j=1
= 12 ( t 1k ,t 0 ), k = 1,... n1
H
n1 n2
1i 12 ( t 1i ,t 2l ) + 2j 22 ( t 2j ,t 2l ) - 2 =
i=1 j=1
= 22 ( t 2l ,t 0 ), l = 1,... n2
I
N1
1i = 0
i=1
N2
2j = 1
j=1
n1 n2
k 2( t 0 ) = 1 + 2 + 1i 12 ( t 1i ,t 0 ) + 2j 22 ( t 2j ,t 0 ) J
2
i= 1 j =1
A soluo do sistema da co-krigagem produzir n1 pesos 1i e n2 pesos 2j e os
multiplicadores Lagrangeanos, 1 e 2.
[ ] [ ] = [b] K
cuja soluo
[ ] = [ ] [b] L
-1
onde []-1 o inverso da matriz de coeficientes [], [] a matriz dos pesos procurados, 1i e
2j, e [b] o lado direito do sistema de equaes (semivarincia do ponto a ser estimado (t0) e
o ponto observado (t12 ou t21)).
A varincia da estimativa pode ser escrita como:
2 k2 ( t 0 ) = [ ] [b] M
t
Suponha ento que o nmero de vizinhos de Z2 usados seja n2=2, e de Z1, n1=4. A
matriz [] ser ento de 8x8 e pode ser escrita como:
11 ( t 11 , t11 ) 11 ( t12 , t 11 ) 11 ( t 13 , t 11 ) 11 ( t 14 , t 11 ) 12 ( t 11 , t 21 ) 12 (t11 , t 22 ) 1 0
11 ( t 11 , t 12 ) 11 ( t 12 , t 12 ) 11 ( t 13 , t 12 ) 11 ( t 14 , t 12 ) 12 ( t 12 , t 21 ) 12 ( t 12 , t 22 ) 1 0
11 ( t 11 , t 13 ) 11 ( t 12 , t 13 ) 11 ( t 13 , t 13 ) 11 ( t 14 , t 13 ) 12 ( t 13 , t 21 ) 12 ( t 13 , t 22 ) 1 0
12 ( t 11 , t 14 ) 11 ( t 12 , t 14 ) 11 ( t 13 , t 14 ) 11 ( t 14 , t 14 ) 12 ( t 14 , t 21 ) 12 ( t 14 , t 22 ) 1 0
12 ( t 11 , t 21 ) 12 ( t 12 , t 21 ) 12 ( t 13 , t 21 ) 12 ( t 14 , t 21 ) 22 ( t 21 , t 21 ) 22 ( t 21 , t 22 ) 0 1
12 ( t 11 , t 22 ) 12 (t12 , t 22 ) 12 ( t 13 , t 22 ) 12 ( t 14 , t 22 ) 22 ( t 22 , t 21 ) 22 ( t 22 , t 22 ) 0 1
1 1 1 1 0 0 0 0
0 0 0 0 1 1 0 0
11
12
13
14
[ ] =
21
22
1
2
12 ( t 11 , t 0 )
12 ( t 12 , t 0 )
12 ( t 13 , t 0 )
[b] =
12 ( t 14 , t 0 )
22 ( t 21 , t 0 )
22 ( t 22 , t 0 )
a) Vizinhana nica
b) Distncia constante
Neste mtodo, para cada ponto estimado selecionada uma vizinhana constando de
todos os vizinhos localizados dentro de um circulo de raio especificado. Conseqentemente,
nos cantos de um campo retangular ocorre 1/4 de crculo, com 1/4 do nmero de vizinhos. A
grande vantagem deste mtodo est no fato que se conhece exatamente a distncia na qual os
vizinhos para estimativa so procurados. Isto particularmente importante porque se pode
limitar o uso do semivariograma quanto distncia sobre qual ele ser calculado. Por outro
lado, o nmero de vizinhos pode mudar bastante ao longo do campo, fazendo com que o
tamanho do sistema matricial seja varivel. Em termos de programao de computador, isto
pode se tornar um problema se exceder o valor usado na dimenso das matrizes.
d) Quadrantes
Ferramentas de
anlises descritivas Krigagem e
Semivariograma co-
das variveis Z1, Z2
da varivel 1 krigagem
Semivariogram Semivariograma
a da varivel 2 Cruzado Mapas
Figura 20. cones ativos nas anlises descritivas, semivariogramas simples, semivariogramas
cruzados, krigagem/co-krigagem e mapas.
Se para cada um dos n locais onde se tem um valor medido Z(xi), estima-se um valor
atravs da krigagem (ou da co-krigagem), Z*(ti), ento poder-se- fazer um grfico dos valores
pareados de Z(ti), Z*(ti) e calcular a regresso linear entre eles. A regresso ser ento:
Z* ( t i ) = a + b Z( t i )
b) O erro absoluto
Uma vez que se tem o conjunto de n valores medidos e estimados, Z(xi) e Z*(xi),
ento pode-se definir o erro absoluto como:
EA( xi ) = Z* ( xi )- Z( xi ) O
EA = E {EA( xi )} = E { Z* ( xi )- Z( xi )} = 0 P
e
2
VAR( EA ) = E {( Z* ( xi )- Z( xi ) ) } = mnima Q
c) Erro reduzido
Lembrando que no clculo dos valores estimados, Z*(xi), sempre se tem a varincia
da estimativa, 2k(ti), ento pode-se definir o erro reduzido como:
ER( t i ) = ( Z* (t i ) - Z( t i ))/ k ( t i ) R
A diviso pela raiz quadrada da varincia da estimativa faz com que os ER(ti) sejam
sem dimenso e que, por isso, as condies de no tendncia e de varincia mnima, requeiram
que:
ER = E {ER( xi )} = E {( Z* ( xi )- Z( xi )) / k ( xi )} = 0 S
VAR( ER ) = E {( Z* ( xi )- Z( xi )) / k ( x0 ) } = 1 T
2
Estas propriedades fazem deste tipo de erro uma valiosa ferramenta e de fcil uso,
nas aplicaes de geoestatstica. O fato de terem valores ideais fixos em 0 (zero) e 1 (um), e
de serem sem dimenso, facilita seu julgamento e estudo, e tambm permite sua comparao
com outras situaes expressas em unidades diferentes.
A Figura 23 mostra uma sada da opo de validao cruzada apresentada pelo
programa GS+. A validao cruzada ativada na janela da Krigagem, conforme mostram a
Figuras 20 e 22.
Note, neste caso, que a reta ajustada est praticamente igual a reta a 45 (Grfico
1:1), o coeficiente de regresso (coeficiente angular) de 0,944 com erro padro de 0,105
indica que este estatisticamente igual a 1 e o y intercept (coeficiente linear) de 0,024
mostra que este pode ser considerado estatisticamente igual a zero, condies estas timas
para as estimativas. O coeficiente de determinao (r2) de 0,39 considerado relativamente
baixo, mas devido ao grande nmero de observaes e sabendo-se que este coeficiente
altamente influenciado pelo nmero de pares, podemos considera-lo como satisfatrio.
Tambm pode-se verificar, pelo grfico, que os valores extremos que esto mais afastados
da reta e podemos associar isto ao fato do semivariograma geralmente apresentar melhores
estimativas para distncias curtas.
A anlise da validao cruzada deve ser feita com base em todos os parmetros e
no com base em parmetros isolados.
8. BIBLIOGRAFIA RECOMENDADA
BARTLETT, M.S. Nearest neighbour models in the analysis for field experiments (with
discussion). Journal of the Royal Statistical Society. B, London, v.40, n.2, p.147-174, 1978.
BUSSAB, W. O.; MORETTIN, P. A . Estatstica bsica. 4a ed.. So Paulo : Atual, 1987. 321
p.
CRESSIE, N.; HARTFIELD, M.N. Conditionally specified gaussian model for spatial
statistical analysis of field traits. Journal of Agricultural, Biological, and Environmental
Statistics, Washington, v.1, n.1, p.60-77, Mar. 1996.
DAVID, M. Geostatistical ore reserve estimation. Elsevier. New York, v. 8, 364 p., 1977.
MATHERON, G. The theory of regionalized variables and its applications. Les Cahiers du
Centre de Moffologie mathemathique. Fas. 5. C. G. Fontainebleau, 1971.
PANNATIER, Y. Variowin Software for spatial data analysis in 2D. New York:
Springer-Verlag, 1996. 90 p..
PAPADAKIS, J. Method statistique pour des expriences sur champ. Bull. Inst. Amlior.
Plantes Salonique. n.23, 1937.
VIEIRA, S. R.; GUIMARES, E. C.; DECHEN, S. C. F.; DE MARIA, I. C.; ROCHETE, P.;
TOPP, G. C.; ZEBCHUK, W. Analisando simultaneamente variabilidade espacial e temporal
usando variogramas tridimensionais. In: XIII Congresso Latino-Amaericano de Cincia do
Solo - Resumos expandidos em CD-ROOM. T01-053. guas de Lindoia, SP: SBCS/ESALQ-
USP, 1996.
ZIMMERMAN, D.I.; HARVILLE, D.A. A random field approach to the analysis of field-
plot experiments and other special experiments. Biometrics, Raleigh, v.47, n.1, p.233-239,
mar. 1991
OBSERVAO:
Pgina na internet para busca de artigos, programas, livros e outros assuntos de
geoestatstica:
http://www.famat.ufu.br/ednaldo/ednaldo.htm
http://www.rc.unesp.br/igce/aplicada/landim.html
http://musis.sites.uol.com.br/geo1.htm
http://sc-terre-218.unil.ch/
http://www.ai-geostats.org/