Escolar Documentos
Profissional Documentos
Cultura Documentos
Vieira (2000)
Vieira (2000)
net/publication/313098532
CITATIONS READS
574 5,918
1 author:
SEE PROFILE
All content following this page was uploaded by Sidney Rosa Vieira on 30 August 2018.
Sidney R. Vieira2
Resumo
Quando uma determinada propriedade varia de um local para outro com algum
grau de organização ou continuidade, expresso pela dependência espacial, a estatística clássica
deve ser abandonada e dar lugar a uma estatística relativamente nova: a geoestatística. Por
estatística clássica entende-se aquela que utiliza parâmetros como média e desvio padrão para
representar um fenômeno, e baseia-se na hipótese principal de que as variações de um local para
outro são aleatórias. Desse modo, esses dois ramos da estatística têm validade de aplicação em
condições perfeitamente distintas. Para se determinar qual das duas deve ser usada em cada caso,
utiliza-se o semivariograma que expressa a dependência espacial entre as amostras. Havendo
dependência espacial, pode-se estimar valores da propriedade em estudo para os locais não
amostrados dentro do campo, sem tendenciosidade e com variância mínima, pelo método
denominado krigagem. Além disso, muitas vezes, duas propriedades correlacionam-se entre si e
no espaço, e uma é mais difícil ou mais cara para se medir no campo. A dependência espacial
entre duas propriedades no espaço pode ser expressa pelo semivariograma cruzado, e se ele
existir, o método chamado co-krigagem pode ser utilizado para estimar aquela mais difícil de se
medir, utilizando-se os dados de ambas. Estes métodos oferecem a escolha de se medir a
propriedade mais difícil com um número mínimo possível. A construção de mapas de contornos
(isolinhas), e o delineamento de espaçamento e disposição ótima de amostras no campo são outras
aplicações imediatas. Neste trabalho procurou-se dar o maior detalhamento possível nos aspectos
teóricos e nos conceitos básicos de geoestatística, numa linguagem simples e compreensível ao
leitor. Para ilustrar, utilizaram-se dados da literatura, como exemplo aplicativo para propriedades
químicas de solo. Os dados e os programas de geoestatística utilizados estão listados em apêndice
no final do trabalho.
When a given soil property varies from place to place with some degree of
continuity, as expressed through its autocorrelation, classical statistical analysis is not valid and a
relatively new tool in soil science called geostatistics must be used. Classical statistical is
understood as that which uses such parameters as mean and standard deviation, to represent a
phenomenon and is based on the principal hypothesis that spatial variation is random. These
1
Recebido para publicação em e aceito em
2 Pesquisador, Centro de Solos e Recursos Agroambientais, Instituto Agronômico, Caixa Postal
28 - 13001-970, Campinas, SP. Email: sidney@cec.iac.br
aspects of statistics are applicable in perfectly distinct circunstances. In order to determine which
should be used in which instance, semivariograms are used to show autocorrelation among
samples. Autocorrelation allows estimation of values for places not sampled in the field, without
bias and with minimum variance, with the kriging method. Furthermore, two properties may have
spatial autocorrelation with each other, and one may be more difficult or more expensive to
measure in the field. Spatial autocorrelation between two properties can be expressed with cross-
semivariograms, and in some cases, the co-kriging method can be used to estimate the property
more difficult to measure, thus using both measures. This method allow selection of the most
difficult property to measure with the lowest possible number of samples. Immediate applications
of these methods are the creation of contour maps and delineation of optimal spacing of field
samples. This paper seeks to provide a high level of detail about theoretical aspects and basic
concepts of geostatistics in a comprehensible format to the reader. As examples, data available
from the literature are used for applications of soil chemical properties. The data and geoestatistics
programs used in this paper are listed in appendices at the end of the paper.
ABSTRACT
I. INTRODUÇÃO
1. Variabilidade: preocupação antiga
2. Repetição e casualização: Fisher entra em cena
3. Das minas de ouro da África do Sul para Fontainebleau na França: nasce a geoestatística
4. Da mineração à Geologia, Dendrologia, Hidrologia e Ciência do Solo: e a moda pega
5. Os objetivos e as ressalvas
II. AS HIPÓTESES
1. Campo de estudo: o domínio e as definições básicas
2. Hipótese de estacionaridade de ordem 2
3. Hipótese intrínseca
4. Hipótese de tendência: krigagem universal
III. O SEMIVARIOGRAMA
1. A equação de cálculo
2. As características ideais
3. Os modelos
4. Os exemplos
IV. A KRIGAGEM
1. O estimador
2. As condições requeridas
3. A dedução do sistema de equações
4. Sistema matricial
5. Particularidades do sistema e métodos de solução
6. Os exemplos
V. O SEMIVARIOGRAMA CRUZADO
1. As definições pertinentes
2. A equação de cálculo
3. As características ideais
4. Os exemplos
VI. A CO-KRIGAGEM
1. O estimador
2. As condições requeridas
3. A dedução do sistema de equações
4. Sistema matricial
5. Os exemplos
X. CONCLUSÕES
XII. APÊNDICE
1. Listagem dos dados de Waynick & Sharp (1919)
Lista das figuras
1. Semivariograma típico.
2. Esquema de amostragem, onde os sinais "+" indicam posição onde amostras foram
coletadas.
3. Semivariogramas escalonados médios para C e N, para dados originais, nos dois locais.
4. Semivariogramas escalonados médios para C/N, para dados originais nos dois locais.
5. Semivariogramas mostrando o efeito da tendência: (a) carbono – Davis; (b) carbono –
Oakley; (c) nitrogênio – Davis; (d) nitrogênio - Oakley.
6. Semivariogramas para os resíduos de tendência, para os dois locais: (a) carbono, com
modelo esférico com parâmetros 0,4; 0,6 e 15,0: (b) nitrogênio, com modelo esférico com
parâmetros 0,0; 1,0 e 25,0.
7. Semivariograma escalonado médio para C/N - Davis, com modelo esférico com parâmetros
0,3; 0,7 e 25,0.
8. Mapa para carbono (%), Davis.
9. Mapa para carbono (%), Oakley.
10. Mapa para nitrogênio (%), Davis.
11. Mapa para nitrogênio (%), Oakley.
12. Semivariogramas escalonados médios para carbono versus nitrogênio, para Davis e Oakley,
com modelo gaussiano com parâmetros 0,0, 1,0 e 13,0.
13. Mapa para nitrogênio (%), Oakley, obtido por cokrigagem.
I. INTRODUÇÃO
3. Das minas de ouro da África do Sul para Fontainebleau na França: nasce a geoestatística
A geoestatística teve suas primeiras aplicações em mineração (Blais e Carlier, 1968; David,
1970; Ugarte, 1972; Journel, 1974; Olea, 1975, 1977), depois em hidrologia (Delhomme, 1976).
Já existem vários estudos em ciência do solo (Hajrasuliha et al., 1980; Burgess & Webster, 1980a
e 1980b; Webster & Burgess, 1980; Vieira et al., 1981; Vauclin et al., 1982; Vieira et al., 1983;
Nielsen et al., 1983; Vieira et al., 1987, Vieira et al., 1991; Vieira et al., 1992) e em sensoriamento
remoto (Vauclin et al., 1982; Vieira & Hatfield, 1984). Além disso, existem alguns livros tratando
do assunto, dentre os quais destacam-se David (1977) e Journel & Huijbregts (1978).
5. Os objetivos e as ressalvas
A variância de Z(xi) é
VAR {Z( xi )} = E {Z( xi ) Z( xi + 0) - m( xi ) m( xi + 0)} =
(3)
= E { Z 2 ( xi ) - m2 ( xi )} = C( xi ,xi )
e a variância de Z(xi+h) é
VAR {Z( xi + h)} = E { Z 2 ( xi + h) - m2 ( xi + h)} = C ( xi + h, xi + h) (4)
Assim, existem três hipóteses de estacionaridade de uma função aleatória Z(xi), e pelo
menos uma delas deve ser satisfeita antes de se fazer qualquer aplicação de geoestatística.
γ (h)
ρ(h) = 1-
C(0)
Portanto, se a hipótese de estacionaridade de ordem 2 puder ser satisfeita, a covariância C(h)
e o variograma 2γ(h) são ferramentas equivalentes para caracterizar a dependência espacial. A
existência de estacionaridade dá a oportunidade de repetir um experimento mesmo que as amostras
devam ser coletadas em pontos diferentes, porque todas são consideradas pertencentes a
populações com os mesmos momentos estatísticos.
3. Hipótese intrínseca
Nesta hipótese, a função aleatória Z(xi), para qualquer posição, xi, consiste de dois
componentes:
Z( xi ) = m( x i ) + e( x i ) (19)
onde m(xi) é o "drift" (tendência principal) e e(xi) é o erro residual. Portanto, para se trabalhar sob
esta hipótese é preciso, para cada posição xi, determinar o "drift", m(xi), e ter uma expressão para o
semivariograma dos resíduos (Webster & Burgess, 1980). Devido à arbitrariedade envolvida na
expressão do "drift" e do semivariograma dos resíduos, não será apresentado aqui nenhum
desenvolvimento teórico para krigagem universal. Trabalhos sobre este assunto podem ser
encontrados em Olea (1975 e 1977) e um exemplo de aplicação pode ser visto em Webster &
Burgess (1980). O leitor é encorajado a consultar essas literaturas para maiores informações.
Se uma função aleatória é estacionária de ordem k (k>0), ela também será estacionária de
todas as ordens menores que k. Consequentemente, se uma função aleatória Z(xi) é estacionária de
ordem 2, ela será também intrínseca. Entretanto, o contrário não é necessariamente verdade.
Não existe um método fácil para testar em qual tipo de estacionaridade os dados se
enquadram. O exame do semivariograma, como será visto a seguir, e um teste conhecido como
"jack-knifing", mostrado no capítulo IX deste trabalho, são as principais ferramentas utilizadas
para se conhecer indiretamente a estacionaridade dos dados.
III. O SEMIVARIOGRAMA
Até o início dos anos 60, a análise de dados era feita sob a hipótese de independência
estatística ou distribuição espacial aleatória, para permitir o uso de métodos estatísticos como
análise de variância e parâmetros como o coeficiente de variação (Harradine, 1949; Ball &
Williams, 1968). Entretanto, esse tipo de hipótese não pode simplesmente ser feito antes que se
prove a não existência de correlação de amostras com distância. Se provada a correlação espacial,
a hipótese de independência fracassa. Um dos métodos mais antigos de se estimar a dependência
no espaço ou no tempo de amostras vizinhas é pelo uso da autocorrelação. Esse método tem suas
origens em análise de séries temporais e tem sido largamente usado em ciência do solo (Webster,
1973; Webster & Cuanalo, 1975; Vieira et al., 1981), principalmente para medições efetuadas em
uma linha reta (transeto). A sua análise pode auxiliar na localização de divisas entre dois tipos de
solos, ou na análise de periodicidade nos dados, pela análise espectral (Vauclin et al. 1982).
Porém, quando as amostras forem coletadas nas duas dimensões do campo e interpolação entre
locais medidos for necessária para a construção de mapas de isolinhas, será preciso usar uma
ferramenta mais adequada para medir a dependência espacial. Essa ferramenta é o
semivariograma (Vieira et al., 1983).
1. A equação de cálculo
onde N(h) é o número de pares de valores medidos Z(xi), Z(xi+h), separados por um vetor h
(Journel & Huijbregts, 1978, pag. 12). O gráfico de γ*(h) versus os valores correspondentes de h,
chamado semivariograma, é uma função do vetor h, e portanto depende de ambos, magnitude e
direção de h. Quando o gráfico do semivariograma é idêntico para qualquer direção de h ele é
chamado isotrópico e representa uma situação bem mais simples do que quando é anisotrópico.
Neste último caso, o semivariograma deve sofrer transformações antes de ser usado. É importante
notar que a maioria das variáveis de ciência do solo poderá ter um comportamento anisotrópico,
isto é, mudar de maneira diferente para direções diferentes. É óbvio que isso depende muito da
propriedade em estudo, das dimensões do campo de estudo e do tipo de solo envolvido. Existem
algumas maneiras de se transformar um semivariograma anisotrópico em isotrópico (Journel &
Huijbregts, 1978, pag. 175; Burgess & Webster, 1980a). Em geral, a precisão da interpolação ou o
tipo de hipótese satisfeita não são afetados se, em vez de se preocupar com a escolha do método de
transformação da anisotropia, apenas se limitar a faixa de distância na qual se utiliza o
semivariograma. De qualquer maneira, é sempre aconselhável examinar semivariogramas para
várias direções, antes de tomar decisões. As principais direções que devem ser examinadas são: 0°
- na direção do eixo X, 90° - na direção do eixo Y, 45° e - 45° - nas duas diagonais. O método
"jack-knifing", descrito no capítulo IX, é também de grande utilidade para se determinar a faixa de
distância na qual o semivariograma pode ser, na prática, considerado isotrópico.
De qualquer maneira, sob isotropia ou não, a equação (21) é a que é usada para o cálculo do
semivariograma. Os programas de computador, como aqueles listados no apêndice 2, utilizados
para calcular o semivariograma, simplesmente calculam aquela equação. Quando os dados forem
coletados em transeto, o semivariograma é unidirecional e nada pode ser dito a respeito de
anisotropia, mas por outro lado é uma preocupação a menos.
2. As características ideais
3.Os modelos
a) Modelo linear:
C1
γ (h) = C0 + h 0 <h<a
a
(22)
γ (h) = C0 + C1 h>a
onde C1/a é o coeficiente angular para 0<h<a. Nesse modelo, o patamar é determinado por
inspeção; o coeficiente angular, C1/a, é determinado pela inclinação da reta que passa pelos
primeiros pontos de γ(h), dando-se maior peso àqueles que correspondem ao maior número de
pares; o efeito pepita, C0, é determinado pela interseção da reta no eixo γ(h); o alcance, a, é o valor
de h correspondente ao cruzamento da reta inicial com o patamar; e C1 = patamar - C0.
b) Modelo esférico:
3 h 1 h 3
γ (h) = C0 + C1 [ ( ) - ( ) ] 0<h<a
2 a 2 a
(23)
γ (h) = C0 + C1 h>a
O modelo esférico é obtido selecionando-se os valores do efeito pepita, C0, e do patamar, C0 + C1,
depois passando-se uma reta que intercepte o eixo y em C0 e seja tangente aos primeiros pontos
próximos de h=0. Essa reta cruzará o patamar à distância, a'=2/3 a. Assim, o alcance, a, será
a=3a'/2. O modelo esférico é linear até aproximadamente 1/3 a.
c) Modelo exponencial:
h
γ (h) = C0 + C1 [1- exp(-3 )] 0<h<d (24)
a
onde d é a máxima distância na qual o semivariograma é definido. Uma diferença fundamental
entre o modelo exponencial e o esférico é que o exponencial atinge o patamar apenas
assintóticamente, enquanto que o modelo esférico o atinge no valor do alcance. O parâmetro a é
determinado visualmente como a distância após a qual o semivariograma se estabiliza. Os
parâmetros C0 e C1 para os modelos exponencial e gaussiano (explicado a seguir) são
determinados da mesma maneira que para o esférico.
d) Modelo gaussiano:
h 2
γ (h) = C0 + C1 [1- exp(-3 ( ) )] 0 <h<d (25)
a
Esses modelos correspondem a fenômenos que têm uma capacidade infinita de dispersão e,
por isso, não têm variância finita e a covariância não pode ser definida. Podem ser escritos da
seguinte maneira :
γ (h) = C + Ah B 0< B<2 (26)
O parâmetro B tem que ser estritamente maior que zero e menor que 2, a fim de garantir que
o semivariograma tenha positividade definida condicional.
Alguns fenômenos podem ter semivariogramas que mostram estrutura entrelaçada, ou seja,
mais de um patamar e mais de um alcance. Isso acontece quando se tem diferentes escalas de
variabilidade nos dados. McBratney et al. (1982), analisando a variabilidade de teores de cobre e
cobalto extraídos de amostras retiradas da superfície do solo do sudoeste da Escócia, encontraram
três estruturas: uma correspondente à variação de uma fazenda a outra, com alcance de 3 km, uma
correspondente à escala geológica, com alcance de 15 km, e a última espacialmente independente,
ou efeito pepita puro.
Em situações como essa é necessário ajustar mais de um modelo, ou um modelo para cada
estrutura, pois um modelo único não é suficiente para representar o semivariograma.
4. Os exemplos
Dois conjuntos de dados obtidos por Waynick e Sharp (1919) serão utilizados neste trabalho
como exemplo. A figura 2 mostra o diagrama das áreas amostradas, com os locais de onde as
amostras foram tomadas. Os autores esclarecem que os campos foram amostrados na forma
apresentada na figura 2, com a finalidade de verificar o efeito da distância entre amostras na
variabilidade. Dois campos foram amostrados no Estado da Califórnia, EUA. Um, na então
chamada Fazenda Universitária em Davis, em solo franco argiloso, e o outro, perto da cidade de
Oakley, em solo arenoso. Os campos foram selecionados por parecerem uniformes e porque se
encontravam sem vegetação na época da amostragem. Ambos eram quase perfeitamente planos.
As amostras foram coletadas com um trado de 7,62cm de diâmetro e levadas ao laboratório para
análise de nitrogênio e carbono totais. Os resultados são dados em porcentagem. Os dados
originais estão listados no apêndice 1 e os principais momentos estatísticos estão no quadro 1.
Os coeficientes de simetria e curtose são apresentados no quadro 1, para comparação com a
distribuição normal, para a qual esses coeficientes têm valores 0 e 3 respectivamente. Não é
intenção, neste trabalho, procurar a distribuição exata das variáveis estudadas. Entretanto, é
importante notar que, exceto para nitrogênio-Davis, as demais variáveis têm distribuição diferente
da normal. Isso pode ser visto principalmente pelos altos coeficientes de curtose, indicando um
excesso de valores próximos à média. Outro fato notável é a baixíssima variância.
Com a finalidade de comparar os semivariogramas e, conseqüentemente, as variabilidades
espaciais de cada uma das variáveis, pode-se realizar do seu escalonamento, como o utilizado por
Vieira et al. (1991).
Os semivariogramas escalonados médios para as quatro variáveis (C e N nos dois locais)
estão mostrados na figura 3. É chamado de semivariograma médio porque a direção dos vetores h
não é considerada e, implicitamente, assume-se isotropia, ou seja, variabilidade idêntica em todas
as direções. Esse deve ser o procedimento adotado como rotina, pois é inútil explorar a
anisotropia quando não existe dependência espacial na média. Após o exame dos
semivariogramas médios, se a dependência espacial for encontrada, então deve-se examinar os
semivariogramas direcionais. O exame dos semivariogramas da figura 3 revela alguns fatos
importantes. Deduz-se que a variabilidade espacial das duas variáveis (carbono e nitrogênio), nos
dois locais (Davis e Oakley), têm alguma semelhança. Em geral, pode-se notar também que as
duas variáveis têm semivariâncias maiores no solo arenoso de Oakley do que no solo franco
argiloso de Davis. Um outro fato bastante importante é que nenhum desses semivariogramas tem
patamar bem definido, denotando a falta de estacionaridade nestes dados.
Os semivariogramas para as relações C/N para os dois locais estão na figura 4, onde se
observa que, para Oakley, não existe dependência espacial para esta variável e, para Davis, a
dependência espacial é pequena, como se pode notar pelo alto valor do efeito pepita em relação ao
patamar. Assim, para Oakley, os valores da relação C/N não tem nenhuma relação com seus
vizinhos, isto é, valores próximos não são necessariamente mais parecidos entre si do que valores
distantes. Nesse caso, o valor médio pode representar o fenômeno.
Devido à aparente falta de estacionaridade para carbono e nitrogênio para os dois locais,
como indicado na figura 3, devem ser calculadas as superfícies parabólicas de tendências de
acordo com Davis (1973), usando a equação,
2
Z est (x, y) = A0 + A1 .x + A2 . y + A3 .x 2 + A4 . y + A5 .xy (27)
pelo método dos quadrados mínimos.
Dessa maneira, pode-se calcular o resíduo
Z res (x, y) = Z(x, y) - Z est (x, y) (28)
Os semivariogramas da variável Zres devem ter patamar indicando que o procedimento para
remoção da tendência foi eficiente. Os semivariogramas resultantes dos resíduos da tendência
para carbono e nitrogênio para os dois locais, estão mostrados na figura 5. De seu exame pode-se
deduzir que a maior tendência existia, na realidade, para os dados relativos ao solo de Davis, pois
nas figuras 5a e 5c pode-se ver que os semivariogramas para Zres têm um patamar bem definido,
quando antes não o tinham. Por outro lado, para o solo de Oakley, os semivariogramas para Z e
Zres são quase idênticos, indicando que não havia tendência retirável pela superfície parabólica.
Nesse caso, pode-se usar os dados originais sem problema; porém, para dar condições iguais aos
de Davis, quando escalonados, os resíduos serão usados
A figura 6 mostra os semivariogramas para os resíduos de tendência para carbono e
nitrogênio de ambos os solos. É notável tanto o efeito da remoção da tendência, estabelecendo
nitidamente o patamar, como também a semelhança nas variabilidades de carbono para os dois
locais e de nitrogênio para os dois locais . O carbono apresenta uma variabilidade inicial maior do
que o nitrogênio, como indica o valor do efeito pepita (0,4). Já o nitrogênio tem efeito pepita nulo
em ambos os solos. Pela semelhança entre esses semivariogramas escalonados, pode-se dizer que,
apesar das diferenças básicas de textura dos dois solos, os fenômenos que regeram a concentração
desses elementos no solo foram parecidos, fazendo com que suas variabilidades fossem parecidas.
É provável que o efeito climático ao longo dos anos tenha sido o maior responsável por estas
concentrações, uma vez que os locais amostrados estavam livres de vegetação na época da
amostragem.
O semivariograma para a relação C/N para Davis está na figura 7, com um modelo esférico
(Esf), com 0,3 de efeito pepita, 1,0 de patamar e 25,0 m de alcance. A relação C/N não apresenta
uma dependência espacial muito boa, implicando alta incerteza na estimativa pela krigagem,
devido à alta variação ao acaso em distâncias pequenas, mas não se pode negar que ela existe.
IV. A KRIGAGEM
1. O estimador
Suponha-se que se queira estimar valores, z*, para qualquer local, x0, onde não se tem
valores medidos, e que a estimativa deve ser uma combinação linear dos valores medidos, ou seja
N
z * ( x0 ) = ∑ λ i z ( x i ) (29)
i=1
2. As condições requeridas
Para que o estimador seja ótimo, ele não pode ser tendencioso e deve ter variância
mínima. Matematicamente,
E {Z * ( x0 ) - Z( x0 )} = 0 (31)
e
VAR {Z * ( x0 ) - Z( x0 )} = E {[Z * ( x0 ) - Z( x0 )] 2 } = mínima (32)
As equações (31) e (32) representam as condições de não-tendência e de variância
mínima, respectivamente. Essas duas condições devem ser rigorosamente satisfeitas e, para
tanto, são usadas como ponto de partida para a dedução das equações. A condição de não-
tendência significa que, em média, a diferença entre valores estimados e medidos para o mesmo
ponto deve ser nula. A condição de variância mínima significa que, embora possam existir
diferenças ponto por ponto entre o valor estimado e o medido, essas diferenças devem ser
mínimas.
À primeira vista, pode parecer estranho quando se fala em diferenças entre valor
estimado e medido, quando o propósito da krigagem é justamente estimar valores para locais onde
estes não foram medidos. Porém, as condições impostas nas equações (31) e (32) são feitas tendo-
se em mente o que poderia acontecer se o valor naquele ponto fosse conhecido. Em outras
palavras, o objetivo é que a estimativa represente, o melhor possível, o que seria o valor medido
para aquele local. Na verdade, essas duas condições e o raciocínio anterior constituem o princípio
básico do "jack-knifing", que será discutido no capítulo IX deste trabalho.
∑ λ - 1= 0
i=1
i
ou seja,
∑λ = 1
N
i
i=1
(36)
Portanto, para que a estimativa não tenha tendência, é necessário que a soma dos pesos
seja igual a 1, qualquer que seja a distribuição de seus valores. Desenvolvendo a equação (32) e
chamando-a de σ2kZ(x0), variância da estimativa, tem-se:
σ 2 K Z* ( x0 ) = E { Z* ( x0 ) - Z( x0 ) } =
2
(37)
2
= E { Z* ( x0 )+ Z 2 ( x0 ) - 2 Z* ( x0 ) Z( x0 )}
Cada termo do lado direito da equação (37) será individualmente desenvolvido a seguir.
Substituindo-se a equação (30), no primeiro termo,
2 N
E { Z* ( x0 )} = E {( ∑ λ i Z( xi ) )2 } (38)
i=1
Aplicando-se propriedades de operações com álgebra linear tem-se:
2 N N
E { Z* ( x 0 )} = E { ∑ λ i Z( x i ) ∑ λ j Z( x j )}
i= 1 j= i
N N
(39)
= E { ∑ λ i ∑ λ j Z( x i ) Z( x j )}
i= 1 j= 1
N N
= ∑ ∑ λ i λ j E {Z( x i ) Z( x j )}
i= 1 j = 1
A equação (6)
C(h) = E{Z( xi )Z( xi + h)} - m2 pode ser reordenada para
∑∑ λ i λ j C( xi ,x j ) + m2
2
E { Z* ( x0 )} = (41)
i=1 j=1
onde C(xi, xj) refere-se à função covariância correspondente a um vetor h, com origem em xi e
extremidade em xj.
O segundo termo no lado direito da equação (37) é:
E { Z 2 ( x0 )} = E {Z( x0 )Z( x0 + 0)} (42)
Substituindo a equação (40) na equação (42) para o valor apropriado de h tem-se:
E { Z 2 ( x0 )} = C(0) + m2 (43)
N
- 2 ( ∑ λ i C( xi , x0 ) + m2 )
i=1
ou simplificando:
N N
σ 2k Z( x0 ) = ∑ ∑ λ i λ j C( xi , x j ) + C(0)
i=1 j=1
(46)
N
- 2 [ ∑ λ i C( xi , x0 )]
i=1
A equação (46) deve ser minimizada sob a restrição de que
N
∑ λi = 1
i=1
Esse processo de minimização pode ser feito pelas técnicas de Lagrange, as quais podem
ser encontradas em livros de cálculo avançado. Para satisfazer a condição expressa na equação
(32), é preciso que as N derivadas parciais
N
∂ ( σ 2k ( x0 ) - 2 µ ∑ λ 1 ) / ∂ λ i (47)
i=1
sejam igualadas a 0 (zero); µ é um multiplicador de Lagrange. Assim, se a derivada parcial
expressa na equação (47) for efetuada obtém-se,
N
2 ∑ λ i C( xi , x j ) - 2C( xi , x0 ) - 2 µ = 0 (48)
i=1
Cancelando o fator 2, rearranjando e combinando com a equação (36), tem-se o sistema
de krigagem expresso em termos de função covariância:
N
∑ λ j C( xi , x j ) - µ = C( xi , x0 ), i = 1 a N
j=1
(49)
N
∑ λ j=1
j=1
As primeiras N equações no sistema (49) podem ser rearranjadas em:
N
∑ λ j C( xi , x j ) = µ + C( xi , x0 ) (50)
j=1
Substituindo a equação (50) na equação (46), tem-se:
N N
2
σ k Z( x0 ) = ∑ λ i ( µ + C( xi , x0 )) + C(0) - 2 ∑ λ i C( xi , x0 )
i=1 i=1
N N
2
σ k Z( x0 ) = C(0)+ µ + ∑ λ i C( xi , x0 ) - 2 ∑ λ i C( xi , x0 ) (51)
i=1 i=1
N
2
σ k Z( x0 ) = C(0)+ µ - ∑ λ i C( xi , x0 )
i=1
A equação (51) é expressão da variância mínima da estimativa. Quando a estacionaridade
de ordem 2 puder ser aceita, o sistema krigagem (49) e a variância da estimativa expressa na
equação (51) podem ser escritos ambos na forma de função covariância, C(h), ou de
semivariograma, γ(h). Existem algumas vantagens computacionais em se usar covariância, que
serão discutidas no final deste capítulo.
Entretanto, se a hipótese intrínseca for o máximo que se puder assumir, então, obrigatoriamente,
tem-se que usar o semivariograma, γ(h), nas equações (50) e (51). A transformação do sistema de
krigagem (49) e da variância da estimativa (51), em termos de semivariograma, pode ser feita
através da equação (13), substituindo-se C(h) por C(0) - γ(h).
Assim, o sistema de krigagem fica:
N
∑ λ j γ ( xi , x j )+ µ = γ ( xi , x0 ), i = 1 a N
j=1
(52)
N
∑ λ j=1
j=1
e a variância da estimativa, σ2k Z(x0), fica
N
σ 2k Z( x0 ) = µ + ∑ λ i γ ( xi , x0 ) (53)
i=1
Os sistemas (49) e (52) contêm N+1 equações e N+1 incógnitas, e uma única solução
produz N pesos, λ, e um multiplicador de Lagrange, µ.
4. Sistema matricial
O sistema de krigagem da equação (49) pode ser escrito em notação matricial como
[C] [ λ ] = [b] (54)
ou, quando se usa semivariograma,
[ γ ] [ λ ] = [b] (55)
cujas soluções são
[ λ ] = [C ] [b]
-1
(56)
ou
[ λ ] = [ γ ] [b]
-1
(57)
onde, [C] é a matriz covariância, [γ] é a matriz semivariância, [C]-1 e [γ]-1 são seus inversos,
respectivamente, [λ] é a matriz dos pesos procurados λi, e [b] é o lado direito das equações (49) ou
(52), quando se usa C(h) ou γ(h), respectivamente.
As equações (51) e (53), da variância da estimativa, podem ser expressas em notação
matricial, como
o k Z( x0 ) = C(0) - [ λ ] [b]
2 t
(58)
ou
o k Z( x0 ) = [ λ ] [b]
2 t
(59)
respectivamente, quando se usa C(h) ou γ(h). A matriz [λ]t é o transposto da matriz [λ].
Suponha que N=4. Então as matrizes [C] e [γ] são matrizes 5x5 e podem ser, explicitamente,
escritas como
⎡ C( x1 , x1 ) C( x1 , x 2 ) C( x1 , x 3 ) C( x1 , x 4 ) 1⎤
⎢ ⎥
⎢C( x 2 , x1 ) C( x 2 , x 2 ) C( x 2 , x 3 ) C( x 2 , x 4 ) 1⎥
⎢ ⎥
[C] = ⎢C( x 3 , x1 ) C( x 3 , x 2 ) C( x 3 , x 3 ) C( x 3 , x 4 ) 1⎥ (60)
⎢ ⎥
⎢C( x 4 , x1 ) C( x 4 , x 2 ) C( x 4 , x 3 ) C( x 4 , x 4 ) 1⎥
⎢ ⎥
⎣ 1 1 1 1 0⎦
ou
⎡γ ( x1 , x1 ) γ ( x1 , x 2 ) γ ( x1 , x 3 ) γ ( x1 , x 4 ) 1⎤
⎢ ⎥
⎢γ ( x 2 , x1 ) γ ( x 2 , x 2 ) γ ( x 2 , x 3 ) γ ( x 2 , x 4 ) 1⎥
⎢ ⎥
[ γ ] = ⎢γ ( x 3 , x1 ) γ ( x 3 , x 2 ) γ ( x 3 , x 3 ) γ ( x 3 , x 4 ) 1⎥ (61)
⎢ ⎥
⎢γ ( x 4 , x1 ) γ ( x 4 , x 2 ) γ ( x 4 , x 3 ) γ ( x 4 , x 4 ) 1⎥
⎢ ⎥
⎣ 1 1 1 1 0⎦
A matriz de lâmbdas [λ] pode ser escrita como
⎡ λ1 ⎤
⎢ ⎥
⎢λ2 ⎥
[ λ ] = ⎢ λ3 ⎥ (62)
⎢ ⎥
⎢ λ4 ⎥
⎢⎣- µ ⎥⎦
ou
⎡λ 1⎤
⎢ ⎥
⎢λ 2 ⎥
[ λ ] = ⎢λ 3 ⎥ (63)
⎢ ⎥
⎢λ 4 ⎥
⎢⎣ µ ⎥⎦
E a matriz do lado direito dos sistemas de krigeagem pode ser escrita como,
⎡C( x1 , x0 )⎤
⎢C( , )⎥
⎢ x 2 x0 ⎥
[b] = ⎢C( x 3 , x0 )⎥ (64)
⎢ ⎥
⎢C( x 4 , x0 )⎥
⎢⎣ 0 ⎥⎦
ou
⎡γ ( x1 , x0 )⎤
⎢γ ( , )⎥
⎢ x 2 x0 ⎥
[b] = ⎢γ ( x 3 , x0 )⎥ (65)
⎢ ⎥
⎢γ ( x 4 , x0 )⎥
⎢⎣ 0 ⎥⎦
Os sistemas de krigagem das equações (49) e (52) têm algumas particularidades que
facilitam grandemente os cálculos e a solução do sistema e mesmo a análise de esquemas de
amostragem. É preciso lembrar que, para cada estimativa ou interpolação efetuada, ter-se-á um
sistema de equações de krigagem para o qual ter-se-á que achar a solução. Essa operação é a que
envolve o maior tempo de processamento de computador, e quando esse tempo é pago, é a
operação que envolve os maiores custos. Por isto, é imprescindível que se faça uso das
particularidades do sistema de krigagem para aumentar eficiência, precisão e velocidade e diminuir
custo de estimativa. Primeiramente serão examinadas as particularidades da matriz de coeficientes,
ou seja, as matrizes covariância ou semivariograma, expressas em (60) e (61) para o caso
particular de N=4.
Tanto as funções covariância, C(h), ou semivariograma, γ(h), são simétricas ao redor de
zero (0). Isso significa que C(h)=C(-h) e γ(h)=γ(-h). Isso faz com que as matrizes (60) e (61)
sejam simétricas, isto é, a parte que fica acima da diagonal principal é exatamente igual à parte
que fica abaixo dela, porque C(x1, x3) = C(x3, x1) ou γ(x1, x3) = γ(x3, x1).
Uma outra particularidade importante é a diagonal principal, a qual deve ser preenchida
com valores de C(h) ou γ(h), correspondentes a vetores nulos, isto é, para h=0. Isso faz com que a
diagonal principal para a matriz (60) tenha valores máximos e iguais a C(0) e para a matriz (61)
tenha zeros (0). Isso acontece porque C(0) é o máximo valor da função covariância e é igual ao
patamar do semivariograma, e γ(0)=0 qualquer que seja o efeito pepita, C(0). Esta afirmação pode
parecer estranha, mas o que deve ser mantido é que γ(0)=0, e γ(e) = C(0) (efeito pepita), onde e é a
menor distância entre amostras.
Existem vários métodos de solução de sistemas lineares de equação como o do sistema de
krigagem (Burden et al., 1978, pag. 299 a 361), como também existem métodos mais eficientes
que levam em conta as particularidades das matrizes (Journel e Huijbregts, 1978, pag. 357 a 360).
O método mais comum seria o de inverter a matriz de coeficientes, (60) ou (61), e multiplicar do
lado direito. Porém esse é também o método mais demorado em termos de tempo de
processamento e o que envolve o maior número de operações de multiplicação/divisão e
soma/subtração e, por isso, é também o que apresenta a maior propagação de erros. O método de
eliminação Gaussiana envolve um número bastante menor de operações e, por isso mesmo, é mais
rápido e mais preciso. Esse método procura, primeiramente, o elemento chamado pivô, o qual é o
valor máximo encontrado em cada coluna da matriz. Desse modo, se for usada a covariância,
C(h), no sistema de krigagem, poder-se-á eliminar essa operação de procura do pivô, pois na
matriz de covariância (60) a diagonal sempre vai conter o elemento máximo. Quanto à ressalva
de estacionaridade de ordem 2 e conseqüente existência de covariância finita, Journel &
Huijbregts, (1978, pag. 357) recomendam que se pode definir uma função pseudocovariância
C(h)=A - γ(h), onde A é uma constante maior que qualquer γ(h) usado no sistema. Devido à
condição de não tendência, (Σλi=1), o valor A será eliminado do sistema da krigagem, e esta
operação não altera os valores dos pesos calculados na solução.
6. Os exemplos
Uma vez que existe uma distância bastante grande entre os pontos medidos, com alguns
pontos mais próximos (Figura 2), é desejável fazer estimativas para os locais não medidos, para
construção de mapas. Além disso, graças à existência de dependência espacial, expressa pelos
semivariogramas da Figura 6, pode-se utilizar krigagem para efetuar as estimativas. Dessa
maneira, foram estimados valores para cada ponto localizado na grade quadrada de 1,52m,
regularizando assim a distância de separação entre amostras em todo o campo. Usando-se esses
dados para cada uma das variáveis, construíram-se os mapas de isolinhas para cada uma das
variáveis, mostrados nas Figuras 8, 9, 10 e 11. Com esses mapas pode-se ver agora, por exemplo,
porque o carbono e nitrogênio para o solo de Davis têm semivariogramas parecidos, pois variam
de maneiras muito semelhantes. Isso pode ser observado nas figuras 8 e 9, respectivamente para
carbono e nitrogênio para o solo de Davis, onde, para quase todas situações de máximo ou de
mínimo para carbono, corresponde uma situação igual para nitrogênio. Outro fato notório nas
Figuras 8 e 9 é a tendência de crescimento na direção y, o que confirma a tendência encontrada.
V. O SEMIVARIOGRAMA CRUZADO
1. As definições pertinentes
2. A equação de cálculo
3. As características ideais
4. Os exemplos
Os semivariogramas cruzados para carbono vs. nitrogênio estão na figura 12, para Davis
e Oakley. Ambos são razoavelmente descritos por um modelo Gaussiano único, portanto ambos
com patamares positivos e escalonados, com alcance de 13,0m.
O exame dos porquês da correlação entre carbono e nitrogênio nesses dois solos está
além dos objetivos deste trabalho e não será considerado aqui. Entretanto, o formato do
semivariograma cruzado revela que a correlação espacial entre as duas variáveis é semelhante nos
dois solos. Suponha-se, então, que seja mais fácil e mais barato medir carbono do que nitrogênio.
Nesse caso, o nitrogênio não precisa ser amostrado na mesma intensidade que o carbono, pois
pode-se usar a dependência espacial entre eles para estimar o teor de nitrogênio. Essa
possibilidade, juntamente com suas vantagens, será examinada no capítulo VI.
VI - A CO-KRIGAGEM
1. O estimador
Suponha que se queira estimar valores, Z2*, para qualquer local, x0, e que a estimativa
deva ser uma combinação linear de ambos Z1 e Z2, ou seja
N1 N2
z 2 ( x0 ) = ∑ λ 1i z1 ( x1i ) + ∑ λ 2j z 2 ( x2j )
*
(76)
i=1 i=1
A equação (77) então expressa que a estimativa da variável Z2 deverá ser uma
combinação linear de ambos Z1 e Z2, com os pesos λ1 e λ2 distribuídos de acordo com a
dependência espacial de cada uma das variáveis entre si e com a correlação cruzada entre elas.
2. As condições requeridas
Para que o estimador seja ótimo, ele não pode ter tendência e tem que ter variância
mínima. Em outras palavras, para que o estimador seja o melhor possível é necessário que ele não
superestime nem subestime valores, e que a confiança nas estimativas seja máxima.
Matematicamente, isso pode ser escrito:
E { Z *2 ( x0 ) - Z 2 ( x0 )} = 0 (78)
e
VAR { Z *2 ( x0 ) - Z 2 ( x0 )} = E {[ Z *2 ( x0 ) - Z 2 ( x0 ) ] 2 } = mínima (79)
Essas duas condições devem ser rigorosamente satisfeitas e para isso são usadas como
ponto de partida para a dedução das equações, a exemplo do que já foi dito para a estimativa com
a krigagem. É importante notar que, apesar de a estimativa ser feita usando-se uma combinação
das duas variáveis (equação (77)), as condições (78) e (79) são impostas na variável estimada.
- E { Z 2 ( x 0 )} = 0
ou
N1 N2
m1 ∑ λ 1i + m2 ( ∑ λ 2j - 1) = 0 (80)
i =1 j =1
Uma vez que não se pode, necessariamente, exigir que m1 e m2 sejam nulos, para
satisfazer a equação (80) e, por conseguinte, para que a estimativa não tenha tendência, é
necessário que
N2
∑ λ 2j = 1 (81)
j=1
N1
∑ λ 1i = 0 (82)
i=1
Desse modo, para que a estimativa não tenha tendência, qualquer que seja a distribuição
dos pesos, a soma daqueles associados com a variável estimada deve ser igual a 1 e a soma
daqueles associadas à outra variável tem que ser nula. Essas duas condições serão usadas como
restrição na etapa seguinte.
Desenvolvendo-se o quadrado na equação (79), chamando-o de σ2k2(x0), tem-se
σ 2 K ( x0 ) = E {[ Z *2 ( x0 ) - Z 2 ( x0 ) ] } = E { Z *2 ( x0 ) + Z 22 ( x0 ) -
2
2
(83)
- Z *2 ( x0 ) Z 2 ( x0 ) - Z 2 ( x0 ) Z *2 ( x0 )}
Aplicando a linearidade do operador E, tem-se:
σ 2 K ( x0 ) = E { Z *2 ( x0 )} + E{ Z 22 ( x0 )} - E { Z *2 ( x0 ) Z 2 ( x0 )} -
2
(84)
- E { Z 2 ( x0 ) Z *2 ( x0 )}
Chamando os termos do lado direito da equação (84) de A, B, C e D, tem-se:
σ 2 K ( x0 ) = A + B - C - D
2
(85)
(88)
+ ∑ λ 2j Z 2 ( x 2j ) ∑ λ 1k Z 1 ( x1k ) + ∑ λ 2j Z 2 ( x 2j ) ∑ λ 2l Z 2 ( x 2l )}
j k j l
+ ∑ ∑ λ 2j λ 1k E { Z 2 ( x 2j ) Z 1 ( xik )} + ∑ ∑ λ 2j λ 2l E { Z 2 ( x 2j ) Z 2 ( x2l )}
j k j l
+ ∑∑ λ 2j λ 1k C 21 ( x 2j ,x1k )+ ∑∑ λ 2j λ 2l C 22 ( x 2j ,x 2l ) + m22
j k j l
C = E {[ ∑ λ 1k Z 1 ( x1k ) + ∑ λ 2i Z 2 ( x 2i )] Z 2 ( x0 )}
k i
C = ∑ λ 1k E { Z 1 ( x1k ) Z 2 ( x0 )} + ∑ λ 2i E{ Z 2 ( x 2i ) Z 2 ( x0 )} (95)
k i
C = ∑ λ ( C ( x ,x ) +
k
1k 12 1k 0 m1 m2 ) + ∑ λ ( C ( x ,x ) +
i
2i 22 2i 0 m22 ) (96)
C = ∑ λ 1k C 12 ( x1k , x0 ) + m1 m2 ∑ λ 1k + ∑ λ 2i C 22 ( x 2i , x0 ) +
k k i
(97)
+ m22 ∑ λ 2i
i
Aplicando as condições (81) e (82) nos termos constantes na equação (97) fica:
C = ∑λ k
1k C12 ( x1k ,x0 ) + ∑λ i
2i C 22 ( x 2i ,x0 )+ m22 (98)
D = ∑ λ 1k E { Z 2 ( x0 ) Z 1 ( x1k )} + ∑ λ 2i E { Z 2 ( x0 ) Z 2 ( x 2i )} (100)
k i
D = ∑ λ 1k C 21 ( x0 , x1k ) + m2 m1 ∑ λ 1k + ∑ λ 2i C 22 ( x0 , x 2i + m22 ) +
k k i
(101)
+ m22 ∑ λ 2i
i
+ ∑∑ λ j k
2j λ 1k C 21 ( x 2j ,x1k )+ ∑∑ λ 2j λ 2l C 22 ( x 2j ,x 2l )+ m22 +
j l
(103)
+ C 22 (0)+ m - ∑ λ 1k C12 ( x1k ,x0 ) - ∑ λ 2i C 22 ( x 2i ,x0 ) -
2
2
k i
Cancelando os m22 e lembrando que C(h) = C(-h) e Ck'k(h) = Ckk'(h), a equação (103)
pode ser reescrita como:
σ 2 k2 ( x0 ) = ∑ ∑ λ 1i λ 1k C 11 ( x1i , x1k ) + ∑ ∑ λ 1i λ 2l C 12 ( x1i , x2l ) +
i k i l
+ ∑ ∑ λ 2j λ 1k C 21 ( x 2j , x1k ) + ∑ ∑ λ 2j λ 2l C 22 ( x 2 j , x 2l ) − (104)
j k j l
- 2 ∑ λ 1k C 12 ( x1k , x0 ) - 2 ∑ λ 2i C 22 ( x 2i , x0 ) + C 22 (0)
k i
e por
∂ ( σ 2k2 ( x0 ) - 2 µ 1 ∑ λ 1k )/ ∂ 1k = 0 (106)
k
(107)
∑λ j
2j C 21 ( x 2j ,x1k ) - 2 C12 ( x1k ,x0 ) - 2 µ 1 = 0
Lembrando-se que Ck'k(h) = Ckk'(h) e substituindo o subíndice "l" por "j", a equação (107)
torna-se:
2∑ λ1i C11 ( x1i , x1k ) + 2∑ λ 2 j C12 ( x1i , x 2 j ) − 2C12 ( x1k , x0 ) − 2 µ 1 = 0 (108)
i j
Cancelando o fator 2 e rearranjando tem-se:
∑ λ 1i C11 ( x1i ,x1k )+ ∑ λ 2j C12 ( x1k ,x2j ) - µ1 = C12 ( x1k ,x0 )
i j
(109)
∑λ
i
1i C 12 ( x 1i , x 2i )+ ∑ λ 2j C 22 ( x 2j , x 2i ) - µ 2 = C 22 ( x 2i , x 0 )
j
∑ λ 1l C 12 ( x1l , x 2l ) + ∑ λ 2k C 22 ( x 2k , x 2k ) - µ 2 = C 22 ( x 2l , x0 ) (110)
l k
Combinando as equações (81), (82), (109) e (110) resulta no sistema de equações da co-
krigagem(111):
N1 N2
= C 22 ( x 2l , x0 ), l = 1,... N 2
(111)
N1
∑ λ 1i = 0
i=1
N2
∑ λ 2j = 1
j=1
= γ 12 ( x1k , x0 ), k = 1,... N 1
N1 N2
∑ λ 1i γ 12 ( x1i , x2l ) + ∑ λ 2j γ 22 ( x2j , x2l ) - µ 2 =
i=1 j=1
= γ 22 ( x 2l , x0 ), l = 1,... N 2
(113)
N1
∑ λ 1i = 0
i=1
N2
∑ λ 2j = 1
j=1
4. Sistema Matricial
O sistema de co-krigagem da equação (113) pode ser escrito em notação matricial como:
[ λ ] [ γ ] = [b] (115)
cuja solução é:
[ λ ] = [ γ ] [b]
-1
(116)
onde [γ]-1 é o inverso da matriz de coeficientes [γ], [λ] é a matriz dos pesos procurados, λ1i e λ2j, e
[b] é o lado direito da equação (113).
A variância da estimativa, por sua vez, pode ser escrita como:
σ 2k ( x0 ) = [ λ ] [b]
t
2
(117)
5. Os exemplos
Como foi visto acima, para que se possam efetuar estimativas de valores para os locais
não medidos através da co-krigagem, é necessário que exista dependência espacial para cada uma
das variáveis envolvidas e também a dependência espacial cruzada entre elas. Neste exemplo, a
variável nitrogênio Oakley será usada para ser estimada, usando os valores de carbono como
variável associada. Para tanto, é necessário que existam: dependência espacial para nitrogênio-
Oakley; para carbono- Oakley; e também a dependência espacial cruzada para carbono-Oakley e
nitrogênio-Oakley. A dependência espacial para carbono-Oakley está mostrada no semivariograma
da figura 6a com o modelo esférico, Esf(0,4; 0,6; 15). Para nitrogênio-Oakley o modelo é o
esférico Esf(0; 1,0; 25), como mostra a figura 6b. A dependência espacial cruzada entre carbono-
Oakley e nitrogênio-Oakley está mostrada no semivariograma cruzado da figura 12, com um
modelo gaussiano, Gau(0; 1,0; 13). A co-krigagem foi efetuada usando o mesmo reticulado já
utilizado para a krigagem, para fins de comparação. O resultado é o mapa de isolinhas mostrado
na figura 13. Comparando-se o mapa para nitrogênio Oakley obtido com o uso dos valores
estimados pela co-krigagem, mostrado na figura 13, com aquele obtido através da krigagem
simples, mostrado na figura 11, nota-se que não existe uma grande diferença entre eles. Isso
significa que, não houve ganho no uso de co-krigagem em relação à krigagem simples, ou a
dependência espacial do nitrogênio Oakley expressa pelo semivariograma da figura 6b é tão forte
que mascara o efeito do carbono Oakley tanto no semivariograma cruzado carbono versus
nitrogênio Oakley (figura 12) como também no mapa mostrado na figura 13. Nesse sentido, é
supérfluo e desnecessário usar a co-krigagem. A vantagem do uso da co-krigagem existiria se, por
exemplo, a variável a ser estimada tivesse uma menor densidade de amostragem do que a variável
associada, o que não é o caso do exemplo aqui utilizado.
VII - A VARIÂNCIA DA ESTIMATIVA
1. Significado
2. Utilidade
Uma vez que esta é uma variância, pode-se naturalmente comparar com a variância dos
dados medidos. Assim, quanto menor for o efeito pepita do semivariograma, menor será a
variância da estimativa. Mais precisamente, quanto menor for a proporção do efeito pepita em
relação ao patamar do semivariograma, maior a continuidade do fenômeno, menor a variância da
estimativa ou maior a confiança que se pode ter na estimativa. A própria intuição poderia levar a
esperar tal comportamento pois, se a variável estudada varia grandemente entre locais medidos,
então não é de se esperar grande confiança na estimativa, como também poderia acontecer se esse
valor fosse medido, pois a variabilidade é grande. Além disso, a pior variância da estimativa
ainda será menor do que a variância dos dados medidos.
Examinando-se as equações (53) e (114), relativas aos cálculos das variâncias da
estimativa de krigagem e co-krigagem, respectivamente, nota-se que são apenas indiretamente
dependentes dos valores medidos. Isso porque o semivariograma e o semivariograma cruzado
representam a maneira como a variável regionalizada varia de um local para o outro no campo, e
os pesos são conseqüências deste fato. Porém, uma vez que se conhece o semivariograma de
uma propriedade, qualquer tipo de esquema de amostragem pode ser desenhado para variâncias da
estimativa pré-especificadas. Obviamente, sendo a variância da estimativa uma função da
distância ou distribuição espacial das amostras, será máxima nos locais mais distantes de valores
medidos. Assim, com base em semivariogramas de variáveis medidas em caráter de
reconhecimento, amostragens definitivas podem ser desenhadas para satisfazer condições pré-
especificadas. A localização ideal de uma rede de pluviômetros em bacias hidrográficas constitui
um exemplo prático desse procedimento. O mesmo pode também ser utilizado pela co-krigagem,
ambos com algumas complicações e vantagens . A principal complicação é que neste caso,
depende-se de três correlações espaciais (de cada variável, individualmente, e entre elas), o que
não é sempre fácil. Entretanto, quando as variáveis são amostradas em espaçamentos diferentes,
haverá pontos onde apenas a variável auxiliar foi medida. Para esses pontos quase sempre a
variância da estimativa da co-krigagem é melhor do que a da krigagem. Com essa vantagem em
mente, pode-se desenhar esquemas de amostragem que envolvam ambas as variáveis, em
densidades de amostragem bem diferentes, de acordo com o grau de dependência espacial
encontrado e a dificuldade de medição.
Qualquer que seja o método, krigagem ou co-krigagem, a variância da estimativa é
extremamente sensível à forma do semivariograma ou semivariograma cruzado, como será
mostrado no capítulo IX deste trabalho. Com base na discussão acima, o mapa de isolinhas ou
tridimensional de uma variável usando valores estimados por um dos métodos geoestatísticos
deve ser sempre acompanhado pelo mapa correspondente da variância da estimativa, para que se
possa visualizar os locais onde a confiança na estimativa é limitada ou é suficiente. Entretanto,
uma vez que a variância da estimativa é uma função indireta da distância dos vizinhos ao redor
do local da estimativa, então em amostragens tomadas em distâncias regulares no reticulado
quadrado o mapa da variância da estimativa será, simplesmente, uma coleção de círculos, com
maiores valores onde o ponto estimado é mais distante. Nesses casos, o mapa da variância tem
pouca utilidade e o exame de células compostas de vizinhos, fechando o primeiro polígono em
volta do valor estimado e mostrando a variância da estimativa, ilustra esse ponto suficientemente
bem.
Uma excelente discussão sobre o efeito do número de amostras disponíveis na variância
da estimativa em co-krigagem pode ser visto em Vauclin et al. (1983).
VIII - A VIZINHANÇA USADA NA ESTIMATIVA
1. Vizinhança única
2. Distância constante
Neste método, para cada ponto estimado é selecionada uma vizinhança, constando de
todos os vizinhos localizados dentro de um círculo de raio especificado. Consequentemente, nos
cantos de um campo retangular ocorre 1/4 de círculo, com 1/4 do número de vizinhos. A grande
vantagem deste método está no fato que se conhece exatamente a distância na qual os vizinhos
para estimativa são procurados. Isso é particularmente importante, porque se pode limitar o uso do
semivariograma quanto à distância sobre a qual ele será calculado. Por outro lado, o número de
vizinhos pode mudar bastante ao longo do campo, fazendo com que o tamanho do sistema
matricial seja variável. Em termos de programação de computador, isso pode se tornar um
problema se exceder o valor usado na dimensão das matrizes.
4. Quadrantes
Desde o começo deste trabalho têm-se discutido métodos ideais de estimativa de valores
em locais não medidos, usando-se informações contidas na maneira como os dados disponíveis
variam no espaço. Isso implica, necessariamente, na formulação de hipóteses de estacionaridade,
seguida do cálculo do semivariograma e semivariograma cruzado, aos quais se deve ajustar um
modelo. Em toda essa seqüência, existe sempre um certo grau de incerteza sobre as hipóteses
assumidas ou sobre os parâmetros ajustados aos modelos. Essa incerteza é o erro da estimativa, o
qual pode ser avaliado usando o procedimento de autovalidação comumente chamado de “jack-
knifing”. Resumidamente, esse procedimento envolve a estimativa de cada ponto medido
"fazendo de conta" que ele não existe, durante a sua estimativa. Há necessidade absoluta de se
"fazer de conta" que o valor que está sendo estimado não existe porque, senão, a solução do
sistema de krigagem fornecerá o peso associado a ele com valor unitário (λ=1) e todos os outros
pesos iguais a zero. A razão para isso é que a krigagem é um interpolador exato, passando
exatamente pelo ponto medido, quando este é usado no cálculo. Porém, quando se "faz de conta"
que o valor não existe, ele será estimado normalmente como se fosse ponto perdido, levando em
conta a variabilidade espacial local expressa nas primeiras distâncias no semivariograma. Então,
quando se executa o “jack-knifing”, está se perguntando "se a krigagem for mesmo representativa
da variabilidade, e se as hipóteses assumidas forem verdadeiras", então como é seu desempenho
para estimar valores conhecidos?
As possíveis respostas a essa pergunta podem ser esclarecidas pela execução de um ou
mais dos procedimentos descritos a seguir. Detalhes e embasamento teórico desse procedimento
podem ser encontrados em Journel & Huijbregts (1978).
Se, para cada um dos N locais onde se tem um valor medido Z(xi), se estimar um valor
pela krigagem (ou co-krigagem), Z*(xi), então poder-se-á fazer um gráfico dos valores pareados de
Z(xi) e, Z*(xi) e calcular a regressão linear entre eles. A regressão será então:
Z* ( xi ) = a + b Z( xi ) (120)
2
onde A é a interseção, B é o coeficiente angular da reta e r é o coeficiente de correlação entre
Z*(xi) e Z(xi).
Assim, se a estimativa (Z*(xi)) fosse idêntica ao valor medido (Z(xi)), então A seria nulo,
B e r2 seriam iguais à unidade (1,0), e o gráfico de Z(xi) vs Z*(xi) seria uma série de pontos na
linha 1:1. À medida que os valores de A aumentam de 0 (zero) para valores positivos, isso indica
que estimador Z*(xi) está superestimando valores pequenos de Z(xi) e subestimando valores
grandes. À medida que A decresce de 0 (zero) para valores negativos, o contrário acontece. Este
último caso, porém, não é comum.
Desse modo, a qualidade da estimativa pode ser medida pelo julgamento desses
parâmetros.
2. O erro absoluto
Uma vez que se tem o conjunto de N valores medidos e estimados, Z(xi) e Z*(xi), pode-
se definir o erro absoluto como:
EA( xi ) = Z* ( xi ) - Z( xi ) (121)
Aplicando-se as condições de não tendência (31) e de variância mínima (32), nos erros
absolutos, pode-se dizer que:
EA = E {EA( xi )} = E { Z* ( xi ) - Z( xi )} = 0 (122)
e
VAR( EA ) = E {( Z * ( xi ) - Z( xi ) )2 } = mínima (123)
Se estas condições não forem satisfeitas, alguma das condições previamente assumidas
estará sendo violada. Porém, a equação (123) é bastante difícil de ser verificada, porque o
conceito de ser mínimo torna-se subjetivo quando não se tem uma referência. O procedimento
seguinte pode contribuir nesse sentido.
3. O erro reduzido
Lembrando que no cálculo dos valores estimados, Z*(xi), sempre se tem a variância da
estimativa, σ2k(xi), então pode-se definir o erro reduzido como:
ER( xi ) = ( Z* ( xi ) - Z( xi )) / σ k ( xi ) (124)
A divisão pela raiz quadrada da variância da estimativa faz com que os ER(xi) sejam sem
dimensão e que, por isso, as condições de não tendência e de variância mínima requeiram que:
ER = E {ER( xi )} = E {( Z* ( xi ) - Z( xi )) / σ k ( xi )} = 0 (125)
e
VAR( ER ) = E {( Z* ( xi ) - Z( xi )) / σ k ( x0 ) } = 1
2
(126)
Essas propriedades fazem desse tipo de erro uma ferramenta valiosa e de fácil uso nas
aplicações de geoestatística. O fato de terem valores ideais fixos em 0 (zero) e 1 (um), e de serem
sem dimensão, facilita seu julgamento e estudo, e também permite sua comparação com outras
situações expressas em unidades diferentes.
4. Os exemplos
X - CONCLUSÕES
BALL, D.F. & WILLIAMS, W.M. Variability of soil chemical properties in two uncultivated
brown earths. The Journal of Soil Science, Oxford, 19: 379-391, 1968.
BARTLETT, M.S. Stochastic processes. 2. ed., London, Cambridge University Press, 1966.
BECKETT, P.H.T. & WEBSTER, R. Soil variability: a review. Soils Fert., Farnham Royal, 34:
1-15, 1971.
BLAIS, R.A. & CARLIER, P.A. Applications of geostatistics in ore evaluation. In: CANADIAN
INSTITUTE OF MINING AND METALLURGY, Ore reserve estimation and grade
control, Montreal, 1968. p. 41-48. (Special Volume, 9)
BURDEN, R.L.; FAIRES, J.D. & REYNOLDS, A.C. Numerical analysis. Boston, Prindle,
Weber & Schmidt, 1978. 578p.
BURGESS, T.M. & WEBSTER, R. Optimal interpolation and isarithmic mapping of soil
properties. I. The semivariogram and punctual kriging. The Journal of Soil Science,
Oxford, 31: 315-331, 1980a.
BURGESS, T.M. & WEBSTER, R. Optimal interpolation and isarithmic mapping of soil
properties. II. Block kriging. The Journal of Soil Science, Oxford, 31: 333-341, 1980b.
CAMPBELL, J.B. Spatial variation of sand content and pH within single contiguous delineation
of two soil mapping units. Soil Science Society of America Journal, Madison, 42: 460-
464, 1978.
DAVID, M. Geostatistical ore reserve estimation. Amsterdam, Elsevier, 1977. 364p.
DAVID, M. The geostatistical estimation of porphyry-type deposits and scale factor problems.
In: PRIBAM MINING CONGRESS, Praga, 1970, Proceedings ..., Praga, 1970,91-109.
DAVIS, J.C. Statistics and data analysis in geology. New York, John Wiley, 1973. 550p.
DELHOMME, J.P. Kriging in hydrosciences. Fontainebleau, Centre D'Informatique
Geologique, 1976. 94p.
FISHER, R.A. Statistical methods and scientific inference. Edinburg, Oliver & Boyd, 1956.
175p.
HAJRASULIHA, S.; BANIABBASSI, J.; METTHEY, J. & NIELSEN, D.R. Spatial variability of
soil sampling for salinity studies in southwest Iran. Irrigation Science, Berlin, 1: 197-208,
1980.
HARRADINE, F.F. The variability of soil properties in relation to stage of profile development.
Soil Science Society of America Proceedings, Madison, 14: 302-311, 1949.
HARRIS, J.A. Practical universality of field heterogeneity as a factor influencing plot yields. Journal Agr.
JOURNEL, A.G. Geostatistical for conditional simulation of orebodies. Economic Geology,
Lancaster, 79(5):673-687, 1974.
JOURNEL, A.G. & HUIJBREGTS, Ch.J. Mining geostatistics. London, Academic Press, 1978,
600p.
KRIGE, D.G. A statistical approach to some basic mine evaluation problems on the
witwatersrand. Journal of South African Institution of Minning and Mettalurgy,
Johanesburg, 52: 119-139, 1951.
MATHERON, G. Principles of geostatistics. Economic Geology, Lancaster, 58: 1246-1266,
1963.
MATHERON, G. The theory of regionalized variables and its application. Les Cahiers du
centre de Morphologie Mathematique, Fas. 5, C. G. Fontainebleau. 1971.
McBRATNEY, A.B. & WEBSTER, R. Detection of ridge and furrow pattern by spectral analysis
of crop yield. International Statistical Review, Voorburb, 49: 49-52, 1981.
McBRATNEY, A.B.; WEBSTER, R.; McLAREN, R.G. & SPIERS, R.B. Regional variation of
extractable copper and cobalt in the topsoil of southwest Scotland. Agronomie, Paris, 2:
969-982, 1982.
MONTGOMERY, E.G. Experiments in wheat breeding: experimental error in the nursery
and variation in nitrogen and yield. Washington, U.S. Dept. Agric.., 1913. 61p. (Bur.
Plant Indust. Bul., 269).
NIELSEN, D.R.; TILLOTSON, P.M. & VIEIRA, S.R. Analysing field-measured soil-water
properties. Agricultural Water Management, Amsterdam, 6: 93-109, 1983.
OLEA, R.A. Measuring spatial dependence with semivariograms. Lawrence, Kansas,
University of Kansas, Kansas Geol. Survey, 1977. 153p. (Series on Spatial Analysis, 3)
OLEA, R.A. Optimum mapping techniques using regionalized variable theory. Lawrence,
Kansas, Kansas Geol. Survey, University of Kansas, 1975. 137p. (Series on Spatial
Analysis, 2)
PENDLETON, R.L. Are soils mapped under a given type name by the Bureau of Soils method
closely similar to one another? Agricultural Sciences, Davis, 3:369-498, 1919.
ROBINSON, G.W. & LLOYD, W.E. On the probable error of sampling in soil surveys. The
Journal
SILVA, A.P. da.; LIBARDI, P.L. & VIEIRA, S.R. Variabilidade espacial da resistência à
penetração de um latossolo vermelho-escuro ao longo de uma transeção. Revista Brasileira
de Ciência do Solo, Campinas, 13: 1-5, 1989.
SMITH, L.H. Plot arrangement for variety experiment with corn. Proc. Amer. Soc. Agron.,
Madison, V. I. 1907/09, p. 84-89, 1910.
SNEDECOR, G.W. & COCHRAN, W.G. Statistical methods. 6. ed., Ames, Iowa State
University Press, 1967. 593 p.
UGARTE, A. Ejemplos de modelos de estimacion a corto e largo plans. Boletin de
Geostadistica, s.l.p., 4:3-22, 1972.
VAUCLIN, M.; VIEIRA, S.R.; BERNARD, R. & HATFIELD, J.L. Spatial variability of two
transects of a bare soil. Water Resources Research, Washington, 18: 1677-1686, 1982.
VAUCLIN, M.; VIEIRA, S.R.; VAUCHAUD, G. & NIELSEN, D.R. The use of cokriging with limited f
VIEIRA, S.R. & HATFIELD, J.L. Temporal variability of air temperature and remotely sensed
surface temperature for bare soil. International Journal of Remote Sensing, Basingstole,
5: 587-596, 1984.
VIEIRA, S.R.; DE MARIA, I.C.; CASTRO, O.M. de; DECHEN, S.C.F. & LOMBARDI NETO,
F. Utilização de análise de Fourier no estudo do efeito residual da adubação em uva, na
crotalária. Revista Brasileira de Ciência do Solo, Campinas, 11:7-10, 1987.
VIEIRA, S.R.; DE MARIA; I.C.; LOMBARDI NETO, F.; DECHEN, S.C.F. & CASTRO, O.M.
de. Caracterização da variabilidade espacial de propriedades físicas. In: Lombardi Neto, F.
& Camargo, O.A. de. Microbacia do Córrego São Joaquim (Município de
Pirassununga, SP)., Campinas, Instituto Agronômico, 1992. p. 41-51. (Documentos IAC,
29)
VIEIRA, S.R.; HATFIELD, T.L.; NIELSEN, D.R. & BIGGAR, J.W. Geostatistical theory and
application to variability of some agronomical properties. Hilgardia, Berkeley, 51: 1-75,
1983.
VIEIRA, S.R.; LOMBARDI NETO, F. & BURROWS, I.T. Mapeamento da chuva máxima
provável para o Estado de São Paulo. Revista Brasileira de Ciência do Solo, Campinas,
15: 93-98, 1991.
VIEIRA, S.R.; NIELSEN, D.R. & BIGGAR, J.W. Spatial variability of field-measured infiltration
rate. Soil Science Society of America Journal, Madison, 45: 1040-1048, 1981.
VIEIRA, S.R.; NIELSEN, D.R.; BIGGAR, J.W. & TILLOTSON, P.M. The Scaling of
semivariograms and the kriging estimation. Revista Brasileira de Ciência do Solo,
Viçosa, 21:525-533, 1997.
WAYNICK, D.D. Variability in soils and its significance to past and future soil investigations. I.
Statistical study of nitrification in soils. Agricultural Sciences, Davis, 3: 243-270, 1918.
WAYNICK, D.D. & SHARP, L.T. Variability in soils and its significance to past and future soil
investigations. II. Variation in nitrogen and carbon in field soils and their relation to the
accuracy of field trials. Agricultural Sciences, Davis, 4: 121-139, 1919.
WEBSTER, R. Automatic soil boundary location for transect data. Mathematical Geology, New
York, 5: 27-37, 1973.
WEBSTER, R. & BURGESS, T.M. Optimal interpolation and isarithmic mapping of soil
properties. III. Changing drift and universal kriging. The Journal of Soil Science, Oxford,
31: 505-524, 1980.
WEBSTER, R. & CUANALO, H.E. de la C. Soil transects correlograms of north Oxfordshire and
their interpretation. The Journal of Soil Science, Oxford, 26: 176-194, 1975.
QUADRO 1. Dados estatísticos para teores (%) de C e de N e relação C/N, de amostras de
solos de Davis e Oakley.
Davis
Carbono 1,111 0,01079 9,35 0,8960 1,383 0,4564 2,816
Nitrogênio 0,099 0,00088 9,14 0,0770 0,118 -0,2485 2,884
C/N 11,17 0,95330 8,74 9,4150 17,26 2,6900 16,54
Oakley
Carbono 0,433 0,01316 26,49 0,1820 0,950 1,4460 6,630
Nitrogênio 0,032 0,00048 21,69 0,0210 0,060 1,5580 6,964
C/N 13,57 6,04500 18,12 7,8570 23,23 0,9128 5,846
10 50
D ados 30
6
Modelo
20
4
10
2
0
0
0 50 100 150 200 0 10 20 30 40 50 60 70 80
D istância
Distância X, metros
1,2 1,2
C - Davis N - Davis C - Oakley N - Oakley C/N Oakley C/N Davis
1,0 1,0
Semivariância
0,8 0,8
Semivariância
0,6 0,6
0,4 0,4
0,2 0,2
0,0 0,0
0 10 20 30 40 50 0 10 20 30 40 50
Distância, metros Distância, metros
1,4 1,2
Carbono Davis Resíduo
1,2 Tendência 1,0 Tendência
Resíduo Carbono Oakley
1,0
Semivariância
Semivariância
0,8
0,8
0,6
0,6
0,4
0,4
0,2 0,2
0,0 0,0
0 10 20 30 40 50 0 10 20 30 40 50
Distância, metros Distância, metros
1,2 1,4
Resíduo Resíduo
1,0 Tendência 1,2 Tendência
Nitrogênio Davis Nitrogênio Oakley
1,0
Semivariância
Semivariância
0,8
0,8
0,6
0,6
0,4
0,4
0,2 0,2
0,0 0,0
0 10 20 30 40 50 0 10 20 30 40 50
Distância, metros Distância, metros
Semivariância
1,0 1,0
0,8 0,8
0,6 0,6
0,4 0,4
0,2 0,2
0,0 0,0
0 10 20 30 40 50 0 10 20 30 40 50
Distância, metros Distância, metros
Figura 6. Semivariogramas para os resíduos de tendência, para os dois locais: (a) carbono, com
modelo esférico com parâmetros 0,4, 0,6 e 15,0; (b) nitrogênio, com modelo esférico com
parâmetros 0,0, 1,0 e 25,0.
1,6 1,6
Modelo Davis Oakley Modelo
1,4 1,4
C/N Davis
1,2 1,2
Semivariância
1,0
Semivariância
1,0
0,8
0,8
0,6
0,6
0,4
0,4
0,2
0,2
0,0
0 10 20 30 40 50 0,0
0 10 20 30 40 50
Distância, metros
Distância, metros
60 60 60
50 50 50
Dist ncia Y, metros
40 40 40
30 30 30
20 20 20
10 10 10
0 0 0
0 10 20 30 40 50 60 70 80 0 10 20 30 40 50 60 70 80 0 10 20 30 40 50 60 70 80
Distância X, metros Distância X, metros Distância X, metros
0.9 1.0 1.1 1.2 1.3 0.2 0.3 0.4 0.5 0.6 0.08 0.09 0.10 0.11
Figura 8. Mapa para carbono (%), Davis. Figura 10. Mapa para nitrogênio (%), Davis
Figura 9. Mapa para carbono (%), Oakley
60 60
50 50
40 40
30 30
20 20
10 10
0 0
0 10 20 30 40 50 60 70 80 0 10 20 30 40 50 60 70 80
Distância X, metros Distância X, metros
Davis Oakley