Você está na página 1de 78

UFU/FAMAT

Geoestatstica Bsica e Aplicada

UNIVERSIDADE FEDERAL DE UBERLNDIA


FACULDADE DE MATEMTICA
NCLEO DE ESTUDOS ESTATSTICOS E BIOMTRICOS

GEOESTATSTICA BSICA E APLICADA

EDNALDO CARVALHO GUIMARES

Fevereiro - 2004
Uberlndia - MG

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

SUMRIO
1. INTRODUO...........................................................................................................
2. ANLISE EXPLORATRIA DE DADOS.............................................................
2.1. Distribuio de freqncias e histograma...............................................................
2.2. As estatsticas.............................................................................................................
2.3. Outras anlises descritivas........................................................................................
2.4. Amostragem...........................................................................................................................................

2.5. Exemplos de anlise exploratria aplicando o programa GS+.............................


3. PRINCPIOS DA ANLISE GEOESTATSTICA..................................................
3.1. Um breve histrico....................................................................................................
3.2. Estacionaridade.........................................................................................................
3.3. Krigagem universal...................................................................................................
4. ANLISE DA DEPENDNCIA ESPACIAL............................................................
4.1. Autocorrelao e Autocorrelograma.......................................................................
4.2. Semivariograma.........................................................................................................
4.3. O uso do software GS+ na determinao do semivariograma..............................
4.4. Exemplos de aplicao...............................................................................................
5. KRIGAGEM.................................................................................................................
5.1. O interpolador...........................................................................................................
5.2. A krigagem no programa GS+.................................................................................
6. SEMIVARIOGRAMA CRUZADO E COKRIGAGEM..........................................
6.1. Semivariograma cruzado..........................................................................................
6.2. Co-krigagem..............................................................................................................
6.3. Varincia da estimativa............................................................................................
6.4. Nmero de vizinhos das estimativas........................................................................
6.5. O uso do programa GS+ na determinao do semivariograma cruzado,
da co-krigagem e no mapeamento da varivel.......................................................
6.6. Exemplos de aplicao no GS+................................................................................
7. VALIDAO DE MODELOS DE SEMIVARIOGRAMAS...................................
8. BIBLIOGRAFIA RECOMENDADA.........................................................................

2
3
3
3
7
7
8
14
14
15
20
21
21
25
36
41
50
50
52
55
55
56
60
62
64
67
70
74

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

1. INTRODUO
Mtodos clssicos de anlise estatstica de dados geralmente supem que, as
realizaes das variveis aleatrias so independentes entre si, ou seja, que observaes
vizinhas no exercem influncias umas sobre as outras.
Fenmenos naturais apresentam-se freqentemente com uma certa estruturao nas
variaes entre vizinhos, desta forma pode-se dizer que as variaes no so aleatrias e,
portanto, apresentam algum grau de dependncia espacial.
A anlise espacial de dados apresenta-se como uma alternativa e/ou como uma
complementao da anlise clssica de dados, sendo que este tipo de anlise considera as
correlaes entre as observaes quando se faz estimativas.
A literatura apresenta alguns procedimentos de anlise espacial de dados, sendo que,
nos ltimos tempos, uma metodologia de anlise denominada geoestatstica ganhou
nfase neste tipo de estudo.
Neste trabalho sero abordados aspectos bsicos da metodologia geoestatstica para
a anlise espacial de dados, com nfase na anlise do semivariograma como ferramenta de
determinao da dependncia espacial.
Inicialmente sero abordados aspectos bsicos de uma anlise exploratria de
dados; em seguida sero introduzidos conceitos bsicos da geoestatstica e da anlise da
dependncia espacial por meio de semivariograma e tambm de interpolao utilizando a
metodologia da krigagem e, por fim sero abordados conceitos bsicos de semivariogramas
cruzados e co-krigagem. Sempre que possvel os tpicos sero acompanhados de exemplos
de aplicao.

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

2. A ANLISE EXPLORATRIA DE DADOS


A anlise exploratria de dados um procedimento de grande importncia na
anlise estatstica e aplica-se para qualquer metodologia que se queira utilizar. Nesta
anlise preliminar dos dados tem-se o objetivo de conhecer a varivel em estudo e resumila. Basicamente, este tipo de anlise se baseia em construo e interpretao grfica e
clculos e interpretao de estatsticas.
No presente texto faremos uma reviso dos principais instrumentos de anlise
exploratria de dados, sendo que estes procedimentos podem ser encontrados em cursos de
estatstica bsica e em livros de estatstica bsica como Costa Neto (1979), Bussab e
Morettin (1987), Triola (1999), Lopes (1999), entre outros.

2.1. A distribuio de freqncias e o histograma


A distribuio de freqncias consiste em agrupar as observaes de uma varivel
em classes ou categorias e o histograma uma das representaes grficas dessa
distribuio. A distribuio de freqncias e o histograma podem ser obtidos em programas
computacionais comercias com o Excel, Statistica e em programas especficos para anlise
geoestatstica, como, por exemplo, o GS+.
A finalidade da distribuio de freqncias e do histograma a de permitir uma
visualizao do comportamento da varivel em estudo, com relao tendncia de
concentrao de dados (tendncia simtrica ou assimtrica). Esta tendncia, principalmente
na anlise no espacial de dados, pode direcionar procedimentos diferenciados de anlise.

2.2. As estatsticas
O clculo de estatsticas como a mdia, a varincia, o desvio padro, o coeficiente
de variao, valor mnimo, valor mximo, coeficiente de assimetria e coeficiente de
curtose, colaboram na descrio da varivel. Passaremos a rever rapidamente estas
estatsticas.

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

A mdia aritmtica ( X )
A mdia aritmtica uma medida de posio bastante utilizada na estatstica e tem

como caractersticas principais facilidade de clculo, a sua adaptabilidade ao tratamento


algbrico e, tambm, geralmente, uma medida no tendenciosa, precisa, eficiente e
suficiente.
Vale ressaltar que nem sempre a mdia aritmtica a medida de posio que melhor
representa uma varivel, por exemplo, em dados com assimetria direita acentuada a moda
ou a mdia geomtrica pode representar melhor a varivel em estudo.
A frmula para o clculo da mdia :
n

X=

x
i =1

em que: X a mdia aritmtica; xi cada valor observado; n o nmero total de


observaes.

Varincia (s2) e desvio padro (s)


A varincia e o desvio padro so estatsticas que nos fornece uma idia de

variabilidade das observaes em torno da mdia aritmtica.


As frmulas de clculo so, respectivamente:

( xi X )2

s 2 = i =1

n 1

s = + s2
Note que em interpretaes de dados, ou seja, na anlise descritiva a mdia
aritmtica deve estar sempre acompanhada do desvio padro para que possamos visualizar
a disperso mdia dos valores.

Coeficiente de variao (CV)


O coeficiente de variao fornece a disperso relativa dos dados, facilitando

visualizar a dimenso da disperso dos valores observados em relao mdia.


O coeficiente de variao dado por:

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

CV (%) = 100

s
X

Valor Mnimo e Valor Mximo


Estes valores permitem visualizar a menor ocorrncia e a maior ocorrncia e

podem ser um primeiro indicativo de erros de amostragem, digitao, etc..


A obteno desses valores se faz a partir da ordenao das observaes.

Coeficiente de assimetria (Cs) e coeficiente de curtose (Ck)


O coeficiente de assimetria mostra o afastamento da varivel em relao a um valor

central, ou seja, na distribuio simtrica tem-se 50% dos valores observados acima da
observao central e 50% abaixo. Se a distribuio assimtrica, esta relao no
observada.
O coeficiente de curtose mostra a disperso (achatamento) da distribuio em
relao a um padro, geralmente a curva normal.
Estes dois coeficientes so utilizados para inferncias sobre a normalidade da
varivel em estudo.
Antes de definirmos estes dois coeficientes e tecermos comentrios sobre eles
vamos definir os momentos estatsticos.
Se x1, x2, ... ,xn so os n valores assumidos pela varivel X, definimos o momento de
ordem t dessa varivel como:
n

Mt =

x
i =1

t
i

Note que se t=1 temos a mdia aritmtica, ou seja, a mdia aritmtica igual ao
primeiro momento em relao origem.
O momento de ordem t centrado em uma constante K , com K 0 definido como:
n

M tK =

(x
i =1

K)t

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

Observe que: se t = 1 e K = X , temos M 1X = m1 = 0 (propriedade da mdia


aritmtica) e, se t =2 e K = X , temos M 2X = m2 = 2.
Vamos definir agora o coeficiente de assimetria (Cs) e o coeficiente de curtose
(Ck).
O coeficiente de assimetria utilizado para caracterizar como e quanto
distribuio de freqncias se afasta da simetria, sendo que: se Cs > 0 temos a distribuio
assimtrica direita; se Cs < 0 a distribuio assimtrica esquerda; e se Cs = 0 a
distribuio simtrica.
O momento centrado na mdia de ordem 3 pode ser utilizado como medida de
assimetria, entretanto, mais conveniente a utilizao de uma medida admensional e que
ser chamada de coeficiente de assimetria:
Cs =

m3
(m 2 ) 3

Em que m2 e m3 so, respectivamente, o segundo e o terceiro momento centrados


na mdia.
O coeficiente de curtose utilizado para caracterizar a forma da distribuio de
freqncias quanto ao seu achatamento. O termo mdio de comparao a distribuio
normal e esta apresenta o valor de Ck = 3. A classificao da distribuio quanto curtose
recebe a seguinte denominao: se Ck = 3 a distribuio mesocrtica (distribuio
normal); se Ck < 3 a distribuio platicrtica; e se Ck > 3 a distribuio leptocrtica. Em
alguns programas computacionais como o Excel, Statistica e GS+ existe uma padronizao
do valor de Ck e o valor de comparao o zero, portanto, se Ck = 0 temos a mesocrtica,
se Ck < 0 temos a platicrtica e se Ck > 0 temos a leptocrtica.
Para verificar o termo de comparao necessrio consultar o manual ou a "ajuda"
do programa.
A frmula para clculo de Ck :
Ck =

m4
(m 2 ) 4

sendo que: m4 o quarto momento em relao mdia aritmtica.

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

Para uma melhor interpretao do coeficiente de assimetria e do coeficiente de


curtose, alguns programas, como o GS+, calcula tambm o erro padro desses coeficientes
e a partir dos valores dos coeficientes associados com seus respectivos erros padro, podese concluir se os dados tem distribuio normal ou no. Por exemplo: Se o valor obtido na
amostra para Cs = 0,30 com erro padro de 0,65 e se o valor de Ck = 2,5 com erro padro de
0,80, podemos dizer que a distribuio tende a normal (simtrica e mesocrtica), pois
0,30,65 e 2,50,80, incluem os valores zero e trs, respectivamente.

2.3. Outras anlises descritivas


As anlises descritas acima so as mais comuns e as que freqentemente so usadas
como anlise exploratria dos dados. Entretanto outros recursos podem ser aplicados como,
por exemplo: grfico box-plot; grficos da distribuio normal; grfico h-disperso, outras
estatsticas (quartil, mediana, moda, etc.); testes de normalidade (Shapiro Wilk,
Kolmogorov Smirnov, etc.), etc.. Tais resultados tambm contribuem para a descrio e
conhecimento da varivel em estudo. Os procedimentos para este tipo de anlise so
encontrados em programas de estatsticas.

2.4. Amostragem
Um requisito bsico na amostragem para fins de anlise de dependncia espacial
utilizando mtodos geoestatsticos que as observaes, ou seja, que as amostras sejam
referenciadas. No necessrio utilizar coordenadas geogrficas, mas algum tipo de
referenciao deve existir.
Exemplos de referenciaes so: a) amostras coletadas ao longo do tempo

cada

observao referenciada com relao ao tempo (Ex: Estudo da precipitao anual na


regio X); b) amostras coletadas ao longo de uma linha reta em uma certa cultura agrcola
cada observao refernciada por um nico ponto no espao (Ex: amostras coletadas
em transees); c) amostras coletadas em uma rea

cada observao ser identificada

por um par ordenado de coordenadas pertencente ao espao (Ex: amostras coletadas em


uma rea X).

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

Um tipo de amostragem bastante utilizado em geoestatstica a amostragem


sistemtica. Neste tipo de amostragem os pontos avaliados (amostras) so obtidos de forma
equidistantes, quer seja no espao ou no tempo, formando uma malha de pontos no caso
bidimensional. No entanto esse no um procedimento obrigatrio, basta que se tenha a
referenciao dos dados para se proceder a anlise espacial. Um exemplo tpico de
amostragem no sistemtica para variveis climticas, onde as estaes climatolgicas,
geralmente, no so equidistantes mas apresentam a referencia geogrfica.
Outro questinamento bsico da geoestatstica "Quantas amostras devo utilizar para
a anlise geoestatstica?". Alguns autores recomendam que seja utilizados pelo menos 100
pontos amostrais, entretanto isso no regra e sim recomenndao, existem trabalhos com
bons resultados de ajuste de semivariogramas usando 45 pontos de amostragem. sabido
que quanto maior o nmero de pontos, maior ser o nmero de pares para o clculo das
semivarincias e, teoricamnte, maior ser a preciso das estimativas das semivarincias.
Pode-se dizer que o nmero de observaes depender dos objetivos que se tem no
trabalho, da escala (ou seja da dimenso), entre os outros fatores que devem ser avaliados
pelo pesquisador. Outro aspecto relacionado com o ajuste de semivariograma e
indiretamente com o tamanho da amostra a presena de tendncia da varivel e/ou o uso
de duas populaes distintas que abordaremos em tpicos seguintes, mas que, de maneira
geral, dificultam o ajuste de semivariogramas com dados originais, mesmo que o volume
de observaes seja grande.

2.5. Exemplos de anlise exploratria aplicando programa GS+


Passaremos a descrever exemplos de anlise exploratria de dados do GS+. Nestes
exemplos ser utilizado a Verso Beta do GS+ (5.0.3) que de domnio publico, conforme
mostra a Figura 1.

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

Figura 1. Programa GS+ Verso 5.0.3

Como ponto de partida vamos descrever a estrutura de arquivos de dados com


vistas a posterior anlise geoestatstica, pois, na anlise geoestatstica necessita-se que os
dados observados estejam referenciados, ou seja, tenham coordenadas. Trabalharemos com
a anlise bidimensional e, portanto, teremos as coordenadas X e Y para cada observao.
Vale ressaltar que, se o objetivo do estudo no for a geoestatstica ou a anlise espacial, esta
referenciao no se faz necessria e ainda ressaltamos que a estrutura de dados
apresentada neste tpico vlida para diversos programas de anlise espacial.
O arquivo pode ser criado no prprio programa GS+ ou em outro programa como o
Excel, necessitando, neste caso de uma importao de dados ou do famoso "copiar" e
"colar". A Figura 2 mostra o aspecto bsico do arquivo de dados.

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

Figura 2. Janela inicial do GS+ com exemplo de arquivo de dados contento as coordenadas
(x,y) e 4 variveis para a anlise.
Neste exemplo temos um arquivo de dados editado no GS+. Na primeira coluna
temos a coordenada X, na segunda coluna temos a coordenada Y e da terceira a sexta
colunas temos as variveis, ou seja, neste caso estamos trabalhando com 4 variveis.
Se o arquivo for editado em outro programa, deve-se importar os dados para o GS+
utilizando o procedimento padro do Windows de copiar e colar, ou recortar e colar, ou
ainda, ativar o cone Import file localizado no canto superior direto da Figura 2.
Para selecionar outra varivel a ser estudada basta clicar na coluna correspondente e
selecion-la como a varivel principal. Por exemplo, se o objetivo a anlise da terceira
varivel (usatpc), procederamos da seguinte forma (Figura 3):

Figura 3. Exemplo de mudana de varivel para anlise

10

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

clique sobre a coluna de interesse (coluna 5, neste exemplo). A coluna selecionada e


aparece a segunda janela, indicando a coluna ativa.

Clique em Z (Primary variable) para selecionar esta coluna como sendo sua varivel de
analise.

Clique em OK para confirmar a opo

Pode-se ainda trabalhar com duas variveis simultaneamente. Neste caso selecionase uma varivel Z2 como covarivel. Voltaremos ao assunto no tpico de semivariograma
cruzado.
Voltando Figura 2 vamos descrever os procedimento da anlise exploratria de
dados.
A barra de ferramenta apresenta os seguintes smbolos que so destinados a este tipo
de anlise:

Planilha
ativa

Principais
Estatstica
s

Anlise grfica
histograma

Posio das observaes


selecionadas por quartil

Os cones no ativos so destinados a anlise com duas variveis (semivariograma


cruzados, co-krigagem, etc).
Para exemplificar o resultado deste tipo de anlise vamos utilizar os dados da
primeira varivel (usatpd coluna 3). Ativando o cone e teremos o resultado das
principais estatsticas, conforme Figura 4:

11

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

mdia

Desvio padro
varincia
mnimo
mximo
Nmero de dados e
Dados perdidos
histograma
Coeficiente de assimetria
e erro padro

Figura 4. Estatsticas da varivel usatpd.

Coeficiente de curtose e
erro padro

Como uma anlise geral desses dados verifica-se que a umidade de saturao do
solo no plantio direto (usatpd) apresentou mdia de 44,0069 (cm3/100cm3), com uma
disperso mdia em torno desse valor de 4,3190 (cm3/100cm3) e, portanto, uma
variabilidade de 9,81%, deste modo nota-se que as observaes se dispersam relativamente
pouco em torno da mdia. O menor valor observado (36,27 cm3/100cm3) e o maior valor
observado (54,810 cm3/100cm3) reforam a idia de baixa variabilidade das observaes e
tambm mostram que, provavelmente, no temos valores discrepantes que poderiam ser
atribudos a erros de determinao, digitao ou de amostragem. O histograma mostra uma
tendncia dos dados simetria e este fato tambm pode ser verificado por meio dos
coeficientes de assimetria e curtose associados aos seus respectivos erros padro, que so
respectivamente: 0,460,30 e 0,340,50, ou seja, assimetria e curtose prximos de zero
indicando distribuio normal aproximada dos dados.
Note ainda que existe a possibilidade de se fazer anlises com dados transformados.
Um detalhamento da distribuio da varivel pode ser obtida clicando o cone do
histograma

na barra de ferramentas. Em um primeiro momento tem-se a visualizao

do histograma e posteriormente pode-se fazer anlises com distribuio de freqncias


acumuladas e grfico da distribuio normal, conforme mostra a Figura 5.

12

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

Histograma
freqncia simples

Grfico de freqncia
acumulada
Grfico da distribuio
normal

Figura 5. Anlise grfica dos dados

Uma outra anlise utilizada no GS+ a localizao espacial dos pontos amostrados
com relao a intervalos de ocorrncia. Este mapa obtido por meio do cone

. Veja o

exemplo na Figura 6.

Figura 6. Localizao espacial das observaes

Verifica-se, por meio da Figura 6, que a princpio no h indcios de concentrao


de valores altos ou baixos em setores especficos da malha, portanto parece no existir
tendncia nos dados e, provavelmente, se existir relao espacial, esta poder ser
representada por um semivariograma mdio (isotrpico).

13

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

3. PRINCPIOS DA ANLISE GEOESTATSTICA


3.1. Um breve histrico
A preocupao com a dependncia espacial ou temporal de observaes realizadas
para um determinado atributo bastante antiga, sendo comprovado este fato por trabalhos
cientficos datados do incio do sculo XX, conforme mostra Vieira (1995).
Em algumas reas da cincia, como a agricultura, a partir da metade do sculo XX
adotou-se a metodologia de anlise de dados proposta por Fisher. Esta metodologia
considera, no seu desenvolvimento e aplicao, as seguintes suposies: normalidade da
varivel; independncia de erros e homocedasticidade de varincia (homogeneidade de
varincia).
A normalidade da varivel e a homogeneidade de varincias podem ser testadas
facilmente em programas de estatsticas por meio de testes especficos como, por exemplo,
Shapiro-Wilk (W teste) para normalidade e F mximo de Hartley para homogeneidade de
varincias. Se for observado no normalidade de dados e/ou no homogeneidade de
varincias, procedimentos como a transformao de dados podem ser adotados para que a
varivel atenda estas hipteses bsicas da metodologia de anlise no espacial proposta por
Fisher.
J a independncia no pode ser testada por mtodos simples e a soluo deste
problema, proposta pela metodologia no espacial, a repetio e a aleatorizao das
observaes. Esta soluo, em muitos casos, no garante a independncia entre as
observaes, isto porque algumas variveis apresentam forte dependncia espacial
(autocorrelao entre as observaes) que no desfeita com este procedimento.
Krige (1951) citado por Vieira (1995), em seus trabalhos com dados de minerao
da frica do Sul, concluiu que a varincia dos dados possua uma estruturao que
dependia da distncia de amostragem. A partir desta constatao surgiu os conceitos
bsicos de geoestatstica.
Os fundamentos tericos da geoestatstica podem ser encontrados nos trabalhos
desenvolvidos por Matheron (1963) e Matheron (1971).
A anlise espacial de dados, utilizando a geoestatstica, ganhou impulso em reas
distintas da minerao e da geologia a partir de 1980, com grande aplicabilidade na cincia

14

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

do solo. Uma justificativa para tal fato a facilidade computacional que viabilizou alguns
clculos relativamente trabalhosos nesta metodologia.
No Brasil destaca-se trabalhos pioneiros nesta rea desenvolvidos pelos
pesquisadores Sidney Rosa Vieira, Paulo Libardi e Klaus Reichardt. Ainda na dcada de
80.
Atualmente a aplicabilidade e a utilizao da geoestatstica como metodologia de
anlise de dados no espao ou no tempo esta difundida em vrios ramos da cincia,
envolvendo reas de cincias humanas, biolgicas e exatas.
Em linhas gerais podemos dizer que a geoestatstica est interessada em determinar
a dependncia espacial das observaes de uma varivel e recebeu tal denominao devido
aos trabalhos desenvolvidos por Krige na frica do Sul. Este pesquisador homenageado
com o nome do mtodo de interpolao utilizado na geoestatstica, a krigagem.
Outras metodologias e alternativas de anlise de dependncia espacial so descritas
em Papadakis (1937), Bartlett (1978), Zimmerman e Harville (1991), Cressie e Hartfield
(1996), Duarte (2000), entre outros autores.

3.2. Estacionaridade
Antes de iniciarmos a discusso sobre a estacionaridade da varivel vamos adotar
uma simbologia para a varivel em estudo. Ao falarmos da varivel Z(t) estaremos falando
de ocorrncias da varivel Z com uma referenciao t, que pode ser uma posio no tempo
(unidimensional, por exemplo: t1, t2, ...,tk) ou no espao (unidimensional, por exemplo: x1,
x2, ..., xn; ou bidimensional, por exemplo; (x1,y1),(x1,y2), ..., (xn, yn))
Diz-se que um processo (ou uma varivel) estacionria se o desenvolvimento
desse processo no tempo ou no espao ocorrer de maneira mais ou menos homognea, com
oscilaes aleatrias contnuas em torno de um valor mdio, em que nem a amplitude
mdia e nem as oscilaes mudam bruscamente no tempo ou no espao. Como exemplo de
processo estacionrio pode-se citar as oscilaes da tenso em uma rede eltrica.
Note que as caractersticas de um processo estacionrio independe da origem
adotada.

15

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

Diz-se que um processo no estacionrio quando no apresenta as caractersticas


citadas anteriormente e, neste caso, as caractersticas do processo dependem da origem que
tomada como referncia. Pode-se utilizar como exemplo de um processo no estacionrio
o relevo no estado de Minas Gerais, ou ainda, as chuvas mensais durante um ano no estado
de Minas Gerais.

Observao: Processos no estacionrios podem apresentar trechos estacionrios.

Pode-se definir uma funo aleatria Z(t) como estacionria, se todos os momentos
estatsticos so invariantes para toda mudana de origem.
Estatisticamente pode-se dizer que, se o processo estacionrio de ordem k, ento:
E[Z(t)] = m1(t) = constante t
E[Z2(t)] = m2(t) = constante t
.

E[Zk(t)] = mk = constante t
Observao: Se um processo estacionrio na ordem k ele tambm ser
estacionrio para as ordens inferiores a k. Por exemplo, se o processo estacionrio de
ordem 4, ele tambm ser estacionrio nas ordens 1, 2 e 3.

Para estudos de geoestatstica necessita-se, como restrio mxima, que o primeiro e


o segundo momento em relao origem sejam constante, ou seja, exige-se no mximo a
estacionaridade de segunda ordem.
Se

esperana

matemtica

de

uma

varivel

aleatria

constante,

independentemente da origem que se toma no espao ou no tempo, podemos dizer que a


varivel estacionria de primeira ordem e, portanto, a mdia ser a mesma para todo o
processo.
E[Z(t)] = m1(t) = = constante

16

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

Se o segundo momento em relao origem constante, temos ento que a


varincia constante independente da origem no espao ou no tempo e, portanto, o
processo estacionrio de ordem 2.
E[Z2(t)] = m2(t) = constante
Var [Z(t)] = E[Z2(t)] {E[Z(t)]}2 = m2(t) [m1(t)]2 = constante
Seja agora a covarincia, ou seja, a esperana do produto do que ocorre em t e t,
com h = t t, definida como:
C(t, t) = E[Z(t).Z(t)] - 2
Se Z(t) estacionria esta covarincia no depende de t e t, ou seja, da origem, mas
somente da distncia h entre os pontos e desta forma:
C(t, t+h) = C(h)
Note que a varincia um caso particular da covarincia quando h = 0.
C(0) = E[Z2(t)] - 2 = Var[Z(t)]
Geralmente utiliza-se a funo de covarincia normada pela varincia:

( h) =

C (h)
Var[ Z (t )]

Neste caso chamamos de funo de correlao ou coeficiente de correlao, que


nada mais do que a correlao entre sees da varivel separadas por um passo h.
Portanto, (0) = 1.
Podemos definir uma varivel como estritamente estacionria se seus momentos
estatsticos so invariantes a translaes na origem. Isto significa que o processo Z(t) e
Z(t+h) tem a mesma estatstica para qualquer h.
Uma varivel chamada de estacionria de segunda ordem se:
A mdia constante:
E[Z(t)] =
O segundo momento existe:
E[Z2(t)] <
Para cada par {Z(t), Z(t+h)} a funo covarincia existe e depende apenas de
h.
C(t, t+h) = C(h)

17

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

A estacionaridade da covarincia implica na estacionaridade da varincia:


Var{Z(t)}= C(0) e do variograma que definido como:
2(h) = E{[Z(t+h) Z(t)]2} =
= E{[Z(t+h)2}+E{[Z(t)]2}-2E{Z(t+h) Z(t)}=
= E{[Z(t+h)]2}+E{[Z(t)]2}-22 =
= E{[Z(t+h)]2}- 2+ E{[Z(t)]2}-2 =
= C(0) C(h)
O coeficiente de correlao entre Z(t+h) e Z(t), chamado de correlograma ou
autocorrelograma, igual a:
r (h) =

C ( h)
( h)
= 1
C (0)
C (0)

Note que, se ocorre a estacionaridade de segunda ordem, o correlograma


(autocorrelograma) e o variograma (semivariograma) sero ferramentas correspondentes na
determinao da dependncia espacial. Mas se a estacionaridade de segunda ordem no
atendida o autocorrelograma no pode ser usado, pois, o denominador da funo
autocorrelao uma varincia e, neste caso, C(0) constante.
Observao: A existncia de estacionaridade permite a repetio de um
experimento, mesmo que as amostras sejam coletadas em pontos diferentes, em relao ao
experimento inicial. Esta fato justificado em funo de que todas as amostras pertencem a
populaes com os mesmos momentos estatsticos.

A dependncia espacial ou temporal de uma varivel Z(t) definida por uma


amplitude a, sendo que para variveis com estacionaridade de segunda ordem:
C(h) = 0

se | h | > a

Ou
(h) = C(0) = Var [Z(t)] se | h | > a
Quando se trabalha com o tempo a constante a chamada de tempo de correlao
de Z(t). Se o estudo for espacial, por analogia, podemos chamar a de domnio de
correlao.

18

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

A hiptese de estacionaridade de segunda ordem assume a existncia de uma


covarincia e assim de uma varincia finita. Var[Z(t)] = C(0). A existncia do variograma
uma hiptese mais fraca do que a existncia da covarincia, e existem muitos fenmenos
que possuem uma grande capacidade de disperso, isto , que no possuem uma varincia a
priori nem uma covarincia, mas um variograma pode ser definido. Uma hiptese mais
fraca (mais abrangente) a hiptese intrnseca.
Na hiptese intrnseca temos:
a) a esperana Z(t) existe e no depende do ponto t.
E[Z(t)] =
b) para todo h, a varincia da diferena [Z(t+h) Z(t)] existe e no depende do ponto t.
Var[Z(t+h) Z(t)] = E{[Z(t+h) Z(t)]2} = 2(h)

Observao: Se uma varivel estacionria de segunda ordem, ento ela tambm


intrnseca, mas o inverso nem sempre ocorre.

A hiptese intrnseca a hiptese mais freqentemente usada em geoestatstica, por


ser menos restritiva e, portanto, o semivariograma a ferramenta mais difundida na
geoestatstica porque exige apenas a hiptese intrnseca, enquanto o autocorrelograma
exige a estacionaridade de segunda ordem.
As Figuras 7A, 7B e 7C ilustram, respectivamente, uma varivel estacionria de
segunda ordem, uma varivel estacionria de primeira ordem e uma outra no estacionria.
Note que no caso da Figura 7A, para qualquer trecho que selecionarmos e calcularmos a
mdia e a varincia, estas permanecero aproximadamente constante, j no caso da Figura
7B, apenas a mdia permanece constante e no caso da Figura 7C nem a media e nem a
varincia permanecem constantes.

19

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

28

26

24
22
20
18
0

10

20

30

40

50

29
27
25
23
21
19
17
15

10

20

30

40

50

30

25
20
15
10
5
0

10

20

30

40

50

Figura 7. Exemplos de estacionaridade: A) Processo estacionrio de segunda ordem; B)


Processo estacionrio de primeira ordem e C) Processo no estacionrio

3.3. Krigagem universal (tendncia)


Na hiptese de tendncia (Krigagem universal), a varivel Z(t) pode ser decomposta
em dois componentes:
Z(t) = m(t) + e(t)

20

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

em que m(t) a tendncia principal (drift) e e(t) o resduo.


Para se trabalhar com essa hiptese necessrio que, para cada posio t se
determine tendncia m(t) e, assim, trabalha-se com o semivariograma dos resduos.
Note que se m(t) = constante, ento o semivariograma da varivel Z(t), usando as
observaes reais, ser igual ao semivariograma dos resduos e(t), mas, se ocorre algum
tipo de tendncia nos dados (tendncia linear, quadrtica, etc.), o semivariograma dos
resduos pode-se apresentar com melhor estruturao e definio dos parmetros,
produzindo estimativas mais confiveis (com menor varincia) na krigagem.

4. ANLISE DA DEPENDNCIA ESPACIAL


As duas funes utilizadas com maior intensidade na geoestatstica para a
determinao da dependncia espacial ou temporal de variveis so a funo autocorrelao
(que gera o autocorrelograma) e a funo semivarincia (que gera o semivariograma).
Passaremos a descrever rapidamente a funo autocorrelao e em seguida, com
maior detalhamento, ser descrita a funo semivarincia e

semivariograma com

instrumento de anlise espacial de dados.

4.1. Autocorrelao e autocorrelograma


Quando estamos trabalhando com variveis bidimensionais, temos que a
covarincia uma medida de associao entre as variveis. Entretanto esta funo tem a
desvantagem de possuir as unidades das variveis que a geram e, tambm, no ter um
padro de comparao, por exemplo, se calculamos a covarincia entre X e Y e
encontramos o valor de 0,75 no podemos dizer se as variveis esto com forte associao
positiva ou no.
A covarincia dada por:

cov( x , y ) = E{[ X x ].[ Y y ]}


O clculo da covarincia pode ser pensada tambm para a anlise espacial. Se
analisarmos a Varivel Z nas posies t e t+h temos:

21

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

cov[ Z ( t ), Z ( t + h )] = E [( Z ( t ) z( t ) ).( Z ( t + h ) Z ( t + h ) )]
Se a varivel Z estacionria, esta funo poder ser estimada por:

n( h )

cov( Z ( t ), Z ( t + h )) =

i =1

[ Z ( ti ) Z ] [ Z ( t i + h ) Z ]
n( h ) 1

pois

neste caso a mdia de Z(t) ser igual mdia de Z(t+h).


Uma propriedade da covarincia diz que "se duas variveis aleatrias so
independentes ento a covarincia entre elas igual a zero". Portanto, ao analisarmos a
varivel Z nas posies t e t+h, com h=1,2,...k, espera-se que o valor da covarincia comece
alto e depois tenda a zero, sendo que quanto maior for o valor da covarincia maior ser a
relao espacial e para covarincia zero teremos independncia. A Figura 9 ilustra uma
funo covarincia.

covarincias

3
2
1
0
-1
0

100

200

300

400

500

600

distncias (m)

Figura 8. Exemplo de uma funo covarincia

Comentamos, anteriormente, que a autocovarincia apresenta algumas dificuldades


de interpretao. Vamos ento definir a funo autocovarincia como uma alternativa de
interpretao da dependncia espacial de uma varivel Z.
Esta funo tem a vantagem de ser adimensional e estar limitada ao valor -1 e 1,
permitindo comparaes entre variveis e tambm inferncias sobre o grau de associao
(dependncia).
Vamos inicialmente fazer uma analogia com as variveis bidimensionais.
Considerando as variveis X e Y, temos:

22

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

( x , y ) =

cov[ X ,Y )]
x y
n

i =1

que pode ser estimada por:

X X ] [Y Y ]

r( x , y ) =

n 1
SxS y

Neste caso quanto mais prximo de 1 ou de -1, maior a relao entre as variveis e
quanto mais prximo de 0, menor a relao linear entre X e Y.
A funo autocorrelao definida como sendo a razo entre a covarincia dos
valores assumidos pela varivel Z, nas posies t e t+h e a varincia dessa varivel Z, em
funo da distncia h, no caso de varivel estacionria de segunda ordem. Desta forma temse:

( h) =

cov[Z (t ), Z (t + h)] Cov[ Z (t ), Z (t + h)]


=
Var[ Z (t )]
2

Trabalhando-se com dados amostrais (h) pode ser estimado por r(h):

n( h )

i =1

[ Z ( t i ) Z ] [ Z ( ti + h ) Z ]
n( h ) 1

r( h ) =

s2

em que:
(h) a autocorrelao entre os valores da varivel Z, separados pela distncia h
(autocorrelao populacional);
Cov [Z(t), Z(t+h)] a covarincia entre a varivel Z(t) e a varivel Z(t+h);
Var[Z(t)] = 2 a varincia populacional, ou seja, a covarincia entre Z(t) e Z(t+h) quando
h=0;
r(h) a autocorrelao amostral para a distncia h;
n(h) o nmero de pontos amostrais separados pela distncia h;
Z o valor mdio (mdia amostral) da varivel Z(t);
s2 a varincia amostral de Z(t).

23

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

r(h)

A Figura 9 mostra um exemplo de comportamento da funo autocorrelao.


1
0.8
0.6
0.4
0.2
0
-0.2
-0.4
0

100

200

300

400

500

600

distncia (m)

Figura 9. Exemplo de um autocorrelograma experimental

O uso dessa funo no estudo da dependncia espacial ou temporal s vlida se a


hiptese de estacionaridade de segunda ordem for atendida.
Teoricamente, para h = O a autocorrelao mxima, ou seja, r(0) = 1 e este valor
decresce at o zero, ou seja, at uma distncia ou tempo que no exista relao entre as
observaes. Esta distncia define a amplitude de dependncia espacial ou temporal (a),
sendo que acima dessa distncia os dados so considerados independentes entre si. Este tipo
de comportamento indica que quanto mais prximas estiverem as amostras maior o grau de
semelhana entre elas e este grau de semelhana decresce com o aumento da distncia entre
observaes.
Podemos ter ainda o autocorrelograma para toda distncia com valor de
autocorrelao igual a zero (r(h) = 0), exceto para h=0 em que r(0) = 1, assim temos
independncia entre as amostras para toda distncia ou tempo de estudo.
Uma outra possibilidade o autocorrelograma com autocorrelaes flutuando em
torno de zero (indica independncia entre as observaes) e o autocorrelograma cclico, que
indica flutuaes peridicas na varivel estudada, conforme Figura 10A e 10B.

24

Prof. Dr. Ednaldo Carvalho Guimares

r(h)

UFU/FAMAT

Geoestatstica Bsica e Aplicada

1.2
1
0.8
0.6
0.4
0.2
0
-0.2

10

15

20

15

20

r(h)

1.2
1
0.8
0.6
0.4
0.2
0
-0.2
-0.4

10
h

Figura 10. Exemplos de autocorrelogrmas: A) independncia entre observaes; B)


periodicidade da varivel.

4.2. Semivariograma
a) Definio do semivariograma
O semivariograma definido como:
1
(h) = {Var[ Z (t ) Z (t + h)]}
2
Note que Var[Z(t) Z(t+h)] a varincia dos dados separados por uma distncia h,
mas, na expresso acima, esta varincia est sendo divida por dois, ento se utiliza o
prefixo semi para distinguir da varincia e da vem o nome semivarincia para (h) e
semivariograma para o grfico de (h) em funo de h.

25

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

Observao: O divisor 2 da varincia surge das dedues e simplificaes


matemticas.

Sob a suposio de tendncia zero, temos: E[Z(t+h)] = E[Z(t)] e, portanto:


1
(h) = {E[ Z (t + h) Z (t )] 2 }
2
^

e uma estimativa de (h) chamada de (h) dada por:


n(h)
^

(h) =

[ z(t + h) Z (t )]

i =1

2n( h )

em que n(h) o nmero de pares separados pela distncia h.


Relembrando a condio de estacionaridade, temos que a utilizao do
semivariograma exige que pelo menos a hiptese intrnseca seja atendida, ou seja, exige a
condio de estacionaridade mais fraca quando comparada com a autocorrelao.

b) Caracterizao do semivariograma
Analisando a expresso da funo semivarincia, pode-se imaginar que quanto mais
prximos estiverem os pontos amostrados, maior ser a semelhana entre eles e, portanto,
menor a semivarincia; e quanto mais distantes estiverem os pontos amostrados menor ser
a semelhana e, consequentemente, maior a disperso (varincia). Na teoria temos que para
a distncia h=0 a semivarincia (0) = 0 e, a semivarincia (h) cresce com o incremento
de h, at atingir um valor constante para (h) que corresponde s variaes aleatrias, ou
seja, variaes que no so justificada pela semelhana de um ponto com outro.
A distncia h a partir da qual (h) se torna aproximadamente constante chamada
de alcance da dependncia espacial (a) sendo que as medies realizadas a distncias
maiores que a, tem distribuio espacial aleatria e, portanto, so independentes entre si. O
valor de (h) constante chamado de patamar (C).
A utilizao de dados amostrais na estimativa da semivarincia e na construo do
semivariograma, revela que, freqentemente, para h = 0 a semivarincia (0) difere de zero.
A impossibilidade de se fazer reamostragem exatamente sobre um ponto j amostrado

26

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

(nestes casos pode ocorrer variaes a distncias menores do que a menor distncia de
amostragem) e erros como erros de amostragem, erros de anlise de laboratrio, etc., so
justificativas dessa descontinuidade na origem. Quando (0) 0, surge um novo termo no
semivariograma chamado de efeito pepita (C0) e, neste caso, o patamar dado por:
C0 + C.
Observao: Pode-se mostrar que o patamar do semivariograma (C0 + C) uma
estimativa sem tendncia da varincia (2) da varivel Z(t).

Nas Figuras 11A

e 11B apresentamos o comportamento ideal de um

semivariograma e tambm so mostrados os parmetros do modelo descritos acima.


C

C0 + C

(A)

(B)

INDEP
DEP.

INDEP.

DEP.

C0

Figura 11. Semivariogramas: (A) sem efeito pepita; (B) com efeito pepita

Os semivariogramas apresentados na Figura 11 indicam estacionaridade de segunda


ordem para a varivel, porque apresenta patamar claro e bem definido.
Se o semivariograma for constante e igual ao patamar para qualquer valor de h,
temos o efeito pepita puro e, neste caso, temos a ausncia total de dependncia espacial,
ou seja, a dependncia espacial, se existir, ser manifestada distncia ou tempo menor do
que o menor espaamento entre amostras.
Um outro tipo de semivariograma aquele que apresenta a semivarincia com
flutuaes. Este semivariograma chamado de semivariograma peridico ou cclico e
indica uma periodicidade nos dados que pode ser explicada por algum fator conhecido e
analisada por meio da densidade espectral.
27

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

Tambm podemos ter um tipo de semivariograma em que as semivarincias


crescem, sem limites, para todos os valores de h, ou seja, semivariogramas sem patamar
definido. Este semivariograma indica que a hiptese de estacionaridade de segunda ordem
no foi atendida e, provavelmente, estamos trabalhando com a hiptese intrnseca (
fenmeno com capacidade infinita de disperso). Ele indica tambm que a mxima
distncia h entre as amostras no foi capaz de exibir toda a varincia dos dados e
provavelmente existe tendncia dos dados para determinada direo. Se for verificada a
tendncia remove-se esta tendncia e verifica-se se a varivel

resduo apresenta

semivariograma com patamar (estacionaridade de segunda ordem). Uma outra alternativa


trabalhar com a hiptese de tendncia nos dados originais. Vale ressaltar que a primeira
alternativa a mais simples e a mais utilizada. Se o semivariograma dos resduos apresenta
efeito pepita puro, pode-se dizer que a superfcie de tendncia a melhor representao
espacial da varivel. Uma metodologia de se ajustar superfcies de tendncia a utilizao
de regresso mltipla.
Podemos ter ainda um semivariograma com mais de uma estrutura de varincia, que
so chamados de semivariogramas com estruturas entrelaadas ou semivariogramas
imbricados. Neste caso uma explicao prtica poderia estar associada ao fato de estarmos
trabalhando com mais de uma populao, ou seja, at uma distncia X estamos trabalhando
com uma determinada populao e a partir da outra ou outras populaes.
As Figuras 12A, 12B, 12C, 12D e 12E, mostram respectivamente, semivariogramas
experimentais com patamar definido, efeito pepita puro, sem patamar, cclico e com
estruturas entrelaadas.

28

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

gama (h)

20

15
10
5
0
0

10

15

20

15

20

15

20

15

20

gama (h)

20
15
10

5
0
0

10
h

gama (h)

20
15

10
5
0
0

10
h

10
gama (h)

6
4
2
0
0

10
h

29

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

gama(h)

40
30

20
10
0
0

10

15

20

25

30

Figura 12. Semivariogramas: A) Com patamar; B) Efeito pepita puro; C) sem patamar
D)Cclico e E) Com estruturas entrelaadas

c) Grau de dependncia espacial


Quanto ao grau de dependncia espacial da varivel em estudo, podemos classificala como:
i) varivel com forte dependncia espacial se o efeito pepita for menor ou igual a 25%
C0

do patamar
< 0,25 ;
C0 + C

ii) varivel com moderada dependncia espacial se o efeito pepita representar entre

C0
25% e 75% do patamar 0,25
0,75 ;
C0 + C

iii) varivel com fraca dependncia espacial se a relao entre efeito pepita e patamar

C0
estiver entre 75% e 100% 0,75 <
< 1,00
C0 + C

iv) varivel independente espacialmente se a relao entre efeito pepita e patamar for
igual a 100%, neste caso temos o semivariograma com efeito pepita puro
C0

= 1,00 .
C0 + C

30

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

d) Isotropia e anisotropia
Note que h um vetor e, consequentemente, o semivariograma depende da
magnitude e da direo de h. Quando o semivariograma idntico para qualquer direo de
h ele chamado de isotrpico e quando o semivariograma apresenta os parmetros C, C0, a
e/ou modelo diferenciado dependendo da direo de h, ele chamado anisotrpico
(podemos classificar a anisotropia em anisotropia geomtrica ou anisotropia zonal). Se o
semivariograma anisotrpico ele deve sofrer transformaes antes de ser usado. Vieira
(1995) alega que, em geral, a preciso da interpolao ou o tipo de hiptese satisfeita, no
so afetados se, ao invs de se preocupar com a escolha de mtodo de transformao de
anisotropia, apenas limitar a faixa de distncia na qual se utiliza o semivariograma. As
principais direes de h que so examinadas so: 0o (na direo X), 90o (na direo Y), 45o
e 1350 (nas duas diagonais principais).
Quando os dados forem coletados em uma transeo (linha), o semivariograma
unidimensional e nada pode ser dito sobre anisotropia.

e) Os principais modelos de semivariogramas


Dados experimentais so influenciados por uma srie de fatores. Um pesquisador,
geralmente, no capaz de controlar todos os fatores que influenciam um conjunto de
dados. Desta idia surge a distino entre modelo matemtico e modelo estatstico.
No modelo matemtico no temos desvios em relao funo proposta, ou seja,
todos os pontos experimentais devem estar sobre a funo proposta para explicar
determinado fenmeno. Por exemplo, se tomarmos os pares ordenados (0,0); (2,4); (3,9);
(4,16) e (5,25) como sendo valores experimentais e propormos o modelo: Yi= Xi2, como o
modelo que explique o comportamento desses dados experimentais, estaremos trabalhando
com um modelo matemtico, pois, todas as observaes pertencem ao modelo proposto
(Figura 13).

31

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

30
25
20
15
10
5
0
-5 0

y = x2

Figura 13. Modelo Matemtico

Para o modelo estatstico os valores experimentais apresentam desvios (erros) em


relao ao modelo proposto (ajustado) e estes erros so atribudos a fontes de variaes no
controladas pelo pesquisador. Por exemplo, podemos ter o seguinte modelo estatstico que
explique o comportamento linear de uma varivel Y em funo de X: Yi = a +bXi +ei,
(Figura 14) em que a e b so as constantes que definem a reta e ei so os erros
experimentais (maiores detalhes podem ser obtidos em textos e livros sobre modelos
lineares ou anlise de regresso).
15
y = 2.0286x + 1.4286+ei

10
5
0
0

Figura 14. Modelo Estatstico


Na aplicao da teoria geoestatstica a dados experimentais, vamos ajustar modelos
tericos de semivariogramas as semivarincias experimentais, e desta forma estaremos
trabalhando com modelos estatsticos de semivariogramas.

32

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

O grfico da semivarincia ((h)) em funo da distncia (h), mostrar uma srie de


pontos discretos que chamado semivariograma experimental. Uma funo contnua deve
ser ajustada as semivarincias experimentais.
A escolha do modelo de semivariograma que ser utilizado um dos aspectos mais
importantes da geoestatstica. Todos os clculos da geoestatstica dependem do modelo de
semivariograma ajustado e, conseqentemente, se o modelo ajustado no for apropriado,
todos os clculos seguintes contero erros que podero afetar as inferncias, portanto o
ajuste de semivariograma uma fase crucial na anlise geoestatstica e deve receber uma
ateno especial.
Vrios mtodos so utilizados para verificar a qualidade do ajuste do
semivariograma aos dados experimentais.
Vieira et al (1983) sugerem o mtodo de ajuste por tentativa e erro (ajuste a critrio
do observador) associado avaliao do modelo pela tcnica de validao cruzada ou
autovalidao (jack-Knifing).
Macbratney e Webster (1986) sugerem o mtodo do Critrio de Informao de
Akaike (AIC) para avaliar o modelo. J Pannatier (1996) sugere a utilizao do "Indicao
da Qualidade do Ajuste" (IGF).
A descrio de cada mtodo de seleo pode ser encontrado nos respectivos
trabalhos originais dos autores e cada programa de anlise geoestatstica de dados apresenta
um critrio de seleo.
O programa GS+, com o qual estamos exemplificando este texto, aplica a
metodologia dos mnimos quadrados para os ajustes dos modelos e utiliza como critrios
para seleo do modelo: i) o coeficiente de determinao (R2), que, relembrando os
conceitos de anlise de regresso, uma relao entre a soma de quadrados devido ao
modelo ajustado e a soma de quadrados total (mede a variao dos dados devido ao modelo
ajustado em relao variao total dos dados) e quanto mais prximo da unidade estiver o
valor de R2 melhor ser o modelo ajustado; ii) Soma de quadrados de resduos (RSS)
quanto menor for este valor, melhor ser o modelo de semivariograma. O GS+ utiliza este
resultado para a seleo do modelo e, por meio de combinaes dos parmetros do modelo,
minimiza esta soma de quadrados de resduos. O autor do programa alega que a utilizao

33

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

desse critrio na seleo do modelo preferido, por ser este mais sensvel e mais robusto
quando comparado com o coeficiente de determinao (R2).

Observao: Em muitos casos (talvez na maioria dos casos) a sensibilidade de quem est
trabalhando com os dados e o conhecimento sobre a varivel de fundamental importncia
na opo do modelo de semivariograma. s vezes prefervel selecionar um modelo com
R2 um pouco menor ou RSS um pouco maior que o sugerido pelo programa, mas que
represente melhor os dados. De maneira geral, quanto mais simples puder ser o modelo
ajustado, melhor, e tambm no se deve dar importncia excessiva a pequenas flutuaes.

A condio para o ajuste de modelos a dados experimentais que ele represente a


tendncia de (h) em relao h e que o modelo tenha positividade definida condicional.
De maneira geral, um modelo positivamente condicional se (h)> 0 e (-h) = (h),
qualquer que seja h.
Definindo C0 como efeito pepita, C0 + C como patamar e a como alcance, os
principais modelos de semivariogramas utilizados na geoestatstica so:
i)

modelo linear com patamar

C 0 + h
( h) =
a
C 0 + C

0ha
h>a

Neste caso C/a o coeficiente angular para 0< h < a

ii)

modelo esfrico

3 h 1 h 3
C + C
(h) = 0
2 a 2 a

C0 + C
iii)

modelo exponencial

(h) = C0 + C 1 e[ 3( h / a )]
34

0ha
h>a

0<h<d

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

Neste modelo e no modelo de gaussiano d a distncia mxima na qual o semivariograma


definido e nestes modelos o patamar (a) atingido apenas assintoticamente O parmetro a
determinado visualmente como a distncia aps a qual o semivariograma se estabiliza.

iv)

modelo gaussiano

(h) = C 0 + C 1 e [ 3( h / a )
v)

0hd

modelos sem patamar

( h ) = C0 + Ah B

0<B<2

Os parmetros A e B so constantes que definem o modelo, sendo que B tem que ser
estritamente maior que zero e menor que dois para garantir a condio de positividade
definida condicional.

Observao: dependendo da escala de trabalho e do espaamento entre amostras, pode-se


ter mais de um modelo de semivariograma para os dados. Nestes casos temos as estruturas
entrelaadas.

As Figuras 15A e 15B mostram os aspectos gerais dos modelos de semivariogramas


discutidos anteriormente.
(A)

A=8,0; B=0,5
A=0,9; B=1,0
A=0,1;B=1,5

Linear
Gaussiano
Exponencial
Esfrico

(B)

Figura 15. Modelos de semivariograma: (A) com patamar; (B) sem patamar.

Observao: Nos modelos exponencial e gaussiano, apresentados no programa GS+, a


amplitude a que deve ser considerada como a amplitude de dependncia espacial deve ser
igual a trs vezes e

3 vezes, respectivamente, o valor de A0, ou seja, a amplitude efetiva

35

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

apresentada na coluna

Geoestatstica Bsica e Aplicada

posterior a coluna de A0. Isto ocorre porque os modelos

exponencial e gaussiano utilizados no programa no consideram o fator 3 apresentados nos


modelos anteriores.

4.3. O uso do software GS+ na determinao do semivariograma


No programa GS+ o cone

indica que a anlise da dependncia espacial ser

realizada por meio do semivariograma.

Observao: Existem outras opes de anlises que so apresentadas em


autocorrelation ou nos respectivos cones na barra de ferramentas.

Ativando o cone do semivariograma, o programa apresenta a seguinte janela


(Figura 16):
Distncia mxima
para clculo das
semivarincias

Passos para
clculo da
semivarincia

Anlise de
anisotropia

Clculo das
semivarincias e do
semivariograma

Exibe o
semivar.

Varincia
amostral
Semivar.
escalonado

Semivariograma
isotrpico
Semivariogramas
anisotrpicos

Figura 16. Anlise da semivarincia

36

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

A distncia mxima para clculo da semivarincia deve ser no mximo igual


mxima distncia de coleta da amostra. O GS+ adota como critrio inicial 80% da distncia
mxima, isto se justifica pelo fato de que a grandes distncias o nmero de pares para o
clculo da semivarincia reduz-se drasticamente, fazendo com que a estimativa da
semivarincia tenha pouca preciso. Este valor pode ser alterado pelo usurio.
Os passos para clculo das semivarincias consiste em como as semivarincias
vo ser agrupadas. Quanto maior for este valor menos pontos teremos no semivariograma.
Vale ressaltar tambm que, se este passo for muito pequeno, teremos classes de distncia
sem pares para clculo da semivarincia.
Para a anlise do semivariograma isotrpico o ngulo de tolerncia (offset
tolerance) deve ser de 900 e, neste caso, os semivariogramas para as diferentes direes
(anisotrpico) sero iguais ao semivariograma isotrpico. No abordaremos neste texto a
discusso sobre anisotropia e procedimentos de anlise de anisotropia.
A janela apresentada na Figura 9 mostra tambm as opes de exibio do
semivariograma. Se marcarmos apenas a primeira opo, teremos o semivariograma
experimental e uma proposta de modelo ajustado. Marcando-se a primeira e a segunda
opes, temos o semivariograma experimental, a proposta de modelo e uma linha paralela
ao eixo X que representa a varincia dos dados. Na terceira opo exibido o
semivariograma escalonado, ou seja, o semivariograma onde cada semivarincia dividida
pela varincia dos dados.
A Figura 17 ilustra o resultado de um semivariograma.

37

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

Mostra o semivariograma
com os respectivos
parmetros e ajuste

Mostra as opes de modelos


com os parmetros e ajuste

Figura 17. Exemplo de um semivariograma

Note que a Figura 17 apresenta ainda a opo model e a opo expand. O resultado
da execuo dessas funes so apresentados nas Figuras 18 e 19.
A Figura 18 exibe as opes de modelos de semivariogramas.

modelos

Efeito
pepita

Refaz o semivariograma
padro do GS+

patamar

amplitude

Amplitude
efetiva (exp
e gaussiano).

Relao
entre C e
patamar

Coef.
Determinao e
soma de quadrados
de erros

Aplica o novo
modelo caso haja
modificao

Figura 18. Modelos e anlises dos modelos

38

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

O GS+ permite, no comando model (Figura 18), visualizar os modelos com os


respectivos ajuste feito pelo programa (vale relembrar que o GS+ seleciona o modelo com
menor soma de quadrados de resduos (RSS)). Ao usurio permitido a modificao do
modelo selecionado pelo GS+ ou, ento, dos parmetros dos modelos e, realizadas
modificaes, o comando apply deve ser ativado para que o programa tome este modelo
como o modelo de variabilidade espacial ou temporal daquela varivel. Para retornar ao
modelo padro do GS+ utilize o comando refit.

Observaes:
a) O programa no apresenta o modelo de efeito pepita puro. Para obter este modelo
utilize o modelo linear com C0 = C0 +C.
b) A amplitude efetiva utilizada no GS+ para determinar a amplitude de dependncia
espacial dos modelos exponencial e gaussiano, devido a formula de clculo desses
modelos no programa, A0 A (Estes modelos no GS+ no consideram o fator
multiplicativo 3).
c) A inclinao no modelo linear e linear com patamar (coeficiente angular) e dado pela
relao entre C e A0, ou seja, C/A0.
d) A relao entre C e C0+C nos d uma idia do grau de dependncia espacial da varivel,
sendo que quanto mais prximo de 1, maior a dependncia espacial. Note que
C0
C
e o primeiro termo j foi discutido no item grau de dependncia
= 1
C0 + C
C0 + C
espacial, classificando a dependncia como fraca, moderada e forte.
e) R2 (coeficiente de determinao) e RSS (soma de quadrados de resduos) nos informa
sobre a qualidade do ajuste do modelo.
f) No ajuste do modelo a sensibilidade do usurio muito mais importante do que os
valores de R2 e RSS e, portanto, tentativas de ajustes diferentes ao proposto pelo
programa devem ser utilizadas, mesmo que isso cause queda no valor de R2 e acrscimo
no valor de RSS.
g) O programa no apresenta a opo de ajuste de modelo sem patamar diferente do linear.
Neste caso, sugere-se que se copie as semivarincias calculadas para outro programa e
que o grfico seja feito neste outro programa, por exemplo, O Excel.

39

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

A Figura 19 mostra o resultado da execuo do comando expand.

Semivariograma
experimental e
modelo ajustado

Parmetros do
modelo
ajustado

Lista semivarincia
calculada, com
distncias e nmero de
pares

Mostra as diferenas
quadrticas que geram
a semivarincia

Edita o
semivariograma

Figura 19. Semivariograma e opes de edio


Nesta tela temos a exibio das semivarincia calculadas, do modelo de
semivariograma ajustado e dos parmetros desse modelo. A listagem dos valores de
semivarincias com as respectivas distncias de clculo (list values), permite que estes
valores sejam transportados para outros programas e que se faa vrios modelos em uma
nica figura.

40

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

4.4. Exemplos de aplicao


1) Suponha que os dados abaixo representem a varivel Z (por exemplo, % de areia de um
certo solo). A amostragem foi feita em uma transeo e as amostras foram coletadas a
cada 20 m. Faa a anlise descritiva da varivel, calcule as semivarincias, monte o
semivariograma experimental e proponha um modelo de ajuste. (note que estes dados
so unidimensionais).
Tabela 1. Dados de % de areia em um solo.
h (m)
0
20
40
60
80
100
120
140
%Areia 16
18
17
20
15
15
15
15
h(m)
160
180
200
220
240
260
280
300
%Areia 17
17
17
18
18
19
18
18
h(m)
320
340
360
380
400
420
440
460
%Areia 18
21
16
20
16
18
18
17
h(m)
480
500
520
540
560
580
600
620
%Areia 18
18
20
17
17
17
17
18
Observao: para ser resolvido sem o uso de programas de geoestatstica
Soluo:
a) Anlise descritiva
Mdia
Erro
padro
Mediana
Moda
Desvio
padro
Varincia
Curtose
Assimetria
Mnimo
Mximo

17.46875
0.265581
17.5
18
1.50235
2.257056
0.129546
0.27713
15
21

A anlise descritiva mostra que os dados possuem uma distribuio de probabilidade


normal aproximada (mdia, mediana e moda aproximadamente iguais; curtose e assimetria
prximos de zero; grfico tendendo simetria). A variabilidade do dados relativamente
baixa (desvio padro = 1,5023 e CV = 8,6%) e os valores mnimo e mximo indicam a no
existncia de problemas amostrais com os dados.

41

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

b) Semivarincia e semivariograma
Os valores das distncias h, das semivarincias ((h)) e nmeros de pares(n(h)) utilizados
no clculo so apresentados abaixo.
Distncias de clculo, valores de semivarincia e nmero de pares.
Distncia h (m)
Semivarincia ((h))
20
2,129
40
1,417
60
2,500
80
2,214
100
2,037
120
2,327
140
2,120
160
2,396
180
2,065
200
2,545
220
2,738
240
2,825
260
2,711
280
1,778
300
2,735
320
1,719
340
3,367
360
1,857
380
2,808
400
2,375
420
2,318
440
2,400
460
1,056

Nmero de pares (n(h))


31
30
29
28
27
26
25
24
23
22
21
20
19
18
17
16
15
14
13
12
11
10
9

A representao grfica (semivariograma) das semivarincias em funo da distncia h


(semivariograma experimental) e uma proposta de modelo ajustado aos dados
experimentais so apresentados na figura abaixo.

semivarincia

4.000
3.000
2.000
1.000
0.000
0

100

200

300

400

500

h (m)

Semivariograma experimental e modelo ajustado.

42

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

O modelo proposto inicialmente um modelo exponencial, com efeito pepita (C0)


de 1,0 (%)2, patamar (C0+C) de 2,3 (%)2 e alcance (a) de 120 m. (Observao: no foi
realizado nenhum teste para verificar se este o melhor modelo de semivariograma para
esta varivel).
Neste caso o semivariograma mostra uma dependncia espacial para a % de areia
at 120 m, ou seja, amostras coletadas a distncia inferiores a 120 m possui dependncia
espacial e, no caso da utilizao de mtodos de anlises estatsticas que consideram
independncia entre amostras, distncia de amostragem mnima deveria ser de 120 m.
OBS: Exerccio resolvido com o auxlio do MS-EXCEL

2) Utilizando os dados do exemplo anterior (exemplo1) refaa a anlise utilizando o GS+


Soluo:
a) Anlise descritiva

b) Semivariograma
O modelo proposto pelo GS+ foi:

43

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

O modelo proposto no exemplo 1 apresenta o seguinte resultado:

Comparando os dois modelos verifica-se ligeiro aumento de r2, mantendo-se o mesmo valor
de RSS, desta forma o modelo proposto no exemplo 1 poderia ser utilizado.
As descries e discusses seguem o padro do exemplo 1.
Lembre-se que o modelo adotado foi o exponencial e portanto o alcance efetivo ser de
40,80 m no primeiro caso e de 120 m no segundo caso.
Outros modelos poderiam ser sugeridos neste caso.

44

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

3) A seguir apresentamos as coordenadas X (m), Y (m) e a varivel silte (%) em uma rea
experimental.
X

10

10

10

10

10

10

10

10

10

20

30

40

50

60

70

10

20

30

40

50

60

70

PBPD

X
Y
PBPD

12.77 12.84 11.39 12.30 12.43 12.43 12.45 12.74 11.39 12.32 12.16 11.49 10.39 11.32 11.24 12.49
20

20

20

20

20

20

20

20

30

30

30

30

30

30

30

30

10

20

30

40

50

60

70

10

20

30

40

50

60

70

11.25 11.97 12.38 12.85 12.55 12.49 12.58 12.82 12.49 11.67 11.59 12.72 11.12 11.18 11.53 11.48

40

40

40

40

40

40

40

40

50

50

50

50

50

50

50

50

10

20

30

40

50

60

70

10

20

30

40

50

60

70

PBPD

11.81 11.19 11.46 11.44 12.39 12.17 11.69 12.32 11.58 11.11 11.55 10.79 11.13 11.29 12.62 12.01

60

60

60

60

60

60

60

60

70

70

70

70

70

70

70

70

10

20

30

40

50

60

70

10

20

30

40

50

60

70

PBPD

12.66 11.49 11.25 12.87 12.77 11.95 11.96 11.11 10.81 11.65 12.36 11.90 12.16 12.56 12.54 11.46

Realizar a anlise dos dados e verificar se existe dependncia espacial para essa varivel.
SOLUO:
a) Anlise descritiva
O resultado das principais estatsticas dessa varivel apresentado a seguir:

Nota-se que a rea apresenta, em mdia, 11,92% de silte, com disperso mdia em torno
desse valor de 0,6302%. Esta disperso em torno da mdia representa uma variabilidade de
5,29% (CV=5,29%), mostrando que os dados tm uma baixa disperso. Os coeficientes de
assimetria e curtose com os respectivos erros padro indicam tendncia simtrica dos
dados, mas a curva do tipo platicrtica, diferindo da curva normal (mesocrtica). Com base
em uma anlise visual do histograma, verifica-se uma distribuio de freqncias bimodal
para esta varivel.

A distribuio das amostras na rea segundo o valor de ocorrncia a seguinte:

45

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

No se observa tendncias de concentrao de valores em posies especficas da rea e


tambm no ocorre sentido preferencial na distribuio dos dados, tal fato um primeiro
indicativo de que a distribuio espacial dessa varivel, nesta rea, aleatria e isotrpica.

b) Anlise do semivariograma
A seguir mostrado o semivariograma dessa varivel:

46

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

O modelo apropriado para descrever o comportamento espacial dessa varivel foi o modelo
de efeito pepita puro. Nota-se que as semivarincias experimentais esto em torno da linha
paralela ao eixo x, ou seja, C0 + C = 0,397. Conclui-se, portanto, que a distribuio espacial
do silte nesta rea experimental aleatria e as amostras, para a malha amostrada (com
distncia entre pontos de 10 m), so independentes.

4) Os dados apresentados abaixo referem-se a umidade de um solo. As amostras foram


coletadas em uma malha contendo 63 pontos com espaamento de 20 m entre amostra,
perfazendo 9 colunas e 7 linhas de amostragem.
X

20

40

60

80

100

120

140

160

180

20

40

60

80

100

120

140

20

20

20

20

20

20

20

20

20

40

40

40

40

40

40

40

X
Y
U

28.16 27.16 26.09 27.27 27.61 26.61 26.13 29.73 31.12 27.52 26.54 26.45 24.98 27.93 26.91 24.13
160

180

20

40

60

80

100

120

140

160

180

20

40

60

80

100

40

40

60

60

60

60

60

60

60

60

60

80

80

80

80

80

27.80 29.69 28.40 27.63 27.42 26.81 26.37 28.61 27.66 30.17 28.86 26.58 26.03 26.72 27.50 26.44

120

140

160

180

20

40

60

80

100

120

140

160

180

20

40

60

80

80

80

80

100

100

100

100

100

100

100

100

100

120

120

120

23.63 26.83 25.46 24.17 26.61 24.49 22.35 22.05 22.05 24.98 23.35 26.18 22.30 27.89 24.64 24.20

80

100

120

140

160

180

20

40

60

80

100

120

140

160

180

120

120

120

120

120

120

140

140

140

140

140

140

140

140

140

PBPD

25.36 24.77 27.54 25.49 24.45 24.36 26.39 26.73 29.87 23.63 25.30 23.27 25.82 26.85 25.36

Realizar a anlise dos dados e verificar se existe dependncia espacial para essa varivel.

47

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

Soluo:
a) Anlise descritiva
As estatsticas e o histograma da varivel umidade foram:

Verifica-se que este solo apresentou, na poca de coleta, umidade mdia de 26, 24 g de
gua/100g de solo, com desvio padro de 2,020 g/100g, o que representa uma variabilidade
de 7,7%, considerada uma baixa variabilidade dos dados em torno do valor mdio. Os
histogramas, associado assimetria e curtose dos dados, mostram que os dados se
distribuem segunda a curva normal.

As posies ocupadas pelos valores de umidade do solo na rea experimental (figura


abaixo), mostram tendncia de que os valores mais altos de umidade (acima de 27,50
g/100g) se concentrem na metade inferior da malha, considerando o eixo Y como referncia
e, conseqentemente, os valores abaixo de 27,50 g/100g se concentram na parte superior da
malha, mostrando uma distribuio espacial no aleatria dos dados. No possvel
visualizar tendncia de distribuio dos dados nas direes preferencias da malha, ou seja,
provavelmente exista uma isotropia na distribuio da umidade do solo nesta rea.

48

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

b) Anlise do semivariograma
O semivariograma desta varivel :

Nota-se que a varivel umidade do solo apresenta dependncia espacial, que pode ser
descrita pelo modelo exponencial com alcance de 81 m, ou seja, amostras de umidade do
solo selecionadas a distncias inferiores a 81 m esto correlacionadas entre si. A relao
entre o efeito pepita e o patamar de 13,63%, indica que a dependncia espacial forte.

49

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

5. KRIGAGEM
5.1. O interpolador
O semivariograma a ferramenta da geoestatstica que permite verificar e modelar a
dependncia espacial de uma varivel. Uma aplicao imediata do semivariograma a
utilizao das informaes geradas por ele na interpolao, ou seja, na estimativa de dados
e posterior mapeamento da varivel. O interpolador que utiliza o semivariograma em sua
modelagem chamado de krigagem. O nome krigagem uma homenagem ao engenheiro
sul-africano D. G. Krige.
Para a aplicao da krigagem assume-se: que sejam conhecidas as realizaes z(t1),
z(t2), ..., z(tn) da varivel Z(t), nos locais t1, t2, ..., tn; que o semivariograma da varivel j
tenha sido determinado; e que o interesse seja estimar um valor z* na posio t0.
O valor estimado z*(t0) dado por:
n

z * (t 0 ) = i z (t i )
i =1

em que: n o nmero de amostras de Z(t) envolvidas na estimativa de z*(t0), e i so os


pesos associados a cada valor medido, z(ti).
Observao: Se existe a dependncia espacial, os pesos i so variveis de acordo com a
distncia entre o ponto a ser estimado z*(t0) e os valores z(ti) envolvidos nas estimativas. Se
ocorre a independncia espacial, ento : i = 1/n e, portanto temos a mdia aritmtica
simples.

A melhor estimativa de z*(t0) obtida quando:


a) o estimador no tendencioso
E{z * (t 0 ) z (t 0 )} = 0
b) a varincia da estimativa mnima
Var[ z * (t 0 ) z (t 0 )] = mnimo
Para que z* seja uma estimativa no tendenciosa de z, a soma dos pesos das
amostras tem que se igualar a 1.

=1

50

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

E para obter a varincia mnima sob a condio de i = 1, introduz-se o


multiplicador de Lagrange para a deduo das equaes e o sistema de krigagem resultante
:
n

(t , t
i =1

) + = (t i , t 0 )

em que: o multiplicador de Lagrange.


A varincia de estimativa dada por:

E2 = + i (t i , t 0 )
O sistema de equaes da krigagem contm n+1 equaes e n+1 incgnitas e uma
nica soluo produz n pesos e um multiplicador de Lagrange .
Em notao matricial, chamando de A a matriz das semivarincias dos valores
amostrados envolvidos na estimativa de z*(t0); a matriz coluna que contm os pesos i e o
multiplicador de Lagrange e b a matriz coluna das semivarincias entre os valores
amostrados e o ponto a ser estimado, tem-se:
A
=b
E, portanto:
=A-1b
A varincia da estimativa (E2) e dada por:
E2 = bt
As matrizes A, b e so:
(t1 , t1 )
(t , t )
2 1
.

A= .
.

(t n , t1 )
1

(t1 , t 2 ) .... (t1 , t n )


(t 2 , t 2 ) .... (t 2 , t n )
.
.
.
.
.
.
(t n , t 2 ) ..... (t n , t n )
1
1

1
(t1 , t 0 )
(t , t )
1
2 0

. ; b= .
; =
.

1
(t n , t 0 )
1

51

1

2
.

.
.

n

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

Observaes:
i)

A matriz A simtrica e possui diagonal principal igual a zero, ou igual ao valor do


efeito pepita.

ii)

Os valores 1 que aparecem nas matrizes A e b so conseqncia do multiplicador de


Lagrange.

iii)

O sistema deve ser resolvido para cada estimativa z* e para cada variao do
nmero de amostras envolvidos na estimativa.

5.2. A krigagem no programa GS+


A Figura 20 mostra a janela da krigagem no GS+. Para ativar a krigagem basta ativar o
cone com a letra k.
Informaes sobre a
malha

Validao cruzada

Mtodo de
krigagem

Modelo de
semivariograma

Arquivo e tipo de
arquivo para gravar a
krigagem

vizinhos

Figura 20. Krigagem no GS+

A krigagem pode ser expressa por meio de mapas, sendo necessrio para isto, ativar o cone
map, tendo como resultado a Figura 21.

52

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

Figura 21. Opes de mapas no GS+

Exemplo: Utilizando os dados no exemplo de umidade do solo (exemplo 4) fazer a


krigagem e o mapeamento da varivel umidade.
Soluo:
Como exemplo de sada dos resultados da krigagem temos uma pequena parte dos
resultados da krigagem, os resultados apresentam com as coordenadas (x,y), os valores
krigados, os desvios padro desses valores e o nmero de vizinhos utilizados na estimativa.

53

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

O mapa da umidade do solo apresentado a seguir:

Neste mapa so apresentadas as regies de ocorrncia das umidades do solo.

54

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

6. SEMIVARIOGRAMA CRUZADO E COKRIGAGEM


6.1. Semivariograma cruzado
Os semivariogramas cruzados objetivam descrever a variao espacial e/ou temporal
simultnea de duas variveis aleatrias. Na natureza comum encontrar variveis que esto
fortemente associadas entre si, por exemplo, a umidade relativa do ar est intimamente
relacionada precipitao pluviomtrica.
Em algumas situaes a determinao de variveis cara e difcil e isto pode
comprometer o estudo da variabilidade espacial daquela varivel, entretanto se sabemos que
existe uma outra varivel de simples determinao e que apresenta boa correlao espacial
com a de difcil determinao pode-se fazer a estimativa de uma delas usando-se informaes
de ambas expressas no semivariograma cruzado, por meio do mtodo chamado co-krigagem.
Estaremos, neste caso, trabalhando com a idia de covarivel.
Consideremos duas variveis {Z1(t1i), i=1,...,n1} e {Z2(t2j), j=1,...,n2}, com as
amostragens feitas no mesmo espao (rea ou tempo), mas que o nmero de amostras de Z1
seja superior ao nmero de amostras de Z2 (n1 >n2).
Assumindo que pelo menos a hiptese intrnseca est sendo atendida para cada
varivel individualmente e para a distribuio conjunta das variveis, podemos definir os
semivariograma individuais e os semivariogramas cruzados como:
Ai) Os semivariogramas de Z1(t1i) e Z2(t2j):

11(h) =

1
E { Z 1( t 1i + h) - Z 1( t 1i ) }2 B
2

22 (h) =

1
E { Z 2 ( t 2j + h) - Z 2 ( t 2j ) }2 C
2

ii) O semivariograma cruzado entre Z1(t1i) e Z2(t2i), igual ao semivariograma cruzado entre
Z2(t2j) e Z1(t1i):

12 (h) = 21( h ) =

1
E {[ Z 1( t 2i + h) - Z 1( t 1i )][ Z 2 ( t 2j + h) - Z 2 ( t 2j )]}
2

55

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

Portanto, a semivarincia pode ser estimada por:

1 n(h)
[ Z 1( t 1i + h) - Z 1( t 1i )][ Z 2 ( t 2j + h) - Z 2 ( t 2j )] E
12 (h) =
2n(h) i=1
onde n(h) o nmero de valores de Z1 e Z2 separados por um vetor h.
Pode-se notar que o semivariograma um caso particular do semivariograma
cruzado, quando as duas variveis so idnticas.
O semivariograma cruzado s ser calculado usando as informaes existentes para
posies geogrficas coincidentes. Isto significa que Z1 e Z2 tem que ser, necessariamente,
definidos para os mesmos locais, e as informaes excedentes no so consideradas no
clculo.
Um semivariograma cruzado com caractersticas que podem ser identificadas como
ideais, teria aparncia do semivariograma simples (de uma nica varivel, ou seja, patamar
definido, semivarincia crescente para pequenas distncias, modelo esfrico), porm, com
significados diferentes, pelo simples fato de envolver o produto das diferenas de duas
variveis diferentes. Por exemplo, ao contrrio do semivariograma, no obvio que o valor
do semivariograma cruzado para h=0, deva ser nulo. Assim, alm de espaos menores do que
distncia de amostragem, acumulado no mesmo parmetro, est falta de correlao entre as
duas variveis.

O alcance aqui representa apenas o final ou a distncia mxima de

dependncia espacial entre as variveis. J o patamar do semivariograma cruzado, se existir,


deve aproximar-se do valor da covarincia entre as duas variveis. Assim, quando as duas
variveis forem de correlao inversa, isto , quando aumenta uma a outra diminui, a
covarincia ser negativa e, conseqentemente, o semivariograma cruzado ser negativo. Os
modelos utilizados para o semivariograma cruzado so os mesmos j discutidos para o
semivariograma simples.

6.2. Co-krigagem
A krigagem um caso particular do mtodo co-krigagem. Uma vez que exista a
dependncia espacial para cada uma das variveis Z1 e Z2, e que tambm exista dependncia
espacial entre Z1 e Z2, ento possvel utilizar a co-krigagem para estimar valores.

56

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

Suponha que se queira estimar valores, Z2*, para qualquer local, t0, e que a estimativa
deva ser uma combinao linear de ambos Z1 e Z2, ou seja,

z*2 (t0

)=

i= 1

1i z 1( t 1i ) +

i= 1

2j z 2 ( t 2j ) F

onde n1 e n2 so os nmeros de vizinhos de Z1 e Z2, respectivamente, e 1i e 2j so os pesos


associados a cada valor de Z1 e Z2. Tomando z1(t1i) e z2(t2i) como sendo uma realizao das
funes aleatrias, Z1(t1i) e Z2(t2i), respectivamente, e assumindo estacionaridade de ordem 2,
o estimador pode ser reescrito em:

Z *2 (to

)=

n1

i= 1

1i Z 1( t 1i ) +

n2

i= 1

2j Z 2 ( t 2j ) G

Para que o estimador seja timo, ele no pode ter tendncia e tem que ter varincia
mnima. Em outras palavras, para que o estimador seja o melhor possvel, necessrio que ele
no superestime nem subestime valores, e que a confiana nas estimativas seja mxima.
O raciocnio bsico para deduo do sistema de equaes da co-krigagem idntico
ao da krigagem, com uma diferena que, neste caso, envolve duas variveis, e por isto envolve
equaes mais longas, com subscritos, complicando um pouco mais a situao. Porm, o
raciocnio e, por conseguinte, a lgebra envolvida, so o mesmo.
Para que a estimativa no tenha tendncia, qualquer que seja a distribuio dos pesos,
a soma daqueles associados com a varivel estimada deve ser igual a 1, e a soma daquelas
associadas outra varivel, tem que ser nula.
O sistema co-krigagem e a varincia da estimativa podem ser escritos em termos de
semivariograma, usando a hiptese de estacionaridade de ordem 2. Assim, o sistema da cokrigagem, em termos de semivariograma fica:

57

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

n1

i= 1

n2

1i 12 ( t 1i ,t 1k ) +

j=1

2j 12 ( t 1k ,t 2j ) - 1 =

= 12 ( t 1k ,t 0 ), k = 1,... n1

n1

i=1

1i 12 ( t 1i ,t 2l ) +

n2

j=1

2j 22 ( t 2j ,t 2l ) - 2 =

= 22 ( t 2l ,t 0 ), l = 1,... n2
I

N1

i=1

1i = 0

N2

2j = 1

j=1
e a varincia da estimativa fica:

n1

n2

k 2( t 0 ) = 1 + 2 + 1i 12 ( t 1i ,t 0 ) + 2j 22 ( t 2j ,t 0 ) J
i= 1
j =1
2

A soluo do sistema da co-krigagem produzir n1 pesos 1i e n2 pesos 2j e os


multiplicadores Lagrangeanos, 1 e 2.
O sistema da co-krigagem pode ser escrito em notao matricial como,
[ ] [ ] = [b] K
cuja soluo

58

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

-1
[ ] = [ ] [b] L

onde []-1 o inverso da matriz de coeficientes [], [] a matriz dos pesos procurados, 1i e
2j, e [b] o lado direito do sistema de equaes (semivarincia do ponto a ser estimado (t0) e
o ponto observado (t12 ou t21)).
A varincia da estimativa pode ser escrita como:

t
2 k2 ( t 0 ) = [ ] [b] M
onde []t o transposto da matriz [].

Suponha ento que o nmero de vizinhos de Z2 usados seja n2=2, e de Z1, n1=4. A
matriz [] ser ento de 8x8 e pode ser escrita como:
11 ( t 11 , t11 )

11 ( t12 , t 11 )

11 ( t 13 , t 11 )

11 ( t 14 , t 11 )

12 ( t 11 , t 21 )

12 (t11 , t 22 ) 1 0

11 ( t 11 , t 12 ) 11 ( t 12 , t 12 )

11 ( t 13 , t 12 )

11 ( t 14 , t 12 )

12 ( t 12 , t 21 ) 12 ( t 12 , t 22 ) 1 0

11 ( t 11 , t 13 ) 11 ( t 12 , t 13 )

11 ( t 13 , t 13 )

11 ( t 14 , t 13 )

12 ( t 13 , t 21 )

12 ( t 11 , t 14 ) 11 ( t 12 , t 14 )

11 ( t 13 , t 14 ) 11 ( t 14 , t 14 ) 12 ( t 14 , t 21 ) 12 ( t 14 , t 22 ) 1 0

12 ( t 13 , t 22 ) 1 0

12 ( t 11 , t 21 ) 12 ( t 12 , t 21 ) 12 ( t 13 , t 21 ) 12 ( t 14 , t 21 ) 22 ( t 21 , t 21 ) 22 ( t 21 , t 22 ) 0 1
12 ( t 11 , t 22 )

12 (t12 , t 22 ) 12 ( t 13 , t 22 ) 12 ( t 14 , t 22 ) 22 ( t 22 , t 21 ) 22 ( t 22 , t 22 ) 0 1

0 0 0

1 0 0

A matriz [] poder ser escrita como

11
12
13
14
[ ] =
21
22
1
2

59

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

N
A matriz [b] do lado direito fica,
12 ( t 11 , t 0 )
12 ( t 12 , t 0 )
[b] =

12 ( t 13 , t 0 )
12 ( t 14 , t 0 )
22 ( t 21 , t 0 )
22 ( t 22 , t 0 )

6.3. Varincia da estimativa


O simples fato de que, atravs da krigagem ou da co-krigagem, pode-se conhecer
tambm a varincia da estimativa, diferencia-os de qualquer outro mtodo. Esta uma
propriedade interessantssima, pois, alm de permitir a estimativa de valores sem tendncia
para os locais onde estes no foram medidos, ainda se pode conhecer a confiana associada a
estas estimativas, as quais podem ser chamadas de timas.
Quanto menor for o efeito pepita do semivariograma, menor ser a varincia da
estimativa. Mais precisamente, quanto menor for a proporo do efeito pepita para o patamar
do semivariograma, maior a continuidade do fenmeno, menor a varincia da estimativa ou
maior a confiana que se pode ter na estimativa.
Examinando-se as equaes relativas aos clculos das varincias da estimativa de
krigagem e co-krigagem, respectivamente, nota-se que so apenas indiretamente dependentes
dos valores medidos.

Isto porque, o semivariograma e semivariogramas cruzados,

representam a maneira como a varivel regionalizada varia de um local para o outro no


espao, e os pesos so conseqncias deste fato.

Porm, uma vez que se conhece o

semivariograma de uma propriedade, qualquer tipo de esquema de amostragem pode ser


desenhado para varincias da estimativa pr-especificadas. Obviamente, a varincia da
estimativa sendo uma funo da distncia ou distribuio espacial das amostras, ser mxima

60

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

nos locais mais distantes de valores medidos. Assim, baseado em semivariogramas de


variveis medidas em carter de reconhecimento, amostragens definitivas podem ser
desenhadas para satisfazer condies pr-especificadas. A localizao ideal de uma rede de
pluvimetros em bacias hidrogrficas constitui um exemplo prtico desse procedimento. O
mesmo pode tambm ser utilizado atravs da co-krigagem, ambos, com algumas complicaes
e vantagens. A principal complicao que neste caso, depende-se de trs correlaes
espaciais (de cada varivel, individualmente, e entre elas), o que no sempre fcil.
Entretanto, quando as variveis so amostradas em espaamentos diferentes, havero pontos
onde apenas a varivel auxiliar foi medida. Para estes pontos, quase sempre a varincia da
estimativa da co-krigagem melhor do que a da krigagem. Com esta vantagem em mente,
pode-se desenhar esquemas de amostragem que envolvam ambas as variveis, em densidades
de amostragem bem diferentes, de acordo com o grau de dependncia espacial encontrado e a
dificuldade de medio.
Qualquer que seja o mtodo, krigagem ou co-krigagem, a varincia da estimativa
extremamente sensvel forma do semivariograma ou semivariograma cruzado. Baseado na
discusso acima, o mapa de isolinhas ou tridimensional de uma varivel usando valores
estimados atravs de um dos mtodos geoestatsticos deve ser sempre acompanhado pelo
mapa correspondente da varincia da estimativa, para que se possa visualizar os locais onde a
confiana na estimativa limitada ou suficiente. Entretanto, uma vez que a varincia da
estimativa uma funo indireta da distncia dos vizinhos ao redor do local da estimativa,
ento em amostragens tomadas em distncias regulares no reticulado quadrado, o mapa da
varincia da estimativa ser, simplesmente, uma coleo de crculos, com maiores valores
onde o ponto estimado mais distante. Nesses casos, o mapa da varincia tem pouca utilidade
e o exame de clulas compostas de vizinhos fechando o primeiro polgono em volta do valor
estimado, mostrando a varincia da estimativa, ilustra este ponto suficientemente bem.

61

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

6.4 Nmero de vizinhos das estimativas

A vizinhana usada na estimativa torna-se um ponto de extrema importncia na


krigagem. Vrios so os mtodos que podem ser utilizados para a determinao do nmero de
vizinhos na estimativa, cada um com vantagens e desvantagens como ser discutido em
seguida. Qualquer que seja o critrio usado para a escolha do mtodo, deve-se levar em conta
o ganho de preciso em relao ao aumento de tempo de computao.

a) Vizinhana nica

Quando o tamanho do conjunto de dados, em termos de nmero de amostras


disponveis tiver tamanho razovel, relativo quantidade de memria e tempo de
processamento disponveis no computador, pode-se usar o procedimento chamado vizinhana
nica. Neste procedimento todos os valores medidos so considerados vizinhos e sero
utilizados na estimativa. Deve-se sempre lembrar que a deciso de se usar vizinhana nica
basea-se em sua praticidade relativa ao tamanho do conjunto de dados e no na preciso obtida
na estimativa.

A razo para tanto reside no alcance do semivariograma, pois os pesos

associados a vizinhos separados por distncias maiores do que o alcance, no devem ter
contribuio significativa no valor estimado. Outro ponto importante que, para se usar
vizinhana nica, necessrio que o semivariograma seja definido at a maior distncia
existente no espao.
A vantagem deste mtodo reside no fato que, uma vez invertida a matriz de
coeficientes, ento as estimativas podem ser feitas para qualquer espaamento com um
pequeno consumo de tempo de processamento de computador.

Desse modo, a matriz

invertida pode ser arquivada no computador e usada quantas vezes for necessrio, desde que
no mude o modelo do semivariograma e distribuio dos pontos amostrados no espao.
Existem algumas variveis que, embora mudem as magnitudes de variao, preservam entre si
a maneira como variam no espao, apresentando semivariogramas que podem ser agrupados
em um nico, quando divididos individualmente, pelas respectivas varincias. Como exemplo
pode-se incluir umidade do solo amostrada em pequenos espaos de tempo. Nesse caso ento,

62

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

as vantagens da vizinhana nica aumentam porque modelos de semivariograma escalonados


podem ser usados para obter pesos comuns a todas as variveis.

b) Distncia constante

Neste mtodo, para cada ponto estimado selecionada uma vizinhana constando de
todos os vizinhos localizados dentro de um circulo de raio especificado. Conseqentemente,
nos cantos de um campo retangular ocorre 1/4 de crculo, com 1/4 do nmero de vizinhos. A
grande vantagem deste mtodo est no fato que se conhece exatamente a distncia na qual os
vizinhos para estimativa so procurados. Isto particularmente importante porque se pode
limitar o uso do semivariograma quanto distncia sobre qual ele ser calculado. Por outro
lado, o nmero de vizinhos pode mudar bastante ao longo do campo, fazendo com que o
tamanho do sistema matricial seja varivel. Em termos de programao de computador, isto
pode se tornar um problema se exceder o valor usado na dimenso das matrizes.

c) Nmero constante de vizinhos

Um outro mtodo bastante usado o que mantm constante o nmero de vizinhos em


qualquer posio no campo. Para tanto, vizinhos so procurados, primeiramente dentro de um
raio inicial. Se o nmero de vizinhos encontrados for menor do que o limite especificado, a
distncia incrementada, e o processo reiniciado. Se, pr outro lado, o nmero encontrado
for maior do que o limite, apenas o nmero especificado mais prximo ser usado.
Conseqentemente, a distncia sobre a qual se procura vizinhos varia sobre o campo.
Obviamente, as vantagens deste mtodo so as desvantagens do anterior (distncia constante)
e vice-versa. Porm, em situaes em que a amostragem foi efetuada em espaamentos
regulares, a distncia de procura por vizinhos no muda muito e as desvantagens deste mtodo
so minimizadas. Devido as amostragens regulares serem as mais usadas e as facilidades
inerentes deste mtodo, fazem dele o mais comumente usado.

63

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

d) Quadrantes

Uma alternativa interessante e bastante fundamentada em termos geoestatsticos


usar um nmero especificado de vizinhos em cada quadrante ao redor do valor a ser estimado.
O fundamento reside na distribuio do nmero de vizinhos ao redor do valor estimado, o que
far com que a estimativa receba contribuio semelhante em nmero, de todas as direes.
Muitas vezes quando no se impe esta restrio, pode-se despercebidamente, utilizar
tendenciosamente sempre um nmero maior de vizinhos de um lado do que de outro. Porm,
isto ainda apresentaria problemas nos cantos e extremidades da rea, e tambm o problema de
que nunca se sabe qual a distncia na qual os vizinhos se localizam. Por estas razes este
mtodo apresenta mais problemas do que vantagens.

6.5. O uso do programa GS+ na determinao do semivariograma cruzado, da cokrigagem e no mapeamento da varivel.
Temos duas variveis aleatrias Z1 e Z2, suponha que a varivel Z1 teve uma
subamostragem em relao a Z2 e que elas apresentam semivariogramas definidos
isoladamente e que tambm apresentem distribuio espacial conjunta, ou seja, correlao
espacial, ento podemos proceder a anlise do semivariograma cruzado e da co-krigagem. O
arquivo de dados ter aspecto apresentado na Figura 19.
Os procedimentos gerais da anlise de semivariogramas cruzados e de co-krigagem
segue os mesmos procedimentos das anlises simples. Deve-se ressaltar que se faz as anlises
individuais das variveis e depois a anlise conjunta.

64

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

Figura 19. Aspecto geral do arquivo de dados para a co-krigagem.

As Figuras 20, 21 e 22 mostram os procedimentos bsicos para se trabalhar com


semivariogramas cruzados e co-krigagem.

Ferramentas de
anlises descritivas
das variveis Z1, Z2

Krigagem e
cokrigagem

Semivariograma
da varivel 1
Semivariogram
a da varivel 2

Semivariograma
Cruzado

Mapas

Figura 20. cones ativos nas anlises descritivas, semivariogramas simples, semivariogramas
cruzados, krigagem/co-krigagem e mapas.

65

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

Figura 21. Janela para a anlise do semivariograma cruzado

Figura 22. Janela para realizao da co-krigagem

66

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

6.6. Exemplo de aplicao no GS+


Suponha que os seguintes dados represente as observaes de macroporosidade e de umidade
de saturao em uma determinada rea.

macro usat

macro Usat

0.00

0.00

16.07

43.19

40.00

0.00

24.66

57.30

0.00

10.00

21.98

48.61

40.00

10.00

13.89

47.39

0.00

20.00

35.50

40.00

20.00

15.45

46.03

0.00

30.00

25.11

56.49

40.00

30.00

24.37

52.26

0.00

40.00

33.89

63.62

40.00

40.00

0.00

50.00

18.52

47.90

40.00

50.00

0.00

60.00

37.32

65.89

40.00

60.00

43.89

0.00

70.00

54.11

40.00

70.00

37.08

10.00

0.00

16.91

47.23

50.00

0.00

10.00

10.00

10.44

40.70

50.00

10.00

10.00

20.00

17.80

45.06

50.00

20.00

10.00

30.00

22.34

52.04

50.00

30.00

10.00

40.00

55.95

50.00

40.00

29.01

59.18

10.00

50.00

45.72

50.00

50.00

22.16

52.06

10.00

60.00

43.26

50.00

60.00

45.67

10.00

70.00

49.98

50.00

70.00

46.45

20.00

0.00

45.31

60.00

0.00

14.14

40.65

20.00

10.00

20.67

53.27

60.00

10.00

28.29

56.86

20.00

20.00

24.14

59.00

60.00

20.00

26.38

56.04

20.00

30.00

28.47

61.94

60.00

30.00

28.42

57.23

20.00

40.00

25.16

55.59

60.00

40.00

24.91

57.56

20.00

50.00

25.88

53.81

60.00

50.00

26.90

52.29

20.00

60.00

49.60

60.00

60.00

46.55

20.00

70.00

54.44

60.00

70.00

44.15

30.00

0.00

54.07

70.00

0.00

25.82

52.15

30.00

10.00

40.00

70.00

10.00

22.30

50.35

30.00

20.00

40.18

70.00

20.00

25.64

53.94

30.00

30.00

21.01

59.21

70.00

30.00

22.79

51.72

30.00

40.00

14.79

46.62

70.00

40.00

18.20

48.55

30.00

50.00

18.03

49.89

70.00

50.00

27.55

53.65

30.00

60.00

50.14

70.00

60.00

30.00

70.00

44.43

70.00

70.00

13.53
20.88

25.65
11.40

14.39

67

49.29
30.51

23.59

58.55

52.84
50.27

29.69

58.20
45.85

45.91
23.37

51.85

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

Faa a anlise da macroporosidade usando como covarivel a umidade de saturao.


Soluo:
A anlise descritiva geral para as variveis analisadas apresentada na Tabela
abaixo.
Verifica-se que a umidade de saturao apresenta maior uniformidade (menor CV)
do que a macroporosidade. Os coeficientes de assimetria e de curtose mostram tendncia
simtrica e mesocrtica das variveis, portanto, pode-se considerar tais variveis com
distribuio de probabilidade aproximadamente normal.
Analisando a relao linear entre a macroporosidade e a unidade de saturao,
obteve-se um coeficiente de correlao linear (r) de 0,9132, indicando que existe uma forte
associao positiva entre macroporosidade e umidade de saturao e, portanto, estimativas
da macroporosidade podem ser feitas com base na umidade de saturao.

Anlise descritiva dos atributos umidade de saturao do solo (USat) e macroporos


(MACRO).
Estatsticas

Atributos
Usat (%)

MACRO (%)

64

45

Mdia

50,54

22,50

Desvio Padro

6,41

5,98

Coef. de Variao

12,68

26,57

Coef. de Assimetria

-0,02

-0,02

Coef. de Curtose

-0,31

-0,33

As Figuras mostram os semivariogramas individuais para as variveis umidade de


saturao (USat) e macroporos e o semivariograma cruzado da MACRO, usando como covarivel a USat.

68

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Semivariograma

Geoestatstica Bsica e Aplicada

para

umidade

de Semivariograma para a macroporosidade do

saturao do solo (USat).

solo

Semivariograma cruzado da macro em


funo da umidade de saturao.

Para a umidade de saturao ajustou-se o modelo exponencial com alcance da


dependncia espacial de 34,20 m, efeito pepita de 9,49 (%) e patamar de 38,59 (%). Para a
macroporosidade (MACRO) o modelo adotado foi o esfrico, com alcance de 45,0 m,
efeito pepita de 19,70 (%) e patamar de 38,7 (%). E para o semivariograma cruzados as
estimativas dos parmetros do modelo exponencial foram: alcance de 23,40 m; efeito pepita
de 6,97 (%) e patamar de 34,08 (%).
Verifica-se que a utilizao da umidade de saturao, como uma co-varivel para a
estimativa da macroporosidade, provocou alterao no alcance da dependncia espacial,
mas ainda assim verifica-se que, a correlao espacial deve ser considerada para a
realizao das estimativas. A alterao do alcance pode estar relacionado aos modelos
individuais diferenciados.

69

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

As Figuras a seguir mostram os mapas da macroporosidade do solo, construdos a


partir da krigagem e da co-krigagem, ou seja, com base no semivariograma individual e
cruzado.

Mapa da macroporosidade do solo usando Mapa da macroporosidade do solo, usando


semivariograma individual

semivariograma cruzado

Verifica-se coincidncia relativamente alta entre as reas de ocorrncia da


macroporosidade. Devido ao processo de estimativa por co-krigagem algumas regies so
subestimatadas e outras regies so superestimadas.

7. VALIDAO DE MODELOS DE SEMIVARIOGRAMAS

O ajuste do semivariograma, como j comentamos, um procedimento que fica a


critrio do pesquisador, mas geralmente feito "a sentimento". Para este tipo de ajuste
podemos utilizar algumas tcnicas chamadas de validao cruzada ou de auto validao para
selecionar o semivariograma adequadamente. Recomenda-se que se ajuste vrios modelos e
que seja selecionado o que melhor se adeque aos seguintes critrios:

a) O grfico 1:1 - Medido vs Estimado

Se para cada um dos n locais onde se tem um valor medido Z(xi), estima-se um valor
atravs da krigagem (ou da co-krigagem), Z*(ti), ento poder-se- fazer um grfico dos valores
pareados de Z(ti), Z*(ti) e calcular a regresso linear entre eles. A regresso ser ento:

70

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

Z* ( t i ) = a + b Z( t i )
onde a a intercesso, b o coeficiente angular da reta e r2 o coeficiente de correlao entre
Z*(xi) e Z(xi).
Assim, se a estimativa (Z*(xi)) fosse idntica ao valor medido (Z(xi)), ento a seria
nulo, b e r2 seriam iguais unidade (um), e o grfico de Z(xi) vs Z*(xi) seria uma srie de
pontos na linha 1:1. Na medida em que os valores de a aumentam de 0 (zero) para valores
positivos, isto indica que estimador Z*(xi) est superestimando valores pequenos de Z(xi) e
subestimando valores grandes. medida que a decresce de 0 (zero) para valores negativos, o
contrrio acontece. Este ltimo caso, porm, no comum.
Desse modo, a qualidade da estimativa pode ser medida pelo julgamento destes
parmetros.

b) O erro absoluto

Uma vez que se tem o conjunto de n valores medidos e estimados, Z(xi) e Z*(xi),
ento pode-se definir o erro absoluto como:
EA( xi ) = Z* ( xi )- Z( xi ) O
Aplicando-se as condies de no tendncia e de varincia mnima, nos erros
absolutos, pode-se ento dizer que:
EA = E {EA( xi )} = E { Z* ( xi )- Z( xi )} = 0 P
e
2

VAR( EA ) = E {( Z* ( xi )- Z( xi ) ) } = mnima Q
Se estas condies no forem satisfeitas, ento alguma das condies previamente
assumidas estar sendo violada. Porm, a equao bastante difcil de ser verificada porque o
conceito de ser mnimo torna-se subjetivo quando no se tem uma referncia. O procedimento
seguinte pode contribuir nesse sentido.

71

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

c) Erro reduzido

Lembrando que no clculo dos valores estimados, Z*(xi), sempre se tem a varincia
da estimativa, 2k(ti), ento pode-se definir o erro reduzido como:
ER( t i ) = ( Z* (t i ) - Z( t i ))/ k ( t i ) R

A diviso pela raiz quadrada da varincia da estimativa faz com que os ER(ti) sejam
sem dimenso e que, por isso, as condies de no tendncia e de varincia mnima, requeiram
que:
ER = E {ER( xi )} = E {( Z* ( xi )- Z( xi )) / k ( xi )} = 0 S
e
VAR( ER ) = E {( Z* ( xi )- Z( xi )) / k ( x0 ) } = 1 T
2

Estas propriedades fazem deste tipo de erro uma valiosa ferramenta e de fcil uso,
nas aplicaes de geoestatstica. O fato de terem valores ideais fixos em 0 (zero) e 1 (um), e
de serem sem dimenso, facilita seu julgamento e estudo, e tambm permite sua comparao
com outras situaes expressas em unidades diferentes.
A Figura 23 mostra uma sada da opo de validao cruzada apresentada pelo
programa GS+. A validao cruzada ativada na janela da Krigagem, conforme mostram a
Figuras 20 e 22.

72

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

Figura 23. Validao cruzada.

Note, neste caso, que a reta ajustada est praticamente igual a reta a 45 (Grfico
1:1), o coeficiente de regresso (coeficiente angular) de 0,944 com erro padro de 0,105
indica que este estatisticamente igual a 1 e o y intercept (coeficiente linear) de 0,024
mostra que este pode ser considerado estatisticamente igual a zero, condies estas timas
para as estimativas. O coeficiente de determinao (r2) de 0,39 considerado relativamente
baixo, mas devido ao grande nmero de observaes e sabendo-se que este coeficiente
altamente influenciado pelo nmero de pares, podemos considera-lo como satisfatrio.
Tambm pode-se verificar, pelo grfico, que os valores extremos que esto mais afastados
da reta e podemos associar isto ao fato do semivariograma geralmente apresentar melhores
estimativas para distncias curtas.
A anlise da validao cruzada deve ser feita com base em todos os parmetros e
no com base em parmetros isolados.

73

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

8. BIBLIOGRAFIA RECOMENDADA

BARTLETT, M.S. Nearest neighbour models in the analysis for field experiments (with
discussion). Journal of the Royal Statistical Society. B, London, v.40, n.2, p.147-174, 1978.
BRAGA, L. P. V. Geoestatstica e aplicaes. Minicurso do 9o Simpsio Brasileiro de
Probabilidades e Estatstica. IME. USP. So Paulo, 1990. 36 p.
BURROUGH, P. A.; McDONNELL, R. A. Principles of geographical information systems.
Oxford University Press, 331 p., 1998.
BUSSAB, W. O.; MORETTIN, P. A . Estatstica bsica. 4a ed.. So Paulo : Atual, 1987. 321
p.
CADIMA, Z. A.; LIBARDI, P. L.; REICHARDT, K. Variabilidade espacial da condutividade
hidrulica em latossolo Vermelho Amarelo textura mdia, no campo. Revista Brasileira de
Cincia do Solo, Campinas, v. 4, n. 2, p. 63-66, 1980.
CAMERON, D. R. Variability of soil water retention curves and prepicted hydraulic
conductives on a small plot. Soil Science. Baltimore, v.126, n.6, p. 364-71, 1978.
COSTA NETO, P. L. Estatstica. So Paulo: Edgard Blucher, 264 p., 1979.
CRESSIE, N.; HARTFIELD, M.N. Conditionally specified gaussian model for spatial
statistical analysis of field traits. Journal of Agricultural, Biological, and Environmental
Statistics, Washington, v.1, n.1, p.60-77, Mar. 1996.
DAVID, M. Geostatistical ore reserve estimation. Elsevier. New York, v. 8, 364 p., 1977.
DUARTE, J.B. Sobre o emprego e a anlise estatstica do delineamento em blocos
aumentados no melhoramento gentico vegetal. 2000 293p. (Tese - Doutorado em Gentica
e Melhoramento de Plantas) ESALQ-USP, Piracicaba.
FREITAS, V. A. de. Anlise de dados espaciais por meio de semivariogramas. Uberlndia.
Monografia (Graduao em Matemtica) Universidade Federal de Uberlndia, 2000. 30p.
GOMES, B. M. Comportamento espacial do percentil 75 da precipitao decendial do
estado de So Paulo. Botucatu. Tese (Doutorado em Agronomia) Universidade Estadual
Paulista Jlio de Mesquita Filho, Faculdade de Cincias Agronmicas Campus de
Botucatu, 2001. 101p.
GOTWAY, C. A.; FERGUSON, R. B.; HERGERT, G. W.; PETERSON, T. A. Comparasion
of kriging and inverse-distance methods for mapping soil parameters. Soil Science Society
America Journal. v. 60, p. 1237 1247, 1996.

74

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

GUIMARES, E. C. Variabilidade espacial da umidade e da densidade do solo em um


Latossolo Roxo. Campinas, SP, 1993. 135 p. Dissertao (Mestrado em Engenharia Agrcola
- rea de concentrao: gua e Solo) - Faculdade de Engenharia Agrcola, Universidade
Estadual de Campinas.
GUIMARES, E. C. Variabilidade espacial de atributos de um Latossolo Vermelho Escuro
textura argilosa da regio do cerrado, submetido ao plantio direto e ao plantio convencional.
Tese (Doutorado). FEAGRI/UNICAMP. Campinas, 2000. 85 p.
GUIMARES, E. C.; AQUINO, L. H. de; OLIVEIRA, M. S. Variabilidade espacial do pH
em gua e da argila dispersa em gua. Revista Cincia e Prtica. Lavras, v. 19, n.1, p. 12-17,
1992.
ISAAKS, E. H.; SRIVASTAVA, R. M. Applied Geostatistics.
University Press, 1989.

New

York : Oxford

LOPES, P. A. Probabilidades e Estatstica. Rio de Janeiro: Reichmann & Affonso Editores,


1999.
MARTINEZ, R.B. Control de la correlation especial en experiments de campo em el sector
agricola. Agronomia Colombiana. v.11, n.1, p.83-89, 1994.
MATHERON, G. Principles of geostatistics. Economic Geology. El Paso, V. 58, p. 11246-66,
1963.
MATHERON, G. The theory of regionalized variables and its applications. Les Cahiers du
Centre de Moffologie mathemathique. Fas. 5. C. G. Fontainebleau, 1971.
McBRATNEY, A. B.; WEBSTER, R. Choosing functions for semivariograms of soil
proprierties and fitting them to sampling estimates. Journal of Soil Science, v. 37, p.617-639,
1986.
PANNATIER, Y. Variowin Software for spatial data analysis in 2D. New York:
Springer-Verlag, 1996. 90 p..
PAPADAKIS, J. Method statistique pour des expriences sur champ. Bull. Inst. Amlior.
Plantes Salonique. n.23, 1937.
PIMENTEL GOMES, F. Curso de estatstica experimental. Piracicaba: Nobel, 1995.
REICHARDT, K.; VIEIRA, S. R.; LIBARDI, P. L. Variabilidade espacial de solos e
experimentao de campo. R. bras. Ci. Solo. Campinas, v. 10, n. 1, p. 1-6, 1986.
ROBERTSON, G. P. GS+: geostatistics for the environmental sciences. Plainwell: Gamma
Design Software,1998, 152 p..

75

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

TEIXEIRA, F. das C. Analise estatstica espacial aplicada a um ensaio florestal. Dissertao


de mestrado. UFLA. 73 p. 2001.
TRAGMAR, B. B.; YOST, R. S.; UEHARA, G. Application of geostatistics to spatial studies
of soil properties. Advances in Agronomy. v. 38, p. 45-93, 1985.
TRIOLA, M. F. Introduo estatstica. Rio de Janeiro: LTC. 7a edio, 1999.
VIEIRA, S. R. Curso de atualizao em conservao do solo - Uso de geoestatstica.
Campinas, IAC, v. 1 e 2, 1995.
VIEIRA, S. R. Variabilidade espacial de argila, silte e atributos qumicos em parcela
experimental de um Latossolo Roxo de Campinas (SP). Bragantia. Campinas, v. 56, n.1, 1997.
VIEIRA, S. R.; GUIMARES, E. C.; DECHEN, S. C. F.; DE MARIA, I. C.; ROCHETE, P.;
TOPP, G. C.; ZEBCHUK, W. Analisando simultaneamente variabilidade espacial e temporal
usando variogramas tridimensionais. In: XIII Congresso Latino-Amaericano de Cincia do
Solo - Resumos expandidos em CD-ROOM. T01-053. guas de Lindoia, SP: SBCS/ESALQUSP, 1996.
VIEIRA, S. R.; HATFIELD, J. L.; NIELSEN, D. R.; BIGGAR, J. W. Geostatistical theory
and application to variability of some agronomical properties. Hilgardia. Berkeley, v. 31, n.
3, 1983. 75 p.
VIEIRA, S. R.; LOMBARDI NETO, F.; BURROWS, I. T. Mapeamento da chuva diria
mxima provvel para o estado de So Paulo. R. bras. Ci. Solo. Campinas, v.15, n.1, p. 93-98,
1991.
VIEIRA, S. R.; TILLOTSON, P. M.; BIGGAR, J. W.; NIELSEN, D. R. Scaling of
semivariograms and the kriging estimation of field-measured prorperties. Revista Brasileira de
Cincia do Solo. Viosa, v.21, n. 4, 1997.
WARRICK, A. W.; MYERS, D. E.; NIELSEN, D. R. Geostatistical methods applied to soil
science. In: Methods of soil analysis: part 1 Physical and mineralogical methods. Soil
Science Society of America, p. 53-82, 1986.
ZIMMERMAN, D.I.; HARVILLE, D.A. A random field approach to the analysis of fieldplot experiments and other special experiments. Biometrics, Raleigh, v.47, n.1, p.233-239,
mar. 1991

76

Prof. Dr. Ednaldo Carvalho Guimares

UFU/FAMAT

Geoestatstica Bsica e Aplicada

OBSERVAO:
Pgina na internet para busca de artigos, programas, livros e outros assuntos de
geoestatstica:
http://www.famat.ufu.br/ednaldo/ednaldo.htm
http://www.rc.unesp.br/igce/aplicada/landim.html
http://musis.sites.uol.com.br/geo1.htm
http://sc-terre-218.unil.ch/
http://www.ai-geostats.org/

77

Prof. Dr. Ednaldo Carvalho Guimares

Você também pode gostar