Geoestatística Básica

UFU/FAMAT
Geoestatstica Bsica e Aplicada
UNIVERSIDADE FEDERAL DE UBERLNDIA FACULDADE DE MATEMTICA NCLEO DE ESTUDOS ESTATSTICOS E BIOMTRICOS
GEOESTATSTICA BSICA E APLICADA
EDNALDO CARVALHO GUIMARES
Fevereiro - 2004 Uberlndia - MG
Prof. Dr. Ednaldo Carvalho Guimares
UFU/FAMAT
SUMRIO
1. INTRODUO........................................................................................................... 2. ANLISE EXPLORATRIA DE DADOS............................................................. 2.1. Distribuio de freqncias e histograma............................................................... 2.2. As estatsticas............................................................................................................. 2.3. Outras anlises descritivas........................................................................................ 2.4. Amostragem...........................................................................................................................................
2.5. Exemplos de anlise exploratria aplicando o programa GS+............................. 3. PRINCPIOS DA ANLISE GEOESTATSTICA.................................................. 3.1. Um breve histrico.................................................................................................... 3.2. Estacionaridade......................................................................................................... 3.3. Krigagem universal................................................................................................... 4. ANLISE DA DEPENDNCIA ESPACIAL............................................................ 4.1. Autocorrelao e Autocorrelograma....................................................................... 4.2. Semivariograma......................................................................................................... 4.3. O uso do software GS+ na determinao do semivariograma.............................. 4.4. Exemplos de aplicao............................................................................................... 5. KRIGAGEM................................................................................................................. 5.1. O interpolador........................................................................................................... 5.2. A krigagem no programa GS+................................................................................. 6. SEMIVARIOGRAMA CRUZADO E COKRIGAGEM.......................................... 6.1. Semivariograma cruzado.......................................................................................... 6.2. Co-krigagem.............................................................................................................. 6.3. Varincia da estimativa............................................................................................ 6.4. Nmero de vizinhos das estimativas........................................................................ 6.5. O uso do programa GS+ na determinao do semivariograma cruzado, da co-krigagem e no mapeamento da varivel....................................................... 6.6. Exemplos de aplicao no GS+................................................................................ 7. VALIDAO DE MODELOS DE SEMIVARIOGRAMAS................................... 8. BIBLIOGRAFIA RECOMENDADA.........................................................................
2 3 3 3 7 7 8 14 14 15 20 21 21 25 36 41 50 50 52 55 55 56 60 62 64 67 70 74
UFU/FAMAT
1. INTRODUO Mtodos clssicos de anlise estatstica de dados geralmente supem que, as realizaes das variveis aleatrias so independentes entre si, ou seja, que observaes vizinhas no exercem influncias umas sobre as outras. Fenmenos naturais apresentam-se freqentemente com uma certa estruturao nas variaes entre vizinhos, desta forma pode-se dizer que as variaes no so aleatrias e, portanto, apresentam algum grau de dependncia espacial. A anlise espacial de dados apresenta-se como uma alternativa e/ou como uma complementao da anlise clssica de dados, sendo que este tipo de anlise considera as correlaes entre as observaes quando se faz estimativas. A literatura apresenta alguns procedimentos de anlise espacial de dados, sendo que, nos ltimos tempos, uma metodologia de anlise denominada geoestatstica ganhou nfase neste tipo de estudo. Neste trabalho sero abordados aspectos bsicos da metodologia geoestatstica para a anlise espacial de dados, com nfase na anlise do semivariograma como ferramenta de determinao da dependncia espacial. Inicialmente sero abordados aspectos bsicos de uma anlise exploratria de dados; em seguida sero introduzidos conceitos bsicos da geoestatstica e da anlise da dependncia espacial por meio de semivariograma e tambm de interpolao utilizando a metodologia da krigagem e, por fim sero abordados conceitos bsicos de semivariogramas cruzados e co-krigagem. Sempre que possvel os tpicos sero acompanhados de exemplos de aplicao.
UFU/FAMAT
2. A ANLISE EXPLORATRIA DE DADOS A anlise exploratria de dados um procedimento de grande importncia na anlise estatstica e aplica-se para qualquer metodologia que se queira utilizar. Nesta anlise preliminar dos dados tem-se o objetivo de conhecer a varivel em estudo e resumila. Basicamente, este tipo de anlise se baseia em construo e interpretao grfica e clculos e interpretao de estatsticas. No presente texto faremos uma reviso dos principais instrumentos de anlise exploratria de dados, sendo que estes procedimentos podem ser encontrados em cursos de estatstica bsica e em livros de estatstica bsica como Costa Neto (1979), Bussab e Morettin (1987), Triola (1999), Lopes (1999), entre outros.
2.1. A distribuio de freqncias e o histograma A distribuio de freqncias consiste em agrupar as observaes de uma varivel em classes ou categorias e o histograma uma das representaes grficas dessa distribuio. A distribuio de freqncias e o histograma podem ser obtidos em programas computacionais comercias com o Excel, Statistica e em programas especficos para anlise geoestatstica, como, por exemplo, o GS+. A finalidade da distribuio de freqncias e do histograma a de permitir uma visualizao do comportamento da varivel em estudo, com relao tendncia de concentrao de dados (tendncia simtrica ou assimtrica). Esta tendncia, principalmente na anlise no espacial de dados, pode direcionar procedimentos diferenciados de anlise.
2.2. As estatsticas O clculo de estatsticas como a mdia, a varincia, o desvio padro, o coeficiente de variao, valor mnimo, valor mximo, coeficiente de assimetria e coeficiente de curtose, colaboram na descrio da varivel. Passaremos a rever rapidamente estas estatsticas.
UFU/FAMAT
A mdia aritmtica ( X ) A mdia aritmtica uma medida de posio bastante utilizada na estatstica e tem
como caractersticas principais facilidade de clculo, a sua adaptabilidade ao tratamento algbrico e, tambm, geralmente, uma medida no tendenciosa, precisa, eficiente e suficiente. Vale ressaltar que nem sempre a mdia aritmtica a medida de posio que melhor representa uma varivel, por exemplo, em dados com assimetria direita acentuada a moda ou a mdia geomtrica pode representar melhor a varivel em estudo. A frmula para o clculo da mdia :
X=
x
i =1
em que: X a mdia aritmtica; xi cada valor observado; n o nmero total de observaes. Varincia (s2) e desvio padro (s) A varincia e o desvio padro so estatsticas que nos fornece uma idia de variabilidade das observaes em torno da mdia aritmtica. As frmulas de clculo so, respectivamente:
s 2 = i =1
( xi X )2 n 1
s = + s2 Note que em interpretaes de dados, ou seja, na anlise descritiva a mdia aritmtica deve estar sempre acompanhada do desvio padro para que possamos visualizar a disperso mdia dos valores.
Coeficiente de variao (CV) O coeficiente de variao fornece a disperso relativa dos dados, facilitando
visualizar a dimenso da disperso dos valores observados em relao mdia. O coeficiente de variao dado por:
UFU/FAMAT
CV (%) = 100
s X
Valor Mnimo e Valor Mximo Estes valores permitem visualizar a menor ocorrncia e a maior ocorrncia e
podem ser um primeiro indicativo de erros de amostragem, digitao, etc.. A obteno desses valores se faz a partir da ordenao das observaes.
Coeficiente de assimetria (Cs) e coeficiente de curtose (Ck) O coeficiente de assimetria mostra o afastamento da varivel em relao a um valor
central, ou seja, na distribuio simtrica tem-se 50% dos valores observados acima da observao central e 50% abaixo. Se a distribuio assimtrica, esta relao no observada. O coeficiente de curtose mostra a disperso (achatamento) da distribuio em relao a um padro, geralmente a curva normal. Estes dois coeficientes so utilizados para inferncias sobre a normalidade da varivel em estudo. Antes de definirmos estes dois coeficientes e tecermos comentrios sobre eles vamos definir os momentos estatsticos. Se x1, x2, ... ,xn so os n valores assumidos pela varivel X, definimos o momento de ordem t dessa varivel como:
Mt =
x
i =1
t i
Note que se t=1 temos a mdia aritmtica, ou seja, a mdia aritmtica igual ao primeiro momento em relao origem. O momento de ordem t centrado em uma constante K , com K 0 definido como:
M tK =
(x
i =1
K)t
UFU/FAMAT
Observe que: se t = 1 e K = X , temos M 1X = m1 = 0 (propriedade da mdia aritmtica) e, se t =2 e K = X , temos M 2X = m2 = 2. Vamos definir agora o coeficiente de assimetria (Cs) e o coeficiente de curtose (Ck). O coeficiente de assimetria utilizado para caracterizar como e quanto distribuio de freqncias se afasta da simetria, sendo que: se Cs > 0 temos a distribuio assimtrica direita; se Cs < 0 a distribuio assimtrica esquerda; e se Cs = 0 a distribuio simtrica. O momento centrado na mdia de ordem 3 pode ser utilizado como medida de assimetria, entretanto, mais conveniente a utilizao de uma medida admensional e que ser chamada de coeficiente de assimetria: Cs = m3 (m 2 ) 3
Em que m2 e m3 so, respectivamente, o segundo e o terceiro momento centrados na mdia. O coeficiente de curtose utilizado para caracterizar a forma da distribuio de freqncias quanto ao seu achatamento. O termo mdio de comparao a distribuio normal e esta apresenta o valor de Ck = 3. A classificao da distribuio quanto curtose recebe a seguinte denominao: se Ck = 3 a distribuio mesocrtica (distribuio normal); se Ck < 3 a distribuio platicrtica; e se Ck > 3 a distribuio leptocrtica. Em alguns programas computacionais como o Excel, Statistica e GS+ existe uma padronizao do valor de Ck e o valor de comparao o zero, portanto, se Ck = 0 temos a mesocrtica, se Ck < 0 temos a platicrtica e se Ck > 0 temos a leptocrtica. Para verificar o termo de comparao necessrio consultar o manual ou a "ajuda" do programa. A frmula para clculo de Ck : Ck = m4 (m 2 ) 4
sendo que: m4 o quarto momento em relao mdia aritmtica.
UFU/FAMAT
Para uma melhor interpretao do coeficiente de assimetria e do coeficiente de curtose, alguns programas, como o GS+, calcula tambm o erro padro desses coeficientes e a partir dos valores dos coeficientes associados com seus respectivos erros padro, podese concluir se os dados tem distribuio normal ou no. Por exemplo: Se o valor obtido na amostra para Cs = 0,30 com erro padro de 0,65 e se o valor de Ck = 2,5 com erro padro de 0,80, podemos dizer que a distribuio tende a normal (simtrica e mesocrtica), pois 0,30,65 e 2,50,80, incluem os valores zero e trs, respectivamente.
2.3. Outras anlises descritivas As anlises descritas acima so as mais comuns e as que freqentemente so usadas como anlise exploratria dos dados. Entretanto outros recursos podem ser aplicados como, por exemplo: grfico box-plot; grficos da distribuio normal; grfico h-disperso, outras estatsticas (quartil, mediana, moda, etc.); testes de normalidade (Shapiro Wilk, Kolmogorov Smirnov, etc.), etc.. Tais resultados tambm contribuem para a descrio e conhecimento da varivel em estudo. Os procedimentos para este tipo de anlise so encontrados em programas de estatsticas.
2.4. Amostragem Um requisito bsico na amostragem para fins de anlise de dependncia espacial utilizando mtodos geoestatsticos que as observaes, ou seja, que as amostras sejam referenciadas. No necessrio utilizar coordenadas geogrficas, mas algum tipo de referenciao deve existir.
Exemplos de referenciaes so: a) amostras coletadas ao longo do tempo
cada
observao referenciada com relao ao tempo (Ex: Estudo da precipitao anual na regio X); b) amostras coletadas ao longo de uma linha reta em uma certa cultura agrcola
cada observao refernciada por um nico ponto no espao (Ex: amostras coletadas
em transees); c) amostras coletadas em uma rea
cada observao ser identificada
por um par ordenado de coordenadas pertencente ao espao (Ex: amostras coletadas em uma rea X).
UFU/FAMAT
Um tipo de amostragem bastante utilizado em geoestatstica a amostragem sistemtica. Neste tipo de amostragem os pontos avaliados (amostras) so obtidos de forma equidistantes, quer seja no espao ou no tempo, formando uma malha de pontos no caso bidimensional. No entanto esse no um procedimento obrigatrio, basta que se tenha a referenciao dos dados para se proceder a anlise espacial. Um exemplo tpico de amostragem no sistemtica para variveis climticas, onde as estaes climatolgicas, geralmente, no so equidistantes mas apresentam a referencia geogrfica. Outro questinamento bsico da geoestatstica "Quantas amostras devo utilizar para a anlise geoestatstica?". Alguns autores recomendam que seja utilizados pelo menos 100 pontos amostrais, entretanto isso no regra e sim recomenndao, existem trabalhos com bons resultados de ajuste de semivariogramas usando 45 pontos de amostragem. sabido que quanto maior o nmero de pontos, maior ser o nmero de pares para o clculo das semivarincias e, teoricamnte, maior ser a preciso das estimativas das semivarincias. Pode-se dizer que o nmero de observaes depender dos objetivos que se tem no trabalho, da escala (ou seja da dimenso), entre os outros fatores que devem ser avaliados pelo pesquisador. Outro aspecto relacionado com o ajuste de semivariograma e indiretamente com o tamanho da amostra a presena de tendncia da varivel e/ou o uso de duas populaes distintas que abordaremos em tpicos seguintes, mas que, de maneira geral, dificultam o ajuste de semivariogramas com dados originais, mesmo que o volume de observaes seja grande.
2.5. Exemplos de anlise exploratria aplicando programa GS+ Passaremos a descrever exemplos de anlise exploratria de dados do GS+. Nestes exemplos ser utilizado a Verso Beta do GS+ (5.0.3) que de domnio publico, conforme mostra a Figura 1.
UFU/FAMAT
Figura 1. Programa GS+ Verso 5.0.3
Como ponto de partida vamos descrever a estrutura de arquivos de dados com vistas a posterior anlise geoestatstica, pois, na anlise geoestatstica necessita-se que os dados observados estejam referenciados, ou seja, tenham coordenadas. Trabalharemos com a anlise bidimensional e, portanto, teremos as coordenadas X e Y para cada observao. Vale ressaltar que, se o objetivo do estudo no for a geoestatstica ou a anlise espacial, esta referenciao no se faz necessria e ainda ressaltamos que a estrutura de dados apresentada neste tpico vlida para diversos programas de anlise espacial. O arquivo pode ser criado no prprio programa GS+ ou em outro programa como o Excel, necessitando, neste caso de uma importao de dados ou do famoso "copiar" e "colar". A Figura 2 mostra o aspecto bsico do arquivo de dados.
UFU/FAMAT
Figura 2. Janela inicial do GS+ com exemplo de arquivo de dados contento as coordenadas (x,y) e 4 variveis para a anlise. Neste exemplo temos um arquivo de dados editado no GS+. Na primeira coluna temos a coordenada X, na segunda coluna temos a coordenada Y e da terceira a sexta colunas temos as variveis, ou seja, neste caso estamos trabalhando com 4 variveis. Se o arquivo for editado em outro programa, deve-se importar os dados para o GS+ utilizando o procedimento padro do Windows de copiar e colar, ou recortar e colar, ou ainda, ativar o cone Import file localizado no canto superior direto da Figura 2. Para selecionar outra varivel a ser estudada basta clicar na coluna correspondente e selecion-la como a varivel principal. Por exemplo, se o objetivo a anlise da terceira varivel (usatpc), procederamos da seguinte forma (Figura 3):
Figura 3. Exemplo de mudana de varivel para anlise
10
UFU/FAMAT
clique sobre a coluna de interesse (coluna 5, neste exemplo). A coluna selecionada e aparece a segunda janela, indicando a coluna ativa.
Clique em Z (Primary variable) para selecionar esta coluna como sendo sua varivel de analise.
Clique em OK para confirmar a opo
Pode-se ainda trabalhar com duas variveis simultaneamente. Neste caso selecionase uma varivel Z2 como covarivel. Voltaremos ao assunto no tpico de semivariograma cruzado. Voltando Figura 2 vamos descrever os procedimento da anlise exploratria de dados. A barra de ferramenta apresenta os seguintes smbolos que so destinados a este tipo de anlise:
Planilha ativa
Principais Estatstica s
Anlise grfica histograma
Posio das observaes selecionadas por quartil
Os cones no ativos so destinados a anlise com duas variveis (semivariograma cruzados, co-krigagem, etc). Para exemplificar o resultado deste tipo de anlise vamos utilizar os dados da primeira varivel (usatpd coluna 3). Ativando o cone e teremos o resultado das principais estatsticas, conforme Figura 4:
11
UFU/FAMAT
mdia
Desvio padro varincia mnimo mximo Nmero de dados e Dados perdidos histograma Coeficiente de assimetria e erro padro Coeficiente de curtose e erro padro
Figura 4. Estatsticas da varivel usatpd.
Como uma anlise geral desses dados verifica-se que a umidade de saturao do solo no plantio direto (usatpd) apresentou mdia de 44,0069 (cm3/100cm3), com uma disperso mdia em torno desse valor de 4,3190 (cm3/100cm3) e, portanto, uma variabilidade de 9,81%, deste modo nota-se que as observaes se dispersam relativamente pouco em torno da mdia. O menor valor observado (36,27 cm3/100cm3) e o maior valor observado (54,810 cm3/100cm3) reforam a idia de baixa variabilidade das observaes e tambm mostram que, provavelmente, no temos valores discrepantes que poderiam ser atribudos a erros de determinao, digitao ou de amostragem. O histograma mostra uma tendncia dos dados simetria e este fato tambm pode ser verificado por meio dos coeficientes de assimetria e curtose associados aos seus respectivos erros padro, que so respectivamente: 0,460,30 e 0,340,50, ou seja, assimetria e curtose prximos de zero indicando distribuio normal aproximada dos dados. Note ainda que existe a possibilidade de se fazer anlises com dados transformados. Um detalhamento da distribuio da varivel pode ser obtida clicando o cone do histograma na barra de ferramentas. Em um primeiro momento tem-se a visualizao
do histograma e posteriormente pode-se fazer anlises com distribuio de freqncias acumuladas e grfico da distribuio normal, conforme mostra a Figura 5.
12
UFU/FAMAT
Histograma freqncia simples
Grfico de freqncia acumulada Grfico da distribuio normal
Figura 5. Anlise grfica dos dados
Uma outra anlise utilizada no GS+ a localizao espacial dos pontos amostrados com relao a intervalos de ocorrncia. Este mapa obtido por meio do cone exemplo na Figura 6. . Veja o
Figura 6. Localizao espacial das observaes
Verifica-se, por meio da Figura 6, que a princpio no h indcios de concentrao de valores altos ou baixos em setores especficos da malha, portanto parece no existir tendncia nos dados e, provavelmente, se existir relao espacial, esta poder ser representada por um semivariograma mdio (isotrpico).
13
UFU/FAMAT
3. PRINCPIOS DA ANLISE GEOESTATSTICA 3.1. Um breve histrico A preocupao com a dependncia espacial ou temporal de observaes realizadas para um determinado atributo bastante antiga, sendo comprovado este fato por trabalhos cientficos datados do incio do sculo XX, conforme mostra Vieira (1995). Em algumas reas da cincia, como a agricultura, a partir da metade do sculo XX adotou-se a metodologia de anlise de dados proposta por Fisher. Esta metodologia considera, no seu desenvolvimento e aplicao, as seguintes suposies: normalidade da varivel; independncia de erros e homocedasticidade de varincia (homogeneidade de varincia). A normalidade da varivel e a homogeneidade de varincias podem ser testadas facilmente em programas de estatsticas por meio de testes especficos como, por exemplo, Shapiro-Wilk (W teste) para normalidade e F mximo de Hartley para homogeneidade de varincias. Se for observado no normalidade de dados e/ou no homogeneidade de varincias, procedimentos como a transformao de dados podem ser adotados para que a varivel atenda estas hipteses bsicas da metodologia de anlise no espacial proposta por Fisher. J a independncia no pode ser testada por mtodos simples e a soluo deste problema, proposta pela metodologia no espacial, a repetio e a aleatorizao das observaes. Esta soluo, em muitos casos, no garante a independncia entre as observaes, isto porque algumas variveis apresentam forte dependncia espacial (autocorrelao entre as observaes) que no desfeita com este procedimento. Krige (1951) citado por Vieira (1995), em seus trabalhos com dados de minerao da frica do Sul, concluiu que a varincia dos dados possua uma estruturao que dependia da distncia de amostragem. A partir desta constatao surgiu os conceitos bsicos de geoestatstica. Os fundamentos tericos da geoestatstica podem ser encontrados nos trabalhos desenvolvidos por Matheron (1963) e Matheron (1971). A anlise espacial de dados, utilizando a geoestatstica, ganhou impulso em reas distintas da minerao e da geologia a partir de 1980, com grande aplicabilidade na cincia
14
UFU/FAMAT
do solo. Uma justificativa para tal fato a facilidade computacional que viabilizou alguns clculos relativamente trabalhosos nesta metodologia. No Brasil destaca-se trabalhos pioneiros nesta rea desenvolvidos pelos pesquisadores Sidney Rosa Vieira, Paulo Libardi e Klaus Reichardt. Ainda na dcada de 80. Atualmente a aplicabilidade e a utilizao da geoestatstica como metodologia de anlise de dados no espao ou no tempo esta difundida em vrios ramos da cincia, envolvendo reas de cincias humanas, biolgicas e exatas. Em linhas gerais podemos dizer que a geoestatstica est interessada em determinar a dependncia espacial das observaes de uma varivel e recebeu tal denominao devido aos trabalhos desenvolvidos por Krige na frica do Sul. Este pesquisador homenageado com o nome do mtodo de interpolao utilizado na geoestatstica, a krigagem. Outras metodologias e alternativas de anlise de dependncia espacial so descritas em Papadakis (1937), Bartlett (1978), Zimmerman e Harville (1991), Cressie e Hartfield (1996), Duarte (2000), entre outros autores.
3.2. Estacionaridade Antes de iniciarmos a discusso sobre a estacionaridade da varivel vamos adotar uma simbologia para a varivel em estudo. Ao falarmos da varivel Z(t) estaremos falando de ocorrncias da varivel Z com uma referenciao t, que pode ser uma posio no tempo (unidimensional, por exemplo: t1, t2, ...,tk) ou no espao (unidimensional, por exemplo: x1, x2, ..., xn; ou bidimensional, por exemplo; (x1,y1),(x1,y2), ..., (xn, yn)) Diz-se que um processo (ou uma varivel) estacionria se o desenvolvimento desse processo no tempo ou no espao ocorrer de maneira mais ou menos homognea, com oscilaes aleatrias contnuas em torno de um valor mdio, em que nem a amplitude mdia e nem as oscilaes mudam bruscamente no tempo ou no espao. Como exemplo de processo estacionrio pode-se citar as oscilaes da tenso em uma rede eltrica. Note que as caractersticas de um processo estacionrio independe da origem adotada.
15
UFU/FAMAT
Diz-se que um processo no estacionrio quando no apresenta as caractersticas citadas anteriormente e, neste caso, as caractersticas do processo dependem da origem que tomada como referncia. Pode-se utilizar como exemplo de um processo no estacionrio o relevo no estado de Minas Gerais, ou ainda, as chuvas mensais durante um ano no estado de Minas Gerais.
Observao: Processos no estacionrios podem apresentar trechos estacionrios.
Pode-se definir uma funo aleatria Z(t) como estacionria, se todos os momentos estatsticos so invariantes para toda mudana de origem. Estatisticamente pode-se dizer que, se o processo estacionrio de ordem k, ento: E[Z(t)] = m1(t) = constante t E[Z2(t)] = m2(t) = constante t . . . . . . . . .
E[Zk(t)] = mk = constante t Observao: Se um processo estacionrio na ordem k ele tambm ser estacionrio para as ordens inferiores a k. Por exemplo, se o processo estacionrio de ordem 4, ele tambm ser estacionrio nas ordens 1, 2 e 3.
Para estudos de geoestatstica necessita-se, como restrio mxima, que o primeiro e o segundo momento em relao origem sejam constante, ou seja, exige-se no mximo a estacionaridade de segunda ordem. Se a esperana matemtica de uma varivel aleatria constante,
independentemente da origem que se toma no espao ou no tempo, podemos dizer que a varivel estacionria de primeira ordem e, portanto, a mdia ser a mesma para todo o processo. E[Z(t)] = m1(t) = = constante
16
UFU/FAMAT
Se o segundo momento em relao origem constante, temos ento que a varincia constante independente da origem no espao ou no tempo e, portanto, o processo estacionrio de ordem 2. E[Z2(t)] = m2(t) = constante Var [Z(t)] = E[Z2(t)] {E[Z(t)]}2 = m2(t) [m1(t)]2 = constante Seja agora a covarincia, ou seja, a esperana do produto do que ocorre em t e t, com h = t t, definida como: C(t, t) = E[Z(t).Z(t)] - 2 Se Z(t) estacionria esta covarincia no depende de t e t, ou seja, da origem, mas somente da distncia h entre os pontos e desta forma: C(t, t+h) = C(h) Note que a varincia um caso particular da covarincia quando h = 0. C(0) = E[Z2(t)] - 2 = Var[Z(t)] Geralmente utiliza-se a funo de covarincia normada pela varincia:
( h) =
C (h) Var[ Z (t )]
Neste caso chamamos de funo de correlao ou coeficiente de correlao, que nada mais do que a correlao entre sees da varivel separadas por um passo h. Portanto, (0) = 1. Podemos definir uma varivel como estritamente estacionria se seus momentos estatsticos so invariantes a translaes na origem. Isto significa que o processo Z(t) e Z(t+h) tem a mesma estatstica para qualquer h. Uma varivel chamada de estacionria de segunda ordem se: A mdia constante: E[Z(t)] = O segundo momento existe: E[Z2(t)] < Para cada par {Z(t), Z(t+h)} a funo covarincia existe e depende apenas de h. C(t, t+h) = C(h)
17
UFU/FAMAT
A estacionaridade da covarincia implica na estacionaridade da varincia: Var{Z(t)}= C(0) e do variograma que definido como: 2(h) = E{[Z(t+h) Z(t)]2} = = E{[Z(t+h)2}+E{[Z(t)]2}-2E{Z(t+h) Z(t)}= = E{[Z(t+h)]2}+E{[Z(t)]2}-22 = = E{[Z(t+h)]2}- 2+ E{[Z(t)]2}-2 = = C(0) C(h) O coeficiente de correlao entre Z(t+h) e Z(t), chamado de correlograma ou autocorrelograma, igual a: r (h) = C ( h) ( h) = 1 C (0) C (0)
Note que, se ocorre a estacionaridade de segunda ordem, o correlograma (autocorrelograma) e o variograma (semivariograma) sero ferramentas correspondentes na determinao da dependncia espacial. Mas se a estacionaridade de segunda ordem no atendida o autocorrelograma no pode ser usado, pois, o denominador da funo autocorrelao uma varincia e, neste caso, C(0) constante. Observao: A existncia de estacionaridade permite a repetio de um experimento, mesmo que as amostras sejam coletadas em pontos diferentes, em relao ao experimento inicial. Esta fato justificado em funo de que todas as amostras pertencem a populaes com os mesmos momentos estatsticos.
A dependncia espacial ou temporal de uma varivel Z(t) definida por uma amplitude a, sendo que para variveis com estacionaridade de segunda ordem: C(h) = 0 Ou (h) = C(0) = Var [Z(t)] se | h | > a Quando se trabalha com o tempo a constante a chamada de tempo de correlao de Z(t). Se o estudo for espacial, por analogia, podemos chamar a de domnio de correlao. se | h | > a
18
UFU/FAMAT
A hiptese de estacionaridade de segunda ordem assume a existncia de uma covarincia e assim de uma varincia finita. Var[Z(t)] = C(0). A existncia do variograma uma hiptese mais fraca do que a existncia da covarincia, e existem muitos fenmenos que possuem uma grande capacidade de disperso, isto , que no possuem uma varincia a priori nem uma covarincia, mas um variograma pode ser definido. Uma hiptese mais fraca (mais abrangente) a hiptese intrnseca. Na hiptese intrnseca temos: a) a esperana Z(t) existe e no depende do ponto t. E[Z(t)] = b) para todo h, a varincia da diferena [Z(t+h) Z(t)] existe e no depende do ponto t. Var[Z(t+h) Z(t)] = E{[Z(t+h) Z(t)]2} = 2(h) Observao: Se uma varivel estacionria de segunda ordem, ento ela tambm intrnseca, mas o inverso nem sempre ocorre.
A hiptese intrnseca a hiptese mais freqentemente usada em geoestatstica, por ser menos restritiva e, portanto, o semivariograma a ferramenta mais difundida na geoestatstica porque exige apenas a hiptese intrnseca, enquanto o autocorrelograma exige a estacionaridade de segunda ordem. As Figuras 7A, 7B e 7C ilustram, respectivamente, uma varivel estacionria de segunda ordem, uma varivel estacionria de primeira ordem e uma outra no estacionria. Note que no caso da Figura 7A, para qualquer trecho que selecionarmos e calcularmos a mdia e a varincia, estas permanecero aproximadamente constante, j no caso da Figura 7B, apenas a mdia permanece constante e no caso da Figura 7C nem a media e nem a varincia permanecem constantes.
19
UFU/FAMAT
28 26 Y 24 22 20 18 0 10 20 X 30 40 50
29 27 25 23 21 19 17 15 0
10
20 X
30
40
50
30 25 Y 20 15 10 5 0 10 20 X 30 40 50
Figura 7. Exemplos de estacionaridade: A) Processo estacionrio de segunda ordem; B) Processo estacionrio de primeira ordem e C) Processo no estacionrio
3.3. Krigagem universal (tendncia) Na hiptese de tendncia (Krigagem universal), a varivel Z(t) pode ser decomposta em dois componentes: Z(t) = m(t) + e(t)
20
UFU/FAMAT
em que m(t) a tendncia principal (drift) e e(t) o resduo. Para se trabalhar com essa hiptese necessrio que, para cada posio t se determine tendncia m(t) e, assim, trabalha-se com o semivariograma dos resduos. Note que se m(t) = constante, ento o semivariograma da varivel Z(t), usando as observaes reais, ser igual ao semivariograma dos resduos e(t), mas, se ocorre algum tipo de tendncia nos dados (tendncia linear, quadrtica, etc.), o semivariograma dos resduos pode-se apresentar com melhor estruturao e definio dos parmetros, produzindo estimativas mais confiveis (com menor varincia) na krigagem.
4. ANLISE DA DEPENDNCIA ESPACIAL As duas funes utilizadas com maior intensidade na geoestatstica para a determinao da dependncia espacial ou temporal de variveis so a funo autocorrelao (que gera o autocorrelograma) e a funo semivarincia (que gera o semivariograma). Passaremos a descrever rapidamente a funo autocorrelao e em seguida, com maior detalhamento, ser descrita a funo semivarincia e instrumento de anlise espacial de dados. semivariograma com
4.1. Autocorrelao e autocorrelograma Quando estamos trabalhando com variveis bidimensionais, temos que a covarincia uma medida de associao entre as variveis. Entretanto esta funo tem a desvantagem de possuir as unidades das variveis que a geram e, tambm, no ter um padro de comparao, por exemplo, se calculamos a covarincia entre X e Y e encontramos o valor de 0,75 no podemos dizer se as variveis esto com forte associao positiva ou no. A covarincia dada por:
cov( x , y ) = E{[ X x ].[ Y y ]}

O clculo da covarincia pode ser pensada tambm para a anlise espacial. Se analisarmos a Varivel Z nas posies t e t+h temos:
21
UFU/FAMAT
cov[ Z ( t ), Z ( t + h )] = E [( Z ( t ) z( t ) ).( Z ( t + h ) Z ( t + h ) )]
Se a varivel Z estacionria, esta funo poder ser estimada por:
n( h )
cov( Z ( t ), Z ( t + h )) =
i =1
[ Z ( ti ) Z ] [ Z ( t i + h ) Z ] n( h ) 1
, pois
neste caso a mdia de Z(t) ser igual mdia de Z(t+h). Uma propriedade da covarincia diz que "se duas variveis aleatrias so independentes ento a covarincia entre elas igual a zero". Portanto, ao analisarmos a varivel Z nas posies t e t+h, com h=1,2,...k, espera-se que o valor da covarincia comece alto e depois tenda a zero, sendo que quanto maior for o valor da covarincia maior ser a relao espacial e para covarincia zero teremos independncia. A Figura 9 ilustra uma funo covarincia.
3 covarincias 2 1 0 -1 0 100 200 300 400 500 600 distncias (m)
Figura 8. Exemplo de uma funo covarincia
Comentamos, anteriormente, que a autocovarincia apresenta algumas dificuldades de interpretao. Vamos ento definir a funo autocovarincia como uma alternativa de interpretao da dependncia espacial de uma varivel Z. Esta funo tem a vantagem de ser adimensional e estar limitada ao valor -1 e 1, permitindo comparaes entre variveis e tambm inferncias sobre o grau de associao (dependncia). Vamos inicialmente fazer uma analogia com as variveis bidimensionais. Considerando as variveis X e Y, temos:
22
UFU/FAMAT
( x , y ) =
cov[ X ,Y )] x y
i =1
[
que pode ser estimada por:
X X ] [Y Y ] n 1 SxS y
r( x , y ) =
Neste caso quanto mais prximo de 1 ou de -1, maior a relao entre as variveis e quanto mais prximo de 0, menor a relao linear entre X e Y. A funo autocorrelao definida como sendo a razo entre a covarincia dos valores assumidos pela varivel Z, nas posies t e t+h e a varincia dessa varivel Z, em funo da distncia h, no caso de varivel estacionria de segunda ordem. Desta forma temse: cov[Z (t ), Z (t + h)] Cov[ Z (t ), Z (t + h)] = Var[ Z (t )] 2
( h) =
Trabalhando-se com dados amostrais (h) pode ser estimado por r(h):
n( h ) i =1
[ Z ( t i ) Z ] [ Z ( ti + h ) Z ] n( h ) 1 s2
r( h ) =
em que:
(h) a autocorrelao entre os valores da varivel Z, separados pela distncia h (autocorrelao populacional); Cov [Z(t), Z(t+h)] a covarincia entre a varivel Z(t) e a varivel Z(t+h); Var[Z(t)] = 2 a varincia populacional, ou seja, a covarincia entre Z(t) e Z(t+h) quando h=0; r(h) a autocorrelao amostral para a distncia h; n(h) o nmero de pontos amostrais separados pela distncia h; Z o valor mdio (mdia amostral) da varivel Z(t); s2 a varincia amostral de Z(t).
23
UFU/FAMAT
A Figura 9 mostra um exemplo de comportamento da funo autocorrelao.

1 0.8 0.6 0.4 0.2 0 -0.2 -0.4 0 100 200 300 400 500 600 distncia (m)
Figura 9. Exemplo de um autocorrelograma experimental
r(h)
O uso dessa funo no estudo da dependncia espacial ou temporal s vlida se a hiptese de estacionaridade de segunda ordem for atendida. Teoricamente, para h = O a autocorrelao mxima, ou seja, r(0) = 1 e este valor decresce at o zero, ou seja, at uma distncia ou tempo que no exista relao entre as observaes. Esta distncia define a amplitude de dependncia espacial ou temporal (a), sendo que acima dessa distncia os dados so considerados independentes entre si. Este tipo de comportamento indica que quanto mais prximas estiverem as amostras maior o grau de semelhana entre elas e este grau de semelhana decresce com o aumento da distncia entre observaes. Podemos ter ainda o autocorrelograma para toda distncia com valor de autocorrelao igual a zero (r(h) = 0), exceto para h=0 em que r(0) = 1, assim temos independncia entre as amostras para toda distncia ou tempo de estudo. Uma outra possibilidade o autocorrelograma com autocorrelaes flutuando em torno de zero (indica independncia entre as observaes) e o autocorrelograma cclico, que indica flutuaes peridicas na varivel estudada, conforme Figura 10A e 10B.
24
UFU/FAMAT
1.2 1 0.8 0.6 0.4 0.2 0 -0.2 0
r(h)
10 h
15
20
1.2 1 0.8 0.6 0.4 0.2 0 -0.2 -0.4 0
r(h)
10 h
15
20
Figura 10. Exemplos de autocorrelogrmas: A) independncia entre observaes; B) periodicidade da varivel.
4.2. Semivariograma a) Definio do semivariograma O semivariograma definido como: 1 (h) = {Var[ Z (t ) Z (t + h)]} 2 Note que Var[Z(t) Z(t+h)] a varincia dos dados separados por uma distncia h, mas, na expresso acima, esta varincia est sendo divida por dois, ento se utiliza o prefixo semi para distinguir da varincia e da vem o nome semivarincia para (h) e semivariograma para o grfico de (h) em funo de h.
25
UFU/FAMAT
Observao: O divisor 2 da varincia surge das dedues e simplificaes matemticas.
Sob a suposio de tendncia zero, temos: E[Z(t+h)] = E[Z(t)] e, portanto: 1 (h) = {E[ Z (t + h) Z (t )] 2 } 2 e uma estimativa de (h) chamada de (h) dada por:
n(h) ^
(h) =
[ z(t + h) Z (t )]
i =1
2n( h )
em que n(h) o nmero de pares separados pela distncia h. Relembrando a condio de estacionaridade, temos que a utilizao do semivariograma exige que pelo menos a hiptese intrnseca seja atendida, ou seja, exige a condio de estacionaridade mais fraca quando comparada com a autocorrelao.
b) Caracterizao do semivariograma Analisando a expresso da funo semivarincia, pode-se imaginar que quanto mais prximos estiverem os pontos amostrados, maior ser a semelhana entre eles e, portanto, menor a semivarincia; e quanto mais distantes estiverem os pontos amostrados menor ser a semelhana e, consequentemente, maior a disperso (varincia). Na teoria temos que para a distncia h=0 a semivarincia (0) = 0 e, a semivarincia (h) cresce com o incremento de h, at atingir um valor constante para (h) que corresponde s variaes aleatrias, ou seja, variaes que no so justificada pela semelhana de um ponto com outro. A distncia h a partir da qual (h) se torna aproximadamente constante chamada de alcance da dependncia espacial (a) sendo que as medies realizadas a distncias maiores que a, tem distribuio espacial aleatria e, portanto, so independentes entre si. O valor de (h) constante chamado de patamar (C). A utilizao de dados amostrais na estimativa da semivarincia e na construo do semivariograma, revela que, freqentemente, para h = 0 a semivarincia (0) difere de zero. A impossibilidade de se fazer reamostragem exatamente sobre um ponto j amostrado
26
UFU/FAMAT
(nestes casos pode ocorrer variaes a distncias menores do que a menor distncia de amostragem) e erros como erros de amostragem, erros de anlise de laboratrio, etc., so justificativas dessa descontinuidade na origem. Quando (0) 0, surge um novo termo no semivariograma chamado de efeito pepita (C0) e, neste caso, o patamar dado por: C0 + C. Observao: Pode-se mostrar que o patamar do semivariograma (C0 + C) uma estimativa sem tendncia da varincia (2) da varivel Z(t). Nas Figuras 11A
C
e 11B apresentamos o comportamento ideal de um
semivariograma e tambm so mostrados os parmetros do modelo descritos acima.

C0 + C
(A) a
INDEP DEP.
(B) a
DEP. INDEP.
C0
Figura 11. Semivariogramas: (A) sem efeito pepita; (B) com efeito pepita
Os semivariogramas apresentados na Figura 11 indicam estacionaridade de segunda ordem para a varivel, porque apresenta patamar claro e bem definido. Se o semivariograma for constante e igual ao patamar para qualquer valor de h, temos o efeito pepita puro e, neste caso, temos a ausncia total de dependncia espacial, ou seja, a dependncia espacial, se existir, ser manifestada distncia ou tempo menor do que o menor espaamento entre amostras. Um outro tipo de semivariograma aquele que apresenta a semivarincia com flutuaes. Este semivariograma chamado de semivariograma peridico ou cclico e indica uma periodicidade nos dados que pode ser explicada por algum fator conhecido e analisada por meio da densidade espectral.
27 Prof. Dr. Ednaldo Carvalho Guimares
UFU/FAMAT
Tambm podemos ter um tipo de semivariograma em que as semivarincias crescem, sem limites, para todos os valores de h, ou seja, semivariogramas sem patamar definido. Este semivariograma indica que a hiptese de estacionaridade de segunda ordem no foi atendida e, provavelmente, estamos trabalhando com a hiptese intrnseca ( fenmeno com capacidade infinita de disperso). Ele indica tambm que a mxima distncia h entre as amostras no foi capaz de exibir toda a varincia dos dados e provavelmente existe tendncia dos dados para determinada direo. Se for verificada a tendncia remove-se esta tendncia e verifica-se se a varivel resduo apresenta
semivariograma com patamar (estacionaridade de segunda ordem). Uma outra alternativa trabalhar com a hiptese de tendncia nos dados originais. Vale ressaltar que a primeira alternativa a mais simples e a mais utilizada. Se o semivariograma dos resduos apresenta efeito pepita puro, pode-se dizer que a superfcie de tendncia a melhor representao espacial da varivel. Uma metodologia de se ajustar superfcies de tendncia a utilizao de regresso mltipla. Podemos ter ainda um semivariograma com mais de uma estrutura de varincia, que so chamados de semivariogramas com estruturas entrelaadas ou semivariogramas imbricados. Neste caso uma explicao prtica poderia estar associada ao fato de estarmos trabalhando com mais de uma populao, ou seja, at uma distncia X estamos trabalhando com uma determinada populao e a partir da outra ou outras populaes. As Figuras 12A, 12B, 12C, 12D e 12E, mostram respectivamente, semivariogramas experimentais com patamar definido, efeito pepita puro, sem patamar, cclico e com estruturas entrelaadas.
28
UFU/FAMAT
20 gama (h) 15 10 5 0 0 5 10 h 15 20
20 gama (h) 15 10 5 0 0 5 10 h 15 20
20 gama (h) 15 10 5 0 0 5 10 h 15 20
10 8 gama (h) 6 4 2 0 0 5 10 h 15 20
29
UFU/FAMAT
40 gama(h) 30 20 10 0 0 5 10 15 h 20 25 30
Figura 12. Semivariogramas: A) Com patamar; B) Efeito pepita puro; C) sem patamar D)Cclico e E) Com estruturas entrelaadas
c) Grau de dependncia espacial Quanto ao grau de dependncia espacial da varivel em estudo, podemos classificala como: i) varivel com forte dependncia espacial se o efeito pepita for menor ou igual a 25% C0 do patamar C + C < 0,25 ; 0 ii) varivel com moderada dependncia espacial se o efeito pepita representar entre C0 25% e 75% do patamar 0 , 25 0 , 75 ; C C + 0 iii) varivel com fraca dependncia espacial se a relao entre efeito pepita e patamar C0 estiver entre 75% e 100% 0,75 < C + C < 1,00 0 iv) varivel independente espacialmente se a relao entre efeito pepita e patamar for igual a 100%, neste caso temos o semivariograma com efeito pepita puro C0 1 , 00 = C +C . 0
30
UFU/FAMAT
d) Isotropia e anisotropia Note que h um vetor e, consequentemente, o semivariograma depende da magnitude e da direo de h. Quando o semivariograma idntico para qualquer direo de h ele chamado de isotrpico e quando o semivariograma apresenta os parmetros C, C0, a e/ou modelo diferenciado dependendo da direo de h, ele chamado anisotrpico (podemos classificar a anisotropia em anisotropia geomtrica ou anisotropia zonal). Se o semivariograma anisotrpico ele deve sofrer transformaes antes de ser usado. Vieira (1995) alega que, em geral, a preciso da interpolao ou o tipo de hiptese satisfeita, no so afetados se, ao invs de se preocupar com a escolha de mtodo de transformao de anisotropia, apenas limitar a faixa de distncia na qual se utiliza o semivariograma. As principais direes de h que so examinadas so: 0o (na direo X), 90o (na direo Y), 45o e 1350 (nas duas diagonais principais). Quando os dados forem coletados em uma transeo (linha), o semivariograma unidimensional e nada pode ser dito sobre anisotropia.
e) Os principais modelos de semivariogramas Dados experimentais so influenciados por uma srie de fatores. Um pesquisador, geralmente, no capaz de controlar todos os fatores que influenciam um conjunto de dados. Desta idia surge a distino entre modelo matemtico e modelo estatstico. No modelo matemtico no temos desvios em relao funo proposta, ou seja, todos os pontos experimentais devem estar sobre a funo proposta para explicar determinado fenmeno. Por exemplo, se tomarmos os pares ordenados (0,0); (2,4); (3,9); (4,16) e (5,25) como sendo valores experimentais e propormos o modelo: Yi= Xi2, como o modelo que explique o comportamento desses dados experimentais, estaremos trabalhando com um modelo matemtico, pois, todas as observaes pertencem ao modelo proposto (Figura 13).
31
UFU/FAMAT
30 25 20 15 10 5 0 -5 0
y = x2
3 X
Figura 13. Modelo Matemtico
Para o modelo estatstico os valores experimentais apresentam desvios (erros) em relao ao modelo proposto (ajustado) e estes erros so atribudos a fontes de variaes no controladas pelo pesquisador. Por exemplo, podemos ter o seguinte modelo estatstico que explique o comportamento linear de uma varivel Y em funo de X: Yi = a +bXi +ei, (Figura 14) em que a e b so as constantes que definem a reta e ei so os erros experimentais (maiores detalhes podem ser obtidos em textos e livros sobre modelos lineares ou anlise de regresso).
15 10 Y 5 0 0 1 2 3 X 4 5 6 y = 2.0286x + 1.4286+ei
Figura 14. Modelo Estatstico Na aplicao da teoria geoestatstica a dados experimentais, vamos ajustar modelos tericos de semivariogramas as semivarincias experimentais, e desta forma estaremos trabalhando com modelos estatsticos de semivariogramas.
32
UFU/FAMAT
O grfico da semivarincia ((h)) em funo da distncia (h), mostrar uma srie de pontos discretos que chamado semivariograma experimental. Uma funo contnua deve ser ajustada as semivarincias experimentais. A escolha do modelo de semivariograma que ser utilizado um dos aspectos mais importantes da geoestatstica. Todos os clculos da geoestatstica dependem do modelo de semivariograma ajustado e, conseqentemente, se o modelo ajustado no for apropriado, todos os clculos seguintes contero erros que podero afetar as inferncias, portanto o ajuste de semivariograma uma fase crucial na anlise geoestatstica e deve receber uma ateno especial. Vrios mtodos so utilizados para verificar a qualidade do ajuste do semivariograma aos dados experimentais. Vieira et al (1983) sugerem o mtodo de ajuste por tentativa e erro (ajuste a critrio do observador) associado avaliao do modelo pela tcnica de validao cruzada ou autovalidao (jack-Knifing). Macbratney e Webster (1986) sugerem o mtodo do Critrio de Informao de Akaike (AIC) para avaliar o modelo. J Pannatier (1996) sugere a utilizao do "Indicao da Qualidade do Ajuste" (IGF). A descrio de cada mtodo de seleo pode ser encontrado nos respectivos trabalhos originais dos autores e cada programa de anlise geoestatstica de dados apresenta um critrio de seleo. O programa GS+, com o qual estamos exemplificando este texto, aplica a metodologia dos mnimos quadrados para os ajustes dos modelos e utiliza como critrios para seleo do modelo: i) o coeficiente de determinao (R2), que, relembrando os conceitos de anlise de regresso, uma relao entre a soma de quadrados devido ao modelo ajustado e a soma de quadrados total (mede a variao dos dados devido ao modelo ajustado em relao variao total dos dados) e quanto mais prximo da unidade estiver o valor de R2 melhor ser o modelo ajustado; ii) Soma de quadrados de resduos (RSS) quanto menor for este valor, melhor ser o modelo de semivariograma. O GS+ utiliza este resultado para a seleo do modelo e, por meio de combinaes dos parmetros do modelo, minimiza esta soma de quadrados de resduos. O autor do programa alega que a utilizao
33
UFU/FAMAT
desse critrio na seleo do modelo preferido, por ser este mais sensvel e mais robusto quando comparado com o coeficiente de determinao (R2).
Observao: Em muitos casos (talvez na maioria dos casos) a sensibilidade de quem est trabalhando com os dados e o conhecimento sobre a varivel de fundamental importncia na opo do modelo de semivariograma. s vezes prefervel selecionar um modelo com R2 um pouco menor ou RSS um pouco maior que o sugerido pelo programa, mas que represente melhor os dados. De maneira geral, quanto mais simples puder ser o modelo ajustado, melhor, e tambm no se deve dar importncia excessiva a pequenas flutuaes.
A condio para o ajuste de modelos a dados experimentais que ele represente a tendncia de (h) em relao h e que o modelo tenha positividade definida condicional. De maneira geral, um modelo positivamente condicional se (h)> 0 e (-h) = (h), qualquer que seja h. Definindo C0 como efeito pepita, C0 + C como patamar e a como alcance, os principais modelos de semivariogramas utilizados na geoestatstica so: i) modelo linear com patamar
C C 0 + h ( h) = a C0 + C
0ha h>a
Neste caso C/a o coeficiente angular para 0< h < a
ii)
modelo esfrico
3 h 1 h 3 C + C (h) = 0 2 a 2 a C0 + C
iii) modelo exponencial
0ha h>a
(h) = C0 + C 1 e[ 3( h / a )]
34
0<h<d
UFU/FAMAT
Neste modelo e no modelo de gaussiano d a distncia mxima na qual o semivariograma definido e nestes modelos o patamar (a) atingido apenas assintoticamente O parmetro a determinado visualmente como a distncia aps a qual o semivariograma se estabiliza.
iv)
modelo gaussiano
(h) = C 0 + C 1 e [ 3( h / a )
v) modelos sem patamar
0hd
( h ) = C0 + Ah B
definida condicional.
0<B<2
Os parmetros A e B so constantes que definem o modelo, sendo que B tem que ser estritamente maior que zero e menor que dois para garantir a condio de positividade
Observao: dependendo da escala de trabalho e do espaamento entre amostras, pode-se ter mais de um modelo de semivariograma para os dados. Nestes casos temos as estruturas entrelaadas.
As Figuras 15A e 15B mostram os aspectos gerais dos modelos de semivariogramas discutidos anteriormente.
(A)
Linear Gaussiano Exponencial Esfrico A=8,0; B=0,5 A=0,9; B=1,0 A=0,1;B=1,5
(B)
Figura 15. Modelos de semivariograma: (A) com patamar; (B) sem patamar.
Observao: Nos modelos exponencial e gaussiano, apresentados no programa GS+, a amplitude a que deve ser considerada como a amplitude de dependncia espacial deve ser igual a trs vezes e 3 vezes, respectivamente, o valor de A0, ou seja, a amplitude efetiva
35
UFU/FAMAT
apresentada na coluna
posterior a coluna de A0. Isto ocorre porque os modelos
exponencial e gaussiano utilizados no programa no consideram o fator 3 apresentados nos modelos anteriores.
4.3. O uso do software GS+ na determinao do semivariograma No programa GS+ o cone realizada por meio do semivariograma. indica que a anlise da dependncia espacial ser
Observao: Existem outras opes de anlises que so apresentadas em autocorrelation ou nos respectivos cones na barra de ferramentas.
Ativando o cone do semivariograma, o programa apresenta a seguinte janela (Figura 16):

Distncia mxima para clculo das semivarincias Passos para clculo da semivarincia Anlise de anisotropia Clculo das semivarincias e do semivariograma
Exibe o semivar.
Varincia amostral Semivar. escalonado
Semivariograma isotrpico Semivariogramas anisotrpicos
Figura 16. Anlise da semivarincia
36
UFU/FAMAT
A distncia mxima para clculo da semivarincia deve ser no mximo igual mxima distncia de coleta da amostra. O GS+ adota como critrio inicial 80% da distncia mxima, isto se justifica pelo fato de que a grandes distncias o nmero de pares para o clculo da semivarincia reduz-se drasticamente, fazendo com que a estimativa da semivarincia tenha pouca preciso. Este valor pode ser alterado pelo usurio. Os passos para clculo das semivarincias consiste em como as semivarincias vo ser agrupadas. Quanto maior for este valor menos pontos teremos no semivariograma. Vale ressaltar tambm que, se este passo for muito pequeno, teremos classes de distncia sem pares para clculo da semivarincia. Para a anlise do semivariograma isotrpico o ngulo de tolerncia (offset tolerance) deve ser de 900 e, neste caso, os semivariogramas para as diferentes direes (anisotrpico) sero iguais ao semivariograma isotrpico. No abordaremos neste texto a discusso sobre anisotropia e procedimentos de anlise de anisotropia. A janela apresentada na Figura 9 mostra tambm as opes de exibio do semivariograma. Se marcarmos apenas a primeira opo, teremos o semivariograma experimental e uma proposta de modelo ajustado. Marcando-se a primeira e a segunda opes, temos o semivariograma experimental, a proposta de modelo e uma linha paralela ao eixo X que representa a varincia dos dados. Na terceira opo exibido o semivariograma escalonado, ou seja, o semivariograma onde cada semivarincia dividida pela varincia dos dados. A Figura 17 ilustra o resultado de um semivariograma.
37
UFU/FAMAT
Mostra o semivariograma com os respectivos parmetros e ajuste
Mostra as opes de modelos com os parmetros e ajuste
Figura 17. Exemplo de um semivariograma
Note que a Figura 17 apresenta ainda a opo model e a opo expand. O resultado da execuo dessas funes so apresentados nas Figuras 18 e 19. A Figura 18 exibe as opes de modelos de semivariogramas.
Efeito pepita patamar amplitude Amplitude efetiva (exp e gaussiano). Relao entre C e patamar Coef. Determinao e soma de quadrados de erros
modelos
Refaz o semivariograma padro do GS+
Aplica o novo modelo caso haja modificao
Figura 18. Modelos e anlises dos modelos
38
UFU/FAMAT
O GS+ permite, no comando model (Figura 18), visualizar os modelos com os respectivos ajuste feito pelo programa (vale relembrar que o GS+ seleciona o modelo com menor soma de quadrados de resduos (RSS)). Ao usurio permitido a modificao do modelo selecionado pelo GS+ ou, ento, dos parmetros dos modelos e, realizadas modificaes, o comando apply deve ser ativado para que o programa tome este modelo como o modelo de variabilidade espacial ou temporal daquela varivel. Para retornar ao modelo padro do GS+ utilize o comando refit.
Observaes: a) O programa no apresenta o modelo de efeito pepita puro. Para obter este modelo utilize o modelo linear com C0 = C0 +C. b) A amplitude efetiva utilizada no GS+ para determinar a amplitude de dependncia espacial dos modelos exponencial e gaussiano, devido a formula de clculo desses modelos no programa, A0 A (Estes modelos no GS+ no consideram o fator multiplicativo 3). c) A inclinao no modelo linear e linear com patamar (coeficiente angular) e dado pela relao entre C e A0, ou seja, C/A0. d) A relao entre C e C0+C nos d uma idia do grau de dependncia espacial da varivel, sendo que quanto mais prximo de 1, maior a dependncia espacial. Note que C0 C e o primeiro termo j foi discutido no item grau de dependncia = 1 C0 + C C0 + C espacial, classificando a dependncia como fraca, moderada e forte. e) R2 (coeficiente de determinao) e RSS (soma de quadrados de resduos) nos informa sobre a qualidade do ajuste do modelo. f) No ajuste do modelo a sensibilidade do usurio muito mais importante do que os valores de R2 e RSS e, portanto, tentativas de ajustes diferentes ao proposto pelo programa devem ser utilizadas, mesmo que isso cause queda no valor de R2 e acrscimo no valor de RSS. g) O programa no apresenta a opo de ajuste de modelo sem patamar diferente do linear. Neste caso, sugere-se que se copie as semivarincias calculadas para outro programa e que o grfico seja feito neste outro programa, por exemplo, O Excel.
39
UFU/FAMAT
A Figura 19 mostra o resultado da execuo do comando expand.
Semivariograma experimental e modelo ajustado
Parmetros do modelo ajustado
Lista semivarincia calculada, com distncias e nmero de pares
Mostra as diferenas quadrticas que geram a semivarincia
Edita o semivariograma
Figura 19. Semivariograma e opes de edio Nesta tela temos a exibio das semivarincia calculadas, do modelo de semivariograma ajustado e dos parmetros desse modelo. A listagem dos valores de semivarincias com as respectivas distncias de clculo (list values), permite que estes valores sejam transportados para outros programas e que se faa vrios modelos em uma nica figura.
40
UFU/FAMAT
4.4. Exemplos de aplicao 1) Suponha que os dados abaixo representem a varivel Z (por exemplo, % de areia de um certo solo). A amostragem foi feita em uma transeo e as amostras foram coletadas a cada 20 m. Faa a anlise descritiva da varivel, calcule as semivarincias, monte o semivariograma experimental e proponha um modelo de ajuste. (note que estes dados so unidimensionais). Tabela 1. Dados de % de areia em um solo. h (m) 0 20 40 60 80 100 120 140 %Areia 16 18 17 20 15 15 15 15 h(m) 160 180 200 220 240 260 280 300 %Areia 17 17 17 18 18 19 18 18 h(m) 320 340 360 380 400 420 440 460 %Areia 18 21 16 20 16 18 18 17 h(m) 480 500 520 540 560 580 600 620 %Areia 18 18 20 17 17 17 17 18 Observao: para ser resolvido sem o uso de programas de geoestatstica Soluo: a) Anlise descritiva
Mdia Erro padro Mediana Moda Desvio padro Varincia Curtose Assimetria Mnimo Mximo 17.46875 0.265581 17.5 18 1.50235 2.257056 0.129546 0.27713 15 21
A anlise descritiva mostra que os dados possuem uma distribuio de probabilidade normal aproximada (mdia, mediana e moda aproximadamente iguais; curtose e assimetria prximos de zero; grfico tendendo simetria). A variabilidade do dados relativamente baixa (desvio padro = 1,5023 e CV = 8,6%) e os valores mnimo e mximo indicam a no existncia de problemas amostrais com os dados.
41
UFU/FAMAT
b) Semivarincia e semivariograma Os valores das distncias h, das semivarincias ((h)) e nmeros de pares(n(h)) utilizados no clculo so apresentados abaixo.
Distncias de clculo, valores de semivarincia e nmero de pares. Distncia h (m) Semivarincia ((h)) 20 2,129 40 1,417 60 2,500 80 2,214 100 2,037 120 2,327 140 2,120 160 2,396 180 2,065 200 2,545 220 2,738 240 2,825 260 2,711 280 1,778 300 2,735 320 1,719 340 3,367 360 1,857 380 2,808 400 2,375 420 2,318 440 2,400 460 1,056
Nmero de pares (n(h)) 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9
A representao grfica (semivariograma) das semivarincias em funo da distncia h (semivariograma experimental) e uma proposta de modelo ajustado aos dados experimentais so apresentados na figura abaixo.
4.000 semivarincia 3.000 2.000 1.000 0.000 0 100 200 h (m) 300 400 500
Semivariograma experimental e modelo ajustado.
42
UFU/FAMAT
O modelo proposto inicialmente um modelo exponencial, com efeito pepita (C0) de 1,0 (%)2, patamar (C0+C) de 2,3 (%)2 e alcance (a) de 120 m. (Observao: no foi realizado nenhum teste para verificar se este o melhor modelo de semivariograma para esta varivel). Neste caso o semivariograma mostra uma dependncia espacial para a % de areia at 120 m, ou seja, amostras coletadas a distncia inferiores a 120 m possui dependncia espacial e, no caso da utilizao de mtodos de anlises estatsticas que consideram independncia entre amostras, distncia de amostragem mnima deveria ser de 120 m. OBS: Exerccio resolvido com o auxlio do MS-EXCEL
2) Utilizando os dados do exemplo anterior (exemplo1) refaa a anlise utilizando o GS+ Soluo: a) Anlise descritiva
b) Semivariograma O modelo proposto pelo GS+ foi:
43
UFU/FAMAT
O modelo proposto no exemplo 1 apresenta o seguinte resultado:
Comparando os dois modelos verifica-se ligeiro aumento de r2, mantendo-se o mesmo valor de RSS, desta forma o modelo proposto no exemplo 1 poderia ser utilizado. As descries e discusses seguem o padro do exemplo 1. Lembre-se que o modelo adotado foi o exponencial e portanto o alcance efetivo ser de 40,80 m no primeiro caso e de 120 m no segundo caso. Outros modelos poderiam ser sugeridos neste caso.
44
UFU/FAMAT
3) A seguir apresentamos as coordenadas X (m), Y (m) e a varivel silte (%) em uma rea experimental.
X Y
PBPD
0 0 20 0 40 0 60 0
0 10 20 10 40 10 60 10
0 20 20 20 40 20 60 20
0 30 20 30 40 30 60 30
0 40 20 40 40 40 60 40
0 50 20 50 40 50 60 50
0 60 20 60 40 60 60 60
0 70 20 70 40 70 60 70
10 0 30 0 50 0 70 0
10 10 30 10 50 10 70 10
10 20 30 20 50 20 70 20
10 30 30 30 50 30 70 30
10 40 30 40 50 40 70 40
10 50 30 50 50 50 70 50
10 60 30 60 50 60 70 60
10 70 30 70 50 70 70 70
12.77 12.84 11.39 12.30 12.43 12.43 12.45 12.74 11.39 12.32 12.16 11.49 10.39 11.32 11.24 12.49
X Y
PBPD
11.25 11.97 12.38 12.85 12.55 12.49 12.58 12.82 12.49 11.67 11.59 12.72 11.12 11.18 11.53 11.48
X Y
PBPD
11.81 11.19 11.46 11.44 12.39 12.17 11.69 12.32 11.58 11.11 11.55 10.79 11.13 11.29 12.62 12.01
X Y
PBPD
12.66 11.49 11.25 12.87 12.77 11.95 11.96 11.11 10.81 11.65 12.36 11.90 12.16 12.56 12.54 11.46
Realizar a anlise dos dados e verificar se existe dependncia espacial para essa varivel. SOLUO: a) Anlise descritiva O resultado das principais estatsticas dessa varivel apresentado a seguir:
Nota-se que a rea apresenta, em mdia, 11,92% de silte, com disperso mdia em torno desse valor de 0,6302%. Esta disperso em torno da mdia representa uma variabilidade de 5,29% (CV=5,29%), mostrando que os dados tm uma baixa disperso. Os coeficientes de assimetria e curtose com os respectivos erros padro indicam tendncia simtrica dos dados, mas a curva do tipo platicrtica, diferindo da curva normal (mesocrtica). Com base em uma anlise visual do histograma, verifica-se uma distribuio de freqncias bimodal para esta varivel.
A distribuio das amostras na rea segundo o valor de ocorrncia a seguinte:
45
UFU/FAMAT
No se observa tendncias de concentrao de valores em posies especficas da rea e tambm no ocorre sentido preferencial na distribuio dos dados, tal fato um primeiro indicativo de que a distribuio espacial dessa varivel, nesta rea, aleatria e isotrpica.
b) Anlise do semivariograma A seguir mostrado o semivariograma dessa varivel:
46
UFU/FAMAT
O modelo apropriado para descrever o comportamento espacial dessa varivel foi o modelo de efeito pepita puro. Nota-se que as semivarincias experimentais esto em torno da linha paralela ao eixo x, ou seja, C0 + C = 0,397. Conclui-se, portanto, que a distribuio espacial do silte nesta rea experimental aleatria e as amostras, para a malha amostrada (com distncia entre pontos de 10 m), so independentes.
4) Os dados apresentados abaixo referem-se a umidade de um solo. As amostras foram coletadas em uma malha contendo 63 pontos com espaamento de 20 m entre amostra, perfazendo 9 colunas e 7 linhas de amostragem.
X Y
U
20 20 160 40 120 80 80 120
40 20 180 40 140 80 100 120
60 20 20 60 160 80 120 120
80 20 40 60 180 80 140 120
100 20 60 60 20 100 160 120
120 20 80 60 40 100 180 120
140 20 100 60 60 100 20 140
160 20 120 60 80 100 40 140
180 20 140 60 100 100 60 140
20 40 160 60 120 100 80 140
40 40 180 60 140 100 100 140
60 40 20 80 160 100 120 140
80 40 40 80 180 100 140 140
100 40 60 80 20 120 160 140
120 40 80 80 40 120 180 140
140 40 100 80 60 120
28.16 27.16 26.09 27.27 27.61 26.61 26.13 29.73 31.12 27.52 26.54 26.45 24.98 27.93 26.91 24.13
X Y
U
27.80 29.69 28.40 27.63 27.42 26.81 26.37 28.61 27.66 30.17 28.86 26.58 26.03 26.72 27.50 26.44
X Y
U
23.63 26.83 25.46 24.17 26.61 24.49 22.35 22.05 22.05 24.98 23.35 26.18 22.30 27.89 24.64 24.20
X Y
PBPD
25.36 24.77 27.54 25.49 24.45 24.36 26.39 26.73 29.87 23.63 25.30 23.27 25.82 26.85 25.36
Realizar a anlise dos dados e verificar se existe dependncia espacial para essa varivel.
47
UFU/FAMAT
Soluo: a) Anlise descritiva As estatsticas e o histograma da varivel umidade foram:
Verifica-se que este solo apresentou, na poca de coleta, umidade mdia de 26, 24 g de gua/100g de solo, com desvio padro de 2,020 g/100g, o que representa uma variabilidade de 7,7%, considerada uma baixa variabilidade dos dados em torno do valor mdio. Os histogramas, associado assimetria e curtose dos dados, mostram que os dados se distribuem segunda a curva normal.
As posies ocupadas pelos valores de umidade do solo na rea experimental (figura abaixo), mostram tendncia de que os valores mais altos de umidade (acima de 27,50 g/100g) se concentrem na metade inferior da malha, considerando o eixo Y como referncia e, conseqentemente, os valores abaixo de 27,50 g/100g se concentram na parte superior da malha, mostrando uma distribuio espacial no aleatria dos dados. No possvel visualizar tendncia de distribuio dos dados nas direes preferencias da malha, ou seja, provavelmente exista uma isotropia na distribuio da umidade do solo nesta rea.
48
UFU/FAMAT
b) Anlise do semivariograma O semivariograma desta varivel :
Nota-se que a varivel umidade do solo apresenta dependncia espacial, que pode ser descrita pelo modelo exponencial com alcance de 81 m, ou seja, amostras de umidade do solo selecionadas a distncias inferiores a 81 m esto correlacionadas entre si. A relao entre o efeito pepita e o patamar de 13,63%, indica que a dependncia espacial forte.
49
UFU/FAMAT
5. KRIGAGEM 5.1. O interpolador O semivariograma a ferramenta da geoestatstica que permite verificar e modelar a dependncia espacial de uma varivel. Uma aplicao imediata do semivariograma a utilizao das informaes geradas por ele na interpolao, ou seja, na estimativa de dados e posterior mapeamento da varivel. O interpolador que utiliza o semivariograma em sua modelagem chamado de krigagem. O nome krigagem uma homenagem ao engenheiro sul-africano D. G. Krige. Para a aplicao da krigagem assume-se: que sejam conhecidas as realizaes z(t1), z(t2), ..., z(tn) da varivel Z(t), nos locais t1, t2, ..., tn; que o semivariograma da varivel j tenha sido determinado; e que o interesse seja estimar um valor z* na posio t0. O valor estimado z*(t0) dado por: z * (t 0 ) = i z (t i )
i =1 n
em que: n o nmero de amostras de Z(t) envolvidas na estimativa de z*(t0), e i so os pesos associados a cada valor medido, z(ti). Observao: Se existe a dependncia espacial, os pesos i so variveis de acordo com a distncia entre o ponto a ser estimado z*(t0) e os valores z(ti) envolvidos nas estimativas. Se ocorre a independncia espacial, ento : i = 1/n e, portanto temos a mdia aritmtica simples.
A melhor estimativa de z*(t0) obtida quando: a) o estimador no tendencioso E{z * (t 0 ) z (t 0 )} = 0 b) a varincia da estimativa mnima Var[ z * (t 0 ) z (t 0 )] = mnimo Para que z* seja uma estimativa no tendenciosa de z, a soma dos pesos das amostras tem que se igualar a 1.
=1
50
UFU/FAMAT
E para obter a varincia mnima sob a condio de i = 1, introduz-se o multiplicador de Lagrange para a deduo das equaes e o sistema de krigagem resultante :
(t , t
i =1 i i
) + = (t i , t 0 )
em que: o multiplicador de Lagrange. A varincia de estimativa dada por:

2 E = + i (t i , t 0 )
O sistema de equaes da krigagem contm n+1 equaes e n+1 incgnitas e uma nica soluo produz n pesos e um multiplicador de Lagrange . Em notao matricial, chamando de A a matriz das semivarincias dos valores amostrados envolvidos na estimativa de z*(t0); a matriz coluna que contm os pesos i e o multiplicador de Lagrange e b a matriz coluna das semivarincias entre os valores amostrados e o ponto a ser estimado, tem-se: A=b E, portanto: =A-1b A varincia da estimativa (E2) e dada por: E2 = bt As matrizes A, b e so: (t1 , t1 ) (t , t ) 2 1 . A= . . (t n , t1 ) 1
(t1 , t 2 ) .... (t1 , t n ) (t 2 , t 2 ) .... (t 2 , t n ) . . . . . . (t n , t 2 ) ..... (t n , t n ) 1 1
1 (t1 , t 0 ) (t , t ) 1 2 0 . . . ; b= . ; = . . 1 (t n , t 0 ) 1 0
1 2 . . . n
51
UFU/FAMAT
Observaes: i) A matriz A simtrica e possui diagonal principal igual a zero, ou igual ao valor do efeito pepita. ii) Os valores 1 que aparecem nas matrizes A e b so conseqncia do multiplicador de Lagrange. iii) O sistema deve ser resolvido para cada estimativa z* e para cada variao do nmero de amostras envolvidos na estimativa.
5.2. A krigagem no programa GS+ A Figura 20 mostra a janela da krigagem no GS+. Para ativar a krigagem basta ativar o cone com a letra k.
Informaes sobre a malha Validao cruzada
Mtodo de krigagem
Modelo de semivariograma
Arquivo e tipo de arquivo para gravar a krigagem
vizinhos
Figura 20. Krigagem no GS+
A krigagem pode ser expressa por meio de mapas, sendo necessrio para isto, ativar o cone map, tendo como resultado a Figura 21.
52
UFU/FAMAT
Figura 21. Opes de mapas no GS+
Exemplo: Utilizando os dados no exemplo de umidade do solo (exemplo 4) fazer a krigagem e o mapeamento da varivel umidade. Soluo: Como exemplo de sada dos resultados da krigagem temos uma pequena parte dos resultados da krigagem, os resultados apresentam com as coordenadas (x,y), os valores krigados, os desvios padro desses valores e o nmero de vizinhos utilizados na estimativa.
53
UFU/FAMAT
O mapa da umidade do solo apresentado a seguir:
Neste mapa so apresentadas as regies de ocorrncia das umidades do solo.
54
UFU/FAMAT
6. SEMIVARIOGRAMA CRUZADO E COKRIGAGEM 6.1. Semivariograma cruzado Os semivariogramas cruzados objetivam descrever a variao espacial e/ou temporal simultnea de duas variveis aleatrias. Na natureza comum encontrar variveis que esto fortemente associadas entre si, por exemplo, a umidade relativa do ar est intimamente relacionada precipitao pluviomtrica. Em algumas situaes a determinao de variveis cara e difcil e isto pode comprometer o estudo da variabilidade espacial daquela varivel, entretanto se sabemos que existe uma outra varivel de simples determinao e que apresenta boa correlao espacial com a de difcil determinao pode-se fazer a estimativa de uma delas usando-se informaes de ambas expressas no semivariograma cruzado, por meio do mtodo chamado co-krigagem. Estaremos, neste caso, trabalhando com a idia de covarivel. Consideremos duas variveis {Z1(t1i), i=1,...,n1} e {Z2(t2j), j=1,...,n2}, com as amostragens feitas no mesmo espao (rea ou tempo), mas que o nmero de amostras de Z1 seja superior ao nmero de amostras de Z2 (n1 >n2). Assumindo que pelo menos a hiptese intrnseca est sendo atendida para cada varivel individualmente e para a distribuio conjunta das variveis, podemos definir os semivariograma individuais e os semivariogramas cruzados como: Ai) Os semivariogramas de Z1(t1i) e Z2(t2j):
11(h) = 22 (h) =
1 E { Z 1( t 1i + h) - Z 1( t 1i ) }2 B 2 1 E { Z 2 ( t 2j + h) - Z 2 ( t 2j ) }2 C 2
ii) O semivariograma cruzado entre Z1(t1i) e Z2(t2i), igual ao semivariograma cruzado entre Z2(t2j) e Z1(t1i):
12 (h) = 21( h ) =
D
1 E {[ Z 1( t 2i + h) - Z 1( t 1i )][ Z 2 ( t 2j + h) - Z 2 ( t 2j )]} 2
55
UFU/FAMAT
Portanto, a semivarincia pode ser estimada por:
1 n(h) [ Z 1( t 1i + h) - Z 1( t 1i )][ Z 2 ( t 2j + h) - Z 2 ( t 2j )] E 12 (h) = 2n(h) i=1

onde n(h) o nmero de valores de Z1 e Z2 separados por um vetor h. Pode-se notar que o semivariograma um caso particular do semivariograma cruzado, quando as duas variveis so idnticas. O semivariograma cruzado s ser calculado usando as informaes existentes para posies geogrficas coincidentes. Isto significa que Z1 e Z2 tem que ser, necessariamente, definidos para os mesmos locais, e as informaes excedentes no so consideradas no clculo. Um semivariograma cruzado com caractersticas que podem ser identificadas como ideais, teria aparncia do semivariograma simples (de uma nica varivel, ou seja, patamar definido, semivarincia crescente para pequenas distncias, modelo esfrico), porm, com significados diferentes, pelo simples fato de envolver o produto das diferenas de duas variveis diferentes. Por exemplo, ao contrrio do semivariograma, no obvio que o valor do semivariograma cruzado para h=0, deva ser nulo. Assim, alm de espaos menores do que distncia de amostragem, acumulado no mesmo parmetro, est falta de correlao entre as duas variveis. O alcance aqui representa apenas o final ou a distncia mxima de
dependncia espacial entre as variveis. J o patamar do semivariograma cruzado, se existir, deve aproximar-se do valor da covarincia entre as duas variveis. Assim, quando as duas variveis forem de correlao inversa, isto , quando aumenta uma a outra diminui, a covarincia ser negativa e, conseqentemente, o semivariograma cruzado ser negativo. Os modelos utilizados para o semivariograma cruzado so os mesmos j discutidos para o semivariograma simples.
6.2. Co-krigagem A krigagem um caso particular do mtodo co-krigagem. Uma vez que exista a dependncia espacial para cada uma das variveis Z1 e Z2, e que tambm exista dependncia espacial entre Z1 e Z2, ento possvel utilizar a co-krigagem para estimar valores.
56
UFU/FAMAT
Suponha que se queira estimar valores, Z2*, para qualquer local, t0, e que a estimativa deva ser uma combinao linear de ambos Z1 e Z2, ou seja,
z* 2 (t0
)=
i= 1
1i z 1( t 1i ) +
i= 1
2j z 2 ( t 2j ) F
onde n1 e n2 so os nmeros de vizinhos de Z1 e Z2, respectivamente, e 1i e 2j so os pesos associados a cada valor de Z1 e Z2. Tomando z1(t1i) e z2(t2i) como sendo uma realizao das funes aleatrias, Z1(t1i) e Z2(t2i), respectivamente, e assumindo estacionaridade de ordem 2, o estimador pode ser reescrito em:
Z* 2 (to
)=
n1
i= 1
1i Z 1( t 1i ) +
n2
i= 1
2j Z 2 ( t 2j ) G
Para que o estimador seja timo, ele no pode ter tendncia e tem que ter varincia mnima. Em outras palavras, para que o estimador seja o melhor possvel, necessrio que ele no superestime nem subestime valores, e que a confiana nas estimativas seja mxima. O raciocnio bsico para deduo do sistema de equaes da co-krigagem idntico ao da krigagem, com uma diferena que, neste caso, envolve duas variveis, e por isto envolve equaes mais longas, com subscritos, complicando um pouco mais a situao. Porm, o raciocnio e, por conseguinte, a lgebra envolvida, so o mesmo. Para que a estimativa no tenha tendncia, qualquer que seja a distribuio dos pesos, a soma daqueles associados com a varivel estimada deve ser igual a 1, e a soma daquelas associadas outra varivel, tem que ser nula. O sistema co-krigagem e a varincia da estimativa podem ser escritos em termos de semivariograma, usando a hiptese de estacionaridade de ordem 2. Assim, o sistema da cokrigagem, em termos de semivariograma fica:
57
UFU/FAMAT
n1
i= 1
1i 12 ( t 1i ,t 1k ) +
n2
j=1
2j 12 ( t 1k ,t 2j ) - 1 =
= 12 ( t 1k ,t 0 ), k = 1,... n1
n1
i=1
1i 12 ( t 1i ,t 2l ) +
n2
j=1
2j 22 ( t 2j ,t 2l ) - 2 =
= 22 ( t 2l ,t 0 ), l = 1,... n2
I
N1
i=1
1i = 0
N2
j=1
e a varincia da estimativa fica:
2j = 1
k 2( t 0 ) = 1 + 2 + 1i 12 ( t 1i ,t 0 ) + 2j 22 ( t 2j ,t 0 ) J i= 1 j =1
2
A soluo do sistema da co-krigagem produzir n1 pesos 1i e n2 pesos 2j e os multiplicadores Lagrangeanos, 1 e 2. O sistema da co-krigagem pode ser escrito em notao matricial como, [ ] [ ] = [b] K cuja soluo
n1
n2
58
UFU/FAMAT
-1 [ ] = [ ] [b] L
onde []-1 o inverso da matriz de coeficientes [], [] a matriz dos pesos procurados, 1i e 2j, e [b] o lado direito do sistema de equaes (semivarincia do ponto a ser estimado (t0) e o ponto observado (t12 ou t21)). A varincia da estimativa pode ser escrita como:
t 2 k2 ( t 0 ) = [ ] [b] M
onde []t o transposto da matriz []. Suponha ento que o nmero de vizinhos de Z2 usados seja n2=2, e de Z1, n1=4. A matriz [] ser ento de 8x8 e pode ser escrita como:
11 ( t 11 , t11 ) 11 ( t12 , t 11 ) 11 ( t 13 , t 11 ) 11 ( t 13 , t 12 ) 11 ( t 13 , t 13 ) 11 ( t 14 , t 11 ) 11 ( t 14 , t 12 ) 11 ( t 14 , t 13 ) 12 ( t 11 , t 21 ) 12 (t11 , t 22 ) 1 0
11 ( t 11 , t 12 ) 11 ( t 12 , t 12 ) 11 ( t 11 , t 13 ) 11 ( t 12 , t 13 ) 12 ( t 11 , t 14 ) 11 ( t 12 , t 14 )
12 ( t 12 , t 21 ) 12 ( t 12 , t 22 ) 1 0 12 ( t 13 , t 21 ) 12 ( t 13 , t 22 ) 1 0
11 ( t 13 , t 14 ) 11 ( t 14 , t 14 ) 12 ( t 14 , t 21 ) 12 ( t 14 , t 22 ) 1 0
12 ( t 11 , t 21 ) 12 ( t 12 , t 21 ) 12 ( t 13 , t 21 ) 12 ( t 14 , t 21 ) 22 ( t 21 , t 21 ) 22 ( t 21 , t 22 ) 0 1 12 ( t 11 , t 22 ) 1 0 12 (t12 , t 22 ) 12 ( t 13 , t 22 ) 12 ( t 14 , t 22 ) 22 ( t 22 , t 21 ) 22 ( t 22 , t 22 ) 0 1 1 0 1 0 1 0 0 1 0 0 0 1 0 0
A matriz [] poder ser escrita como
11 12 13 14 [ ] = 21 22 1 2
59
UFU/FAMAT
N A matriz [b] do lado direito fica, 12 ( t 11 , t 0 ) 12 ( t 12 , t 0 ) [b] = 12 ( t 13 , t 0 ) 12 ( t 14 , t 0 ) 22 ( t 21 , t 0 ) 22 ( t 22 , t 0 )
6.3. Varincia da estimativa O simples fato de que, atravs da krigagem ou da co-krigagem, pode-se conhecer tambm a varincia da estimativa, diferencia-os de qualquer outro mtodo. Esta uma propriedade interessantssima, pois, alm de permitir a estimativa de valores sem tendncia para os locais onde estes no foram medidos, ainda se pode conhecer a confiana associada a estas estimativas, as quais podem ser chamadas de timas. Quanto menor for o efeito pepita do semivariograma, menor ser a varincia da estimativa. Mais precisamente, quanto menor for a proporo do efeito pepita para o patamar do semivariograma, maior a continuidade do fenmeno, menor a varincia da estimativa ou maior a confiana que se pode ter na estimativa. Examinando-se as equaes relativas aos clculos das varincias da estimativa de krigagem e co-krigagem, respectivamente, nota-se que so apenas indiretamente dependentes dos valores medidos. Isto porque, o semivariograma e semivariogramas cruzados,
representam a maneira como a varivel regionalizada varia de um local para o outro no espao, e os pesos so conseqncias deste fato. Porm, uma vez que se conhece o
semivariograma de uma propriedade, qualquer tipo de esquema de amostragem pode ser desenhado para varincias da estimativa pr-especificadas. Obviamente, a varincia da estimativa sendo uma funo da distncia ou distribuio espacial das amostras, ser mxima
60
UFU/FAMAT
nos locais mais distantes de valores medidos. Assim, baseado em semivariogramas de variveis medidas em carter de reconhecimento, amostragens definitivas podem ser desenhadas para satisfazer condies pr-especificadas. A localizao ideal de uma rede de pluvimetros em bacias hidrogrficas constitui um exemplo prtico desse procedimento. O mesmo pode tambm ser utilizado atravs da co-krigagem, ambos, com algumas complicaes e vantagens. A principal complicao que neste caso, depende-se de trs correlaes espaciais (de cada varivel, individualmente, e entre elas), o que no sempre fcil. Entretanto, quando as variveis so amostradas em espaamentos diferentes, havero pontos onde apenas a varivel auxiliar foi medida. Para estes pontos, quase sempre a varincia da estimativa da co-krigagem melhor do que a da krigagem. Com esta vantagem em mente, pode-se desenhar esquemas de amostragem que envolvam ambas as variveis, em densidades de amostragem bem diferentes, de acordo com o grau de dependncia espacial encontrado e a dificuldade de medio. Qualquer que seja o mtodo, krigagem ou co-krigagem, a varincia da estimativa extremamente sensvel forma do semivariograma ou semivariograma cruzado. Baseado na discusso acima, o mapa de isolinhas ou tridimensional de uma varivel usando valores estimados atravs de um dos mtodos geoestatsticos deve ser sempre acompanhado pelo mapa correspondente da varincia da estimativa, para que se possa visualizar os locais onde a confiana na estimativa limitada ou suficiente. Entretanto, uma vez que a varincia da estimativa uma funo indireta da distncia dos vizinhos ao redor do local da estimativa, ento em amostragens tomadas em distncias regulares no reticulado quadrado, o mapa da varincia da estimativa ser, simplesmente, uma coleo de crculos, com maiores valores onde o ponto estimado mais distante. Nesses casos, o mapa da varincia tem pouca utilidade e o exame de clulas compostas de vizinhos fechando o primeiro polgono em volta do valor estimado, mostrando a varincia da estimativa, ilustra este ponto suficientemente bem.
61
UFU/FAMAT
6.4 Nmero de vizinhos das estimativas
A vizinhana usada na estimativa torna-se um ponto de extrema importncia na krigagem. Vrios so os mtodos que podem ser utilizados para a determinao do nmero de vizinhos na estimativa, cada um com vantagens e desvantagens como ser discutido em seguida. Qualquer que seja o critrio usado para a escolha do mtodo, deve-se levar em conta o ganho de preciso em relao ao aumento de tempo de computao.
a) Vizinhana nica
Quando o tamanho do conjunto de dados, em termos de nmero de amostras disponveis tiver tamanho razovel, relativo quantidade de memria e tempo de processamento disponveis no computador, pode-se usar o procedimento chamado vizinhana nica. Neste procedimento todos os valores medidos so considerados vizinhos e sero utilizados na estimativa. Deve-se sempre lembrar que a deciso de se usar vizinhana nica basea-se em sua praticidade relativa ao tamanho do conjunto de dados e no na preciso obtida na estimativa. A razo para tanto reside no alcance do semivariograma, pois os pesos
associados a vizinhos separados por distncias maiores do que o alcance, no devem ter contribuio significativa no valor estimado. Outro ponto importante que, para se usar vizinhana nica, necessrio que o semivariograma seja definido at a maior distncia existente no espao. A vantagem deste mtodo reside no fato que, uma vez invertida a matriz de coeficientes, ento as estimativas podem ser feitas para qualquer espaamento com um pequeno consumo de tempo de processamento de computador. Desse modo, a matriz
invertida pode ser arquivada no computador e usada quantas vezes for necessrio, desde que no mude o modelo do semivariograma e distribuio dos pontos amostrados no espao. Existem algumas variveis que, embora mudem as magnitudes de variao, preservam entre si a maneira como variam no espao, apresentando semivariogramas que podem ser agrupados em um nico, quando divididos individualmente, pelas respectivas varincias. Como exemplo pode-se incluir umidade do solo amostrada em pequenos espaos de tempo. Nesse caso ento,
62
UFU/FAMAT
as vantagens da vizinhana nica aumentam porque modelos de semivariograma escalonados podem ser usados para obter pesos comuns a todas as variveis.
b) Distncia constante
Neste mtodo, para cada ponto estimado selecionada uma vizinhana constando de todos os vizinhos localizados dentro de um circulo de raio especificado. Conseqentemente, nos cantos de um campo retangular ocorre 1/4 de crculo, com 1/4 do nmero de vizinhos. A grande vantagem deste mtodo est no fato que se conhece exatamente a distncia na qual os vizinhos para estimativa so procurados. Isto particularmente importante porque se pode limitar o uso do semivariograma quanto distncia sobre qual ele ser calculado. Por outro lado, o nmero de vizinhos pode mudar bastante ao longo do campo, fazendo com que o tamanho do sistema matricial seja varivel. Em termos de programao de computador, isto pode se tornar um problema se exceder o valor usado na dimenso das matrizes.
c) Nmero constante de vizinhos
Um outro mtodo bastante usado o que mantm constante o nmero de vizinhos em qualquer posio no campo. Para tanto, vizinhos so procurados, primeiramente dentro de um raio inicial. Se o nmero de vizinhos encontrados for menor do que o limite especificado, a distncia incrementada, e o processo reiniciado. Se, pr outro lado, o nmero encontrado for maior do que o limite, apenas o nmero especificado mais prximo ser usado. Conseqentemente, a distncia sobre a qual se procura vizinhos varia sobre o campo. Obviamente, as vantagens deste mtodo so as desvantagens do anterior (distncia constante) e vice-versa. Porm, em situaes em que a amostragem foi efetuada em espaamentos regulares, a distncia de procura por vizinhos no muda muito e as desvantagens deste mtodo so minimizadas. Devido as amostragens regulares serem as mais usadas e as facilidades inerentes deste mtodo, fazem dele o mais comumente usado.
63
UFU/FAMAT
d) Quadrantes
Uma alternativa interessante e bastante fundamentada em termos geoestatsticos usar um nmero especificado de vizinhos em cada quadrante ao redor do valor a ser estimado. O fundamento reside na distribuio do nmero de vizinhos ao redor do valor estimado, o que far com que a estimativa receba contribuio semelhante em nmero, de todas as direes. Muitas vezes quando no se impe esta restrio, pode-se despercebidamente, utilizar tendenciosamente sempre um nmero maior de vizinhos de um lado do que de outro. Porm, isto ainda apresentaria problemas nos cantos e extremidades da rea, e tambm o problema de que nunca se sabe qual a distncia na qual os vizinhos se localizam. Por estas razes este mtodo apresenta mais problemas do que vantagens.
6.5. O uso do programa GS+ na determinao do semivariograma cruzado, da cokrigagem e no mapeamento da varivel. Temos duas variveis aleatrias Z1 e Z2, suponha que a varivel Z1 teve uma subamostragem em relao a Z2 e que elas apresentam semivariogramas definidos isoladamente e que tambm apresentem distribuio espacial conjunta, ou seja, correlao espacial, ento podemos proceder a anlise do semivariograma cruzado e da co-krigagem. O arquivo de dados ter aspecto apresentado na Figura 19. Os procedimentos gerais da anlise de semivariogramas cruzados e de co-krigagem segue os mesmos procedimentos das anlises simples. Deve-se ressaltar que se faz as anlises individuais das variveis e depois a anlise conjunta.
64
UFU/FAMAT
Figura 19. Aspecto geral do arquivo de dados para a co-krigagem.
As Figuras 20, 21 e 22 mostram os procedimentos bsicos para se trabalhar com semivariogramas cruzados e co-krigagem.
Ferramentas de anlises descritivas das variveis Z1, Z2
Semivariograma da varivel 1 Semivariogram a da varivel 2
Krigagem e cokrigagem Semivariograma Cruzado
Mapas
Figura 20. cones ativos nas anlises descritivas, semivariogramas simples, semivariogramas cruzados, krigagem/co-krigagem e mapas.
65
UFU/FAMAT
Figura 21. Janela para a anlise do semivariograma cruzado
Figura 22. Janela para realizao da co-krigagem
66
UFU/FAMAT
6.6. Exemplo de aplicao no GS+ Suponha que os seguintes dados represente as observaes de macroporosidade e de umidade de saturao em uma determinada rea.
x 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 10.00 10.00 10.00 10.00 10.00 10.00 10.00 10.00 20.00 20.00 20.00 20.00 20.00 20.00 20.00 20.00 30.00 30.00 30.00 30.00 30.00 30.00 30.00 30.00
y 0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00 0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00 0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00 0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00
macro usat 16.07 21.98 25.11 33.89 18.52 37.32 16.91 10.44 17.80 22.34 13.53 20.88 20.67 24.14 28.47 25.16 25.88 25.65 11.40 21.01 14.79 18.03 14.39 43.19 48.61 35.50 56.49 63.62 47.90 65.89 54.11 47.23 40.70 45.06 52.04 55.95 45.72 43.26 49.98 45.31 53.27 59.00 61.94 55.59 53.81 49.60 54.44 54.07 40.00 40.18 59.21 46.62 49.89 50.14 44.43
x 40.00 40.00 40.00 40.00 40.00 40.00 40.00 40.00 50.00 50.00 50.00 50.00 50.00 50.00 50.00 50.00 60.00 60.00 60.00 60.00 60.00 60.00 60.00 60.00 70.00 70.00 70.00 70.00 70.00 70.00 70.00 70.00
y 0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00 0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00 0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00 0.00 10.00 20.00 30.00 40.00 50.00 60.00 70.00
macro Usat 24.66 13.89 15.45 24.37 30.51 57.30 47.39 46.03 52.26 49.29 58.55 43.89 37.08 23.59 29.69 29.01 22.16 52.84 50.27 58.20 45.85 59.18 52.06 45.67 46.45 14.14 28.29 26.38 28.42 24.91 26.90 40.65 56.86 56.04 57.23 57.56 52.29 46.55 44.15 25.82 22.30 25.64 22.79 18.20 27.55 23.37 52.15 50.35 53.94 51.72 48.55 53.65 45.91 51.85
67
UFU/FAMAT
Faa a anlise da macroporosidade usando como covarivel a umidade de saturao. Soluo: A anlise descritiva geral para as variveis analisadas apresentada na Tabela abaixo. Verifica-se que a umidade de saturao apresenta maior uniformidade (menor CV) do que a macroporosidade. Os coeficientes de assimetria e de curtose mostram tendncia simtrica e mesocrtica das variveis, portanto, pode-se considerar tais variveis com distribuio de probabilidade aproximadamente normal. Analisando a relao linear entre a macroporosidade e a unidade de saturao, obteve-se um coeficiente de correlao linear (r) de 0,9132, indicando que existe uma forte associao positiva entre macroporosidade e umidade de saturao e, portanto, estimativas da macroporosidade podem ser feitas com base na umidade de saturao.
Anlise descritiva dos atributos umidade de saturao do solo (USat) e macroporos (MACRO). Estatsticas Usat (%) n Mdia Desvio Padro Coef. de Variao Coef. de Assimetria Coef. de Curtose 64 50,54 6,41 12,68 -0,02 -0,31 Atributos MACRO (%) 45 22,50 5,98 26,57 -0,02 -0,33
As Figuras mostram os semivariogramas individuais para as variveis umidade de saturao (USat) e macroporos e o semivariograma cruzado da MACRO, usando como covarivel a USat.
68
UFU/FAMAT
Semivariograma
para
umidade
de Semivariograma para a macroporosidade do solo
saturao do solo (USat).
Semivariograma cruzado da macro em funo da umidade de saturao.
Para a umidade de saturao ajustou-se o modelo exponencial com alcance da dependncia espacial de 34,20 m, efeito pepita de 9,49 (%) e patamar de 38,59 (%). Para a macroporosidade (MACRO) o modelo adotado foi o esfrico, com alcance de 45,0 m, efeito pepita de 19,70 (%) e patamar de 38,7 (%). E para o semivariograma cruzados as estimativas dos parmetros do modelo exponencial foram: alcance de 23,40 m; efeito pepita de 6,97 (%) e patamar de 34,08 (%). Verifica-se que a utilizao da umidade de saturao, como uma co-varivel para a estimativa da macroporosidade, provocou alterao no alcance da dependncia espacial, mas ainda assim verifica-se que, a correlao espacial deve ser considerada para a realizao das estimativas. A alterao do alcance pode estar relacionado aos modelos individuais diferenciados.
69
UFU/FAMAT
As Figuras a seguir mostram os mapas da macroporosidade do solo, construdos a partir da krigagem e da co-krigagem, ou seja, com base no semivariograma individual e cruzado.
Mapa da macroporosidade do solo usando Mapa da macroporosidade do solo, usando semivariograma individual semivariograma cruzado
Verifica-se coincidncia relativamente alta entre as reas de ocorrncia da macroporosidade. Devido ao processo de estimativa por co-krigagem algumas regies so subestimatadas e outras regies so superestimadas.
7. VALIDAO DE MODELOS DE SEMIVARIOGRAMAS
O ajuste do semivariograma, como j comentamos, um procedimento que fica a critrio do pesquisador, mas geralmente feito "a sentimento". Para este tipo de ajuste podemos utilizar algumas tcnicas chamadas de validao cruzada ou de auto validao para selecionar o semivariograma adequadamente. Recomenda-se que se ajuste vrios modelos e que seja selecionado o que melhor se adeque aos seguintes critrios:
a) O grfico 1:1 - Medido vs Estimado
Se para cada um dos n locais onde se tem um valor medido Z(xi), estima-se um valor atravs da krigagem (ou da co-krigagem), Z*(ti), ento poder-se- fazer um grfico dos valores pareados de Z(ti), Z*(ti) e calcular a regresso linear entre eles. A regresso ser ento:
70
UFU/FAMAT
Z* ( t i ) = a + b Z( t i ) onde a a intercesso, b o coeficiente angular da reta e r2 o coeficiente de correlao entre Z*(xi) e Z(xi). Assim, se a estimativa (Z*(xi)) fosse idntica ao valor medido (Z(xi)), ento a seria nulo, b e r2 seriam iguais unidade (um), e o grfico de Z(xi) vs Z*(xi) seria uma srie de pontos na linha 1:1. Na medida em que os valores de a aumentam de 0 (zero) para valores positivos, isto indica que estimador Z*(xi) est superestimando valores pequenos de Z(xi) e subestimando valores grandes. medida que a decresce de 0 (zero) para valores negativos, o contrrio acontece. Este ltimo caso, porm, no comum. Desse modo, a qualidade da estimativa pode ser medida pelo julgamento destes parmetros.
b) O erro absoluto
Uma vez que se tem o conjunto de n valores medidos e estimados, Z(xi) e Z*(xi), ento pode-se definir o erro absoluto como: EA( xi ) = Z* ( xi )- Z( xi ) O Aplicando-se as condies de no tendncia e de varincia mnima, nos erros absolutos, pode-se ento dizer que: EA = E {EA( xi )} = E { Z* ( xi )- Z( xi )} = 0 P e VAR( EA ) = E {( Z* ( xi )- Z( xi ) ) } = mnima Q Se estas condies no forem satisfeitas, ento alguma das condies previamente assumidas estar sendo violada. Porm, a equao bastante difcil de ser verificada porque o conceito de ser mnimo torna-se subjetivo quando no se tem uma referncia. O procedimento seguinte pode contribuir nesse sentido.
2
71
UFU/FAMAT
c) Erro reduzido
Lembrando que no clculo dos valores estimados, Z*(xi), sempre se tem a varincia da estimativa, 2k(ti), ento pode-se definir o erro reduzido como: ER( t i ) = ( Z* (t i ) - Z( t i ))/ k ( t i ) R
A diviso pela raiz quadrada da varincia da estimativa faz com que os ER(ti) sejam sem dimenso e que, por isso, as condies de no tendncia e de varincia mnima, requeiram que: ER = E {ER( xi )} = E {( Z* ( xi )- Z( xi )) / k ( xi )} = 0 S e VAR( ER ) = E {( Z* ( xi )- Z( xi )) / k ( x0 ) } = 1 T
2
Estas propriedades fazem deste tipo de erro uma valiosa ferramenta e de fcil uso, nas aplicaes de geoestatstica. O fato de terem valores ideais fixos em 0 (zero) e 1 (um), e de serem sem dimenso, facilita seu julgamento e estudo, e tambm permite sua comparao com outras situaes expressas em unidades diferentes. A Figura 23 mostra uma sada da opo de validao cruzada apresentada pelo programa GS+. A validao cruzada ativada na janela da Krigagem, conforme mostram a Figuras 20 e 22.
72
UFU/FAMAT
Figura 23. Validao cruzada.
Note, neste caso, que a reta ajustada est praticamente igual a reta a 45 (Grfico 1:1), o coeficiente de regresso (coeficiente angular) de 0,944 com erro padro de 0,105 indica que este estatisticamente igual a 1 e o y intercept (coeficiente linear) de 0,024 mostra que este pode ser considerado estatisticamente igual a zero, condies estas timas para as estimativas. O coeficiente de determinao (r2) de 0,39 considerado relativamente baixo, mas devido ao grande nmero de observaes e sabendo-se que este coeficiente altamente influenciado pelo nmero de pares, podemos considera-lo como satisfatrio. Tambm pode-se verificar, pelo grfico, que os valores extremos que esto mais afastados da reta e podemos associar isto ao fato do semivariograma geralmente apresentar melhores estimativas para distncias curtas. A anlise da validao cruzada deve ser feita com base em todos os parmetros e no com base em parmetros isolados.
73
UFU/FAMAT
8. BIBLIOGRAFIA RECOMENDADA
BARTLETT, M.S. Nearest neighbour models in the analysis for field experiments (with discussion). Journal of the Royal Statistical Society. B, London, v.40, n.2, p.147-174, 1978. BRAGA, L. P. V. Geoestatstica e aplicaes. Minicurso do 9o Simpsio Brasileiro de Probabilidades e Estatstica. IME. USP. So Paulo, 1990. 36 p. BURROUGH, P. A.; McDONNELL, R. A. Principles of geographical information systems. Oxford University Press, 331 p., 1998. BUSSAB, W. O.; MORETTIN, P. A . Estatstica bsica. 4a ed.. So Paulo : Atual, 1987. 321 p. CADIMA, Z. A.; LIBARDI, P. L.; REICHARDT, K. Variabilidade espacial da condutividade hidrulica em latossolo Vermelho Amarelo textura mdia, no campo. Revista Brasileira de Cincia do Solo, Campinas, v. 4, n. 2, p. 63-66, 1980. CAMERON, D. R. Variability of soil water retention curves and prepicted hydraulic conductives on a small plot. Soil Science. Baltimore, v.126, n.6, p. 364-71, 1978. COSTA NETO, P. L. Estatstica. So Paulo: Edgard Blucher, 264 p., 1979. CRESSIE, N.; HARTFIELD, M.N. Conditionally specified gaussian model for spatial statistical analysis of field traits. Journal of Agricultural, Biological, and Environmental Statistics, Washington, v.1, n.1, p.60-77, Mar. 1996. DAVID, M. Geostatistical ore reserve estimation. Elsevier. New York, v. 8, 364 p., 1977. DUARTE, J.B. Sobre o emprego e a anlise estatstica do delineamento em blocos aumentados no melhoramento gentico vegetal. 2000 293p. (Tese - Doutorado em Gentica e Melhoramento de Plantas) ESALQ-USP, Piracicaba. FREITAS, V. A. de. Anlise de dados espaciais por meio de semivariogramas. Uberlndia. Monografia (Graduao em Matemtica) Universidade Federal de Uberlndia, 2000. 30p. GOMES, B. M. Comportamento espacial do percentil 75 da precipitao decendial do estado de So Paulo. Botucatu. Tese (Doutorado em Agronomia) Universidade Estadual Paulista Jlio de Mesquita Filho, Faculdade de Cincias Agronmicas Campus de Botucatu, 2001. 101p. GOTWAY, C. A.; FERGUSON, R. B.; HERGERT, G. W.; PETERSON, T. A. Comparasion of kriging and inverse-distance methods for mapping soil parameters. Soil Science Society America Journal. v. 60, p. 1237 1247, 1996.
74
UFU/FAMAT
GUIMARES, E. C. Variabilidade espacial da umidade e da densidade do solo em um Latossolo Roxo. Campinas, SP, 1993. 135 p. Dissertao (Mestrado em Engenharia Agrcola - rea de concentrao: gua e Solo) - Faculdade de Engenharia Agrcola, Universidade Estadual de Campinas. GUIMARES, E. C. Variabilidade espacial de atributos de um Latossolo Vermelho Escuro textura argilosa da regio do cerrado, submetido ao plantio direto e ao plantio convencional. Tese (Doutorado). FEAGRI/UNICAMP. Campinas, 2000. 85 p. GUIMARES, E. C.; AQUINO, L. H. de; OLIVEIRA, M. S. Variabilidade espacial do pH em gua e da argila dispersa em gua. Revista Cincia e Prtica. Lavras, v. 19, n.1, p. 12-17, 1992. ISAAKS, E. H.; SRIVASTAVA, R. M. Applied Geostatistics. University Press, 1989. New York : Oxford
LOPES, P. A. Probabilidades e Estatstica. Rio de Janeiro: Reichmann & Affonso Editores, 1999. MARTINEZ, R.B. Control de la correlation especial en experiments de campo em el sector agricola. Agronomia Colombiana. v.11, n.1, p.83-89, 1994. MATHERON, G. Principles of geostatistics. Economic Geology. El Paso, V. 58, p. 11246-66, 1963. MATHERON, G. The theory of regionalized variables and its applications. Les Cahiers du Centre de Moffologie mathemathique. Fas. 5. C. G. Fontainebleau, 1971. McBRATNEY, A. B.; WEBSTER, R. Choosing functions for semivariograms of soil proprierties and fitting them to sampling estimates. Journal of Soil Science, v. 37, p.617-639, 1986. PANNATIER, Y. Variowin Software for spatial data analysis in 2D. New York: Springer-Verlag, 1996. 90 p.. PAPADAKIS, J. Method statistique pour des expriences sur champ. Bull. Inst. Amlior. Plantes Salonique. n.23, 1937. PIMENTEL GOMES, F. Curso de estatstica experimental. Piracicaba: Nobel, 1995. REICHARDT, K.; VIEIRA, S. R.; LIBARDI, P. L. Variabilidade espacial de solos e experimentao de campo. R. bras. Ci. Solo. Campinas, v. 10, n. 1, p. 1-6, 1986. ROBERTSON, G. P. GS+: geostatistics for the environmental sciences. Plainwell: Gamma Design Software,1998, 152 p..
75
UFU/FAMAT
TEIXEIRA, F. das C. Analise estatstica espacial aplicada a um ensaio florestal. Dissertao de mestrado. UFLA. 73 p. 2001. TRAGMAR, B. B.; YOST, R. S.; UEHARA, G. Application of geostatistics to spatial studies of soil properties. Advances in Agronomy. v. 38, p. 45-93, 1985. TRIOLA, M. F. Introduo estatstica. Rio de Janeiro: LTC. 7a edio, 1999. VIEIRA, S. R. Curso de atualizao em conservao do solo - Uso de geoestatstica. Campinas, IAC, v. 1 e 2, 1995. VIEIRA, S. R. Variabilidade espacial de argila, silte e atributos qumicos em parcela experimental de um Latossolo Roxo de Campinas (SP). Bragantia. Campinas, v. 56, n.1, 1997. VIEIRA, S. R.; GUIMARES, E. C.; DECHEN, S. C. F.; DE MARIA, I. C.; ROCHETE, P.; TOPP, G. C.; ZEBCHUK, W. Analisando simultaneamente variabilidade espacial e temporal usando variogramas tridimensionais. In: XIII Congresso Latino-Amaericano de Cincia do Solo - Resumos expandidos em CD-ROOM. T01-053. guas de Lindoia, SP: SBCS/ESALQUSP, 1996. VIEIRA, S. R.; HATFIELD, J. L.; NIELSEN, D. R.; BIGGAR, J. W. Geostatistical theory and application to variability of some agronomical properties. Hilgardia. Berkeley, v. 31, n. 3, 1983. 75 p. VIEIRA, S. R.; LOMBARDI NETO, F.; BURROWS, I. T. Mapeamento da chuva diria mxima provvel para o estado de So Paulo. R. bras. Ci. Solo. Campinas, v.15, n.1, p. 93-98, 1991. VIEIRA, S. R.; TILLOTSON, P. M.; BIGGAR, J. W.; NIELSEN, D. R. Scaling of semivariograms and the kriging estimation of field-measured prorperties. Revista Brasileira de Cincia do Solo. Viosa, v.21, n. 4, 1997. WARRICK, A. W.; MYERS, D. E.; NIELSEN, D. R. Geostatistical methods applied to soil science. In: Methods of soil analysis: part 1 Physical and mineralogical methods. Soil Science Society of America, p. 53-82, 1986. ZIMMERMAN, D.I.; HARVILLE, D.A. A random field approach to the analysis of fieldplot experiments and other special experiments. Biometrics, Raleigh, v.47, n.1, p.233-239, mar. 1991
76
UFU/FAMAT
OBSERVAO: Pgina na internet para busca de artigos, programas, livros e outros assuntos de geoestatstica: http://www.famat.ufu.br/ednaldo/ednaldo.htm http://www.rc.unesp.br/igce/aplicada/landim.html http://musis.sites.uol.com.br/geo1.htm http://sc-terre-218.unil.ch/ http://www.ai-geostats.org/
77

Geoestatística Básica

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Geoestatística Básica

Enviado por

Direitos autorais:

Formatos disponíveis

UFU/FAMAT

Geoestatstica Bsica e Aplicada

UNIVERSIDADE FEDERAL DE UBERLNDIA FACULDADE DE MATEMTICA NCLEO DE ESTUDOS ESTATSTICOS E BIOMTRICOS

GEOESTATSTICA BSICA E APLICADA

EDNALDO CARVALHO GUIMARES

Fevereiro - 2004 Uberlndia - MG

Prof. Dr. Ednaldo Carvalho Guimares

Geoestatstica Bsica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimares

Geoestatstica Bsica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimares

Geoestatstica Bsica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimares

Geoestatstica Bsica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimares

Geoestatstica Bsica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimares

Geoestatstica Bsica e Aplicada

sendo que: m4 o quarto momento em relao mdia aritmtica.

Prof. Dr. Ednaldo Carvalho Guimares

Geoestatstica Bsica e Aplicada

Exemplos de referenciaes so: a) amostras coletadas ao longo do tempo

em transees); c) amostras coletadas em uma rea

cada observao ser identificada

Prof. Dr. Ednaldo Carvalho Guimares

Geoestatstica Bsica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimares

Geoestatstica Bsica e Aplicada

Figura 1. Programa GS+ Verso 5.0.3

Prof. Dr. Ednaldo Carvalho Guimares

Geoestatstica Bsica e Aplicada

Figura 3. Exemplo de mudana de varivel para anlise

Prof. Dr. Ednaldo Carvalho Guimares

Geoestatstica Bsica e Aplicada

Clique em OK para confirmar a opo

Anlise grfica histograma

Posio das observaes selecionadas por quartil

Prof. Dr. Ednaldo Carvalho Guimares

Geoestatstica Bsica e Aplicada

Figura 4. Estatsticas da varivel usatpd.

Prof. Dr. Ednaldo Carvalho Guimares

Geoestatstica Bsica e Aplicada

Histograma freqncia simples

Grfico de freqncia acumulada Grfico da distribuio normal

Figura 5. Anlise grfica dos dados

Figura 6. Localizao espacial das observaes

Prof. Dr. Ednaldo Carvalho Guimares

Geoestatstica Bsica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimares

Geoestatstica Bsica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimares

Geoestatstica Bsica e Aplicada

Observao: Processos no estacionrios podem apresentar trechos estacionrios.

Prof. Dr. Ednaldo Carvalho Guimares

Geoestatstica Bsica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimares

Geoestatstica Bsica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimares

Geoestatstica Bsica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimares

Geoestatstica Bsica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimares

Geoestatstica Bsica e Aplicada