P. 1
Geoestatística básica

Geoestatística básica

|Views: 13|Likes:

More info:

Published by: Diogo Murillo Costa Mortoni on Aug 25, 2013
Direitos Autorais:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

05/11/2014

pdf

text

original

Sections

  • 1. INTRODUÇÃO
  • 2. A ANÁLISE EXPLORATÓRIA DE DADOS
  • 2.1. A distribuição de freqüências e o histograma
  • 2.2. As estatísticas
  • 2.3. Outras análises descritivas
  • 2.4. Amostragem
  • 2.5. Exemplos de análise exploratória aplicando programa GS+
  • 3. PRINCÍPIOS DA ANÁLISE GEOESTATÍSTICA
  • 3.1. Um breve histórico
  • 3.2. Estacionaridade
  • 4. ANÁLISE DA DEPENDÊNCIA ESPACIAL
  • 4.1. Autocorrelação e autocorrelograma
  • 4.2. Semivariograma
  • 4.3. O uso do software GS+ na determinação do semivariograma
  • 4.4. Exemplos de aplicação
  • 5. KRIGAGEM
  • 5.1. O interpolador
  • 5.2. A krigagem no programa GS+
  • 6. SEMIVARIOGRAMA CRUZADO E COKRIGAGEM
  • 6.1. Semivariograma cruzado
  • 6.2. Co-krigagem
  • 6.3. Variância da estimativa
  • 6.4 Número de vizinhos das estimativas
  • 6.6. Exemplo de aplicação no GS+
  • 7. VALIDAÇÃO DE MODELOS DE SEMIVARIOGRAMAS
  • 8. BIBLIOGRAFIA RECOMENDADA

UFU/FAMAT

Geoestatística Básica e Aplicada

UNIVERSIDADE FEDERAL DE UBERLÂNDIA FACULDADE DE MATEMÁTICA NÚCLEO DE ESTUDOS ESTATÍSTICOS E BIOMÉTRICOS

GEOESTATÍSTICA BÁSICA E APLICADA

EDNALDO CARVALHO GUIMARÃES

Fevereiro - 2004 Uberlândia - MG

1

Prof. Dr. Ednaldo Carvalho Guimarães

UFU/FAMAT

Geoestatística Básica e Aplicada

SUMÁRIO
1. INTRODUÇÃO........................................................................................................... 2. ANÁLISE EXPLORATÓRIA DE DADOS............................................................. 2.1. Distribuição de freqüências e histograma............................................................... 2.2. As estatísticas............................................................................................................. 2.3. Outras análises descritivas........................................................................................ 2.4. Amostragem...........................................................................................................................................

2.5. Exemplos de análise exploratória aplicando o programa GS+............................. 3. PRINCÍPIOS DA ANÁLISE GEOESTATÍSTICA.................................................. 3.1. Um breve histórico.................................................................................................... 3.2. Estacionaridade......................................................................................................... 3.3. Krigagem universal................................................................................................... 4. ANÁLISE DA DEPENDÊNCIA ESPACIAL............................................................ 4.1. Autocorrelação e Autocorrelograma....................................................................... 4.2. Semivariograma......................................................................................................... 4.3. O uso do software GS+ na determinação do semivariograma.............................. 4.4. Exemplos de aplicação............................................................................................... 5. KRIGAGEM................................................................................................................. 5.1. O interpolador........................................................................................................... 5.2. A krigagem no programa GS+................................................................................. 6. SEMIVARIOGRAMA CRUZADO E COKRIGAGEM.......................................... 6.1. Semivariograma cruzado.......................................................................................... 6.2. Co-krigagem.............................................................................................................. 6.3. Variância da estimativa............................................................................................ 6.4. Número de vizinhos das estimativas........................................................................ 6.5. O uso do programa GS+ na determinação do semivariograma cruzado, da co-krigagem e no mapeamento da variável....................................................... 6.6. Exemplos de aplicação no GS+................................................................................ 7. VALIDAÇÃO DE MODELOS DE SEMIVARIOGRAMAS................................... 8. BIBLIOGRAFIA RECOMENDADA.........................................................................

2 3 3 3 7 7 8 14 14 15 20 21 21 25 36 41 50 50 52 55 55 56 60 62 64 67 70 74

1

Prof. Dr. Ednaldo Carvalho Guimarães

UFU/FAMAT

Geoestatística Básica e Aplicada

1. INTRODUÇÃO Métodos clássicos de análise estatística de dados geralmente supõem que, as realizações das variáveis aleatórias são independentes entre si, ou seja, que observações vizinhas não exercem influências umas sobre as outras. Fenômenos naturais apresentam-se freqüentemente com uma certa estruturação nas variações entre vizinhos, desta forma pode-se dizer que as variações não são aleatórias e, portanto, apresentam algum grau de dependência espacial. A análise espacial de dados apresenta-se como uma alternativa e/ou como uma complementação da análise clássica de dados, sendo que este tipo de análise considera as correlações entre as observações quando se faz estimativas. A literatura apresenta alguns procedimentos de análise espacial de dados, sendo que, nos últimos tempos, uma metodologia de análise denominada “geoestatística” ganhou ênfase neste tipo de estudo. Neste trabalho serão abordados aspectos básicos da metodologia geoestatística para a análise espacial de dados, com ênfase na análise do semivariograma como ferramenta de determinação da dependência espacial. Inicialmente serão abordados aspectos básicos de uma análise exploratória de dados; em seguida serão introduzidos conceitos básicos da geoestatística e da análise da dependência espacial por meio de semivariograma e também de interpolação utilizando a metodologia da krigagem e, por fim serão abordados conceitos básicos de semivariogramas cruzados e co-krigagem. Sempre que possível os tópicos serão acompanhados de exemplos de aplicação.

2

Prof. Dr. Ednaldo Carvalho Guimarães

Dr. 2. coeficiente de assimetria e coeficiente de curtose. o GS+. No presente texto faremos uma revisão dos principais instrumentos de análise exploratória de dados. Ednaldo Carvalho Guimarães . Statistica e em programas específicos para análise geoestatística. entre outros. Passaremos a rever rapidamente estas estatísticas. a variância. Lopes (1999). valor mínimo. A distribuição de freqüências e o histograma A distribuição de freqüências consiste em agrupar as observações de uma variável em classes ou categorias e o histograma é uma das representações gráficas dessa distribuição. pode direcionar procedimentos diferenciados de análise. 2. Nesta análise preliminar dos dados tem-se o objetivo de conhecer a variável em estudo e resumila. Esta tendência. A finalidade da distribuição de freqüências e do histograma é a de permitir uma visualização do comportamento da variável em estudo.UFU/FAMAT Geoestatística Básica e Aplicada 2. como. Basicamente.2. 3 Prof. valor máximo. sendo que estes procedimentos podem ser encontrados em cursos de estatística básica e em livros de estatística básica como Costa Neto (1979). o desvio padrão.1. Triola (1999). colaboram na descrição da variável. A distribuição de freqüências e o histograma podem ser obtidos em programas computacionais comercias com o Excel. principalmente na análise não espacial de dados. por exemplo. Bussab e Morettin (1987). A ANÁLISE EXPLORATÓRIA DE DADOS A análise exploratória de dados é um procedimento de grande importância na análise estatística e aplica-se para qualquer metodologia que se queira utilizar. este tipo de análise se baseia em construção e interpretação gráfica e cálculos e interpretação de estatísticas. As estatísticas O cálculo de estatísticas como a média. o coeficiente de variação. com relação à tendência de concentração de dados (tendência simétrica ou assimétrica).

eficiente e suficiente. em dados com assimetria à direita acentuada a moda ou a média geométrica pode representar melhor a variável em estudo. é uma medida não tendenciosa. a sua adaptabilidade ao tratamento algébrico e. Dr. por exemplo. facilitando visualizar a dimensão da dispersão dos valores observados em relação à média. respectivamente: ∑ - n s 2 = i =1 ( xi − X )2 n −1 s = + s2 Note que em interpretações de dados. geralmente. O coeficiente de variação é dado por: 4 Prof. ou seja. n é o número total de observações. precisa.UFU/FAMAT Geoestatística Básica e Aplicada - A média aritmética ( X ) A média aritmética é uma medida de posição bastante utilizada na estatística e tem como características principais à facilidade de cálculo. As fórmulas de cálculo são. Variância (s2) e desvio padrão (s) A variância e o desvio padrão são estatísticas que nos fornece uma idéia de variabilidade das observações em torno da média aritmética. também. Ednaldo Carvalho Guimarães . - Coeficiente de variação (CV) O coeficiente de variação fornece a dispersão relativa dos dados. xi é cada valor observado. na análise descritiva a média aritmética deve estar sempre acompanhada do desvio padrão para que possamos visualizar a dispersão média dos valores. A fórmula para o cálculo da média é: X= ∑x i =1 n i n em que: X é a média aritmética. Vale ressaltar que nem sempre a média aritmética é a medida de posição que melhor representa uma variável.

a média aritmética é igual ao primeiro momento em relação à origem. etc. Ednaldo Carvalho Guimarães . ou seja. definimos o momento de ordem t dessa variável como: Mt = ∑x i =1 n t i n Note que se t=1 temos a média aritmética. Dr. digitação... Antes de definirmos estes dois coeficientes e tecermos comentários sobre eles vamos definir os momentos estatísticos. Estes dois coeficientes são utilizados para inferências sobre a normalidade da variável em estudo. O momento de ordem t centrado em uma constante K . Se x1. O coeficiente de curtose mostra a dispersão (achatamento) da distribuição em relação a um padrão. - Coeficiente de assimetria (Cs) e coeficiente de curtose (Ck) O coeficiente de assimetria mostra o afastamento da variável em relação a um valor central.. ou seja. esta relação não é observada. . com K ≠ 0 é definido como: M tK = ∑ (x i =1 n i − K)t n 5 Prof. Se a distribuição é assimétrica.xn são os n valores assumidos pela variável X. geralmente a curva normal.UFU/FAMAT Geoestatística Básica e Aplicada CV (%) = 100 s X - Valor Mínimo e Valor Máximo Estes valores permitem visualizar a menor ocorrência e a maior ocorrência e podem ser um primeiro indicativo de erros de amostragem. na distribuição simétrica tem-se 50% dos valores observados acima da observação central e 50% abaixo. x2. A obtenção desses valores se faz a partir da ordenação das observações. .

Para verificar o termo de comparação é necessário consultar o manual ou a "ajuda" do programa. temos M 1X = m1 = 0 (propriedade da média aritmética) e. O coeficiente de curtose é utilizado para caracterizar a forma da distribuição de freqüências quanto ao seu “achatamento”. se Ck < 3 a distribuição é platicúrtica. Em alguns programas computacionais como o Excel. se t =2 e K = X . A fórmula para cálculo de Ck é : Ck = m4 (m 2 ) 4 sendo que: m4 é o quarto momento em relação à média aritmética. sendo que: se Cs > 0 temos a distribuição assimétrica à direita. entretanto. respectivamente. se Cs < 0 a distribuição é assimétrica à esquerda. Statistica e GS+ existe uma padronização do valor de Ck e o valor de comparação é o zero. o segundo e o terceiro momento centrados na média. portanto. é mais conveniente a utilização de uma medida admensional e que será chamada de coeficiente de assimetria: Cs = m3 (m 2 ) 3 Em que m2 e m3 são. O termo médio de comparação é a distribuição normal e esta apresenta o valor de Ck = 3. Ednaldo Carvalho Guimarães . O momento centrado na média de ordem 3 pode ser utilizado como medida de assimetria. A classificação da distribuição quanto à curtose recebe a seguinte denominação: se Ck = 3 a distribuição é mesocúrtica (distribuição normal). e se Cs = 0 a distribuição é simétrica. temos M 2X = m2 = σ2. Vamos definir agora o coeficiente de assimetria (Cs) e o coeficiente de curtose (Ck). Dr. 6 Prof. se Ck = 0 temos a mesocúrtica. e se Ck > 3 a distribuição é leptocúrtica. se Ck < 0 temos a platicúrtica e se Ck > 0 temos a leptocúrtica.UFU/FAMAT Geoestatística Básica e Aplicada Observe que: se t = 1 e K = X . O coeficiente de assimetria é utilizado para caracterizar como e quanto à distribuição de freqüências se afasta da simetria.

respectivamente. Dr. etc. alguns programas. c) amostras coletadas em uma área cada observação será identificada por um par ordenado de coordenadas pertencente ao espaço (Ex: amostras coletadas em uma área X).80. testes de normalidade (Shapiro – Wilk. etc. Os procedimentos para este tipo de análise são encontrados em programas de estatísticas. 2. gráficos da distribuição normal. b) amostras coletadas ao longo de uma linha reta em uma certa cultura agrícola   cada observação é referênciada por um único ponto no espaço (Ex: amostras coletadas   em transeções). podemos dizer que a distribuição tende a normal (simétrica e mesocúrtica).3. Ednaldo Carvalho Guimarães .80.30 com erro padrão de 0.65 e 2.). Outras análises descritivas As análises descritas acima são as mais comuns e as que freqüentemente são usadas como análise exploratória dos dados. Kolmogorov – Smirnov. Por exemplo: Se o valor obtido na amostra para Cs = 0. mas algum tipo de referenciação deve existir. 2. Não é necessário utilizar coordenadas geográficas. outras estatísticas (quartil.5±0. etc. que as amostras sejam referenciadas. incluem os valores zero e três.65 e se o valor de Ck = 2.5 com erro padrão de 0. gráfico h-dispersão. por exemplo: gráfico box-plot. Entretanto outros recursos podem ser aplicados como. ou seja. Amostragem Um requisito básico na amostragem para fins de análise de dependência espacial utilizando métodos geoestatísticos é que as observações.   Exemplos de referenciações são: a) amostras coletadas ao longo do tempo cada observação é referenciada com relação ao tempo (Ex: Estudo da precipitação anual na região X). moda.3±0. calcula também o erro padrão desses coeficientes e a partir dos valores dos coeficientes associados com seus respectivos erros padrão. mediana. como o GS+. Tais resultados também contribuem para a descrição e conhecimento da variável em estudo.4.UFU/FAMAT Geoestatística Básica e Aplicada Para uma melhor interpretação do coeficiente de assimetria e do coeficiente de curtose. pois 0. podese concluir se os dados tem distribuição normal ou não. 7 Prof..).

Um exemplo típico de amostragem não sistemática é para variáveis climáticas. conforme mostra a Figura 1. geralmente. 2. não são equidistantes mas apresentam a referencia geográfica. entretanto isso não é regra e sim recomenndação. da escala (ou seja da dimensão). entre os outros fatores que devem ser avaliados pelo pesquisador.5. 8 Prof. teoricamnte. quer seja no espaço ou no tempo. Alguns autores recomendam que seja utilizados pelo menos 100 pontos amostrais. Nestes exemplos será utilizado a Versão Beta do GS+ (5. Pode-se dizer que o número de observações dependerá dos objetivos que se tem no trabalho. formando uma malha de pontos no caso bidimensional. maior será a precisão das estimativas das semivariâncias. maior será o número de pares para o cálculo das semivariâncias e. Outro aspecto relacionado com o ajuste de semivariograma e indiretamente com o tamanho da amostra é a presença de tendência da variável e/ou o uso de duas populações distintas que abordaremos em tópicos seguintes. basta que se tenha a referenciação dos dados para se proceder a análise espacial.3) que é de domínio publico. Dr. Outro questinamento básico da geoestatística é "Quantas amostras devo utilizar para a análise geoestatística?". dificultam o ajuste de semivariogramas com dados originais. existem trabalhos com bons resultados de ajuste de semivariogramas usando 45 pontos de amostragem. Neste tipo de amostragem os pontos avaliados (amostras) são obtidos de forma equidistantes. É sabido que quanto maior o número de pontos. Exemplos de análise exploratória aplicando programa GS+ Passaremos a descrever exemplos de análise exploratória de dados do GS+. No entanto esse não é um procedimento obrigatório. mesmo que o volume de observações seja grande. de maneira geral. Ednaldo Carvalho Guimarães . onde as estações climatológicas.0. mas que.UFU/FAMAT Geoestatística Básica e Aplicada Um tipo de amostragem bastante utilizado em geoestatística é a amostragem sistemática.

Dr. tenham coordenadas. esta referenciação não se faz necessária e ainda ressaltamos que a estrutura de dados apresentada neste tópico é válida para diversos programas de análise espacial. Programa GS+ Versão 5. portanto. neste caso de uma importação de dados ou do famoso "copiar" e "colar". na análise geoestatística necessita-se que os dados observados estejam referenciados. necessitando.UFU/FAMAT Geoestatística Básica e Aplicada Figura 1.3 Como ponto de partida vamos descrever a estrutura de arquivos de dados com vistas a posterior análise geoestatística. Vale ressaltar que. 9 Prof. Ednaldo Carvalho Guimarães . pois. se o objetivo do estudo não for a geoestatística ou a análise espacial. Trabalharemos com a análise bidimensional e. teremos as coordenadas X e Y para cada observação. O arquivo pode ser criado no próprio programa GS+ ou em outro programa como o Excel.0. ou seja. A Figura 2 mostra o aspecto básico do arquivo de dados.

Se o arquivo for editado em outro programa. Janela inicial do GS+ com exemplo de arquivo de dados contento as coordenadas (x. Para selecionar outra variável a ser estudada basta clicar na coluna correspondente e selecioná-la como a variável principal. ou seja. Na primeira coluna temos a coordenada X. ou ainda. na segunda coluna temos a coordenada Y e da terceira a sexta colunas temos as variáveis. Ednaldo Carvalho Guimarães . ativar o ícone Import file localizado no canto superior direto da Figura 2. procederíamos da seguinte forma (Figura 3): Figura 3. deve-se importar os dados para o GS+ utilizando o procedimento padrão do Windows de copiar e colar. Por exemplo. se o objetivo é a análise da terceira variável (usatpc).UFU/FAMAT Geoestatística Básica e Aplicada Figura 2. ou recortar e colar. Neste exemplo temos um arquivo de dados editado no GS+. Dr. neste caso estamos trabalhando com 4 variáveis.y) e 4 variáveis para a análise. Exemplo de mudança de variável para análise 10 Prof.

conforme Figura 4: 11 Prof. Dr. Voltaremos ao assunto no tópico de semivariograma cruzado. Para exemplificar o resultado deste tipo de análise vamos utilizar os dados da primeira variável (usatpd – coluna 3). A coluna é selecionada e aparece a segunda janela. Ednaldo Carvalho Guimarães . - Clique em Z (Primary variable) para selecionar esta coluna como sendo sua variável de analise.UFU/FAMAT Geoestatística Básica e Aplicada - clique sobre a coluna de interesse (coluna 5. Voltando à Figura 2 vamos descrever os procedimento da análise exploratória de dados. co-krigagem. neste exemplo). Ativando o ícone ∑ e teremos o resultado das principais estatísticas. Neste caso selecionase uma variável Z2 como covariável. A barra de ferramenta apresenta os seguintes símbolos que são destinados a este tipo de análise: Planilha ativa Principais Estatística s Análise gráfica histograma Posição das observações selecionadas por quartil Os ícones não ativos são destinados a análise com duas variáveis (semivariograma cruzados. - Clique em OK para confirmar a opção Pode-se ainda trabalhar com duas variáveis simultaneamente. etc). indicando a coluna ativa.

assimetria e curtose próximos de zero indicando distribuição normal aproximada dos dados.27 cm3/100cm3) e o maior valor observado (54.810 cm3/100cm3) reforçam a idéia de baixa variabilidade das observações e também mostram que. O menor valor observado (36. portanto. provavelmente. uma variabilidade de 9. Como uma análise geral desses dados verifica-se que a umidade de saturação do solo no plantio direto (usatpd) apresentou média de 44.81%. com uma dispersão média em torno desse valor de 4. Em um primeiro momento tem-se a visualização do histograma e posteriormente pode-se fazer análises com distribuição de freqüências acumuladas e gráfico da distribuição normal. Ednaldo Carvalho Guimarães .34±0. que são respectivamente: 0. O histograma mostra uma tendência dos dados à simetria e este fato também pode ser verificado por meio dos coeficientes de assimetria e curtose associados aos seus respectivos erros padrão.0069 (cm3/100cm3).50.UFU/FAMAT Geoestatística Básica e Aplicada média Desvio padrão variância mínimo máximo Número de dados e Dados perdidos histograma Coeficiente de assimetria e erro padrão Coeficiente de curtose e erro padrão Figura 4. deste modo nota-se que as observações se dispersam relativamente pouco em torno da média.46±0.3190 (cm3/100cm3) e. digitação ou de amostragem. 12 Prof. Note ainda que existe a possibilidade de se fazer análises com dados transformados. Estatísticas da variável “usatpd”. Um detalhamento da distribuição da variável pode ser obtida clicando o ícone do histograma na barra de ferramentas. não temos valores discrepantes que poderiam ser atribuídos a erros de determinação. ou seja. conforme mostra a Figura 5.30 e 0. Dr.

provavelmente.UFU/FAMAT Geoestatística Básica e Aplicada Histograma – freqüência simples Gráfico de freqüência acumulada Gráfico da distribuição normal Figura 5. que a princípio não há indícios de concentração de valores altos ou baixos em setores específicos da malha. por meio da Figura 6. Análise gráfica dos dados Uma outra análise utilizada no GS+ é a localização espacial dos pontos amostrados com relação a intervalos de ocorrência. Este mapa é obtido por meio do ícone exemplo na Figura 6. 13 Prof. . Ednaldo Carvalho Guimarães . Localização espacial das observações Verifica-se. Veja o Figura 6. portanto parece não existir tendência nos dados e. esta poderá ser representada por um semivariograma médio (isotrópico). Dr. se existir relação espacial.

sendo comprovado este fato por trabalhos científicos datados do início do século XX. em seus trabalhos com dados de mineração da África do Sul. A normalidade da variável e a homogeneidade de variâncias podem ser testadas facilmente em programas de estatísticas por meio de testes específicos como. independência de erros e homocedasticidade de variância (homogeneidade de variância). proposta pela metodologia não espacial. PRINCÍPIOS DA ANÁLISE GEOESTATÍSTICA 3. Em algumas áreas da ciência. Um breve histórico A preocupação com a dependência espacial ou temporal de observações realizadas para um determinado atributo é bastante antiga. A partir desta constatação surgiu os conceitos básicos de geoestatística. Se for observado não normalidade de dados e/ou não homogeneidade de variâncias. conforme mostra Vieira (1995). as seguintes suposições: normalidade da variável. Já a independência não pode ser testada por métodos simples e a solução deste problema. é a repetição e a aleatorização das observações. concluiu que a variância dos dados possuía uma estruturação que dependia da distância de amostragem. como a agricultura. ganhou impulso em áreas distintas da mineração e da geologia a partir de 1980. Esta solução. Dr. Os fundamentos teóricos da geoestatística podem ser encontrados nos trabalhos desenvolvidos por Matheron (1963) e Matheron (1971). utilizando a geoestatística. Shapiro-Wilk (W teste) para normalidade e F máximo de Hartley para homogeneidade de variâncias. Esta metodologia considera. não garante a independência entre as observações.UFU/FAMAT Geoestatística Básica e Aplicada 3. procedimentos como a transformação de dados podem ser adotados para que a variável atenda estas hipóteses básicas da metodologia de análise não espacial proposta por Fisher. no seu desenvolvimento e aplicação. isto porque algumas variáveis apresentam forte dependência espacial (autocorrelação entre as observações) que não é desfeita com este procedimento. A análise espacial de dados.1. em muitos casos. com grande aplicabilidade na ciência 14 Prof. Ednaldo Carvalho Guimarães . Krige (1951) citado por Vieira (1995). a partir da metade do século XX adotou-se a metodologia de análise de dados proposta por Fisher. por exemplo.

por exemplo: t1. Estacionaridade Antes de iniciarmos a discussão sobre a estacionaridade da variável vamos adotar uma simbologia para a variável em estudo. Paulo Libardi e Klaus Reichardt. Este pesquisador é homenageado com o nome do método de interpolação utilizado na geoestatística. Como exemplo de processo estacionário pode-se citar as oscilações da tensão em uma rede elétrica.tk) ou no espaço (unidimensional. (xn. No Brasil destaca-se trabalhos pioneiros nesta área desenvolvidos pelos pesquisadores Sidney Rosa Vieira. xn. (x1.y1). envolvendo áreas de ciências humanas. em que nem a amplitude média e nem as oscilações mudam bruscamente no tempo ou no espaço. Uma justificativa para tal fato é a facilidade computacional que viabilizou alguns cálculos relativamente trabalhosos nesta metodologia. Note que as características de um processo estacionário independe da origem adotada. por exemplo. . 15 Prof... x2... t2.. entre outros autores. Cressie e Hartfield (1996). que pode ser uma posição no tempo (unidimensional. Bartlett (1978). Ao falarmos da variável Z(t) estaremos falando de ocorrências da variável Z com uma referenciação t.y2). 3.. Duarte (2000). yn)) Diz-se que um processo (ou uma variável) é estacionária se o desenvolvimento desse processo no tempo ou no espaço ocorrer de maneira mais ou menos homogênea.. por exemplo: x1. Outras metodologias e alternativas de análise de dependência espacial são descritas em Papadakis (1937). Dr.(x1. a krigagem. . Ainda na década de 80. Atualmente a aplicabilidade e a utilização da geoestatística como metodologia de análise de dados no espaço ou no tempo esta difundida em vários ramos da ciência. com oscilações aleatórias contínuas em torno de um valor médio. Ednaldo Carvalho Guimarães .2. biológicas e exatas. ou bidimensional. Zimmerman e Harville (1991)... Em linhas gerais podemos dizer que a geoestatística está interessada em determinar a dependência espacial das observações de uma variável e recebeu tal denominação devido aos trabalhos desenvolvidos por Krige na África do Sul.UFU/FAMAT Geoestatística Básica e Aplicada do solo. .

Se a esperança matemática de uma variável aleatória é constante. . as características do processo dependem da origem que é tomada como referência. . que o primeiro e o segundo momento em relação à origem sejam constante. neste caso. Por exemplo. podemos dizer que a variável é estacionária de primeira ordem e. como restrição máxima. se todos os momentos estatísticos são invariantes para toda mudança de origem. Pode-se utilizar como exemplo de um processo não estacionário o relevo no estado de Minas Gerais. exige-se no máximo a estacionaridade de segunda ordem. E[Z(t)] = m1(t) = µ = constante 16 Prof. . ou ainda. E[Zk(t)] = mk = constante ∀ t Observação: Se um processo é estacionário na ordem k ele também será estacionário para as ordens inferiores a k. . Ednaldo Carvalho Guimarães . Observação: Processos não estacionários podem apresentar trechos estacionários. se o processo é estacionário de ordem 4. Dr. . Estatisticamente pode-se dizer que. então: E[Z(t)] = m1(t) = constante ∀ t E[Z2(t)] = m2(t) = constante ∀ t . 2 e 3. Para estudos de geoestatística necessita-se. . as chuvas mensais durante um ano no estado de Minas Gerais. Pode-se definir uma função aleatória Z(t) como estacionária. ele também será estacionário nas ordens 1. a média será a mesma para todo o processo. independentemente da origem que se toma no espaço ou no tempo. . ou seja.UFU/FAMAT Geoestatística Básica e Aplicada Diz-se que um processo é não estacionário quando não apresenta as características citadas anteriormente e. . se o processo é estacionário de ordem k. portanto.

que nada mais é do que a correlação entre seções da variável separadas por um passo h. t+h) = C(h) Note que a variância é um caso particular da covariância quando h = 0. o processo é estacionário de ordem 2. C(0) = E[Z2(t)] . Ednaldo Carvalho Guimarães . definida como: C(t. Z(t+h)} a função covariância existe e depende apenas de h. ou seja. ρ(0) = 1. Dr. ou seja. Isto significa que o processo Z(t) e Z(t+h) tem a mesma estatística para qualquer h.µ2 = Var[Z(t)] Geralmente utiliza-se a função de covariância normada pela variância: ρ ( h) = C (h) Var[ Z (t )] Neste caso chamamos ρ de função de correlação ou coeficiente de correlação. Uma variável é chamada de estacionária de segunda ordem se: A média é constante: E[Z(t)] = µ O segundo momento existe: E[Z2(t)] < ∞ Para cada par {Z(t). a esperança do produto do que ocorre em t e t’. portanto. E[Z2(t)] = m2(t) = constante Var [Z(t)] = E[Z2(t)] – {E[Z(t)]}2 = m2(t) – [m1(t)]2 = constante Seja agora a covariância. temos então que a variância é constante independente da origem no espaço ou no tempo e.UFU/FAMAT Geoestatística Básica e Aplicada Se o segundo momento em relação à origem é constante. t’) = E[Z(t). Portanto. t+h) = C(h) 17 Prof. Podemos definir uma variável como estritamente estacionária se seus momentos estatísticos são invariantes a translações na origem. da origem. C(t. mas somente da distância h entre os pontos e desta forma: C(t.Z(t’)] . com h = t’ – t.µ2 Se Z(t) é estacionária esta covariância não depende de t e t’.

Se o estudo for espacial. por analogia. mesmo que as amostras sejam coletadas em pontos diferentes. pois. chamado de correlograma ou autocorrelograma. C(0) ≠ constante. Dr. se ocorre a estacionaridade de segunda ordem. Esta fato é justificado em função de que todas as amostras pertencem a populações com os mesmos momentos estatísticos. é igual a: r (h) = C ( h) γ ( h) = 1− C (0) C (0) Note que. Ednaldo Carvalho Guimarães . se | h | > a 18 Prof.UFU/FAMAT Geoestatística Básica e Aplicada A estacionaridade da covariância implica na estacionaridade da variância: Var{Z(t)}= C(0) e do variograma que é definido como: 2γ(h) = E{[Z(t+h) – Z(t)]2} = = E{[Z(t+h)2}+E{[Z(t)]2}-2E{Z(t+h) Z(t)}= = E{[Z(t+h)]2}+E{[Z(t)]2}-2µ2 = = E{[Z(t+h)]2}. podemos chamar a de domínio de correlação. Mas se a estacionaridade de segunda ordem não é atendida o autocorrelograma não pode ser usado. o denominador da função autocorrelação é uma variância e. A dependência espacial ou temporal de uma variável Z(t) é definida por uma amplitude a. sendo que para variáveis com estacionaridade de segunda ordem: C(h) = 0 Ou γ(h) = C(0) = Var [Z(t)] se | h | > a Quando se trabalha com o tempo a constante a é chamada de tempo de correlação de Z(t). em relação ao experimento inicial.µ2+ E{[Z(t)]2}-µ2 = = C(0) – C(h) O coeficiente de correlação entre Z(t+h) e Z(t). neste caso. o correlograma (autocorrelograma) e o variograma (semivariograma) serão ferramentas correspondentes na determinação da dependência espacial. Observação: A existência de estacionaridade permite a repetição de um experimento.

A hipótese intrínseca é a hipótese mais freqüentemente usada em geoestatística. Na hipótese intrínseca temos: a) a esperança Z(t) existe e não depende do ponto t. estas permanecerão aproximadamente constante. 19 Prof. e existem muitos fenômenos que possuem uma grande capacidade de dispersão. As Figuras 7A. apenas a média permanece constante e no caso da Figura 7C nem a media e nem a variância permanecem constantes. já no caso da Figura 7B. Var[Z(t+h) – Z(t)] = E{[Z(t+h) – Z(t)]2} = 2γ(h) Observação: Se uma variável é estacionária de segunda ordem. mas o inverso nem sempre ocorre. que não possuem uma variância a priori nem uma covariância. o semivariograma é a ferramenta mais difundida na geoestatística porque exige apenas a hipótese intrínseca. então ela é também intrínseca. Dr. E[Z(t)] = µ b) para todo h. Ednaldo Carvalho Guimarães . respectivamente. isto é. por ser menos restritiva e. uma variável estacionária de primeira ordem e uma outra não estacionária. 7B e 7C ilustram. Var[Z(t)] = C(0). mas um variograma pode ser definido. a variância da diferença [Z(t+h) – Z(t)] existe e não depende do ponto t. Note que no caso da Figura 7A. A existência do variograma é uma hipótese mais fraca do que a existência da covariância. para qualquer trecho que selecionarmos e calcularmos a média e a variância. portanto.UFU/FAMAT Geoestatística Básica e Aplicada A hipótese de estacionaridade de segunda ordem assume a existência de uma covariância e assim de uma variância finita. Uma hipótese mais fraca (mais abrangente) é a hipótese intrínseca. uma variável estacionária de segunda ordem. enquanto o autocorrelograma exige a estacionaridade de segunda ordem.

3. Ednaldo Carvalho Guimarães .UFU/FAMAT Geoestatística Básica e Aplicada 28 26 Y 24 22 20 18 0 10 20 X 30 40 50 A 29 27 25 23 21 19 17 15 0 B Y 10 20 X 30 40 50 30 25 Y 20 15 10 5 0 10 20 X 30 40 50 C Figura 7. Exemplos de estacionaridade: A) Processo estacionário de segunda ordem. B) Processo estacionário de primeira ordem e C) Processo não estacionário 3. Krigagem universal (tendência) Na hipótese de tendência (Krigagem universal). Dr. a variável Z(t) pode ser decomposta em dois componentes: Z(t) = m(t) + e(t) 20 Prof.

A covariância é dada por: cov( x .UFU/FAMAT Geoestatística Básica e Aplicada em que m(t) é a tendência principal (drift) e e(t) é o resíduo. também. se ocorre algum tipo de tendência nos dados (tendência linear. 4.75 não podemos dizer se as variáveis estão com forte associação positiva ou não. será descrita a função semivariância e instrumento de análise espacial de dados. com maior detalhamento. mas. usando as observações reais. Autocorrelação e autocorrelograma Quando estamos trabalhando com variáveis bidimensionais.1. Passaremos a descrever rapidamente a função autocorrelação e em seguida.). Dr. ANÁLISE DA DEPENDÊNCIA ESPACIAL As duas funções utilizadas com maior intensidade na geoestatística para a determinação da dependência espacial ou temporal de variáveis são a função autocorrelação (que gera o autocorrelograma) e a função semivariância (que gera o semivariograma). etc. para cada posição t se determine à tendência m(t) e. Ednaldo Carvalho Guimarães . Note que se m(t) = constante. quadrática. y ) = E{[ X − µx ]. não ter um padrão de comparação.[ Y − µy ]} O cálculo da covariância pode ser pensada também para a análise espacial. semivariograma com 4. assim. trabalha-se com o semivariograma dos resíduos. o semivariograma dos resíduos pode-se apresentar com melhor estruturação e definição dos parâmetros. por exemplo. então o semivariograma da variável Z(t). Para se trabalhar com essa hipótese é necessário que. será igual ao semivariograma dos resíduos e(t). temos que a covariância é uma medida de associação entre as variáveis. Entretanto esta função tem a desvantagem de possuir as unidades das variáveis que a geram e. produzindo estimativas mais confiáveis (com menor variância) na krigagem. se calculamos a covariância entre X e Y e encontramos o valor de 0. Se analisarmos a Variável Z nas posições t e t+h temos: 21 Prof.

Vamos então definir a função autocovariância como uma alternativa de interpretação da dependência espacial de uma variável Z.k..( Z ( t + h ) − µ Z ( t + h ) )] Se a variável Z é estacionária.UFU/FAMAT Geoestatística Básica e Aplicada cov[ Z ( t ). sendo que quanto maior for o valor da covariância maior será a relação espacial e para covariância zero teremos independência. que a autocovariância apresenta algumas dificuldades de interpretação. 3 covariâncias 2 1 0 -1 0 100 200 300 400 500 600 distâncias (m) Figura 8. Esta função tem a vantagem de ser adimensional e estar limitada ao valor -1 e 1. Vamos inicialmente fazer uma analogia com as variáveis bidimensionais. Ednaldo Carvalho Guimarães . anteriormente.2. Z ( t + h )] = E [( Z ( t ) − µ z( t ) ). A Figura 9 ilustra uma função covariância. Portanto. esta função poderá ser estimada por: n( h ) cov( Z ( t ). Z ( t + h )) = i =1 ∑ [ Z ( ti ) − Z ] [ Z ( t i + h ) − Z ] n( h ) − 1 . Considerando as variáveis X e Y... Uma propriedade da covariância diz que "se duas variáveis aleatórias são independentes então a covariância entre elas é igual a zero". espera-se que o valor da covariância comece alto e depois tenda a zero. pois neste caso a média de Z(t) será igual à média de Z(t+h). ao analisarmos a variável Z nas posições t e t+h. com h=1. Dr. Exemplo de uma função covariância Comentamos. temos: 22 Prof. permitindo comparações entre variáveis e também inferências sobre o grau de associação (dependência).

no caso de variável estacionária de segunda ordem. A função autocorrelação é definida como sendo a razão entre a covariância dos valores assumidos pela variável Z.Y )] σxσ y i =1 ∑[ que pode ser estimada por: n X − X ] [Y −Y ] n −1 SxS y r( x . Cov [Z(t). y ) = cov[ X . em função da distância h. ou seja. n(h) é o número de pontos amostrais separados pela distância h. a covariância entre Z(t) e Z(t+h) quando h=0. Ednaldo Carvalho Guimarães . Z (t + h)] Cov[ Z (t ). Z é o valor médio (média amostral) da variável Z(t). Dr. menor a relação linear entre X e Y. r(h) é a autocorrelação amostral para a distância h. nas posições t e t+h e a variância dessa variável Z. Desta forma temse: cov[Z (t ). 23 Prof. s2 é a variância amostral de Z(t). separados pela distância h (autocorrelação populacional). maior a relação entre as variáveis e quanto mais próximo de 0. Z(t+h)] é a covariância entre a variável Z(t) e a variável Z(t+h). Var[Z(t)] = σ2 é a variância populacional. y ) = Neste caso quanto mais próximo de 1 ou de -1. Z (t + h)] = Var[ Z (t )] σ2 ρ ( h) = Trabalhando-se com dados amostrais ρ(h) pode ser estimado por r(h): n( h ) i =1 ∑ [ Z ( t i ) − Z ] [ Z ( ti + h ) − Z ] n( h ) − 1 s2 r( h ) = em que: ρ (h) é a autocorrelação entre os valores da variável Z.UFU/FAMAT Geoestatística Básica e Aplicada ρ( x .

ou seja. r(0) = 1 e este valor decresce até o zero. Dr.8 0.4 0.UFU/FAMAT Geoestatística Básica e Aplicada A Figura 9 mostra um exemplo de comportamento da função autocorrelação. Teoricamente. 1 0. que indica flutuações periódicas na variável estudada. assim temos independência entre as amostras para toda à distância ou tempo de estudo. sendo que acima dessa distância os dados são considerados independentes entre si. Ednaldo Carvalho Guimarães . para h = O a autocorrelação é máxima. exceto para h=0 em que r(0) = 1. Exemplo de um autocorrelograma experimental r(h) O uso dessa função no estudo da dependência espacial ou temporal só é válida se a hipótese de estacionaridade de segunda ordem for atendida.2 0 -0. Uma outra possibilidade é o autocorrelograma com autocorrelações flutuando em torno de zero (indica independência entre as observações) e o autocorrelograma cíclico. Este tipo de comportamento indica que quanto mais próximas estiverem as amostras maior o grau de semelhança entre elas e este grau de semelhança decresce com o aumento da distância entre observações.4 0 100 200 300 400 500 600 distância (m) Figura 9. Esta distância define a amplitude de dependência espacial ou temporal (a).6 0.2 -0. até uma distância ou tempo que não exista relação entre as observações. conforme Figura 10A e 10B. Podemos ter ainda o autocorrelograma para toda distância com valor de autocorrelação igual a zero (r(h) = 0). 24 Prof. ou seja.

4 0 B r(h) 5 10 h 15 20 Figura 10. mas.2 0 -0.2.2 0 -0.8 0. Dr. então se utiliza o prefixo “semi” para distinguir da variância e daí vem o nome semivariância para γ(h) e semivariograma para o gráfico de γ(h) em função de h.2 1 0.UFU/FAMAT Geoestatística Básica e Aplicada 1. Ednaldo Carvalho Guimarães .6 0.2 1 0.2 0 A r(h) 5 10 h 15 20 1.6 0. B) periodicidade da variável.8 0. Semivariograma a) Definição do semivariograma O semivariograma é definido como: 1 γ (h) = {Var[ Z (t ) − Z (t + h)]} 2 Note que Var[Z(t) –Z(t+h)] é a variância dos dados separados por uma distância h.2 -0. 4.4 0.4 0. Exemplos de autocorrelogrmas: A) independência entre observações. na expressão acima. esta variância está sendo divida por dois. 25 Prof.

Dr. variações que não são justificada pela semelhança de um ponto com outro. portanto. portanto: 1 γ (h) = {E[ Z (t + h) − Z (t )] 2 } 2 e uma estimativa de γ(h) chamada de γ (h) é dada por: n(h) ^ γ (h) = ^ ∑ [ z(t + h) − Z (t )] i =1 2 2n( h ) em que n(h) é o número de pares separados pela distância h. temos que a utilização do semivariograma exige que pelo menos a hipótese intrínseca seja atendida. A utilização de dados amostrais na estimativa da semivariância e na construção do semivariograma.UFU/FAMAT Geoestatística Básica e Aplicada Observação: O divisor 2 da variância surge das deduções e simplificações matemáticas. portanto. A distância h a partir da qual γ(h) se torna aproximadamente constante é chamada de alcance da dependência espacial (a) sendo que as medições realizadas a distâncias maiores que a. A impossibilidade de se fazer reamostragem exatamente sobre um ponto já amostrado 26 Prof. freqüentemente. até atingir um valor constante para γ(h) que corresponde às variações aleatórias. exige a condição de estacionaridade mais fraca quando comparada com a autocorrelação. maior a dispersão (variância). maior será a semelhança entre eles e. revela que. tem distribuição espacial aleatória e. ou seja. consequentemente. temos: E[Z(t+h)] = E[Z(t)] e. b) Caracterização do semivariograma Analisando a expressão da função semivariância. pode-se imaginar que quanto mais próximos estiverem os pontos amostrados. são independentes entre si. Relembrando a condição de estacionaridade. para h = 0 a semivariância γ(0) difere de zero. a semivariância γ(h) cresce com o incremento de h. Ednaldo Carvalho Guimarães . menor a semivariância. Na teoria temos que para a distância h=0 a semivariância γ(0) = 0 e. e quanto mais distantes estiverem os pontos amostrados menor será a semelhança e. Sob a suposição de tendência zero. O valor de γ(h) constante é chamado de patamar (C). ou seja.

Dr. Um outro tipo de semivariograma é aquele que apresenta a semivariância com flutuações. INDEP. porque apresenta patamar claro e bem definido. neste caso. se existir. C0 + C (A) a INDEP DEP. Observação: Pode-se mostrar que o patamar do semivariograma (C0 + C) é uma estimativa sem tendência da variância (σ2) da variável Z(t). o patamar é dado por: C0 + C.UFU/FAMAT Geoestatística Básica e Aplicada (nestes casos pode ocorrer variações a distâncias menores do que a menor distância de amostragem) e erros como erros de amostragem. temos o efeito pepita puro e. Ednaldo Carvalho Guimarães . a dependência espacial. Este semivariograma é chamado de semivariograma periódico ou cíclico e indica uma periodicidade nos dados que pode ser explicada por algum fator conhecido e analisada por meio da densidade espectral. ou seja. erros de análise de laboratório.. são justificativas dessa descontinuidade na origem. etc. Se o semivariograma for constante e igual ao patamar para qualquer valor de h. temos a ausência total de dependência espacial. 27 Prof. (B) a DEP. Nas Figuras 11A C e 11B apresentamos o comportamento ideal de um semivariograma e também são mostrados os parâmetros do modelo descritos acima. surge um novo termo no semivariograma chamado de efeito pepita (C0) e. C0 Figura 11. Quando γ(0) ≠ 0. Semivariogramas: (A) sem efeito pepita. será manifestada à distância ou tempo menor do que o menor espaçamento entre amostras. neste caso. (B) com efeito pepita Os semivariogramas apresentados na Figura 11 indicam estacionaridade de segunda ordem para a variável.

Neste caso uma explicação prática poderia estar associada ao fato de estarmos trabalhando com mais de uma população. pode-se dizer que a superfície de tendência é a melhor representação espacial da variável. 28 Prof. 12B. ou seja. Se o semivariograma dos resíduos apresenta efeito pepita puro.UFU/FAMAT Geoestatística Básica e Aplicada Também podemos ter um tipo de semivariograma em que as semivariâncias crescem. Uma outra alternativa é trabalhar com a hipótese de tendência nos dados originais. 12D e 12E. cíclico e com estruturas entrelaçadas. Dr. estamos trabalhando com a hipótese intrínseca ( fenômeno com capacidade infinita de dispersão). Ele indica também que a máxima distância h entre as amostras não foi capaz de exibir toda a variância dos dados e provavelmente existe tendência dos dados para determinada direção. Vale ressaltar que a primeira alternativa é a mais simples e a mais utilizada. Podemos ter ainda um semivariograma com mais de uma estrutura de variância. para todos os valores de h. ou seja. Se for verificada a tendência remove-se esta tendência e verifica-se se a variável resíduo apresenta semivariograma com patamar (estacionaridade de segunda ordem). semivariogramas experimentais com patamar definido. sem limites. provavelmente. semivariogramas sem patamar definido. até uma distância X estamos trabalhando com uma determinada população e a partir daí outra ou outras populações. que são chamados de semivariogramas com estruturas entrelaçadas ou semivariogramas imbricados. Este semivariograma indica que a hipótese de estacionaridade de segunda ordem não foi atendida e. 12C. As Figuras 12A. Uma metodologia de se ajustar superfícies de tendência é a utilização de regressão múltipla. Ednaldo Carvalho Guimarães . sem patamar. efeito pepita puro. mostram respectivamente.

Dr. Ednaldo Carvalho Guimarães .UFU/FAMAT Geoestatística Básica e Aplicada 20 gama (h) 15 10 5 0 0 5 10 h 15 20 A 20 gama (h) 15 10 5 0 0 5 10 h 15 20 B 20 gama (h) 15 10 5 0 0 5 10 h 15 20 C 10 8 gama (h) 6 4 2 0 0 5 10 h 15 20 D 29 Prof.

 0  ii) variável com moderada dependência espacial – se o efeito pepita representar entre   C0  25% e 75% do patamar  0 .00   0   iv) variável independente espacialmente – se a relação entre efeito pepita e patamar for igual a 100%. Dr. C) sem patamar D)Cíclico e E) Com estruturas entrelaçadas c) Grau de dependência espacial Quanto ao grau de dependência espacial da variável em estudo. Semivariogramas: A) Com patamar. 25 0 .75 < C + C < 1. neste caso temos o semivariograma com efeito pepita puro  C0    1 . 75 ≤ ≤  . B) Efeito pepita puro.UFU/FAMAT Geoestatística Básica e Aplicada 40 gama(h) 30 20 10 0 0 5 10 15 h 20 25 30 E Figura 12. 00 = C +C . C C + 0   iii) variável com fraca dependência espacial – se a relação entre efeito pepita e patamar   C0 estiver entre 75% e 100%   0. Ednaldo Carvalho Guimarães .25  . podemos classificala como: i) variável com forte dependência espacial – se o efeito pepita for menor ou igual a 25%  C0  do patamar   C + C < 0.  0  30 Prof.

e) Os principais modelos de semivariogramas Dados experimentais são influenciados por uma série de fatores. (3. ao invés de se preocupar com a escolha de método de transformação de anisotropia. ou seja. o semivariograma depende da magnitude e da direção de h. Se o semivariograma é anisotrópico ele deve sofrer transformações antes de ser usado. não são afetados se. Desta idéia surge a distinção entre modelo matemático e modelo estatístico. 45o e 1350 (nas duas diagonais principais).16) e (5. todos os pontos experimentais devem estar sobre a função proposta para explicar determinado fenômeno. 31 Prof. Por exemplo. a precisão da interpolação ou o tipo de hipótese satisfeita. consequentemente.9). Vieira (1995) alega que. (4. apenas limitar a faixa de distância na qual se utiliza o semivariograma. 90o (na direção Y). a e/ou modelo diferenciado dependendo da direção de h.25) como sendo valores experimentais e propormos o modelo: Yi= Xi2. Ednaldo Carvalho Guimarães . C0. pois. estaremos trabalhando com um modelo matemático. Um pesquisador. ele é chamado anisotrópico (podemos classificar a anisotropia em anisotropia geométrica ou anisotropia zonal). não é capaz de controlar todos os fatores que influenciam um conjunto de dados. As principais direções de h que são examinadas são: 0o (na direção X).4). o semivariograma é unidimensional e nada pode ser dito sobre anisotropia. Quando o semivariograma é idêntico para qualquer direção de h ele é chamado de isotrópico e quando o semivariograma apresenta os parâmetros C. em geral. Dr. Quando os dados forem coletados em uma transeção (linha).0). geralmente. como o modelo que explique o comportamento desses dados experimentais. No modelo matemático não temos desvios em relação à função proposta. todas as observações pertencem ao modelo proposto (Figura 13). (2. se tomarmos os pares ordenados (0.UFU/FAMAT Geoestatística Básica e Aplicada d) Isotropia e anisotropia Note que h é um vetor e.

Modelo Matemático Para o modelo estatístico os valores experimentais apresentam desvios (erros) em relação ao modelo proposto (ajustado) e estes erros são atribuídos a fontes de variações não controladas pelo pesquisador. Dr.0286x + 1. Por exemplo.4286+ei Figura 14. e desta forma estaremos trabalhando com modelos estatísticos de semivariogramas. podemos ter o seguinte modelo estatístico que explique o comportamento linear de uma variável Y em função de X: Yi = a +bXi +ei.UFU/FAMAT Geoestatística Básica e Aplicada 30 25 20 15 10 5 0 -5 0 y = x2 Y 1 2 3 X 4 5 6 Figura 13. 15 10 Y 5 0 0 1 2 3 X 4 5 6 y = 2. 32 Prof. Modelo Estatístico Na aplicação da teoria geoestatística a dados experimentais. Ednaldo Carvalho Guimarães . vamos ajustar modelos teóricos de semivariogramas as semivariâncias experimentais. (Figura 14) em que a e b são as constantes que definem a reta e ei são os erros experimentais (maiores detalhes podem ser obtidos em textos e livros sobre modelos lineares ou análise de regressão).

Já Pannatier (1996) sugere a utilização do "Indicação da Qualidade do Ajuste" (IGF). melhor será o modelo de semivariograma. com o qual estamos exemplificando este texto. se o modelo ajustado não for apropriado. é uma relação entre a soma de quadrados devido ao modelo ajustado e a soma de quadrados total (mede a variação dos dados devido ao modelo ajustado em relação à variação total dos dados) e quanto mais próximo da unidade estiver o valor de R2 melhor será o modelo ajustado. por meio de combinações dos parâmetros do modelo. aplica a metodologia dos mínimos quadrados para os ajustes dos modelos e utiliza como critérios para seleção do modelo: i) o coeficiente de determinação (R2).UFU/FAMAT Geoestatística Básica e Aplicada O gráfico da semivariância (γ(h)) em função da distância (h). conseqüentemente. mostrará uma série de pontos discretos que é chamado semivariograma experimental. Macbratney e Webster (1986) sugerem o método do Critério de Informação de Akaike (AIC) para avaliar o modelo. Vieira et al (1983) sugerem o método de ajuste por tentativa e erro (ajuste a critério do observador) associado à avaliação do modelo pela técnica de validação cruzada ou autovalidação (“jack-Knifing”). Ednaldo Carvalho Guimarães . minimiza esta soma de quadrados de resíduos. todos os cálculos seguintes conterão erros que poderão afetar as inferências. Uma função contínua deve ser ajustada as semivariâncias experimentais. Dr. que. O GS+ utiliza este resultado para a seleção do modelo e. O programa GS+. Vários métodos são utilizados para verificar a qualidade do ajuste do semivariograma aos dados experimentais. relembrando os conceitos de análise de regressão. A descrição de cada método de seleção pode ser encontrado nos respectivos trabalhos originais dos autores e cada programa de análise geoestatística de dados apresenta um critério de seleção. A escolha do modelo de semivariograma que será utilizado é um dos aspectos mais importantes da geoestatística. ii) Soma de quadrados de resíduos (RSS) – quanto menor for este valor. O autor do programa alega que a utilização 33 Prof. portanto o ajuste de semivariograma é uma fase crucial na análise geoestatística e deve receber uma atenção especial. Todos os cálculos da geoestatística dependem do modelo de semivariograma ajustado e.

A condição para o ajuste de modelos a dados experimentais é que ele represente a tendência de γ(h) em relação à h e que o modelo tenha positividade definida condicional. um modelo é positivamente condicional se γ(h)> 0 e γ(-h) = γ(h). quanto mais simples puder ser o modelo ajustado. por ser este mais sensível e mais robusto quando comparado com o coeficiente de determinação (R2). Às vezes é preferível selecionar um modelo com R2 um pouco menor ou RSS um pouco maior que o sugerido pelo programa. De maneira geral. os principais modelos de semivariogramas utilizados na geoestatística são: i) modelo linear com patamar C  C 0 + h γ ( h) =  a   C0 + C 0≤h≤a h>a Neste caso C/a é o coeficiente angular para 0< h < a ii) modelo esférico   3  h  1  h 3  C + C    −    γ (h) =  0  2  a  2  a      C0 + C iii) modelo exponencial 0≤h≤a h>a γ (h) = C0 + C 1 − e[ −3( h / a )] 34 [ ] 0<h<d Prof. C0 + C como patamar e a como alcance. Dr.UFU/FAMAT Geoestatística Básica e Aplicada desse critério na seleção do modelo é preferido. e também não se deve dar importância excessiva a pequenas flutuações. melhor. mas que represente melhor os dados. qualquer que seja h. Definindo C0 como efeito pepita. Ednaldo Carvalho Guimarães . De maneira geral. Observação: Em muitos casos (talvez na maioria dos casos) a sensibilidade de quem está trabalhando com os dados e o conhecimento sobre a variável é de fundamental importância na opção do modelo de semivariograma.

B=1. sendo que B tem que ser estritamente maior que zero e menor que dois para garantir a condição de positividade Observação: dependendo da escala de trabalho e do espaçamento entre amostras. (B) sem patamar. Modelos de semivariograma: (A) com patamar. a amplitude efetiva 35 Prof. apresentados no programa GS+. Ednaldo Carvalho Guimarães . (A) Linear Gaussiano Exponencial Esférico A=8. ou seja. iv) modelo gaussiano γ (h) = C 0 + C 1 − e [ −3( h / a ) v) modelos sem patamar [ 2 ] 0≤h≤d γ( h ) = C0 + Ah B definida condicional. respectivamente.UFU/FAMAT Geoestatística Básica e Aplicada Neste modelo e no modelo de gaussiano d é a distância máxima na qual o semivariograma é definido e nestes modelos o patamar (a) é atingido apenas assintoticamente O parâmetro a é determinado visualmente como a distância após a qual o semivariograma se estabiliza.9.5 A=0. Dr.5 (B) Figura 15.0 A=0. Observação: Nos modelos exponencial e gaussiano. a amplitude a que deve ser considerada como a amplitude de dependência espacial deve ser igual a três vezes e 3 vezes. pode-se ter mais de um modelo de semivariograma para os dados. Nestes casos temos as estruturas entrelaçadas. o valor de A0.1.B=1. As Figuras 15A e 15B mostram os aspectos gerais dos modelos de semivariogramas discutidos anteriormente. B=0.0. 0<B<2 Os parâmetros A e B são constantes que definem o modelo.

escalonado Semivariograma isotrópico Semivariogramas anisotrópicos Figura 16.UFU/FAMAT Geoestatística Básica e Aplicada apresentada na coluna posterior a coluna de A0. Variância amostral Semivar. Ednaldo Carvalho Guimarães . indica que a análise da dependência espacial será Observação: Existem outras opções de análises que são apresentadas em “autocorrelation” ou nos respectivos ícones na barra de ferramentas. o programa apresenta a seguinte janela (Figura 16): Distância máxima para cálculo das semivariâncias Passos para cálculo da semivariância Análise de anisotropia Cálculo das semivariâncias e do semivariograma Exibe o semivar. Isto ocorre porque os modelos exponencial e gaussiano utilizados no programa não consideram o fator 3 apresentados nos modelos anteriores. Dr. O uso do software GS+ na determinação do semivariograma No programa GS+ o ícone realizada por meio do semivariograma. Análise da semivariância 36 Prof.3. Ativando o ícone do semivariograma. 4.

Os passos para cálculo das semivariâncias consiste em como as semivariâncias vão ser agrupadas. teremos o semivariograma experimental e uma proposta de modelo ajustado. a proposta de modelo e uma linha paralela ao eixo X que representa a variância dos dados. Ednaldo Carvalho Guimarães . O GS+ adota como critério inicial 80% da distância máxima. Quanto maior for este valor menos pontos teremos no semivariograma. temos o semivariograma experimental. ou seja. Na terceira opção é exibido o semivariograma escalonado. o semivariograma onde cada semivariância é dividida pela variância dos dados. fazendo com que a estimativa da semivariância tenha pouca precisão. Vale ressaltar também que. Marcando-se a primeira e a segunda opções. se este passo for muito pequeno. A janela apresentada na Figura 9 mostra também as opções de exibição do semivariograma. isto se justifica pelo fato de que a grandes distâncias o número de pares para o cálculo da semivariância reduz-se drasticamente. 37 Prof. A Figura 17 ilustra o resultado de um semivariograma. Este valor pode ser alterado pelo usuário.UFU/FAMAT Geoestatística Básica e Aplicada A distância máxima para cálculo da semivariância deve ser no máximo igual à máxima distância de coleta da amostra. Dr. os semivariogramas para as diferentes direções (anisotrópico) serão iguais ao semivariograma isotrópico. teremos classes de distância sem pares para cálculo da semivariância. Não abordaremos neste texto a discussão sobre anisotropia e procedimentos de análise de anisotropia. Se marcarmos apenas a primeira opção. neste caso. Para a análise do semivariograma isotrópico o ângulo de tolerância (offset tolerance) deve ser de 900 e.

Modelos e análises dos modelos 38 Prof. O resultado da execução dessas funções são apresentados nas Figuras 18 e 19. Relação entre C e patamar Coef. Ednaldo Carvalho Guimarães . Efeito pepita patamar amplitude Amplitude efetiva (exp e gaussiano). Dr. A Figura 18 exibe as opções de modelos de semivariogramas. Exemplo de um semivariograma Note que a Figura 17 apresenta ainda a opção model e a opção expand.UFU/FAMAT Geoestatística Básica e Aplicada Mostra o semivariograma com os respectivos parâmetros e ajuste Mostra as opções de modelos com os parâmetros e ajuste Figura 17. Determinação e soma de quadrados de erros modelos Refaz o semivariograma padrão do GS+ Aplica o novo modelo caso haja modificação Figura 18.

39 Prof. sendo que quanto mais próximo de 1. Ednaldo Carvalho Guimarães . e) R2 (coeficiente de determinação) e RSS (soma de quadrados de resíduos) nos informa sobre a qualidade do ajuste do modelo. então. visualizar os modelos com os respectivos ajuste feito pelo programa (vale relembrar que o GS+ seleciona o modelo com menor soma de quadrados de resíduos (RSS)). Para retornar ao modelo padrão do GS+ utilize o comando refit. dos parâmetros dos modelos e. maior a dependência espacial. Observações: a) O programa não apresenta o modelo de efeito pepita puro. devido a formula de cálculo desses modelos no programa. Neste caso. Ao usuário é permitido a modificação do modelo selecionado pelo GS+ ou. d) A relação entre C e C0+C nos dá uma idéia do grau de dependência espacial da variável. o comando apply deve ser ativado para que o programa tome este modelo como o modelo de variabilidade espacial ou temporal daquela variável. classificando a dependência como fraca. C/A0. por exemplo. moderada e forte. c) A inclinação no modelo linear e linear com patamar (coeficiente angular) e dado pela relação entre C e A0. f) No ajuste do modelo a sensibilidade do usuário é muito mais importante do que os valores de R2 e RSS e. A0 ≠ A (Estes modelos no GS+ não consideram o fator multiplicativo 3). b) A amplitude efetiva é utilizada no GS+ para determinar a amplitude de dependência espacial dos modelos exponencial e gaussiano. no comando model (Figura 18).UFU/FAMAT Geoestatística Básica e Aplicada O GS+ permite. sugere-se que se copie as semivariâncias calculadas para outro programa e que o gráfico seja feito neste outro programa. realizadas modificações. g) O programa não apresenta a opção de ajuste de modelo sem patamar diferente do linear. tentativas de ajustes diferentes ao proposto pelo programa devem ser utilizadas. Dr. Note que C0 C e o primeiro termo já foi discutido no item grau de dependência = 1− C0 + C C0 + C espacial. Para obter este modelo utilize o modelo linear com C0 = C0 +C. O Excel. ou seja. portanto. mesmo que isso cause queda no valor de R2 e acréscimo no valor de RSS.

do modelo de semivariograma ajustado e dos parâmetros desse modelo. Dr. Semivariograma experimental e modelo ajustado Parâmetros do modelo ajustado Lista semivariância calculada. permite que estes valores sejam transportados para outros programas e que se faça vários modelos em uma única figura. A listagem dos valores de semivariâncias com as respectivas distâncias de cálculo (list values). com distâncias e número de pares Mostra as diferenças quadráticas que geram a semivariância Edita o semivariograma Figura 19. Semivariograma e opções de edição Nesta tela temos a exibição das semivariância calculadas. 40 Prof.UFU/FAMAT Geoestatística Básica e Aplicada A Figura 19 mostra o resultado da execução do comando expand. Ednaldo Carvalho Guimarães .

A variabilidade do dados é relativamente baixa (desvio padrão = 1. 41 Prof. Dr. Exemplos de aplicação 1) Suponha que os dados abaixo representem a variável Z (por exemplo.5023 e CV = 8. Ednaldo Carvalho Guimarães . A amostragem foi feita em uma transeção e as amostras foram coletadas a cada 20 m. monte o semivariograma experimental e proponha um modelo de ajuste.6%) e os valores mínimo e máximo indicam a não existência de problemas amostrais com os dados.46875 0.4. mediana e moda aproximadamente iguais. % de areia de um certo solo).265581 17. gráfico tendendo à simetria). (note que estes dados são unidimensionais). Tabela 1.257056 0. Faça a análise descritiva da variável.UFU/FAMAT Geoestatística Básica e Aplicada 4.27713 15 21 A análise descritiva mostra que os dados possuem uma distribuição de probabilidade normal aproximada (média.5 18 1. Dados de % de areia em um solo. h (m) 0 20 40 60 80 100 120 140 %Areia 16 18 17 20 15 15 15 15 h(m) 160 180 200 220 240 260 280 300 %Areia 17 17 17 18 18 19 18 18 h(m) 320 340 360 380 400 420 440 460 %Areia 18 21 16 20 16 18 18 17 h(m) 480 500 520 540 560 580 600 620 %Areia 18 18 20 17 17 17 17 18 Observação: para ser resolvido sem o uso de programas de geoestatística Solução: a) Análise descritiva Média Erro padrão Mediana Moda Desvio padrão Variância Curtose Assimetria Mínimo Máximo 17.50235 2. curtose e assimetria próximos de zero.129546 0. calcule as semivariâncias.

318 440 2.367 360 1.375 420 2.065 200 2.056 Número de pares (n(h)) 31 30 29 28 27 26 25 24 23 22 21 20 19 18 17 16 15 14 13 12 11 10 9 A representação gráfica (semivariograma) das semivariâncias em função da distância h (semivariograma experimental) e uma proposta de modelo ajustado aos dados experimentais são apresentados na figura abaixo.825 260 2.129 40 1.719 340 3.120 160 2. 4.000 0.417 60 2.396 180 2. Ednaldo Carvalho Guimarães .778 300 2. Distâncias de cálculo.000 2. 42 Prof.000 semivariância 3.735 320 1.500 80 2. Distância h (m) Semivariância (γ(h)) 20 2.327 140 2. Dr.UFU/FAMAT Geoestatística Básica e Aplicada b) Semivariância e semivariograma Os valores das distâncias h.711 280 1.738 240 2.037 120 2.857 380 2. das semivariâncias (γ(h)) e números de pares(n(h)) utilizados no cálculo são apresentados abaixo.400 460 1.214 100 2.000 0 100 200 h (m) 300 400 500 Semivariograma experimental e modelo ajustado.000 1.808 400 2.545 220 2. valores de semivariância e número de pares.

UFU/FAMAT Geoestatística Básica e Aplicada O modelo proposto inicialmente é um modelo exponencial.0 (%)2. Neste caso o semivariograma mostra uma dependência espacial para a % de areia até 120 m. amostras coletadas a distância inferiores a 120 m possui dependência espacial e. com efeito pepita (C0) de 1. patamar (C0+C) de 2. à distância de amostragem mínima deveria ser de 120 m. no caso da utilização de métodos de análises estatísticas que consideram independência entre amostras. Ednaldo Carvalho Guimarães . OBS: Exercício resolvido com o auxílio do MS-EXCEL® 2) Utilizando os dados do exemplo anterior (exemplo1) refaça a análise utilizando o GS+ Solução: a) Análise descritiva b) Semivariograma O modelo proposto pelo GS+ foi: 43 Prof. Dr. ou seja. (Observação: não foi realizado nenhum teste para verificar se este é o melhor modelo de semivariograma para esta variável).3 (%)2 e alcance (a) de 120 m.

desta forma o modelo proposto no exemplo 1 poderia ser utilizado. 44 Prof. Outros modelos poderiam ser sugeridos neste caso.UFU/FAMAT Geoestatística Básica e Aplicada O modelo proposto no exemplo 1 apresenta o seguinte resultado: Comparando os dois modelos verifica-se ligeiro aumento de r2.80 m no primeiro caso e de 120 m no segundo caso. As descrições e discussões seguem o padrão do exemplo 1. Dr. Ednaldo Carvalho Guimarães . Lembre-se que o modelo adotado foi o exponencial e portanto o alcance efetivo será de 40. mantendo-se o mesmo valor de RSS.

49 X Y PBPD 11. Os coeficientes de assimetria e curtose com os respectivos erros padrão indicam tendência simétrica dos dados.39 12.49 11.30 12.58 12.90 12.39 12.95 11.84 11. com dispersão média em torno desse valor de 0.62 12.36 11.81 11.54 11.01 X Y PBPD 12. verifica-se uma distribuição de freqüências bimodal para esta variável.59 12.19 11.43 12.65 12.6302%.66 11. Ednaldo Carvalho Guimarães .18 11.24 12.39 11.92% de silte.56 12.29%).12 11. diferindo da curva normal (mesocúrtica). mostrando que os dados têm uma baixa dispersão.32 11.69 12.46 11.UFU/FAMAT Geoestatística Básica e Aplicada 3) A seguir apresentamos as coordenadas X (m).87 12.46 Realizar a análise dos dados e verificar se existe dependência espacial para essa variável. SOLUÇÃO: a) Análise descritiva O resultado das principais estatísticas dessa variável é apresentado a seguir: Nota-se que a área apresenta.96 11.77 12.82 12. Esta dispersão em torno da média representa uma variabilidade de 5.17 11.74 11.49 11.25 12.77 11.48 X Y PBPD 11.11 10.16 11.29% (CV=5.81 11.67 11. em média.53 11.44 12. 11. Y (m) e a variável silte (%) em uma área experimental.55 12.72 11.43 12. mas a curva do tipo platicúrtica.85 12.13 11. A distribuição das amostras na área segundo o valor de ocorrência é a seguinte: 45 Prof.49 12. Dr.38 12.39 12.49 10.32 12. X Y PBPD 0 0 20 0 40 0 60 0 0 10 20 10 40 10 60 10 0 20 20 20 40 20 60 20 0 30 20 30 40 30 60 30 0 40 20 40 40 40 60 40 0 50 20 50 40 50 60 50 0 60 20 60 40 60 60 60 0 70 20 70 40 70 60 70 10 0 30 0 50 0 70 0 10 10 30 10 50 10 70 10 10 20 30 20 50 20 70 20 10 30 30 30 50 30 70 30 10 40 30 40 50 40 70 40 10 50 30 50 50 50 70 50 10 60 30 60 50 60 70 60 10 70 30 70 50 70 70 70 12.79 11.29 12.16 12.58 11.25 11. Com base em uma análise visual do histograma.97 12.11 11.45 12.55 10.32 11.

b) Análise do semivariograma A seguir é mostrado o semivariograma dessa variável: 46 Prof. Ednaldo Carvalho Guimarães . é aleatória e isotrópica. nesta área. Dr. tal fato é um primeiro indicativo de que a distribuição espacial dessa variável.UFU/FAMAT Geoestatística Básica e Aplicada Não se observa tendências de concentração de valores em posições específicas da área e também não ocorre sentido preferencial na distribuição dos dados.

63 27.69 28.37 28.73 29.09 27.18 22.86 26.72 27.54 25.66 30.17 28.44 X Y U 23.81 26. 4) Os dados apresentados abaixo referem-se a umidade de um solo.87 23. Dr. As amostras foram coletadas em uma malha contendo 63 pontos com espaçamento de 20 m entre amostra.45 24.61 24.36 Realizar a análise dos dados e verificar se existe dependência espacial para essa variável.13 X Y U 27.397. Conclui-se.27 25.16 27. 47 Prof.30 23.UFU/FAMAT Geoestatística Básica e Aplicada O modelo apropriado para descrever o comportamento espacial dessa variável foi o modelo de efeito pepita puro.27 27.64 24.05 22. ou seja. Nota-se que as semivariâncias experimentais estão em torno da linha paralela ao eixo x. são independentes.39 26.12 27.16 26.45 24.03 26.98 23.20 X Y PBPD 25.80 29.30 27.61 26.42 26.05 24.82 26.85 25. perfazendo 9 colunas e 7 linhas de amostragem.61 26.36 26.50 26. C0 + C = 0. Ednaldo Carvalho Guimarães .89 24.58 26.63 26.61 27. portanto.91 24.98 27.52 26.35 22.49 22. que a distribuição espacial do silte nesta área experimental é aleatória e as amostras.63 25.36 24.73 31.17 26.54 26.83 25.49 24.40 27. para a malha amostrada (com distância entre pontos de 10 m). X Y U 20 20 160 40 120 80 80 120 40 20 180 40 140 80 100 120 60 20 20 60 160 80 120 120 80 20 40 60 180 80 140 120 100 20 60 60 20 100 160 120 120 20 80 60 40 100 180 120 140 20 100 60 60 100 20 140 160 20 120 60 80 100 40 140 180 20 140 60 100 100 60 140 20 40 160 60 120 100 80 140 40 40 180 60 140 100 100 140 60 40 20 80 160 100 120 140 80 40 40 80 180 100 140 140 100 40 60 80 20 120 160 140 120 40 80 80 40 120 180 140 140 40 100 80 60 120 28.35 26.77 27.13 29.93 26.46 24.

conseqüentemente. Os histogramas. considerada uma baixa variabilidade dos dados em torno do valor médio.UFU/FAMAT Geoestatística Básica e Aplicada Solução: a) Análise descritiva As estatísticas e o histograma da variável umidade foram: Verifica-se que este solo apresentou.50 g/100g se concentram na parte superior da malha.020 g/100g.7%. Dr. 24 g de água/100g de solo. mostram que os dados se distribuem segunda a curva normal. Ednaldo Carvalho Guimarães . com desvio padrão de 2. associado à assimetria e à curtose dos dados. considerando o eixo Y como referência e. Não é possível visualizar tendência de distribuição dos dados nas direções preferencias da malha. mostram tendência de que os valores mais altos de umidade (acima de 27. ou seja. As posições ocupadas pelos valores de umidade do solo na área experimental (figura abaixo). 48 Prof. mostrando uma distribuição espacial não aleatória dos dados. umidade média de 26. os valores abaixo de 27.50 g/100g) se concentrem na metade inferior da malha. na época de coleta. provavelmente exista uma isotropia na distribuição da umidade do solo nesta área. o que representa uma variabilidade de 7.

63%. ou seja.UFU/FAMAT Geoestatística Básica e Aplicada b) Análise do semivariograma O semivariograma desta variável é: Nota-se que a variável umidade do solo apresenta dependência espacial. Dr. 49 Prof. amostras de umidade do solo selecionadas a distâncias inferiores a 81 m estão correlacionadas entre si. A relação entre o efeito pepita e o patamar de 13. indica que a dependência espacial é forte. Ednaldo Carvalho Guimarães . que pode ser descrita pelo modelo exponencial com alcance de 81 m.

. portanto temos a média aritmética simples. nos locais t1. tn.. A melhor estimativa de z*(t0) é obtida quando: a) o estimador é não tendencioso E{z * (t 0 ) − z (t 0 )} = 0 b) a variância da estimativa é mínima Var[ z * (t 0 ) − z (t 0 )] = mínimo Para que z* seja uma estimativa não tendenciosa de z. z(tn) da variável Z(t). Dr.. . Para a aplicação da krigagem assume-se: que sejam conhecidas as realizações z(t1). Observação: Se existe a dependência espacial. O valor estimado z*(t0) é dado por: z * (t 0 ) = ∑ λ i z (t i ) i =1 n em que: n é o número de amostras de Z(t) envolvidas na estimativa de z*(t0). e λi são os pesos associados a cada valor medido.. z(ti). ou seja. Krige. na estimativa de dados e posterior mapeamento da variável. G. t2. e que o interesse seja estimar um valor z* na posição t0. a soma dos pesos das amostras tem que se igualar a 1.UFU/FAMAT Geoestatística Básica e Aplicada 5.. que o semivariograma da variável já tenha sido determinado. Se ocorre a independência espacial. O nome krigagem é uma homenagem ao engenheiro sul-africano D. Ednaldo Carvalho Guimarães . ∑λ i =1 50 Prof.. O interpolador O semivariograma é a ferramenta da geoestatística que permite verificar e modelar a dependência espacial de uma variável.1. Uma aplicação imediata do semivariograma é a utilização das informações geradas por ele na interpolação. KRIGAGEM 5. . O interpolador que utiliza o semivariograma em sua modelagem é chamado de krigagem. os pesos λi são variáveis de acordo com a distância entre o ponto a ser estimado z*(t0) e os valores z(ti) envolvidos nas estimativas. z(t2). então : λi = 1/n e.

Em notação matricial. t 2 ) . . t n ) 1 1 1 γ (t1 . λ=  . γ (t1 .. t 2 ) .. portanto: λ=A-1b A variância da estimativa (σE2) e dada por: σE2 = btλ As matrizes A. t i =1 i i n j ) + µ = γ (t i . chamando de A a matriz das semivariâncias dos valores amostrados envolvidos na estimativa de z*(t0). t1 )  1  γ (t1 .. t 0 )  1  0    λ1  λ   2 .    1 γ (t n . λ a matriz coluna que contém os pesos λi e o multiplicador de Lagrange e b a matriz coluna das semivariâncias entre os valores amostrados e o ponto a ser estimado.. t 0 ) em que: µ é o multiplicador de Lagrange.    λ n  µ    51 Prof.    . tem-se: Aλ=b E. A variância de estimativa é dada por: 2 σE = µ + ∑ λ i γ (t i . t 0 )  γ (t .. t1 ) γ (t . t )  1   2 0    .  . t )  2 1 .UFU/FAMAT Geoestatística Básica e Aplicada E para obter a variância mínima sob a condição de ∑λi = 1. .  . b e λ são: γ (t1 . t 0 ) O sistema de equações da krigagem contém n+1 equações e n+1 incógnitas e uma única solução produz n pesos λ e um multiplicador de Lagrange µ..γ (t n . .  . Ednaldo Carvalho Guimarães ..  γ (t n . t n ) γ (t 2 .  . γ (t n . introduz-se o multiplicador de Lagrange para a dedução das equações e o sistema de krigagem resultante é: ∑ λ γ (t ..    .  . b=  .. γ (t 2 . Dr. t 2 ) .. . . t n ) .  A= . .

Ednaldo Carvalho Guimarães . ii) Os valores 1 que aparecem nas matrizes A e b são conseqüência do multiplicador de Lagrange. A krigagem no programa GS+ A Figura 20 mostra a janela da krigagem no GS+. tendo como resultado a Figura 21. Dr. Para ativar a krigagem basta ativar o ícone com a letra k. sendo necessário para isto. 5. Krigagem no GS+ A krigagem pode ser expressa por meio de mapas. ou igual ao valor do efeito pepita.2. ativar o ícone map. 52 Prof.UFU/FAMAT Geoestatística Básica e Aplicada Observações: i) A matriz A é simétrica e possui diagonal principal igual a zero. iii) O sistema deve ser resolvido para cada estimativa z* e para cada variação do número de amostras envolvidos na estimativa. Informações sobre a malha Validação cruzada Método de krigagem Modelo de semivariograma Arquivo e tipo de arquivo para gravar a krigagem vizinhos Figura 20.

os valores krigados. Dr.UFU/FAMAT Geoestatística Básica e Aplicada Figura 21. os resultados apresentam com as coordenadas (x. Solução: Como exemplo de saída dos resultados da krigagem temos uma pequena parte dos resultados da krigagem. Opções de mapas no GS+ Exemplo: Utilizando os dados no exemplo de umidade do solo (exemplo 4) fazer a krigagem e o mapeamento da variável umidade. 53 Prof. Ednaldo Carvalho Guimarães . os desvios padrão desses valores e o número de vizinhos utilizados na estimativa.y).

Dr.UFU/FAMAT Geoestatística Básica e Aplicada O mapa da umidade do solo é apresentado a seguir: Neste mapa são apresentadas as regiões de ocorrência das umidades do solo. 54 Prof. Ednaldo Carvalho Guimarães .

.Z 1( t 1i ) }2 B 2 1 E { Z 2 ( t 2j + h) ...Z 2 ( t 2j )]} 2 55 Prof. a umidade relativa do ar está intimamente relacionada à precipitação pluviométrica.1... Assumindo que pelo menos a hipótese intrínseca está sendo atendida para cada variável individualmente e para a distribuição conjunta das variáveis.. entretanto se sabemos que existe uma outra variável de simples determinação e que apresenta boa correlação espacial com a de difícil determinação pode-se fazer a estimativa de uma delas usando-se informações de ambas expressas no semivariograma cruzado. Na natureza é comum encontrar variáveis que estão fortemente associadas entre si. Ednaldo Carvalho Guimarães . mas que o número de amostras de Z1 seja superior ao número de amostras de Z2 (n1 >n2). Consideremos duas variáveis {Z1(t1i).UFU/FAMAT Geoestatística Básica e Aplicada 6. trabalhando com a idéia de covariável. j=1. SEMIVARIOGRAMA CRUZADO E COKRIGAGEM 6. por meio do método chamado co-krigagem. Dr.n2}. Estaremos. i=1. neste caso. com as amostragens feitas no mesmo espaço (área ou tempo).Z 2 ( t 2j ) }2 C 2 ii) O semivariograma cruzado entre Z1(t1i) e Z2(t2i). por exemplo.. podemos definir os semivariograma individuais e os semivariogramas cruzados como: Ai) Os semivariogramas de Z1(t1i) e Z2(t2j): γ 11(h) = γ 22 (h) = 1 E { Z 1( t 1i + h) .n1} e {Z2(t2j). Em algumas situações a determinação de variáveis é cara e difícil e isto pode comprometer o estudo da variabilidade espacial daquela variável.. igual ao semivariograma cruzado entre Z2(t2j) e Z1(t1i): γ 12 (h) = γ 21( h ) = D 1 E {[ Z 1( t 2i + h) . Semivariograma cruzado Os semivariogramas cruzados objetivam descrever a variação espacial e/ou temporal simultânea de duas variáveis aleatórias.Z 1( t 1i )][ Z 2 ( t 2j + h) .

está à falta de correlação entre as duas variáveis. semivariância crescente para pequenas distâncias. então é possível utilizar a co-krigagem para estimar valores. Pode-se notar que o semivariograma é um caso particular do semivariograma cruzado. 56 Prof. isto é. e as informações excedentes não são consideradas no cálculo. deve aproximar-se do valor da covariância entre as duas variáveis. quando as duas variáveis são idênticas. Já o patamar do semivariograma cruzado. ao contrário do semivariograma. Uma vez que exista a dependência espacial para cada uma das variáveis Z1 e Z2. conseqüentemente. quando as duas variáveis forem de correlação inversa. com significados diferentes. e que também exista dependência espacial entre Z1 e Z2. deva ser nulo. se existir. a semivariância pode ser estimada por: 1 n(h) ∑ [ Z 1( t 1i + h) . patamar definido.Z 1( t 1i )][ Z 2 ( t 2j + h) . Assim. acumulado no mesmo parâmetro. quando aumenta uma a outra diminui. Dr. pelo simples fato de envolver o produto das diferenças de duas variáveis diferentes. o semivariograma cruzado será negativo. necessariamente. definidos para os mesmos locais. além de espaços menores do que à distância de amostragem. Um semivariograma cruzado com características que podem ser identificadas como ideais.Z 2 ( t 2j )] E γ 12 (h) = 2n(h) i=1 onde n(h) é o número de valores de Z1 e Z2 separados por um vetor h. Por exemplo. O alcance aqui representa apenas o final ou a distância máxima de dependência espacial entre as variáveis. não é obvio que o valor do semivariograma cruzado para h=0. teria aparência do semivariograma simples (de uma única variável. Isto significa que Z1 e Z2 tem que ser. a covariância será negativa e. O semivariograma cruzado só será calculado usando as informações existentes para posições geográficas coincidentes. ou seja. 6. Ednaldo Carvalho Guimarães . modelo esférico). Os modelos utilizados para o semivariograma cruzado são os mesmos já discutidos para o semivariograma simples. porém.2. Assim.UFU/FAMAT Geoestatística Básica e Aplicada Portanto. Co-krigagem A krigagem é um caso particular do método co-krigagem.

complicando um pouco mais a situação. qualquer que seja a distribuição dos pesos. respectivamente. neste caso. a álgebra envolvida. por conseguinte. e que a estimativa deva ser uma combinação linear de ambos Z1 e Z2. Para que a estimativa não tenha tendência. é necessário que ele não superestime nem subestime valores. e por isto envolve equações mais longas. Z2*. ele não pode ter tendência e tem que ter variância mínima. Porém. para que o estimador seja o melhor possível. tem que ser nula. n z* 2 (t0 )= ∑ 1 n i= 1 λ 1i z 1( t 1i ) + ∑ 2 i= 1 λ 2j z 2 ( t 2j ) F onde n1 e n2 são os números de vizinhos de Z1 e Z2. em termos de semivariograma fica: 57 Prof. e assumindo estacionaridade de ordem 2. usando a hipótese de estacionaridade de ordem 2. ou seja. o raciocínio e. respectivamente. e a soma daquelas associadas à outra variável. Assim. O sistema co-krigagem e a variância da estimativa podem ser escritos em termos de semivariograma. Ednaldo Carvalho Guimarães . envolve duas variáveis. com uma diferença que. O raciocínio básico para dedução do sistema de equações da co-krigagem é idêntico ao da krigagem. e que a confiança nas estimativas seja máxima. para qualquer local. Z1(t1i) e Z2(t2i).UFU/FAMAT Geoestatística Básica e Aplicada Suponha que se queira estimar valores. o estimador pode ser reescrito em: Z* 2 (to )= n1 ∑ i= 1 λ 1i Z 1( t 1i ) + n2 ∑ i= 1 λ 2j Z 2 ( t 2j ) G Para que o estimador seja ótimo. Tomando z1(t1i) e z2(t2i) como sendo uma realização das funções aleatórias. o sistema da cokrigagem. e λ1i e λ2j são os pesos associados a cada valor de Z1 e Z2. a soma daqueles associados com a variável estimada deve ser igual a 1. com subscritos. Em outras palavras. t0. Dr. são o mesmo.

.µ1 = = γ 12 ( t 1k .. Ednaldo Carvalho Guimarães . k = 1..t 0 ).. n1 H n1 ∑ i=1 λ1i γ12 ( t 1i .t 2j ) .. l = 1.t 1k ) + n2 ∑ j=1 λ 2j γ 12 ( t 1k ..t 0 ).UFU/FAMAT Geoestatística Básica e Aplicada n1 ∑ i= 1 λ 1i γ 12 ( t 1i .t 2l ) + n2 ∑ j=1 λ 2j γ 22 ( t 2j . µ1 e µ2.µ 2 = = γ 22 ( t 2l .t 2l ) . [ λ ] [ γ ] = [b] K cuja solução é n1 n2 58 Prof.t 0 ) + ∑ λ 2j γ 22 ( t 2j .t 0 ) J i= 1 j =1 2 A solução do sistema da co-krigagem produzirá n1 pesos λ1i e n2 pesos λ2j e os multiplicadores Lagrangeanos. n2 I N1 ∑ i=1 λ1i = 0 N2 ∑ j=1 e a variância da estimativa fica: λ 2j = 1 σ k 2( t 0 ) = µ 1 + µ 2 + ∑ λ 1i γ 12 ( t 1i . Dr. O sistema da co-krigagem pode ser escrito em notação matricial como.

t 22 ) 1 0 γ12 ( t 13 . t 22 ) γ12 ( t 13 . t 11 ) γ11 ( t 13 . t 21 ) γ12 ( t 13 . t 13 ) γ11 ( t 14 . Suponha então que o número de vizinhos de Z2 usados seja n2=2. e [b] é o lado direito do sistema de equações (semivariância do ponto a ser estimado (t0) e o ponto observado (t12 ou t21)). t 12 ) γ11 ( t 14 . t 12 ) γ11 ( t 13 . t 21 ) γ12 (t11 . Ednaldo Carvalho Guimarães . t 22 ) γ12 ( t 14 . t 22 ) 1 0 γ12 (t12 . t 14 ) γ12 ( t 14 . t 13 ) γ11 ( t 12 . [λ] é a matriz dos pesos procurados. t 21 ) γ 22 ( t 22 . λ1i e λ2j. e de Z1. t 22 ) 1 0 γ12 ( t 11 . t11 ) γ11 ( t12 . t 22 ) 1 0 γ11 ( t 11 . A matriz [γ] será então de 8x8 e pode ser escrita como: γ11 ( t 11 . t 14 ) γ11 ( t 12 . t 21 ) γ 22 ( t 21 . Dr. t 13 ) γ12 ( t 11 . t 11 ) γ11 ( t 13 . A variância da estimativa pode ser escrita como: t σ 2 k2 ( t 0 ) = [ λ ] [b] M onde [λ]t é o transposto da matriz [λ]. t 21 ) γ12 ( t 14 . t 11 ) γ11 ( t 14 .UFU/FAMAT Geoestatística Básica e Aplicada -1 [ λ ] = [ γ ] [b] L onde [γ]-1 é o inverso da matriz de coeficientes [γ]. t 21 ) γ12 ( t 14 . t 21 ) γ 22 ( t 21 . t 22 ) 0 1 1 0 1 0 1 0 0 1 0 0 0 1 0 0 A matriz [λ] poderá ser escrita como λ 11 λ 12 λ 13 λ 14 [λ ] = λ 21 λ 22 µ1 µ2 59 Prof. t 22 ) 0 1 γ12 ( t 11 . t 13 ) γ12 ( t 11 . t 21 ) γ12 ( t 12 . t 22 ) γ 22 ( t 22 . t 21 ) γ12 ( t 12 . t 14 ) γ12 ( t 12 . t 12 ) γ11 ( t 11 . n1=4. t 14 ) γ11 ( t 14 . t 12 ) γ11 ( t 12 . t 21 ) γ12 ( t 13 . t 22 ) 1 0 γ11 ( t 13 .

t 0 ) γ12 ( t 14 . t 0 ) γ 22 ( t 22 . menor a variância da estimativa ou maior a confiança que se pode ter na estimativa.UFU/FAMAT Geoestatística Básica e Aplicada N A matriz [b] do lado direito fica. nota-se que são apenas indiretamente dependentes dos valores medidos. t 0 ) γ12 ( t 12 . Dr. o semivariograma e semivariogramas cruzados. pode-se conhecer também a variância da estimativa. t 0 ) [b] = γ12 ( t 13 . as quais podem ser chamadas de ótimas. será máxima 60 Prof. Isto porque. t 0 ) 6. Examinando-se as equações relativas aos cálculos das variâncias da estimativa de krigagem e co-krigagem.3. através da krigagem ou da co-krigagem. Obviamente. Variância da estimativa O simples fato de que. diferencia-os de qualquer outro método. t 0 ) γ 22 ( t 21 . além de permitir a estimativa de valores sem tendência para os locais onde estes não foram medidos. menor será a variância da estimativa. representam a maneira como a variável regionalizada varia de um local para o outro no espaço. γ12 ( t 11 . e os pesos são conseqüências deste fato. Ednaldo Carvalho Guimarães . Quanto menor for o efeito pepita do semivariograma. Esta é uma propriedade interessantíssima. quanto menor for a proporção do efeito pepita para o patamar do semivariograma. respectivamente. uma vez que se conhece o semivariograma de uma propriedade. Porém. pois. qualquer tipo de esquema de amostragem pode ser desenhado para variâncias da estimativa pré-especificadas. Mais precisamente. ainda se pode conhecer a confiança associada a estas estimativas. maior a continuidade do fenômeno. a variância da estimativa sendo uma função da distância ou distribuição espacial das amostras.

o que não é sempre fácil. mostrando a variância da estimativa. krigagem ou co-krigagem. Assim. Dr. amostragens definitivas podem ser desenhadas para satisfazer condições pré-especificadas. a variância da estimativa é extremamente sensível à forma do semivariograma ou semivariograma cruzado. com maiores valores onde o ponto estimado é mais distante. A localização ideal de uma rede de pluviômetros em bacias hidrográficas constitui um exemplo prático desse procedimento. Com esta vantagem em mente. uma vez que a variância da estimativa é uma função indireta da distância dos vizinhos ao redor do local da estimativa. em densidades de amostragem bem diferentes. ambos.UFU/FAMAT Geoestatística Básica e Aplicada nos locais mais distantes de valores medidos. Qualquer que seja o método. quando as variáveis são amostradas em espaçamentos diferentes. ilustra este ponto suficientemente bem. 61 Prof. Para estes pontos. Ednaldo Carvalho Guimarães . Baseado na discussão acima. A principal complicação é que neste caso. depende-se de três correlações espaciais (de cada variável. então em amostragens tomadas em distâncias regulares no reticulado quadrado. haverão pontos onde apenas a variável auxiliar foi medida. pode-se desenhar esquemas de amostragem que envolvam ambas as variáveis. de acordo com o grau de dependência espacial encontrado e a dificuldade de medição. uma coleção de círculos. O mesmo pode também ser utilizado através da co-krigagem. Entretanto. simplesmente. para que se possa visualizar os locais onde a confiança na estimativa é limitada ou é suficiente. Entretanto. o mapa da variância tem pouca utilidade e o exame de células compostas de vizinhos fechando o primeiro polígono em volta do valor estimado. Nesses casos. quase sempre a variância da estimativa da co-krigagem é melhor do que a da krigagem. o mapa de isolinhas ou tridimensional de uma variável usando valores estimados através de um dos métodos geoestatísticos deve ser sempre acompanhado pelo mapa correspondente da variância da estimativa. baseado em semivariogramas de variáveis medidas em caráter de reconhecimento. o mapa da variância da estimativa será. com algumas complicações e vantagens. e entre elas). individualmente.

cada um com vantagens e desvantagens como será discutido em seguida. apresentando semivariogramas que podem ser agrupados em um único. deve-se levar em conta o ganho de precisão em relação ao aumento de tempo de computação. A razão para tanto reside no alcance do semivariograma. em termos de número de amostras disponíveis tiver tamanho razoável. pois os pesos associados a vizinhos separados por distâncias maiores do que o alcance. a matriz invertida pode ser arquivada no computador e usada quantas vezes for necessário. pelas respectivas variâncias. 62 Prof. Outro ponto importante é que. pode-se usar o procedimento chamado vizinhança única. é necessário que o semivariograma seja definido até a maior distância existente no espaço. Qualquer que seja o critério usado para a escolha do método. relativo à quantidade de memória e tempo de processamento disponíveis no computador. Dr. Deve-se sempre lembrar que a decisão de se usar vizinhança única basea-se em sua praticidade relativa ao tamanho do conjunto de dados e não na precisão obtida na estimativa. Como exemplo pode-se incluir umidade do solo amostrada em pequenos espaços de tempo. não devem ter contribuição significativa no valor estimado.UFU/FAMAT Geoestatística Básica e Aplicada 6.4 Número de vizinhos das estimativas A vizinhança usada na estimativa torna-se um ponto de extrema importância na krigagem. Ednaldo Carvalho Guimarães . Desse modo. então as estimativas podem ser feitas para qualquer espaçamento com um pequeno consumo de tempo de processamento de computador. Existem algumas variáveis que. Vários são os métodos que podem ser utilizados para a determinação do número de vizinhos na estimativa. desde que não mude o modelo do semivariograma e distribuição dos pontos amostrados no espaço. preservam entre si a maneira como variam no espaço. Neste procedimento todos os valores medidos são considerados vizinhos e serão utilizados na estimativa. uma vez invertida a matriz de coeficientes. a) Vizinhança única Quando o tamanho do conjunto de dados. Nesse caso então. quando divididos individualmente. para se usar vizinhança única. embora mudem as magnitudes de variação. A vantagem deste método reside no fato que.

o número encontrado for maior do que o limite. apenas o número especificado mais próximo será usado. Por outro lado. para cada ponto estimado é selecionada uma vizinhança constando de todos os vizinhos localizados dentro de um circulo de raio especificado. e o processo é reiniciado. Se o número de vizinhos encontrados for menor do que o limite especificado. b) Distância constante Neste método. 63 Prof. pôr outro lado. Para tanto. Devido as amostragens regulares serem as mais usadas e as facilidades inerentes deste método. Ednaldo Carvalho Guimarães . em situações em que a amostragem foi efetuada em espaçamentos regulares. c) Número constante de vizinhos Um outro método bastante usado é o que mantém constante o número de vizinhos em qualquer posição no campo. Conseqüentemente. Dr. a distância sobre a qual se procura vizinhos varia sobre o campo. isto pode se tornar um problema se exceder o valor usado na dimensão das matrizes. fazem dele o mais comumente usado. primeiramente dentro de um raio inicial. nos cantos de um campo retangular ocorre 1/4 de círculo.UFU/FAMAT Geoestatística Básica e Aplicada as vantagens da vizinhança única aumentam porque modelos de semivariograma escalonados podem ser usados para obter pesos comuns a todas as variáveis. com 1/4 do número de vizinhos. a distância de procura por vizinhos não muda muito e as desvantagens deste método são minimizadas. Isto é particularmente importante porque se pode limitar o uso do semivariograma quanto à distância sobre qual ele será calculado. Obviamente. Se. o número de vizinhos pode mudar bastante ao longo do campo. as vantagens deste método são as desvantagens do anterior (distância constante) e vice-versa. A grande vantagem deste método está no fato que se conhece exatamente a distância na qual os vizinhos para estimativa são procurados. a distância é incrementada. Porém. Conseqüentemente. fazendo com que o tamanho do sistema matricial seja variável. Em termos de programação de computador. vizinhos são procurados.

Deve-se ressaltar que se faz as análises individuais das variáveis e depois a análise conjunta. Muitas vezes quando não se impõe esta restrição. de todas as direções. e também o problema de que nunca se sabe qual a distância na qual os vizinhos se localizam. da cokrigagem e no mapeamento da variável. Os procedimentos gerais da análise de semivariogramas cruzados e de co-krigagem segue os mesmos procedimentos das análises simples. Dr. Porém. Ednaldo Carvalho Guimarães . Por estas razões este método apresenta mais problemas do que vantagens. correlação espacial. O uso do programa GS+ na determinação do semivariograma cruzado. utilizar tendenciosamente sempre um número maior de vizinhos de um lado do que de outro. isto ainda apresentaria problemas nos cantos e extremidades da área. 6. suponha que a variável Z1 teve uma subamostragem em relação a Z2 e que elas apresentam semivariogramas definidos isoladamente e que também apresentem distribuição espacial conjunta. ou seja.UFU/FAMAT Geoestatística Básica e Aplicada d) Quadrantes Uma alternativa interessante e bastante fundamentada em termos geoestatísticos é usar um número especificado de vizinhos em cada quadrante ao redor do valor a ser estimado. pode-se despercebidamente. o que fará com que a estimativa receba contribuição semelhante em número. então podemos proceder a análise do semivariograma cruzado e da co-krigagem. Temos duas variáveis aleatórias Z1 e Z2. 64 Prof.5. O arquivo de dados terá aspecto apresentado na Figura 19. O fundamento reside na distribuição do número de vizinhos ao redor do valor estimado.

semivariogramas simples. Aspecto geral do arquivo de dados para a co-krigagem. 65 Prof. krigagem/co-krigagem e mapas. Z2 Semivariograma da variável 1 Semivariogram a da variável 2 Krigagem e cokrigagem Semivariograma Cruzado Mapas Figura 20. As Figuras 20. Ícones ativos nas análises descritivas. Ferramentas de análises descritivas das variáveis Z1. 21 e 22 mostram os procedimentos básicos para se trabalhar com semivariogramas cruzados e co-krigagem. Dr. Ednaldo Carvalho Guimarães .UFU/FAMAT Geoestatística Básica e Aplicada Figura 19. semivariogramas cruzados.

UFU/FAMAT Geoestatística Básica e Aplicada Figura 21. Janela para realização da co-krigagem 66 Prof. Janela para a análise do semivariograma cruzado Figura 22. Ednaldo Carvalho Guimarães . Dr.

95 45.00 40.00 30.00 0.00 50.00 40.00 60.00 60.53 20.31 53.66 13.03 52.00 20.UFU/FAMAT Geoestatística Básica e Aplicada 6.37 52.00 70.30 47.56 52.11 47.00 40.00 20.00 40.00 50.86 56.00 70.00 30.89 15.00 30.19 48.00 20.91 10.00 20.98 45.65 11.39 46.00 40.00 60.00 0.00 40.70 45.00 20.91 26.00 30.35 53.04 57.00 50.79 18.23 40.00 60.00 30.61 35.26 49.42 24.67 24.00 60.00 0.51 57.88 20.47 25.00 10.00 50.00 macro usat 16.00 50.79 18.26 49.07 40.00 40.81 49.65 45.00 10.80 22.00 50.84 50.89 18.00 60.00 50.00 20.00 0.00 0.14 28.44 54.00 70.89 37.00 20.38 28.00 50.00 30.00 70.00 0.00 10.90 40.00 30.06 45.00 20.29 58.00 20.14 44.00 0.00 61.00 20.29 26.59 53.85 59.00 40.00 40.00 20.00 70.00 40.45 14.00 60.64 22.00 40.00 30.14 28.00 50.72 43.04 55.00 70.98 25.40 21.60 54.59 29. x 0.01 22.06 52.18 59.20 27.00 20.29 46.00 10.30 25.00 60.11 33.00 10.00 30.00 70.21 46.00 60.00 70.67 46.00 20.00 60.00 70.6. Dr.39 43.00 60.00 70.00 10.00 60.43 x 40.00 50.90 65.01 14.00 30.00 10.27 59.82 22. Ednaldo Carvalho Guimarães .91 51.00 70.00 40.55 44.00 10.00 0.00 70.16 52.00 y 0.69 29.94 51.72 48.52 37.00 60.65 56.00 macro Usat 24.27 58.00 50.55 43.00 40.00 10.50 56.88 25.03 14.00 70.49 63.00 50.00 40.00 60. Exemplo de aplicação no GS+ Suponha que os seguintes dados represente as observações de macroporosidade e de umidade de saturação em uma determinada área.00 10.00 0.00 0.62 47.00 30.85 67 Prof.23 57.00 10.89 54.55 53.00 20.15 25.00 10.00 70.32 16.15 50.45 24.00 20.00 50.00 30.00 10.00 60.00 70.55 23.00 y 0.37 30.44 17.08 23.00 40.00 10.00 0.00 30.16 25.00 10.00 40.89 50.00 10.00 30.00 0.00 0.18 52.00 50.00 50.00 20.34 13.20 45.00 30.00 50.00 60.94 55.00 70.00 30.62 49.07 21.

98 26. portanto.41 12. Dr. Os coeficientes de assimetria e de curtose mostram tendência simétrica e mesocúrtica das variáveis. 68 Prof. de Assimetria Coef. de Curtose 64 50. obteve-se um coeficiente de correlação linear (r) de 0. usando como covariável a USat.68 -0. Verifica-se que a umidade de saturação apresenta maior uniformidade (menor CV) do que a macroporosidade.UFU/FAMAT Geoestatística Básica e Aplicada Faça a análise da macroporosidade usando como covariável a umidade de saturação.31 Atributos MACRO (%) 45 22.02 -0. Analisando a relação linear entre a macroporosidade e a unidade de saturação.54 6. portanto.9132. Estatísticas Usat (%) n Média Desvio Padrão Coef.57 -0.02 -0. de Variação Coef. estimativas da macroporosidade podem ser feitas com base na umidade de saturação. indicando que existe uma forte associação positiva entre macroporosidade e umidade de saturação e.50 5. Ednaldo Carvalho Guimarães . Solução: A análise descritiva geral para as variáveis analisadas é apresentada na Tabela abaixo. Análise descritiva dos atributos umidade de saturação do solo (USat) e macroporos (MACRO).33 As Figuras mostram os semivariogramas individuais para as variáveis umidade de saturação (USat) e macroporos e o semivariograma cruzado da MACRO. pode-se considerar tais variáveis com distribuição de probabilidade aproximadamente normal.

Para a umidade de saturação ajustou-se o modelo exponencial com alcance da dependência espacial de 34. Semivariograma cruzado da macro em função da umidade de saturação.0 m.59 (%)². efeito pepita de 6.UFU/FAMAT Geoestatística Básica e Aplicada Semivariograma para a umidade de Semivariograma para a macroporosidade do solo saturação do solo (USat). Dr. como uma co-variável para a estimativa da macroporosidade. E para o semivariograma cruzados as estimativas dos parâmetros do modelo exponencial foram: alcance de 23. a correlação espacial deve ser considerada para a realização das estimativas.49 (%)² e patamar de 38.20 m.7 (%)². efeito pepita de 9. provocou alteração no alcance da dependência espacial. 69 Prof. com alcance de 45. Para a macroporosidade (MACRO) o modelo adotado foi o esférico.08 (%)².97 (%)² e patamar de 34. efeito pepita de 19.40 m. A alteração do alcance pode estar relacionado aos modelos individuais diferenciados.70 (%)² e patamar de 38. Ednaldo Carvalho Guimarães . mas ainda assim verifica-se que. Verifica-se que a utilização da umidade de saturação.

Recomenda-se que se ajuste vários modelos e que seja selecionado o que melhor se adeque aos seguintes critérios: a) O gráfico 1:1 . Mapa da macroporosidade do solo usando Mapa da macroporosidade do solo. mas geralmente é feito "a sentimento". Z*(ti) e calcular a regressão linear entre eles. A regressão será então: 70 Prof.UFU/FAMAT Geoestatística Básica e Aplicada As Figuras a seguir mostram os mapas da macroporosidade do solo. Z*(ti). VALIDAÇÃO DE MODELOS DE SEMIVARIOGRAMAS O ajuste do semivariograma. estima-se um valor através da krigagem (ou da co-krigagem).Medido vs Estimado Se para cada um dos n locais onde se tem um valor medido Z(xi). construídos a partir da krigagem e da co-krigagem. com base no semivariograma individual e cruzado. Devido ao processo de estimativa por co-krigagem algumas regiões são subestimatadas e outras regiões são superestimadas. ou seja. Para este tipo de ajuste podemos utilizar algumas técnicas chamadas de validação cruzada ou de auto validação para selecionar o semivariograma adequadamente. 7. então poder-se-á fazer um gráfico dos valores pareados de Z(ti). como já comentamos. Ednaldo Carvalho Guimarães . usando semivariograma individual semivariograma cruzado Verifica-se coincidência relativamente alta entre as áreas de ocorrência da macroporosidade. é um procedimento que fica a critério do pesquisador. Dr.

Ednaldo Carvalho Guimarães . Assim. e o gráfico de Z(xi) vs Z*(xi) seria uma série de pontos na linha 1:1.Z( xi ) ) } = mÍnima Q Se estas condições não forem satisfeitas. pode-se então dizer que: EA = E {EA( xi )} = E { Z* ( xi ). isto indica que estimador Z*(xi) está superestimando valores pequenos de Z(xi) e subestimando valores grandes. Na medida em que os valores de a aumentam de 0 (zero) para valores positivos. Este último caso. b é o coeficiente angular da reta e r2 é o coeficiente de correlação entre Z*(xi) e Z(xi).Z( xi )} = 0 P e VAR( EA ) = E {( Z* ( xi ). b e r2 seriam iguais à unidade (um). a equação é bastante difícil de ser verificada porque o conceito de ser mínimo torna-se subjetivo quando não se tem uma referência. não é comum. Dr. o contrário acontece. À medida que a decresce de 0 (zero) para valores negativos. se a estimativa (Z*(xi)) fosse idêntica ao valor medido (Z(xi)). então alguma das condições previamente assumidas estará sendo violada. então a seria nulo. porém.UFU/FAMAT Geoestatística Básica e Aplicada Z* ( t i ) = a + b Z( t i ) onde a é a intercessão. a qualidade da estimativa pode ser medida pelo julgamento destes parâmetros. 2 71 Prof. O procedimento seguinte pode contribuir nesse sentido. nos erros absolutos. Z(xi) e Z*(xi). Desse modo. então pode-se definir o erro absoluto como: EA( xi ) = Z* ( xi ).Z( xi ) O Aplicando-se as condições de não tendência e de variância mínima. Porém. b) O erro absoluto Uma vez que se tem o conjunto de n valores medidos e estimados.

UFU/FAMAT

Geoestatística Básica e Aplicada

c) Erro reduzido

Lembrando que no cálculo dos valores estimados, Z*(xi), sempre se tem a variância da estimativa, σ2k(ti), então pode-se definir o erro reduzido como: ER( t i ) = ( Z* (t i ) - Z( t i ))/ σk ( t i ) R

A divisão pela raiz quadrada da variância da estimativa faz com que os ER(ti) sejam sem dimensão e que, por isso, as condições de não tendência e de variância mínima, requeiram que: ER = E {ER( xi )} = E {( Z* ( xi )- Z( xi )) / σ k ( xi )} = 0 S e VAR( ER ) = E {( Z* ( xi )- Z( xi )) / σ k ( x0 ) } = 1 T
2

Estas propriedades fazem deste tipo de erro uma valiosa ferramenta e de fácil uso, nas aplicações de geoestatística. O fato de terem valores ideais fixos em 0 (zero) e 1 (um), e de serem sem dimensão, facilita seu julgamento e estudo, e também permite sua comparação com outras situações expressas em unidades diferentes. A Figura 23 mostra uma saída da opção de validação cruzada apresentada pelo programa GS+. A validação cruzada é ativada na janela da Krigagem, conforme mostram a Figuras 20 e 22.

72

Prof. Dr. Ednaldo Carvalho Guimarães

UFU/FAMAT

Geoestatística Básica e Aplicada

Figura 23. Validação cruzada.

Note, neste caso, que a reta ajustada está praticamente igual a reta a 45º (Gráfico 1:1), o coeficiente de regressão (coeficiente angular) de 0,944 com erro padrão de 0,105 indica que este é estatisticamente igual a 1 e o y intercept (coeficiente linear) de 0,024 mostra que este pode ser considerado estatisticamente igual a zero, condições estas ótimas para as estimativas. O coeficiente de determinação (r2) de 0,39 é considerado relativamente baixo, mas devido ao grande número de observações e sabendo-se que este coeficiente é altamente influenciado pelo número de pares, podemos considera-lo como satisfatório. Também pode-se verificar, pelo gráfico, que os valores extremos é que estão mais afastados da reta e podemos associar isto ao fato do semivariograma geralmente apresentar melhores estimativas para distâncias curtas. A análise da validação cruzada deve ser feita com base em todos os parâmetros e não com base em parâmetros isolados.

73

Prof. Dr. Ednaldo Carvalho Guimarães

UFU/FAMAT

Geoestatística Básica e Aplicada

8. BIBLIOGRAFIA RECOMENDADA

BARTLETT, M.S. Nearest neighbour models in the analysis for field experiments (with discussion). Journal of the Royal Statistical Society. B, London, v.40, n.2, p.147-174, 1978. BRAGA, L. P. V. Geoestatística e aplicações. Minicurso do 9o Simpósio Brasileiro de Probabilidades e Estatística. IME. USP. São Paulo, 1990. 36 p. BURROUGH, P. A.; McDONNELL, R. A. Principles of geographical information systems. Oxford University Press, 331 p., 1998. BUSSAB, W. O.; MORETTIN, P. A . Estatística básica. 4a ed.. São Paulo : Atual, 1987. 321 p. CADIMA, Z. A.; LIBARDI, P. L.; REICHARDT, K. Variabilidade espacial da condutividade hidráulica em latossolo Vermelho Amarelo textura média, no campo. Revista Brasileira de Ciência do Solo, Campinas, v. 4, n. 2, p. 63-66, 1980. CAMERON, D. R. Variability of soil water retention curves and prepicted hydraulic conductives on a small plot. Soil Science. Baltimore, v.126, n.6, p. 364-71, 1978. COSTA NETO, P. L. Estatística. São Paulo: Edgard Blucher, 264 p., 1979. CRESSIE, N.; HARTFIELD, M.N. Conditionally specified gaussian model for spatial statistical analysis of field traits. Journal of Agricultural, Biological, and Environmental Statistics, Washington, v.1, n.1, p.60-77, Mar. 1996. DAVID, M. Geostatistical ore reserve estimation. Elsevier. New York, v. 8, 364 p., 1977. DUARTE, J.B. Sobre o emprego e a análise estatística do delineamento em blocos aumentados no melhoramento genético vegetal. 2000 293p. (Tese - Doutorado em Genética e Melhoramento de Plantas) – ESALQ-USP, Piracicaba. FREITAS, V. A. de. Análise de dados espaciais por meio de semivariogramas. Uberlândia. Monografia (Graduação em Matemática) – Universidade Federal de Uberlândia, 2000. 30p. GOMES, B. M. Comportamento espacial do percentil 75 da precipitação decendial do estado de São Paulo. Botucatu. Tese (Doutorado em Agronomia) – Universidade Estadual Paulista “Júlio de Mesquita Filho”, Faculdade de Ciências Agronômicas Campus de Botucatu, 2001. 101p. GOTWAY, C. A.; FERGUSON, R. B.; HERGERT, G. W.; PETERSON, T. A. Comparasion of kriging and inverse-distance methods for mapping soil parameters. Soil Science Society America Journal. v. 60, p. 1237 – 1247, 1996.

74

Prof. Dr. Ednaldo Carvalho Guimarães

v. The theory of regionalized variables and its applications. C. GUIMARÃES. Variowin – Software for spatial data analysis in 2D. 90 p. M. Inst. ROBERTSON. Ci. Piracicaba: Nobel.. Principles of geostatistics. ISAAKS. M. Plantes à Salonique. Variabilidade espacial do pH em água e da argila dispersa em água. p. 37. Economic Geology.. Campinas. 1971.11. LIBARDI. 11246-66. Dissertação (Mestrado em Engenharia Agrícola . R. OLIVEIRA. F. Method statistique pour des expériences sur champ. v. PIMENTEL GOMES. E. MARTINEZ. 19. de. McBRATNEY. Rio de Janeiro: Reichmann & Affonso Editores. 1-6. Y. 1986. v. AQUINO.1998. C. Revista Ciência e Prática. n. J. 152 p. Curso de estatística experimental. 1992. G. n. E. 2000.. VIEIRA. 75 Prof. Plainwell: Gamma Design Software.23. Variabilidade espacial de atributos de um Latossolo Vermelho Escuro textura argilosa da região do cerrado. Bull. 1993. 1. R. p. 1963. New York: Springer-Verlag. Dr.83-89. R. V. 1994. K. Campinas.Área de concentração: Água e Solo) . PANNATIER.. MATHERON. Variabilidade espacial da umidade e da densidade do solo em um Latossolo Roxo. 1996. Choosing functions for semivariograms of soil proprierties and fitting them to sampling estimates. G. University Press. p.. S. L. G. Agronomia Colombiana. H. L. Fontainebleau. Fas. E. PAPADAKIS. New York : Oxford LOPES. 135 p. Amélior. Control de la correlation especial en experiments de campo em el sector agricola. n.. Universidade Estadual de Campinas. 85 p. MATHERON. 1937.UFU/FAMAT Geoestatística Básica e Aplicada GUIMARÃES. P. GS+: geostatistics for the environmental sciences. A. submetido ao plantio direto e ao plantio convencional. 58. n. 1989. R. El Paso. Campinas. 1986. C. S.. FEAGRI/UNICAMP. Solo. Probabilidades e Estatística. p. H.1. Tese (Doutorado). SRIVASTAVA. C.1. 1999. Ednaldo Carvalho Guimarães . REICHARDT. 10.Faculdade de Engenharia Agrícola. WEBSTER. P. v. G. B. Variabilidade espacial de solos e experimentação de campo. Les Cahiers du Centre de Moffologie mathemathique. bras. Journal of Soil Science. SP. E. P. Applied Geostatistics.617-639. 5. p. GUIMARÃES. Lavras. 1995. 12-17. R.B. A.

1991. 2001. 3. v. mar. F.. R. R. Biometrics. In: XIII Congresso Latino-Amaericano de Ciência do Solo . n. Mapeamento da chuva diária máxima provável para o estado de São Paulo. VIEIRA. 38. v. Dissertação de mestrado. D. 75 p. Application of geostatistics to spatial studies of soil properties. ZEBCHUK. A random field approach to the analysis of fieldplot experiments and other special experiments. R. SP: SBCS/ESALQUSP.233-239. GUIMARÃES. TILLOTSON. F. TRIOLA. 1985. 1986. D.. A. 7a edição.1. Dr. W.. 45-93.1. WARRICK. S. v. Ednaldo Carvalho Guimarães . Advances in Agronomy. UEHARA. Hilgardia. W. B.. D. Águas de Lindoia.. VIEIRA.. 73 p. BIGGAR. HATFIELD. 1 e 2. DECHEN. Soil Science Society of America. R. In: Methods of soil analysis: part 1 – Physical and mineralogical methods. D. TOPP. n. v. 1996. J. G.. 1997. Variabilidade espacial de argila. NIELSEN. BIGGAR. TRAGMAR. Scaling of semivariograms and the kriging estimation of field-measured prorperties. R. Raleigh.21. 31. Geostatistical theory and application to variability of some agronomical properties. v. R. BURROWS. VIEIRA. Campinas. P.15. Curso de atualização em conservação do solo . R. MYERS.. G. 93-98. S. p.. silte e atributos químicos em parcela experimental de um Latossolo Roxo de Campinas (SP).. p. F.UFU/FAMAT Geoestatística Básica e Aplicada TEIXEIRA.Uso de geoestatística. S. C. ROCHETE.47. Berkeley. I. L. D. p. F. DE MARIA. n. W. v.. 1983. W.. Rio de Janeiro: LTC. S..A. P. S. das C. NIELSEN. p. 1999. E. LOMBARDI NETO. Introdução à estatística.. 56. M.. M. T. Revista Brasileira de Ciência do Solo.. R. 1991 76 Prof. Geostatistical methods applied to soil science. n. R. T01-053. Analise estatística espacial aplicada a um ensaio florestal.Resumos expandidos em CD-ROOM. UFLA. Viçosa. bras. S. D. Ci. HARVILLE. VIEIRA. J.1. YOST. J. I.. Campinas. Campinas. 1995. Bragantia.. n. C. NIELSEN. v. 1997. C. S. Solo. E. IAC. R. R. 4. ZIMMERMAN. VIEIRA. VIEIRA. 53-82. B..I. S. Analisando simultaneamente variabilidade espacial e temporal usando variogramas tridimensionais. C.

programas.uol.html http://musis.famat.br/ednaldo/ednaldo.sites.org/ 77 Prof.unesp.htm http://sc-terre-218. livros e outros assuntos de geoestatística: http://www.br/geo1.unil. Dr. Ednaldo Carvalho Guimarães .ai-geostats.htm http://www.ch/ http://www.ufu.com.rc.UFU/FAMAT Geoestatística Básica e Aplicada OBSERVAÇÃO: Página na internet para busca de artigos.br/igce/aplicada/landim.

You're Reading a Free Preview

Descarregar
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->