Você está na página 1de 27

Geoestatística: Fundamentos e

Aplicações
Prof. Paulo Augusto Ferreira Borges

Aula 03

1
1/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
2. Estatística

2.6 Distribuição Normal


A distribuição normal é a mais importante em todas as áreas de
aplicação da estatística. Na análise de dados geoespaciais, a
distribuição normal também é muito usada, pois a maioria das
variáveis contínuas segue esse modelo teórico e também por ser
uma distribuição muito conveniente por suas propriedades que são
matematicamente conhecidas.

Um fator importante para fins de interpolação de dados é a simetria,


propriedade importante, pois indica que há uma distribuição
equitativa dos dados em torno da média.

2/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
2. Estatística

2.6 Distribuição Normal


A figura abaixo mostra a distribuição de frequência normal
mostrando dados distribuídos igualmente nas duas caudas.

A distribuição normal combina a variação natural do sistema com os


erros aleatórios da observação, onde a média e a variância fundem
erros de medida com a variação inerente ao fenômeno estudado. 3/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
2. Estatística

2.6 Distribuição Normal


Muitas vezes, os dados não seguem uma distribuição normal, mas
após aplicação de uma transformação matemática, estes dados
passam a apresentar as características desejáveis, tais como
simetria na distribuição de frequências, com média igual a zero e
variância unitária.

Um método extremamente simples para transformação de dados é


denominado transformada escore normal (segundo Deutsch e
Journel, 1992, p. 138), em que não importa a forma da distribuição
inicial, pois a distribuição final será sempre normal com média zero
e variância igual a um.
4/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
2. Estatística

2.6 Distribuição Normal


Dizemos que uma v.a. contínua 𝑋 apresenta distribuição normal
quando a sua fdp (função densidade probabilidade) é dada por:
1 − 𝑥−𝜇 2
𝜙 𝑥 = ∙ 𝑒 2𝜎2
𝜎 2𝜋
com −∞ < 𝑥 < +∞
A função acima (identificada como equação de Gauss) fica
determinada mediante o conhecimento de dois parâmetros:
𝜇 = média da distribuição (número real);
𝜎 = desvio padrão (número positivo).

5/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
2. Estatística

2.6 Distribuição Normal


É comum utilizar a notação 𝑋~𝑁 𝜇, 𝜎 para significar que a v.a.
contínua X tem distribuição normal com média 𝜇 e desvio padrão 𝜎.
Considerando uma operação qualquer de medição com redundância
significativa, nas mesmas condições (mesmo operador, instrumento
e método, etc.) a teoria das probabilidades mostra e a experiência
permite verificar que os erros acidentais produzidos apresentam as
seguintes propriedades:
1. a um erro positivo corresponde um erro negativo de mesmo
valor absoluto (os erros positivos e negativos de mesmo valor
absoluto têm igual probabilidade);
2. os erros pequenos são os mais numerosos (o erro nulo é o mais
provável).
6/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
2. Estatística

2.6 Distribuição Normal


A curva que representa a Lei de Gauss tem forma de um
sino e apresenta das seguintes propriedades:
a) É simétrica em relação ao eixo dos 𝑦, isto é, os erros positivos e
negativos de mesmo valor absoluto têm igual probabilidade;
b) As ordenadas correspondentes aos erros pequenos são as
maiores, isto é, os erros pequenos têm maior probabilidade do que
os grandes;
c) A curva tem por assíntota o eixo dos 𝑥, isto é, o erro ∞ tem uma
probabilidade nula;
d) A curva apresenta dois pontos de inflexão correspondentes a ±𝜎
(desvio padrão);
7/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
2. Estatística

2.6 Distribuição Normal


e) A probabilidade de se cometer um erro, em valor absoluto, menor
que ∆ (erro compreendido entre +∆ e −∆ ) é igual à área assinalada
na figura.

f) A área total limitada pela curva, isto é, a probabilidade de se


cometer simultaneamente todos os erros é, portanto, igual à unidade
(100%) 8/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
2. Estatística

2.6 Distribuição Normal


A Figura abaixo mostra as áreas calculadas para alguns escores
normais, que significam as probabilidades de P(Z ≤ z), permitindo
obter as probabilidades acumuladas para a distribuição normal
padrão.

9/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
2. Estatística

2.6 Distribuição Normal


Se for considerado na equação da Lei de Gauss desvios padrões
𝜎 = 1, 𝜎 = 2 𝑒 𝜎 = 3, as curvas correspondentes seriam:

Quanto maior for o desvio padrão (menor precisão), mais achatada


será a curva.

10/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
2. Estatística

2.6 Distribuição Normal


Avaliando-se os valores o achatamento da curva de Gauss pode-se
medir o grau de afilamento relativamente à normal. Essa medida é
conhecida como curtose e permite indicar a intensidade das
frequências na vizinhança dos valores centrais, aproximando-se da
média com valor zero.
Os coeficientes de assimetria e curtose são utilizados para verificar
se um conjunto de dados podem ter sido gerados a partir de uma
distribuição normal.
A partir de uma proposta de alteração no cálculo do coeficiente de
curtose foi possível facilitar sua interpretação. Assim definiu-se o
coeficiente Excesso de curtose dado por:
𝑏2 = 𝑔2 − 3 (onde 𝑔2 é o coeficiente de curtose)
11/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
2. Estatística

2.6 Distribuição Normal


a) se 𝑏2 < 0 dizemos que a distribuição tem caudas mais leves do
que a normal (platicúrtica);
b) se 𝑏2 = 0 dizemos que a distribuição tem caudas com o mesmo
peso das de uma normal (mesocúrtica) e
c) se 𝑏2 > 0 dizemos que a distribuição tem caudas mais pesadas
do que a normal (leptocúrtica).

12/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
2. Estatística

2.6 Distribuição Normal


As áreas sob as curvas normais fornecem probabilidades, que
dependem apenas da distância entre a média µ e o ponto dado em
unidades de desvio padrão σ (Lapin, 1998, p. 169). Por exemplo, a
Figura abaixo representa as áreas sob a curva normal para 1, 2 e 3
desvios padrão em torno da média.

13/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
2. Estatística

2.6 Distribuição Normal


O coeficiente de assimetria é calculado como somatória de
diferenças elevadas à uma potência ímpar, podendo resultar positivo
ou negativo.

Quando o valor for positivo, tem-se assimetria positiva e quando


negativo, diz-se que há assimetria negativa. Na Figura abaixo tem-
se a distribuição de frequências com assimetria positiva (em
vermelho) e assimetria negativa (em azul), segundo Yamamoto
(2020, p. 63).

14/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
2. Estatística

2.6 Distribuição Normal


O coeficiente de curtose é sempre positivo, pois se trata da somatória
de diferenças elevadas à uma potência par. A curtose é usada para
medir a dispersão em distribuições simétricas.

A Figura abaixo mostra as distribuições com graus variáveis de curtose:


leptocúrtica (menor dispersão), mesocúrtica (dispersão média) e
platicúrtica (maior dispersão).

15/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
3. Princípios da Análise Geoestatística

3.1 Introdução
A análise geoestatística tem a finalidade de determinar o modelo de
correlação espacial dos pontos de dados, a serem utilizados nos
processos de estimativas geoestatísticas, além da aplicação das
técnicas de simulação estocástica. Um modelo de correlação espacial
reflete o padrão de distribuição dos pontos de dados e o tipo de
distribuição de frequências da variável. A figura a seguir indica sua
representação esquemática.

A) Localização dos pontos de dados;


B) Histograma da variável; C)
Variograma experimental e modelo
ajustado.
16/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
3. Princípios da Análise Geoestatística

3.1 Introdução
Normalmente os ensaios físicos são obtidos por meio de amostras e
experimentos, e estes são realizados em localizações específicas,
cujas coordenadas geográficas são obtidas por meio do
posicionamento por GNSS. Estas observações qualitativas e
quantitativas constituem as variáveis regionalizadas, que serão
analisadas e manipuladas pelos métodos geoestatísticos.
Uma variável regionalizada é uma função numérica com distribuição
espacial, que varia de um ponto a outro com continuidade aparente,
mas cujas variações não podem ser representadas por uma função
matemática simples.
A análise geoestatística é feita por meio do cálculo da estatística de
dois pontos, utilizando-se conceitos da estatística bivariada.
17/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
3. Princípios da Análise Geoestatística

3.2 Transformação de Dados


As estatísticas de dois pontos dependem da variabilidade
apresentada pela variável regionalizada, sendo esta identificada
pela variância ou dispersão, ou ainda, pelo histograma, avaliando-se
seu grau de assimetria positiva.
Nas Ciências da Terra, muitas variáveis apresentam uma
distribuição assimétrica, em que os poucos valores muito altos
podem afetar as estatísticas amostrais, tais como: média, variância,
coeficiente de correlação, bem como medidas de correlação
espacial (GOOVAERTS, 1997).
Se a variabilidade for alta, faz-se uma transformação de dados e,
em seguida, passa-se ao cálculo das estatísticas de dois pontos.

18/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
3. Princípios da Análise Geoestatística

3.2 Transformação de Dados


O esquema a seguir ilustra esta sequência:
VARÍAVEL
REGIONALIZADA

ANÁLISE
ESTATÍSTICA

BAIXA VARIABILIDADE ALTA VARIABILIDADE

TRANSFORMAÇÃO
DE DADOS

ESTATÍSTICA DE DOIS PONTOS

MODELO DE CORRELAÇÃO ESPACIAL

19/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
3. Princípios da Análise Geoestatística

3.2 Transformação de Dados

Os valores extremos em uma distribuição de frequências se


manifestam pela variabilidade alta.
Dentre as distribuições de frequências, aquela com assimetria
positiva é a que pode representar um problema real para fins de
estimativa e simulação estocástica. Estas distribuições seguem um
modelo lognormal, e devem ser transformada em uma variável
normal.

20/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
3. Princípios da Análise Geoestatística

3.2 Transformação de Dados

Segundo Goovaerts (1997), os valores extremos podem ser


manipulados como segue:
⚫ Declarar os valores extremos errôneos e removê-los do conjunto
de dados;
⚫ Classificar os valores extremos em uma população estatística
separada;
⚫ Usar estatística robusta, que é menos sensível aos valores
extremos;
⚫ Transformar os dados para reduzir a influência dos valores
extremos.
21/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
3. Princípios da Análise Geoestatística

3.2 Transformação de Dados


Genericamente, a transformação de dados é feita pela aplicação de
uma função matemática, onde a transformação é uma função de uma
observação que define uma nova observação.

O principal objetivo da transformação não linear é a mudança da forma


da distribuição (KOCH E LINK, 1970) em direção à simetria, ou seja,
busca-se uma distribuição de frequências simétrica, qualquer que seja
a forma da distribuição dos dados originais, conforme ilustra a figura a
seguir:

22/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
3. Princípios da Análise Geoestatística

3.3 Estacionaridade
Diz-se que um processo (ou uma variável) é estacionário se o
desenvolvimento desse processo no tempo ou no espaço ocorrer de
maneira mais ou menos homogênea, com oscilações aleatórias
contínuas em torno de um valor médio, em que nem a amplitude
média e nem as oscilações mudam bruscamente no tempo ou no
espaço. Como exemplo de processo estacionário pode-se citar as
oscilações da tensão em uma rede elétrica. Note que as
características de um processo estacionário independe da origem
adotada.

23/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
3. Princípios da Análise Geoestatística

3.3 Estacionaridade
Diz-se que um processo é não estacionário quando não apresenta
as características citadas anteriormente e, neste caso, as
características do processo dependem da origem que é tomada
como referência. Pode-se utilizar como exemplo de um processo
não estacionário o relevo de uma região, ou ainda, as chuvas
mensais durante um ano em um determinado local.
Para estudos de geoestatística necessita-se, como restrição
máxima, que o primeiro e o segundo momento em relação à origem
sejam constante, ou seja, exige-se no máximo a estacionaridade de
segunda ordem.

24/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
3. Princípios da Análise Geoestatística

3.3 Estacionaridade
Se a esperança matemática de uma variável aleatória é constante,
independentemente da origem que se toma no espaço ou no tempo,
podemos dizer que a variável é estacionária de primeira ordem e,
portanto, a média será a mesma para todo o processo.
A existência de estacionaridade permite a repetição de um
experimento, mesmo que as amostras sejam coletadas em pontos
diferentes, em relação ao experimento inicial. Esta fato é justificado
em função de que todas as amostras pertencem a populações com
os mesmos momentos estatísticos.
As Figuras A, B e C ilustram, respectivamente, uma variável
estacionária de segunda ordem, uma variável estacionária de
primeira ordem e uma outra não estacionária.
25/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
3. Princípios da Análise Geoestatística

3.3 Estacionaridade

Note que no caso da Figura A, para qualquer trecho que


selecionarmos e calcularmos a média e a variância, estas
permanecerão aproximadamente constante, já no caso da Figura B,
apenas a média permanece constante e no caso da Figura C nem a
media e nem a variância permanecem constantes. 26/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento
Referências Bibliográficas
CAMARGO, E. C. G.. Geoestatística: Fundamentos e Aplicações. In:
Geoprocessamento para Projetos Ambientais. INPE, 1998. Disponível em:
<http://www.dpi.inpe.br/gilberto/tutoriais/gis_ambiente/>.
GOOVAERTS, P. 1997. Geostatistics for natural resources evaluation. New York,
Oxford University Press. 483p
GRANZOTTO, J. G. Resumo Estatística Básica. 2002. 33p.
GUIMARÃES, E. C. Geoestatística básica e aplicada. UFU/FAMAT, 2004. 78 p.
KOCH, G.S.; LINK, R.F. 1970. Statistical analysis of geological data. New York,
Dover Publications Inc. Vol. I. 375 p.; Vol. II. 438p.
PIRES, J. F. Cálculo das Probabilidades e Estatística I. Departamento de
Estatística Universidade Federal da Paraíba - UFPB.
YAMAMOTO, J.K. 2020. Estatística, análise e interpolação de dados
geoespaciais. São Paulo, Gráfica Paulo’s. 308p.

27/27
_______________________________________________________________________________________________________________
IFSULDEMINAS 2021 Técnico em Geoprocessamento

Você também pode gostar