Você está na página 1de 11

ESTATSTICA DESCRITIVA E A ESTACIONARIDADE EM VARIVEIS GEOQUMICAS

AMBIENTAIS
Henrique Csar Pereira Assumpo
Gisele Mara Hadlich
1

Universidade Federal da Bahia - UFBA/IGEO


40201-340- Salvador - BA, Brasil
henri2ue@gmail.com
gisele@ufba.com

Resumo
O objetivo deste trabalho analisar os dados de atributos geoqumicos a fim de verificar sua
estacionaridade e correlacionar a normalidade estatstica com o uso da tcnica da krigagem ordinria.
A escolha da krigagem ordinria como mtodo geoestatstico aplicado ao trabalho deve-se ao fato de,
essa ser a tcnica aconselhada para fazer estudo em reas onde existam dados com variveis que
possam apresentar dependncia espacial, como o caso de variveis geoqumicas e por ser indicada
para dados que apresentam estacionaridade. A metodologia utilizada para a realizao desta pesquisa
envolve, alm da reviso de literatura, a obteno de dados de metais trao (Cu, Zn, Mn, Fe, Cr e Pb)
extrados parcialmente de amostras superficiais (0-10 cm) de solos e de sedimentos coletados em
campo. Tambm foram determinados o pH, salinidade, nitrognio total, fsforo, matria orgnica e
granulometria. Foram feitas anlises estatsticas, construes de semivariogramas, aplicao da
krigagem ordinria e por fim a validao cruzada para medir a incerteza da premedio dos dados.
Verificou-se nesse trabalho que atravs dos variogramas, ficou comprovado que mesmo os dados no
sendo normais, eles apresentaram estacionaridade e o parmetro da estatistica descritiva que mais
possui correlao direta com a krigagem ordinria a varincia.
Palavras-chave: geoestatstica, krigagem ordinria, normalidade estatstica, semivariograma, .
Abstract
The objective of this work is to analyze the geochemical data in order to check their stationarity and
correlate statistical normality using the technique of ordinary kriging. The choice of ordinary kriging
geostatistical method as applied to work is due to the fact, that the technique be advised to study in
areas where data variables that may present spatial dependence exist, such as geochemical variables
and to be indicated presenting data to stationarity. The methodology used for this research involves, in
addition to literature review, obtaining data of trace metals (Cu, Zn, Mn, Fe, Cr and Pb) extracted
partially from surface samples (0-10 cm) of soils and sediment collected in the field. We also
determined the pH, salinity, total nitrogen, phosphorus, organic matter and particle size. Statistical
analyzes, buildings semivariogramas, applying ordinary kriging and finally cross-validation to
measure the uncertainty of data were made. It was found in this work through the variogram, it was
proved that even the data is not normal, they showed stationarity and descriptive statistics of the
parameter that has more direct correlation with the ordinary kriging is the variance.
Keywords: geostatistics, ordinary kriging, statistical normality, semivariogram
1 Introduo
A Geoestatstica determina o grau de correlao entre pares de amostras com base na direo e
distncia entre elas, ou seja, extrai-se da aparente desordem, dos dados disponveis, uma imagem da
variabilidade dos mesmos e uma medida da correlao existente entre os valores tomados em pontos
no espao, cuja anlise obtida por meio do semivariograma (Ortiz, 2002).
Um dos problemas na determinao do semivariograma a presena de tendncia nos dados
avaliados, ou seja, a no estacionaridade da varivel, dificultando o ajuste de modelos adequados ao

comportamento espacial da varivel (Vieira, 1997; Guimares, 2004). Vieira et al (1983) argumentam
que quando a varivel apresentar tendncia esta deve ser removida antes do ajuste do semivariograma.
A tendncia consiste em uma caracterstica particular das amostras, a qual pode ser detectada a
partir da construo de um semivariograma omnidirecional com direo angular igual a 0 e tolerncia
angular de 90 (Isaaks & Srivastava, 1989) e atravs de tcnicas que testam a normalidade dos dados,
como o teste de Pearson e estatstica descritiva dos dados. Segundo Folegatti (1996), para o ajuste de
semivariogramas a normalidade dos dados no necessria, mas desejvel. Caso a distribuio no
seja normal, mas seja razoavelmente simtrica, podem-se admitir as hipteses necessrias construo
do semivariograma. Em contrapartida, Vieira & Lombardi Neto (1995) afirmam que os clculos
utilizados em geoestatstica no requerem o conhecimento da distribuio de frequncias da varivel
analisada.
Os testes empregados para verificar a distribuio normal dos dados em uma anlise
geoestatstica exploratria, tm por objetivo direcionar o pesquisador a saber sobre a tendncia dos
dados.
Para este trabalho utilizou-se a anlise estatstica descritiva e o teste de DAgostino Pearson
para o teste de normalidade dos dados, logo aps foram gerados semiraviogramas para comprovar a
estacionaridade dos dados, ento a Krigagem ordinria foi aplicada e por fim foi avaliado o erro mdio
da premedio atravs da validao cruzada.
Espera-se, com este trabalho, analisar a estacionaridade de variveis ambientais e verificar se
h algum parmetro da estatstica descritiva que se correlaciona diretamente com o indicativo de
qualidade quanto s estimativas geradas para cada varivel. Para tanto, foram utilizados dados
secundrios de variveis de geoqumica ambiental de Boaventura (2011) e Silva (2012). Os estudos
foram conduzidos na ilha sede do municpio de Madre de Deus, localizado na regio norte da Baa de
Todos os Santos (BTS).
2 Materiais e mtodos
Para a realizao dessa pesquisa a metodologia usada constou alm da reviso de literatura,
com a obteno de dados de metais trao nos ambientes estudados e, posteriormente, com a aplicao
de tcnicas estatsticas e geostticas para anlise dos dados. Os trabalhos podem ser descritos em
diferentes etapas contemplando campo, laboratrio e trabalho em escritrio. Na fase de campo, foram
coletadas 96 amostras envolvendo os trs ambientes estudados As amostras foram coletadas em
superfcie (0-10 cm de profundidade) com colheres plsticas previamente lavadas e ambientadas.
Antes da coleta foi retirado o material superficial que se encontrava solto, como folhas, cascalhos ou
outros materiais. Estas amostras foram encaminhadas para o Laboratrio de Estudos Ambientais
NEA/IGEO/UFBA, onde foram feitas as anlises qumicas.
A partir dos resultados obtidos com as anlises qumicas, criou-se um banco de dados
(BD_MadreDeus) atravs do programa de computador Microsoft Excel contendo, para cada ponto
amostrado, o dado espacial (coordenadas UTM) e as variveis analisadas.
Para se verificar a normalidade, os dados numricos coletados inicialmente foram submetidos
ao teste DAgostino-Pearson, sendo considerados valores de p menores que 0,05 significantes (no
apresentando normalidade), e a uma anlise estatstica descritiva, para verificar o tipo de distribuio.
Ambos os testes foram conduzidos e analisados no programa Bioestat verso 5.0 (Ayres et al. 2007).
O clculo da semivarincia foi feito atravs da equao (1):
(h) = (x-) / 2n
(1)
onde: (h) = semivarincia das amostras em funo da distncia h entre elas, x = valor das
amostras, = mdia das amostras, n = nmero de amostras.
A partir dos valores de (h) e de h constroi-se o semivariograma.
Aps gerao do semivariograma, faz-se necessrio ajustar a curva da funo a um modelo
conhecido (Figura 1) a fim de determinar os parmetros efeito pepita, alcance e patamar. Exemplos de
modelos mais utilizados em geoestatstica so: esfrico, gaussiano e exponencial (Druck, 2002).

Figura 1 - Representao grfica dos modelos

Fonte: Druck et al. (2002)


Os procedimentos da anlise do variograma foram realizados de acordo com Vieira et al.
(1983) e as anlises foram feitas no programa GS+ Verso 7 (Gamma Design Software, 2004).
A uso da krigagem ordinria e da validao cruzada foram realizadas no programa ArcGis 10.
A krigagem um conjunto de tcnicas de regresso linear generalizadas para minimizar uma
varincia de estimao a partir de um modelo de covarincia definido a priori, (Deutsch & Journel,
1992).
Alguns pesquisadores tm trabalhado a aplicao da krigagem indicativa (bastante et al., 2005;
Salgueiro et al., 2008; Lee et al., 2007), krigagem fatorial e co-krigagem. Nesse trabalho ser utilizado
a Krigagem ordinria, que Segundo Landim (2006) e conforme constatado em Jung et al. (2006) e
Zhou et al. (2007), a krigagem ordinria (KO) uma das tcnicas mais utilizada dentre os mtodos
geoestatsticos conhecidos, principalmente quando se trata de estudos envolvendo as variveis
ambientais.
A estimativa por krigagem ordinria de um atributo , na posio e com coordenadas dado
pelo vetor , dada pela equao (2) (ISAAKS; SRIVASTAVA,1989):

(2)

onde: so as ponderaes aplicadas aos i-simos valores dos atributos que possuam dependncia
espacial com o valor da varivel a ser estimado na posio .
Para a determinao do erro associado ao modelo geoestatistico criado, utilizou-se a validao
cruzada que utilizada para medir a incerteza da premedio dos dados (ALMEIDA et al., 2007).
Segundo Isaaks e Srivastava (1989), na etapa de Validao Cruzada, cada ponto medido
excludo e seu valor estimado levando-se em conta os dados restantes. Nessa tcnica so estimados
os valores dos parmetros analisados e dos parmetros individualizados dos pontos amostrados, sendo
em seguida comparados aos novos valores dos dados medidos.
Se os resultados da validao cruzada apresentarem os dados sobre uma reta de regresso
prxima da bissetriz e com pequena disperso dos pontos em torno desta reta, pode-se confiar na
estimativa, sendo que o valor mdio das diferenas ser to mais prximo de zero quanto melhor for a
estimativa. A validao cruzada pode ser utilizada tambm para avaliar se o modelo de variograma
escolhido est bem ajustado aos dados disponveis; um ajuste pobre significa a presena de vis
(ANDRIOTTI, 2002).

3 Resultados
A partir das variveis ambientais e da distribuio dos elementos geoqumicos, foi feito uma
anlise estatstica descritiva com a finalidade de observar a normalidade dos dados (Tabela 4.1). Sabese que o coeficiente de variao alto (maior que 1) e o coeficiente de assimetria e de curtose que se
afastam do valor zero podem ser indicativos da no normalidade.
Verificou-se assim que o parmetro salinidade, a frao granulomtrica argila e os elementos
fosforo, Ferro, Mangans, Cromo e Chumbo, no apresentaram normalidade por apresentarem valores
de assimetria e curtose acima do zero e coeficiente de variao acima do valor 1. Porm ao aplicar o
teste de normalidade DAgostino-Pearson, observa-se que apenas o pH apresentou normalidade (p >
0,05).
Com a finalidade de observar os efeitos dos testes acima descritos em uma anlise
geoestatstica, foram produzidos variogramas para cada varivel. O modelo que melhor ajustou-se aos
dados do atributo Fsforo (P) foi o esfrico, apresentando o maior coeficiente de determinao (r2) em
relao aos outros modelos.

Tabela 1 - Estatstica descritiva das variveis geoqumicas estudadas.


pH

Salinidade

Areia
(%)

Silte
(%)

Argila
(%)

N
(%)

MO
(%)

P
(%)

Nmero de
amostras

96.00

96.00

96.00

96.00

96.00

96.00

96.00

96.00

96.00

96.00

96.00

96.00

96.00

96.00

Mnimo

4.44

0.00

3.50

2.72

0.00

0.04

0.25

0.00

663.2

3.15

0.05

0.05

0.00

4.19

Mximo
Amplitude
Total

8.38

100.00

97.28

92.99

3.74

0.64

11.43

1715.69

37446.6

844.52

29.16

39.79

27.34

61.81

3.94

100.00

93.78

90.27

3.74

0.60

11.18

1715.69

36783.3

841.37

29.11

39.74

27.34

57.62

Mediana
Mdia
Aritmtica

6.82

5.00

79.38

19.99

0.49

0.11

2.00

48.28

2645.2

32.75

3.00

7.01

0.38

15.75

6.59

30.87

72.32

27.00

0.78

0.14

2.44

130.91

4528.14

95.77

4.57

10.14

2.86

19.75

Varincia
Desvio
Padro

1.25

1305.55

568.95

536.47

0.71

0.01

3.52

59550.8

2860800

27894.0

26.89

87.84

30.33

152.08

1.12

36.13

23.85

23.16

0.84

0.10

1.88

244.03

5348.60

167.02

5.19

9.37

5.51

12.33

Erro Padro
Coeficiente
de Variao
Assimetria
(g1)

0.12

3.73

2.46

2.39

0.09

0.01

0.19

25.17

551.67

17.23

0.53

0.97

0.57

1.27

0.17

1.17

0.33

0.86

1.08

0.73

0.77

1.86

1.18

1.74

1.13

0.92

1.92

0.62

-0.37

0.82

-1.62

1.61

1.54

2.37

1.94

4.36

3.60

2.92

2.04

1.69

2.88

1.22

Curtose (g2)
Valor de p

-1.08
0.07

-0.82
0.01

Fe
(mg

Mn
(mg

Cr
(mg

Cu
(mg

Pb
(mg

Zn
(mg

1.92
1.87
2.14
7.90
5.30
23.15
17.21
8.60
5.72
2.26
8.84
1.19
< 0.0001 < 0.0001 < 0.0001 < 0.0001 < 0.0001 < 0.0001 < 0.0001 < 0.0001 < 0.0001 < 0.0001 < 0.0001 < 0.0001

estatstica do teste de normalide DAgostino-Pearson.

O melhor modelo para todas as outras variveis foi o exponencial, apresentando r2


superior a 10% para todos os atributos e a menor soma de quadrados do resduo (SQR) quando
comparado aos demais modelos testados. Segundo Robertson (1998), a SQR um parmetro
mais robusto do que o r2 e propicia uma medida mais exata do modelo que se ajusta aos dados,
sendo os dois parmetros usados na escolha do melhor modelo.
Como observado na Figura 2 (a partir da prxima pgina), todos os variogramas
construdos apresentaram patamar bem definido, indicando que os dados so estacionrios, ou
seja, eles podem ser usados em uma anlise geoestatstica utilizando a krigagem ordinria.
Aps aplicar a tcnica da krigagem ordinria, utilizando o modelo exponencial e um
alcance de 337 metros para todos os variogramas, foi utilizada a validao cruzada para avaliar
a incerteza associada s estimativas obtidas. A Tabela 2 apresenta a mdia das diferenas entre
os valores medidos e os valores estimados pela krigagem (Erro mdio), feita pela validao
cruzada, junto com os dados obtidos pela estatstica descritiva. Observa-se que os maiores
valores de erro mdio esto associados s maiores varincias, e o Chumbo (Pb) apesar de
apresentar um alto valor de coeficiente de variao, curtose e assimetria, apresentou um baixo
erro mdio, devido a sua baixa varincia.
Tabela 2 Parmetros da anlise estatstica descritiva e o erro mdio associado modelagem
krigagem ordinria das variveis geoqumicas estudadas
Variveis
pH
Salinidade
N total
MO
P
Fe
Mn
Cr
Cu
Pb
Zn
Areia
Silte
Argila

Erro mdio
(validao
cruzada)
0.05
1.40
0.00
0.04
6.40
107.87
2.3
0.40
0.90
0.05
0.60
0.80
0.80
0.01

Varincia

Coeficiente de
Variao

Assimetria
(g1)

Curtose
(g2)

1.2539
1305.55
0.01
3.52
59550.84
28608000.00
27894.01
26.89
87.84
30.33
152.08
568.95
536.47
0.71

0.1698
1.17
0.73
0.77
1.86
1.18
1.74
1.13
0.92
1.92
0.62
0.33
0.86
1.08

-0.3699
0.82
2.37
1.94
4.36
3.60
2.92
2.04
1.69
2.88
1.22
-1.62
1.61
1.54

-1.076
-0.82
7.90
5.30
23.15
17.21
8.60
5.72
2.26
8.84
1.19
1.92
1.87
2.14

Figura 2 Semivariogramas omnidirecional das variveis geoqumicas analisadas (C0 : efeito


pepita; C = C0 + C1: patamar; r2: Coeficiente de determinao)
Salinidade: Variograma isotrpico

Semivarincia

Semivarincia

pH: Variograma isotrpico

Distncia (h)

Distncia (h)
Modelo exponencial

Modelo exponencial

Silte: Variograma isotrpico

Semivarincia

Semivarincia

Areia: Variograma isotrpico

Distncia (h)

Distncia (h)
Modelo exponencial

Modelo exponencial

N total: Variograma isotrpico

Semivarincia

Argila: Variograma isotrpico

Distncia (h)

Modelo exponencial

Distncia (h)

Modelo exponencial

continua

P: Variograma isotrpico

Semivarincia

Semivarincia

M.O.: Variograma isotrpico

Distncia (h)
Modelo exponencial

Distncia (h)
Modelo Esfrico

Mn: Variograma isotrpico

Semivarincia

Semivarincia

Fe: Variograma isotrpico

Distncia (h)

Distncia (h)

Modelo exponencial

Modelo exponencial

Cu: Variograma isotrpico

Semivarincia

Semivarincia

Cr: Variograma isotrpico

Distncia (h)

Modelo exponencial

Distncia (h)

Modelo exponencial

continua

Zn: Variograma isotrpico

Semivarincia

Semivarincia

Pb: Variograma isotrpico

Distncia (h)

Distncia (h)
Modelo exponencial

Modelo exponencial

Para a comprovao da relao existente entre a varincia e erro mdio estimado


pela validao cruzada, utilizou-se uma matriz de correlao (Tabela 3). Observa-se
ento, que a varincia, apresenta uma correlao direta com o erro mdio, da etapa
validao cruzada, comprovando assim que a normalidade dos dados no est
diretamente relacionada com uma boa modelagem geoestatstica utilizando a tcnica da
krigagem ordinria.
Tabela 3 Matriz de correlao de Pearson (p<0,05) dos parmetros obtidos na anlise
descritiva e do erro mdio associado a krigagem ordinria dos dados das variveis estudadas.
Erro mdio
(validao
cruzada)

Varincia

Coeficiente de
Variao

Assimetria
(g1)

Curtose
(g2)

Erro mdio (validao


cruzada)

1.00

---

---

---

---

Varincia

1.00

1.00

---

---

---

Coeficiente de Variao

0.10

0.08

1.00

---

---

Assimetria (g1)

0.36

0.34

0.79

1.00

---

Curtose (g2)

0.50

0.47

0.65

0.81

1.00

4 Concluso
Apesar da maioria das variveis analisadas no apresentarem normalidade, os
variogramas gerados demonstraram que os dados possuam estacionaridade, indicando assim
que preciso um estudo prvio dos dados para obter um bom resultado na modelagem
geoestatstica.
A varincia apresentou-se como o melhor parmetro da estatstica descritiva para ser
investigado quando se utiliza a tcnica da krigagem ordinria.

5 Referncias
Almeida R., Bernardi J. V. E., Bastos W. R., Nascimento E. L., Oliveira R. C., Carvalho D. P.
2007. Mtodo geoestatstico para modelagem ambiental de poluentes em sistemas lacustres
Amaznia Ocidental. In: 13 Simpsio Brasileiro De Sensoriamento Remoto, Florianpolis,
p.2247-2253.
Andriotti J. L. S. 2002. Notas de geoestattica. Acta Geologica Leopoldensia, 25(45):3-14.
Ayres M.; Ayres J.R.M.; Ayres D.L.; Santos A.S. 2007. BioEstat 5.0: aplicaes estatsticas nas
reas das cincias biolgicas e mdicas. Belm, CNPQ, 290 p.
Bastante F. G.; Taboada J; Alejano L.R.; Ordonez C. 2005. Evaluation of the resources of a
slate deposit using indicator kriging. Engineering Geology. 81: 407-418.
Boaventura S. F. 2011. Distribuio de metais trao em superfcie no Municpio de Madre de
Deus, Bahia. MS Dissertation, Instituto de Geociencias, Universidade Federal da Bahia,
Salvador, 70 p.
Deutsch C.V., Journel A. G.1992. GSLIB: Geostatistical Software Library and users guide.
New York, Oxford University Press. 339 p.
Druck S. 2002. A geoestatstica e os sistemas de informaes geogrficas. Espao & Geografia.
5(1):1-15.
Folegatti M.V. 1996. Estabilidade temporal e variabilidade espacial da umidade e do
armazenamento de gua em solo siltoso. PhD Thesis, Universidade de So Paulo, Piracicaba, 84
p.
Gamma Design Software. GS+ - Geostatistics for the Environmental Sciences. Version 9.0.
Michigan: 2004. 1 CD-ROM.
Guimares E. C. 2004. Geoestatistica bsica e aplicada. 77 p. Disponvel em:
www.famat.ufu.br/ednaldo/ednaldo.htm. Acesso em: 10 dez. 2013.
Isaaks E. H., Srivastava R. M. 1989. An Introduction to Applied Geostatistics. New York:
Oxford University Press, 560 p.
Jung, K.; Stelzenmller, V.; Zauke, G-P. 2006. Spatial distribution of heavy metal
concentrations and biomass indices in Cerastoderma edule Linnaeus (1758) from the German
Wadden Sea: An integrated biomonitoring approach. Journal of Experimental Marine Biology
and Ecology. 338:8195.
Landim P. M. B. 2006. Sobre geoestatstica e mapas. Terrae Didtica, 2(1):19-33.
Lee, Jin-Jing, Jang, Cheng-Shin, Wang, Sheng-Wei, Liu, Chen-Wuing. Evaluation of potential
health risk of arsenic-affected groundwater using indicator kriging and dose response model.
2007. Science of the Total Environment. 384:151162,.
Ortiz G.C. 2002. Aplicao de mtodos Geoestatsticos para identificar a magnitude e a
estrutura da variabilidade espacial de variveis fsicas do solo. MS Dissertation Universidade de
So Paulo, Piracicaba, 75 p.
Robertson, G. P. 1998. GS+ Geostatistics for the environmental sciences: GS+ users guide.
Plainwell: Gamma Design Software. 152 p, CD-ROM.

Salgueiro, A. R., vila, P. F., Pereira, H. G., Oliveira, J. M. S. 2008. Geostatistical estimation of
chemical contamination in stream sediments: The case study of Vale das Gatas mine (northern
Portugal). Journal of Geochemical Exploration, 98:15-21.
Silva, M. J. 2012. Disponibilidade de metais-trao em solos e sedimentos na Baa de Todos
os Santos: aplicao do mtodo Tessier. MS Dissertation, Instituto de Geociencias,
Universidade Federal da Bahia, Salvador, 80 p.
Vieira S. R. 1997. Variabilidade espacial de argila, silte e atributos qumicos em parcela
experimental de um Latossolo Roxo de Campinas (SP). Bragantia, 56(1):181-190.
Vieira S.R., Hatfield J.L., Nielsen D.R.; Biggar, J.W. 1983. Geoestatiscal theory and application
to variability of some agronomical properties. Hilgardia, 51:1-75.
Vieira, S.R.; Lombardi Neto, F. 1995. Variabilidade espacial do potencial de eroso das chuvas
do Estado de So Paulo. Bragantia, 54(2):405-412.
Zhou F., Guo H., Ho Z. 2007. Spatial distribution of heavy metals in Hong Kongs marine
sediments and their human impacts: A GIS-based chemometric approach. Marine Pollution
Bulletin, 54:1371-1384.