Você está na página 1de 5

58

Dezembro, 2003
Campinas, SP
Uso de ndices de Desempenho e
do Critrio de Akaike para Ajuste
de Modelos de Semivariograma
ISSN 1677-8464
Laurimar Gonalves Vendrusculo
Mestre em Engenharia Agrcola, Pesquisadora da Embrapa Informtica Agropecuria, Caixa Postal 6041, Baro Geraldo - 13083-970 - Campinas, SP.
(e-mail: laurimar@cnptia.embrapa.br)
O semivariograma constitui-se numa ferramenta importante
para representao quantitativa da variabilidade espacial e
temporal de determinado atributo. Segundo Vieira (2000),
esta ferramenta a mais adequada para medir dependncia
espacial e interpolao em locais no-amostrados com intuito
de gerar mapas de isolinhas ou tridimensionais para exame e
interpretao de variabilidade.
Em geoestatstica a escolha do melhor modelo de
semivariograma crucial para a correta interpretao de
fenmenos que apresentem dependncia espacial. A esta
escolha, repercute diretamente a confiabilidade dos
resultados oriundos do processo de interpolao (krigagem);
ou seja, na confiabilidade dos valores estimados em pontos
no-amostrados.
De uma maneira geral, a modelagem de sistemas tais como
os biolgicos e qumicos, constituem-se em uma atividade
que contempla mltiplos e conflitantes objetivos. Estes
objetivos envolvem a complexidade do modelos, o(s)
critrio(s) de desempenho e a validao, que influenciam a
seleo da estrutura do modelo matemtico. Alguns
prncipios podem auxiliar a construo destes modelos, um
deles o princpio da parcimnia onde os melhores modelos
so obtidos utilizando-se estruturas aceitveis e simples,
contendo em sua formulao um menor nmero de
parmetros. Lark (2001) usou este princpio para a seleo de
vrios modelos que explicassem a resposta de produtividade,
no contexto da agricultura de preciso. Posteriormente, o
critrio de informao de Akaike foi utilizado para medir a
parcimnia destes modelos.
O objetivo deste trabalho apresentar os ndices de
desempenho mais utilizados e o critrio de informao de
Akaike, que contribuem para escolha do melhor modelo
matemtico para a representao de estudos espaciais.
Neste trabalho ser utilizado o software GEOEST
(Vendrusculo et al., 2004), destinado anlise
geoestatstica e que disponibiliza tais ndices. Com o intuito
de exemplificar o ajuste e a escolha do melhor modelo do
semivariograma, atravs dos ndices de desempenho so
utilizados os dados de precipitao anual mdia do Estado de
So Paulo Os dados so provenientes de mil e vinte e sete
observaes correspondentes as estaes do DAEE, para o
perodo de 1957 a 1997.
ndices de Desempenho e Critrio
de Informao de Akaike
Uma das maneiras de se encontrar a melhor estrutura de um
modelo matemtico para a representao de um sistema
dinmico pode se dar por meio da estimao de parmetros
para todas as possveis estruturas e a conseqente escolha
baseado na comparao de alguns ndices de desempenho.
No caso do semivariograma, os parmetros estimados nos
modelos matemticos, so: C Efeito pepita, C patamar
o
e a alcance. Os modelos matemticos mais usados no
contexto agropecurio, que contemplam estudos de
variabilidade das variveis do solo e agroclimatolgicos so
os modelos esfrico, exponencial e gaussiano,
representados na Fig. 1.

.
Comunicado
Tcnico
2
Modelo Exponencial
Modelo Esfrico
Modelo Gausiano
(h)
h
0
a
C0
C
C = C0 + C1
Fig. 1. Modelos tericos de semivariograma.
O semivariograma pode ser definido como :
( )
( )
( ) ( )
( )

=
+ =
h N
i
i i
h x Z X Z
h N
h
1
2 *
] [
2
1

(1)
onde N(h) o nmero de pares de valores medidos Z(xi) e
Z(xi+h), separados pela distncia h se a varivel for escalar
(Carvalho et al., 2003).
O grfico da Fig. 1 destaca em seus eixos ( (h)
semivarincia e h distncia), na forma de crculos, os
parmetros do semivariograma. Esta ferramenta uma
funo de h e portanto depende da magnitude e direo de h.
O significado de cada parmetro estrutural descrito a
seguir:
Efeito Pepita (C ) - quando o semivariograma tende a zero
o
( (h) = 0) o valor C observado, revelando a
o
descontinuidade do fenmeno para valores menores que a
menor distncia entre as amostras. Isaaks & Srivastava
(1989) atribuem s condies adversas na poca de
medio ou a variabilidade de menor escala no percebida
pelo processo de amostragem.
Alcance (a): distncia na qual as amostras se encontram
correlacionadas espacialmente.
Patamar ( C ): corresponde ao alcance (a) no grfico do
semivariograma. Considera-se que a partir deste ponto no
exista mais dependncia espacial entre as amostras.
aproximadamente igual a varincia dos dados.
Varincia Estrutural (C1): a diferena entre patamar e o
efeito pepita.
Dentre os ndices de desempenho freqentemente utilizados
para a tomada de deciso sobre o melhor modelo matemtico
cita-se:
1. Soma dos quadrados residual

2
) (
1
mod exp
) ) ( ) ( (
=
=
h C
i
h h SQR (2)
onde (h)exp corresponde a semivarincia do semivariograma
experimental (valores observados) e (h)mod a
semivarincia do modelo matemtico (valores estimados). O
modelo que apresenta o menor valor de RSS (RSS > 0)
assumido com sendo o melhor.
2
2. Coeficiente de determinao ou correlao mltipla (R ) -
2 2
o modelo que apresentar maior valor de R (0 < R # 1)
2
considerado o melhor. O valor de 1 para R representa que
o modelo terico se adequou exatamente aos valores
medidos no processo.
Pode-se calcular o coeficiente de determinao pela seguinte
frmula:
)
) ) ( ) ( (
) ) ( ) ( (
1 (
2
) (
1
exp
2
) (
1
mod exp
2
mdio
orig
h C
i
h C
i
h h
h h
R

=
=
(3)
(h)exp corresponde a semivarincia do semivariograma
experimental;
(h)mod a semivarincia do modelo matemtico;
(h)orig a semivarincia mdia do semivariograma
experimental.
3. Soma dos Quadrados dos Desvios Ponderados (SQDP) -
neste caso escolhe-se o menor valor como o melhor. O
clculo deste ndice obtido pela seguinte frmula:
mdio
) ) ( * (
2
) (
1
) (
1
exp
) ( mod ) ( h h
h C
i
h C
i
i
i
P
P
SQDP

=
=

=
(4)
onde:
Pi correspondem aos nmeros de pares para cada classe de
distncia;
C(h) representa o nmero de classes de distncias.
De acordo com Schaible et al. (1997), outros ndices, no
menos importantes, podem ser utilizados. So eles: Soma do
quadrado total (Total sum of squares TSS); Soma dos
quadrados devido a regresso (Sum of square to regression -
SS) e soma do quadrado dos resduos normalizados
(Normalized residual sum of square NRSS).
2
Ressalta-se que o clculo de R e SQDP realizado sobre
todos os pontos do semivariograma experimental e do
modelo. Na comparao entre os modelos procura-se valores
2
de R prximos unidade e baixos valores de SQDP.
Estes critrios so largamente utilizados para a escolha do
melhor modelo, porm no ponderam sobre o nmero de
componentes usados para o modelo matemtico estimado.
Para tanto um compromisso satisfatrio entre o bom ajuste e
o princpio de parcimnia pode ser alcanado aplicando-se o
chamado Critrio de informao de Akaike (AIC), descrito em
Akaike (1974) como um procedimento para identificao de
modelo estatstico.
Uso de ndices de Desempenho e do Critrio de Akaike para Ajuste de Modelos de Semivariograma
3
AIC = -2 log (Mxima Verossimilhana) + 2p (5)
Onde p nmero de parmetros do modelo
independentemente ajustados.
Webster & McBratney (1989) utilizaram o AIC para escolha
de modelos de variograma em propriedades de solos.
Disponibilidade Computacional
dos ndices e Critrio
So citados sumariamente a seguir dois sistemas
computacionais que implementam os parmetros sob estudo
neste trabalho.
O Variogram Estimation and Spatial Prediction with Error -
VESPER (Whelan et al., 2001), desenvolvido pelo Centro
Australiano de Agricultura de Preciso da Universidade de
Sidney e distribudo de forma shareware utiliza o Critrio de
Akaike e a soma do quadrado dos erros (Sum of square
error) para a escolha do modelo de melhor ajuste dos dados.
Outra iniciativa baseada no trabalho de Vieira (1983) o
sistema GEOEST, desenvolvido em ambiente Delphi
seguindo o paradigma de orientao a objetos, para o
ambiente Windows. A Fig. 2 d uma viso geral dos
mdulos do GEOEST e esclarece, por meio de um diagrama
simplificado, em que fase so calculados os ndices e o AIC.
Fig. 2. Representao simplificada dos principais processos da anlise geoestatstica e seus
respectivos subprodutos do GEOEST.
Estudo de Caso
Um exemplo, no software GEOEST, da utilizao dos ndices
de desempenho e Critrio de Akaike para dados de
precipitao anual do estado de So Paulo visualizado pela
Fig.3.
O software destaca automaticamente o melhor valor de cada
ndice em cor vermelha, medida que o usurio entra ou
modifica os valores do alcance, efeito pepita e varincia
estrutural. A disponibilidade de tais informaes auxilia a
determinao dos parmetros estruturantes do modelo a ser
submetido tcnica de auto-validao J ack-knifing. Esta
tcnica reestima todos os pontos medidos em funo dos
pontos vizinhos e do modelo matemtico escolhido. Devem
ocorrer vrias iteraes (ajustes manuais) por parte do
usurio optando pelo melhor modelo em funo dos ndices e
da etapa de J ack-knifing, conforme destaca a Fig. 2. A atual
verso do GEOEST no implementa a determinao
automtica dos valores de a, C1 e C . Esta funcionalidade
0
pode ser programada, por exemplo, usando o mtodo dos
quadrados mnimos ponderados, descrito por J ian et al.
(1996).
O software realiza o clculo dos ndices em modelos
matemticos de estrutura simples, ou seja, no aninhados.
Nos modelos aninhados, como por exemplo duplo esfrico,
devem haver tratamento especfico no que se refere ao AIC
(Webster & McBratney, 1989).
Uso de ndices de Desempenho e do Critrio de Akaike para Ajuste de Modelos de Semivariograma
Definio da
Distncia
Mxima e
regulao da
distncia
Entrada manual
dos valores de
C , C1 e a
o
1
2
Anlise do modelo
terico, dos ndices
e AIC.
Auto-validao
"J ack-knifing"
Krigagem
Elaborao de Mapas de Isolinhas
ou tridimensionais.
3
4
5
6

Modelo Terico, ndices de


desempenho e AIC calculados
Pontos medidos reestimados
Melhor modelo selecionado.
Pontos Interpolados
V
a
l
i
d
a

o

d
o

m
o
d
e
l
o
Semivariograma
experimental mdio calculado
4
2
Fig. 3. Ambiente para modelagem do semivariograma destacando os ndices de desempenho (R e SQDP)
e Critrio de Akaike (AIC) para dados de precipitao no estado de So Paulo.
A situao ideal seria que os ndices de desempenho e AIC
convergissem para um nico modelo dos cinco apresentados
pela Fig. 3. Ou seja o melhor modelo seria aquele que
2
apresentasse, concomitantemente, o maior valor de R ,
menor valor de SQDP e menor valor de AIC. Na Fig. 3, o
menor valor de AIC corresponde ao modelo Gaussiano
2
(-3.941) e os melhores valores de R e SQDP coincidem com o
modelo exponencial.
Na situao mostrada pela Fig. 3 mais iteraes dos
parmetros do modelo seriam necessrias ou pelo
conhecimento da variabilidade do atributo, o usurio poderia
optar pela escolha do modelo matemtico que atendesse a
maioria dos ndices.
Concluses
Uso de ndices de desempenho e critrio de informao de
Akaike constituem-se em importante instrumento utilizado
para a escolha do melhor modelo para ajuste do
semivariograma, diminuindo a subjetividade que permeia
este processo. Esse fato influencia diretamente a melhoria
da confiana dos valores interpolados, pois o modelo
escolhido representa com mais fidelidade a variabilidade
do atributo estudado; visto isso, recomenda-se
fortemente aos usurios da tcnica geoestatstica testar
os dados de seu interesse em sistemas que implementem
algum ou todos estes ndices e critrio; e
para aplicaes que permitam a modelagem do
semivariograma de forma manual e onde so necessrias
grande nmero de interaes a disponibilidade destes
ndices e do critrio no Software GEOEST, e o destaque
automtico dos melhores valores agiliza o processo de
modelagem do semivariograma, etapa fundamental na
anlise de variabilidade geoestatstica.
Referncias Bibliogrficas
AKAIKE, H. A new look at statistical model identification.
IEEE Trans. on Automatic Control, v. 19, n. 6, p. 716-723,
1974.
CARVALHO, J . R. P. de; QUEIROZ, E. F. de; VIEIRA, S. R.
Uso da geoestatstica multivariada com incorporao de
altitude na interpolao espacial da precipitao. In:
CONGRESSO BRASILEIRO DE CINCIA DO SOLO, 29.,
2003, Ribeiro Preto. [Anais...]. Ribeiro Preto: Sociedade
Brasileira de Cincia do Solo, 2003. CD-ROM.
ISAAKS, E. H.; SRIVASTAVA, R. M. An introduction to
applied geostatistics. New York: Oxford University Press,
1989. 561 p.
J IAN, X.; OLEA, R. A.; YU, Y. Semivariogram modeling by
weighted least squares. Computers & Geosciences, v. 22, n.
4, p. 387-397, 1996.
Uso de ndices de Desempenho e do Critrio de Akaike para Ajuste de Modelos de Semivariograma
Comunicado
Tcnico, 58
Embrapa Informtica Agropecuria
rea de Comunicao e Negcios (ACN)
Endereo: Caixa Postal 6041 - Baro Geraldo
13083-970 - Campinas, SP
Fone: (19) 3789-5743
Fax: (19) 3289-9594
e-mail: sac@cnptia.embrapa.com.br
1 edio on-line - 2003
Comit de
Publicaes
Presidente: Luciana Alvim Santos Romani
Menbros Efetivos: Carla Geovana Macrio, J os Ruy Porto
de Carvalho, Marcia Izabel Fugisawa Souza, Marcos
Lordello Chaim, Suzilei Almeida Carneiro.
Suplentes: Carlos Alberto Alves Meira, Eduardo Delgado
Assad, Maria Angelica Andrade Leite, Maria Fernanda
Moura, Maria Goretti Gurgel Praxedis.
Expediente
Supervisor editorial: Ivanilde Dispato
Normalizao bibliogrfica: Marcia Izabel Fugisawa Souza
Editorao eletrnica: rea de Comunicao e Negcios
Todos os direitos reservados.
LARK, R. M. Some tools for parsimonious modelling and
interpretation of within-field variation of soil and crop
system. Soil & Tillage Research, v. 58, n. 3-4, p. 99-111,
2001.
SCHAIBLE, B.; XIE, H.; LEE, Y. C. Fuzzy logic models for
ranking process effects. IEEE Transactions on Fuzzy
Systems, v. 5, n. 4, p. 545-556, 1997.
VENDRUSCULO, L. G.; MAGALHES, P. S. G.; VIEIRA, S.
R.; CARVALHO, J . R. P. de. Computational system for
geostatistical analyses. Scientia Agricola, Piracicaba, v. 61,
n. 1, p. 100-107, 2004.
VIEIRA, S. R. Geoestatstica em estudos de variabilidade
espacial do solo. In: NOVAIS, R. F. de; ALVAREZ V. V. H;
SCHAEFER, C. E. G. R. (Ed.). Tpicos em cincia do solo.
Viosa: Sociedade Brasileira de Cincia do Solo, 2000. v. 1,
p. 1-54.
VIEIRA, S. R.; HATFIELD, T. L.; NIELSEN, D. R.; BIGGAR, J .
W. Geostatistical theory and application to variability of some
agronomical properties. Hilgardia, Berkeley, v. 51, n. 3, p. 1-
75, 1983.
WEBSTER, R.; MCBRATNEY, A. B. On the Akaike
information criterion for choosing models for variograms of
soil properties. J ournal of Soil Science, v. 40, n. 3, p. 494-
496, 1989.
WHELAN, B. M; MCBRATNEY, A. B.; MINASNY, B. VESPER -
spatial prediction software for precision agriculture. In:
rd
GRENIER, G.; BLACKMORE, S. (Ed.). Proceedings of the 3 .
European Conference on Precision Agriculture. Montpellier:
Agro-Montpellier, 2001. p. 139-144.
Uso de ndices de Desempenho e do Critrio de Akaike para Ajuste de Modelos de Semivariograma 5
Ministrio da Agricultura,
Pecuria e Abastecimento
Governo
Federal

Você também pode gostar