Escolar Documentos
Profissional Documentos
Cultura Documentos
Estespacial PDF
Estespacial PDF
Estatstica Espacial
Alexandre Diniz
Estatstica Espacial
Anlise espacial x no espacial
Em termos gerais, pode-se definir anlise espacial como o estudo quantitativo de fenmenos posicionados no
espao. Portanto, o interesse centrado nos processos que ocorrem no espao e os mtodos aqui empregados
buscam descrever ou explicar o comportamento desses processos, bem como a sua relao com outros
fenmenos espaciais. Os dados portanto, representam, no mais das vezes, amostras desses processos, a partir
dos quais se busca fazer inferncias sobre o comportamento desses fenmenos. Portanto, em anlise espacial,
utiliza-se de tcnicas que explicitamente incorporam as localizaes ou arranjos espaciais dos
objetos/fenmenos em questo.
Um exemplo:
Biogeografia o nmero de espcies de plantas e um conjunto de pequenas ilhas.
1- Relao entre o nmero de espcies e o tamanho das ilhas
Relao positiva quanto maior a rea das ilhas, maior ser o nmero de espcies, uma vez que o
tamanho da ilha influencia a probabilidade de se encontrar uma maior diversidade de hbitats.
Anlise espacial no est particularmente envolvida neste estgio. O simples fato de que se est lidando
com um conjunto de reas que tm posio geogrfica definida no torna o estudo espacial.
2- Distncia isolamento das ilhas em relao a outras ilhas e ao continente e o nmero de espcies.
Relao negativa evidncia emprica demonstra que a distribuio de espcies de pssaros entre ilhas
do Pacfico, demonstram que a distncia da Nova Guin reduz o nmero de espcies.
Anlise espacial mais claramente presente, uma vez que a localizao relativa das ilhas (proximidade
umas das outras e do continente) influenciam o nmero de espcies e esto sendo exploradas na anlise.
O fato que a anlise espacial produz resultados diferentes daqueles das abordagens no espaciais, uma vez
que os seus resultados so geralmente mais robustos por incorporarem a dimenso espacial.
observao sejam espacialmente definidas. Portanto, apesar das variveis serem importantes, esses valores
divorciados do seu contexto espacial perdem valor e significado. Para a produo da anlise espacial
necessita-se, pelo menos, informao sobre a localizao e atributos, independentemente de como esses
atributos sejam mensurados.
Caso desejamos estudar apenas o arranjo espacial ou padro espacial de entidades, ento esta
essencialmente uma questo geomtrica e ns apenas coletamos dados sobre as localizaes das entidades.
Mas, caso queiramos comparar os arranjos espaciais de diferentes entidades ou o estudo dos padres espaciais
de medidas tomadas a partir de locais especficos, ento precisaremos fazer uso de informaes sobre os
atributos tambm.
Centro mdio
X=
Y=
X w=
ixi
Yw=
wi
iyi
wi
Obs: a localizao do ponto mdio e do ponto mdio ponderado afetada pela localizao de cada ponto em
particular, assim como o peso de cada localizao. Pontos com localizaes extremas, ou com pesos altos
atraem para si o centro de distribuio.
- Mdia de X)2 +
N
- Mdia de Y)2
Obs1: Assim como o desvio padro mensurado na unidade de medida dos dados originais, tambm a
distncia padro expressa nas unidades de medida de X e Y (Cm, Km, Milhas, Graus, etc.)
Obs2:Valores muito discrepantes do conjunto de dados costumam influenciar o valor da distncia padro, uma
vez que as suas distncias so elevadas ao quadrado.
- Mdia de Xw)2 +
- Mdia de Yw)2
ixi
wi
Yw=
iyi
wi
Em IDRISI, CENTER calcula a mdia ponderada e no ponderada e o raio padro de um conjunto de pontos
expressos como freqncias de clulas. No processo, o coeficiente de disperso relativa tambm calculado.
A rotina CENTER requer que se revele o nome da imagem a ser avaliada. No processo, a rotina assume que
os valores presentes na imagem representem o nmero de pontos em cada clula (para o clculo da mdia
central), ou pesos a serem aplicados posio da clula (para o clculo da mdia central ponderada).
Os resultados trazem o centro mdio ponderado pelos valores das clulas, levando-se em considerao as sua
posio em relao s linhas e colunas, bem como em relao ao sistema de coordenadas utilizados. Da
mesma maneira, o raio padro expresso em termos de clulas e unidades de referncia. CENTER tambm
indica o coeficiente de disperso relativa (CRD). O CRD expressa o grau de disperso relativa em uma dada
rea. Ele calculado a partir da razo entre o raio padro e o raio de um crculo que contenha a mesma rea
sendo estudada, vezes 100.
Tcnica similar anlise de regresso mltipla, na qual as variveis independentes so compostas pelas
coordenadas espaciais dos diversos pontos em questo. O objetivo identificar a tendncia distributiva de um
dado fenmeno em uma determinada regio, a partir da identificao de tendncias relativas latitude e
longitude. Tal objetivo atingido a partir do clculo de equaes polinomiais lineares, quadrticas e cbicas
para um conjunto de pontos.
Exemplo:
O tamanho mdio dos seixos encontrados a partir de pontos amostras em uma praia. Existe uma tendncia
espacial em relao a esta distribuio?
Ao produzirmos uma anlise de regresso simples, utilizando o tamanho mdio dos seixos como varivel
dependente (Y) e as duas coordenadas dos pontos (U) e (V) teremos:
Y= 1.45 + 0.71U
Y= 1.45 + 0.71V
rYU= 0.85
rYV=0.85
A primeira dessas equaes indica uma forte tendncia de crescimento no tamanho mdio dos seixos em
relao ao leste ao longo da praia. Por outro lado, a segunda equao sugere a presena de uma forte
tendncia ao aumento no tamanho mdio dos seixos em direo ao norte da praia.
RY.UV = 1.0
Obs: Como se est utilizando a mesma unidade de medida para U e V (graus), pode-se comparar os
coeficientes de regresso.
Portanto, neste exemplo acabamos de demonstrar a utilizao de uma equao polinomial linear, na qual
Z = b0 + b1x + b2y
Ou seja, trabalhamos com tendncias unidirecionais (Norte-Sul x Leste-Oeste). Entretanto, pode-se trabalhar
com padres espaciais mais complexos com a ajuda de outras equaes. Neste sentido, poder-se-ia ter
relaes como essas:
Y= a + b1U b2U2 +/- e
Indicando que o tamanho mdio dos seixos aumentaria ao nos distanciarmos da paria no sentido leste e depois
voltaria a diminuir. Ou ainda,
Y= a - b1V b2V2 +/- e
Indicando que o tamanho mdio dos seixos diminuiria e depois aumentaria no sentido norte.
Adicionando-se as duas frmulas demanda a incorporao de um termo de interao entre U e V de modo que
se tem uma relao quadrtica:
Y = a + b1U + b2U2 + b3UV + b4V +b5V2 +/- e
Tal equao produz uma tendncia de superfcie quadrtica, cuja forma se assemelha a de um domo.
Superfcies de grandeza maior devem ser produzidas onde os padres espaciais forem excessivamente
complexos. Na maioria dos casos tais superfcies so utilizadas para descrever padres de maneira mais
apurada, j que o significado dos coeficientes de regresso so mais difceis de serem interpretados.
Em IDRISI o mdulo TREND calcula e produz superfcies de tendncia com base em equaes polinomiais
lineares, quadrticas e cbicas. O mdulo TREND, alm de produzir a imagem, tambm traz informaes
sobre a equao polinomial produzida, bem como o seu poder de predio. O nmero de clulas utilizadas
para determinar a imagem de tendncia informada, seguido dos coeficientes da equao polinomial. O
coeficiente "b0" representa o termo interceptor, e os coeficientes "bn" so os coeficientes de inclinao (b)
associados ordem da equao polinomial selecionada. O grau de predio do modelo expresso em
percentagem e acompanhado pelo valor de F e os graus de liberdade.
Tipo de domiclio
Mulheres
Homens
Total
Centro
60
175
235
Periferia
40
250
290
Total
100
425
525
H1: Existe uma relao entre o tipo predominante de domiclio e a localidade no mbito da cidade
H0: No existe relao alguma entre o tipo predominante de domiclio e a localidade no mbito da cidade
Com base nos dados acima, sabe-se que:
25,53% dos domiclios do centro so chefiados por mulheres, contra 13,79% daqueles situados na periferia.
Esta diferena estatisticamente significativa? Atravs do teste de Qui-quadrado pode-se testar esta suspeita.
X2 =
(Oij-Eij)2
Eij
Onde,
c
Somatrio das colunas
l
- Somatrio das linhas
Oij Valores observados
Eij - Valores esperados caso nenhuma relao existisse
B
D
B+D
A+B
C+D
A+B+C+D = N
44.76
55.24
190.24
234.76
Valores esperados
Tipo de domiclio Centro Periferia
Mulheres
44.76
55.24
Homens
190.24 234.76
Total
235
290
Total
100
425
525
(40-55.24)2
55.24
+ (175-190.24)2
190.24
(250-234.76)2
234.76
Graus de liberdade:
CeL>1
C=1eL
C
C = N de colunas
L = N de linhas
Comparar valor computado com valor crtico
10
X2 crtico = 6.635
X2 computado = 11.60
Concluso: Confirma-se a presena de uma relao estatstica
Obs:
Amostras devem ser independentes
N por clula deve ser maior ou igual a 5
Cramers V =
X2
.
N (k-1)
Sendo que o valor mnimo se refere ao menor nmero de colunas e linhas presentes na anlise.
Com base nos dados acima:
Cramers V =
11.6 .
525 (1)
Cramers V = 0.1486
3.0 Kappa
Permite confirmar a relao entre duas variveis categricas que possuem classes similares. O coeficiente
de Kappa oscila entre 0 e 1, com interpretao similar de Cramers V.
Ex: Dois supervisores classificaram o desempenho em sala de aula de 72 monitores de acordo com os
seguintes critrios: autoritrio, democrtico e permissivo. Os resultados finais so apresentados abaixo:
Supervisor 1
Autoritrio
Democrtico
Permissivo
Total
Supervisor 2
Autoritrio Democrtico
17 (23.6)
4 (5.6)
5 (6.9)
12 (16.7)
10 (13.9)
3 (4.2)
32 (44.4)
19 (26.4)
Permissivo
8 (11.1)
13 (18.1)
21 (29.2)
Total
29 (40.3)
17 (23.6)
26 (36.1)
72 (100.0)
A media mais simples de concordncia entre as duas avaliaes seria simplesmente a proporo de avaliaes
que so comuns entre os dois supervisores. Neste caso o resultado seria 58.3%. Entretanto, esta metodologia
no leva em considerao o fator chance no processo de coincidncia entre as avaliaes.
Para corrigir este erro, pode-se computar a proporo de casos coincidentes que se esperaria encontrar caso as
avaliaes fossem independentes. Por exemplo, o supervisor 1 classificou 40.3% dos monitores como
autoritrios, enquanto o supervisor 2 classificou 44.4% dos monitores como autoritrios. Caso as avaliaes
fossem independentes, voc esperaria que 17.9% (40.3% x 44.4%) dos monitores fossem classificados como
11
autoritrios por ambos supervisores. Da mesma forma 6.2% (23.6% x 26.4%) seriam classificados como
democrticos e 10.5% (36.5% x 29.2%) como permissivos. Portanto, 34.6% de todos os monitores seriam
classificados da mesma forma por pura chance.
A diferena entre a proporo observada de casos nos quais as avaliaes coincidem e aquela que ocorre ao
acaso 0.237 (0.583-0.346). O coeficiente de Kappa nomaliza esta diferena ao dividi-la pela diferena
mxima possvel aos totais marginais. Neste exemplo, o maior valor possvel de concordncia real de 10.346 ( nvel de chance). Portanto,
Kappa = 0.237/ (1-0.346) = 0.362
Em Idrisi, a opo CROSSTAB executa duas operaes. Primeiramente, o programa executa um cruzamento
de imagens na qual as categorias de uma imagem so comparadas s categorias de uma segunda imagem em
forma de tabela. Nesta tabela so apresentadas todas as formas de combinao. O resultado desta operao
uma tabela que traz os totais tabulados, bem como duas medidas de associao entre as imagens.
A primeira desta medidas o Cramer's V. Alm disso, a estatstica de Chi-quadrado tambm produzida
juntamente com os graus de liberdade apropriados para que a significncia de Cramer's V possa ser testada.
Se o Chi-quadrado significante, o mesmo vale para Cramer's V.
Caso as duas imagens tenham o mesmo nmero de categorias, uma outra medida de grau de associao
est disponvel: Kappa. Esta medida tambm varia entre 0.0 e 1.0 com a mesma interpretao. Entrementes,
Kappa s pode ser utilizada quando as categorias atinentes s imagens em questo expressem o mesmo tipo
de dados, com o mesmo nmero de classes.
A Segunda operao a cross-classificao de imagens. Tal operao pode ser definida como uma
justaposio (OVERLAY) mltipla, demonstrando todos os tipos de combinao. O resultado uma nova
imagem que demonstra os locais de todas as combinaes entre categorias presentes nas imagens originais.
No processo, uma legenda automaticamente produzida demonstrando essas combinaes.
12
logit(p)=a+b1*x1+b2*x2+b3*x3
Onde,
logit(p) = ln(p/(1-p)) (L na figura acima), p a varivel dependente, a probabilidade de que um determinado
evento tenha ocorrido. Os demais componentes tm o mesmo significado que em regresso linear mltipla.
A relao entre uma varivel dependente e outra independente segue uma curva logstica como representado a
figura acima.
Note-se que a transformao logstica de dados dicotmicos garante que a varivel dependente da regresso
seja contnua, e que a nova varivel (a probabilidade de ocorrncia de um determinado fenmeno) seja
irrestrita, sem fronteiras. Alm do mais, a transformao tambm garante que as estimativas de probabilidade
sejam contnuas oscilando entre 0-1.
O mtodo para determinar a relao logstica utilizado no modelo LOGITREG o mtodo nos quadrados
mnimos com introduo de pesos, que segue os seguintes procedimentos:
(1). LOGITREG transforma a probabilidade de se produzir uma nova varivel dependente L (tambm
chamada de razo de probabilidades):
Li = logit(pi) =ln(pi/(1-pi))
Onde pi a probabilidade para observao i (note-se que LOGIT significa unidades logsticas)
(2). Introduz pesos para cada observao (para variveis dependentes e independentes) usando:
Wi =
* pi*(1-pi)
Onde,
Wi o peso para cada observao i,
Ni o tamanho da amostra a partir da qual a probabilidade para cada observao foi calculada.
(3). Aplica-se o mtodo dos quadrados mnimos seguinte equao linear:
Wi * Li =
* bk * Xik)
Onde,
K o nmero de variveis independentes
13
Em Idrisi o mdulo LOGITREG produz regresso logstica e estimativas a partir de imagens ou arquivos de
dados. LOGITREG demanda que se indique o tipo de regresso a ser produzido, entre imagens ou arquivos de
dados.
A varivel dependente deve ser uma imagem cujo formato real binrio, demonstrando probabilidades que
oscilam entre 0 e 1. J as imagens independentes devem estar em formato real. A imagem mscara, quando
utilizada, deve estar m formato byte-binrio com 1s em todas as clulas que devero compor a regresso e 0
nos demais locais.
tambm necessrio estabelecer um nvel de confiana que oscila entre 0 e 1 (a medida em que eventos
futuros correspondero imagem indicada). Uma outra tarefa importante definir o tamanho da amostra para
o clculo de probabilidade (nmero inteiro) a partir dos quais sero calculadas probabilidades associadas a
todos os pontos.
J a rotina LOGITREG, demanda como varivel dependente uma imagem probabilstica, representando a
probabilidade de ocorrncia de um certo evento. A probabilidade pode ser obtida a partir da freqncia na
qual o evento ocorreu em uma amostra de clulas, ou ao combinar-se evidncia indireta com julgamentos
subjetivos do tipo Bayesian and Dempster-Shafer uncertainty.
O tamanho da amostra um parmetro demandado pela rotina LOGITREG. Caso voc tenha apenas uma
imagem Booleana para um determinado evento, pode-se produzir uma imagem de probabilidade utilizandose a rotina FILTER a partir de um tamanho de kernel definido. Isto assume que cada pixel no filtro de kernel
uma amostra para o pixel central, e que o tamanho da amostra o conjunto de pixels inseridos no filtro de
kernel.
14
Bibliografia Bsica
Bailey, T and Gatrell, A. Interactive Spatial Data Analysis. New York Longman Scientific & Technical
1995.
Barber, G. Elementary Statistics of Geographers New York The Guilford Press 1988.
Clif, A and Ord, J. Spatial Autocorrelation London Pion Limited - 1973
Collett, D. Modelining Binary Data London Chapman & Hall - 1991
Eastman, J. Idrisi 32 Tutorial Worcester, Ma. Clark Labs 1999.
Hammond, R. and Mccullagh, P. Quantitative Techniques in Geography: an introduction. London,
Oxford University-1975.
Gerardi, L. Silva, B. Quantificao em Geografia So Paulo Difel - 1981
Johnston, R.J. Multivarite Statistical Analysis in Geography. New York Longman Scientific &
Technical. 1978.
King, L. Statistical Analysis in Geography. Englewood Cliffs, N.J. Prentice Hall Inc.- 1969.
Mongomery, D. and Peck E. Introduction to Linear Regression Analysis. New York John Wiley & Sons,
INC. 1992.
Wrigley, N. Statistical Applications in the Spatial Sciences. London Pion Limited 1979.
15