Você está na página 1de 0

Apostila II

Estatstica Espacial

Alexandre Diniz

Estatstica Espacial
Anlise espacial x no espacial
Em termos gerais, pode-se definir anlise espacial como o estudo quantitativo de fenmenos posicionados no
espao. Portanto, o interesse centrado nos processos que ocorrem no espao e os mtodos aqui empregados
buscam descrever ou explicar o comportamento desses processos, bem como a sua relao com outros
fenmenos espaciais. Os dados portanto, representam, no mais das vezes, amostras desses processos, a partir
dos quais se busca fazer inferncias sobre o comportamento desses fenmenos. Portanto, em anlise espacial,
utiliza-se de tcnicas que explicitamente incorporam as localizaes ou arranjos espaciais dos
objetos/fenmenos em questo.
Um exemplo:
Biogeografia o nmero de espcies de plantas e um conjunto de pequenas ilhas.
1- Relao entre o nmero de espcies e o tamanho das ilhas

Relao positiva quanto maior a rea das ilhas, maior ser o nmero de espcies, uma vez que o
tamanho da ilha influencia a probabilidade de se encontrar uma maior diversidade de hbitats.
Anlise espacial no est particularmente envolvida neste estgio. O simples fato de que se est lidando
com um conjunto de reas que tm posio geogrfica definida no torna o estudo espacial.

2- Distncia isolamento das ilhas em relao a outras ilhas e ao continente e o nmero de espcies.

Relao negativa evidncia emprica demonstra que a distribuio de espcies de pssaros entre ilhas
do Pacfico, demonstram que a distncia da Nova Guin reduz o nmero de espcies.
Anlise espacial mais claramente presente, uma vez que a localizao relativa das ilhas (proximidade
umas das outras e do continente) influenciam o nmero de espcies e esto sendo exploradas na anlise.

O fato que a anlise espacial produz resultados diferentes daqueles das abordagens no espaciais, uma vez
que os seus resultados so geralmente mais robustos por incorporarem a dimenso espacial.

Tipos de fenmenos e relaes espaciais


Discretos fenmenos espaciais so constitudos por pontos, linhas e reas. Ex: plantas, pessoas, lojas,
epicentros de terremotos.
Contnuos nfase na continuidade de fenmenos espaciais. Exemplos clssicos so os fenmenos no
ambiente natural tais como a temperatura, elevao, presso atmosfrica, solo, etc. Portanto, tais camadas de
informao, em princpio, podem ser observadas e medidas em todos os pontos da terra.
Atributos - Os fenmenos discretos tm caractersticas ou atributos associados diretamente a eles. Tais
atributos podem ser medidos a partir das escalas clssicas : nominal, ordinal ou intervalar. Pontos podem ser
distinguveis por classes de fenmenos (tipos de espcies de plantas), ordem (vilas, povoados, cidades,
metrpoles), ou ao longo de uma escala contnua de medio (profundidade). O mesmo se aplica s linhas.
Cursos dgua , por exemplo, podem ser limpos ou poludos; de primeira ordem, segunda ordem ou terceira
ordem. Ou ainda podem ter dados em relao ao seu volume de descarga. As reas tm usos de solo
especficos (nominal), mas essas mesmas reas podem ser classificadas de acordo com alguma ordenao. Ou
ainda, os setores censitrios podem ser dados contnuos como densidade populacional, produo econmica,
etc.
Porm se lidarmos exclusivamente com os atributos, ignorando as relaes espaciais entre os pontos de
amostragem, no se pode afirmar que estamos fazendo anlise espacial. Mesmo que nossas unidades de

observao sejam espacialmente definidas. Portanto, apesar das variveis serem importantes, esses valores
divorciados do seu contexto espacial perdem valor e significado. Para a produo da anlise espacial
necessita-se, pelo menos, informao sobre a localizao e atributos, independentemente de como esses
atributos sejam mensurados.
Caso desejamos estudar apenas o arranjo espacial ou padro espacial de entidades, ento esta
essencialmente uma questo geomtrica e ns apenas coletamos dados sobre as localizaes das entidades.
Mas, caso queiramos comparar os arranjos espaciais de diferentes entidades ou o estudo dos padres espaciais
de medidas tomadas a partir de locais especficos, ento precisaremos fazer uso de informaes sobre os
atributos tambm.

Conceitos gerais em anlise de dados espaciais


Anlise de dados espaciais envolve uma descrio apurada de dados relacionados processos operando no
espao, bem como a explorao de padres e relaes em tais dados e a busca de explicao para tais padres
e relaes. Cabe portando fazer uma distino entre os mtodos que so essencialmente voltados para a
visualizao de dados espaciais aqueles que so exploratrios; aqueles voltados para resumir e investigar
padres e relaes espaciais; e aqueles que contam com especificao de um modelo estatstico e a estimao
de parmetros. Esta uma distino que auxilia no entendimento global, mas que no muito precisa.
1. Visualizar dados espaciais
Requerimento essencial em todo tipo de analise de dados a habilidade de ver a distribuio de dados.
Grficos de disperso e outras modalidades grficas so ferramentas importantes para o analista que busca
compreender padres espaciais, formular hipteses e testa-las. Neste sentido na anlise de dados espaciais, o
mapeamento cumpre uma funo muito importante. Equivalente do grfico de disperso.

2. Explorar dados espaciais


Mtodos exploratrios de anlise buscam realizar boas descries dos dados, auxiliando o analista a
desenvolver hipteses sobre tais dados. Tais tcnicas so marcadas por uma srie de afirmaes a priori sobre
os dados e muitas so desenhadas especificamente para serem robustas, ou seja, resistentes influencia de
valores extremos ou outliers.
No contexto da anlise de dados espaciais, os mtodos exploratrios podem ser empregados no formato de
mapas, enquanto outros podem envolver grficos convencionais. Portanto, a diferena do agrupamento
anterior se d pelo nvel de sofisticao empregado.
3. Modelar dados espaciais
Utilizados quando se busca testar certas hipteses, ou estimar, com alguma preciso, a extenso e a forma que
certas relaes estabelecem. Modelos estatsticos esto implcitos em todas as formas de inferncia estatstica
e teste de hipteses, apesar do termo modelo no se utilizado explicitamente nos textos de estatstica
elementar. Como os modelos estatsticos esto voltados para fenmenos que so estocsticos (que so sujeitos
a incerteza e variabilidade, ou governados pelas leis da probabilidade), utiliza-se uma linguagem que nos
permite representar tal incerteza matematicamente. Por isso se faz uso do conceito de varivel aleatria e a
sua distribuio de probabilidade.
Existe uma mirade de mtodos e tcnicas voltadas para o estudo espacial de um conjunto de pontos, linhas e
reas. Aqui, porm, explorar-se- algumas tcnicas voltadas ao estudo de pontos e reas

Mtodos para distribuio de pontos


Aqui os dados consistem de uma srie de pontos locacionais (s1, s2, ...sn) em uma dada rea ou regio R, na
qual eventos de interesse aconteceram. O termo evento utilizado em um sentido mais geral, uma vez que os
eventos em questo podem estar relacionados uma grande variedade de fenmenos espaciais que podem
ocorrer em cada ponto.
Ex: localizaes de ncleos celulares em um a parcela de tecido microscpico, certos tipos de rvores em uma
floresta, casos de doenas ou tipos de crime em uma regio geogrfica.
Um padro espacial de pontos um exemplo simples de dados espaciais, pois os dados so compostos
basicamente pelas coordenadas dos eventos. Isto no significa necessariamente que a anlise ser mais fcil
do que outros tipos de anlise. Na verdade, do ponto de vista estatstico, padres de pontos podem muitas
vezes ser matematicamente mais complexos.
No entanto, muitas vezes os dados no so compostos exclusivamente pela localizao de eventos. Pode-se
tambm ter outros atributos associados a estes eventos que podem ser incorporados na anlise. Tais atributos
podem ser classes de fenmenos (tipos de crimes, espcies de plantas), ou o tempo da ocorrncia de um dado
evento (data).
O objetivo bsico na anlise espacial de padres de pontos examinar se um conjunto de eventos apresenta
um padro sistemtico, ou aleatrio. As alternativas so a formao de agrupamentos ou regularidade na
distribuio de dados. Caso exista algum tipo de padro sistemtico, pode-se buscar compreender em qual
escala este padro ocorre e se algum tipo de padro de concentrao ocorre nas proximidades de algum tipo
de fator ou entidade. A partir desta constatao, uma srie de hipteses so passveis de serem formuladas.

Medidas de tendncia central e disperso espacial


1.0 Centro Mdio

Anlogo mdia aritmtica.


Definido como o ponto de um plano que minimiza a soma das distncias quadrticas a todos os outros
pontos do plano.
Tambm pode ser encarado como o ponto de equilbrio de um dado plano
A posio construda com base na mdia aritmtica dos valores de X e de Y, tomados de maneira
independente

Para o clculo deve-se:

Estabelecer um sistema de coordenadas


Enumerar as observaes
Fazer a leitura das coordenadas de cada ponto
Aplicar as seguintes frmulas aos valores observados

Centro mdio
X=

Y=

2.0 Centro Mdio Ponderado


No clculo do centro mdio, atribumos o mesmo peso a todos os valores, alm de levarmos em considerao
apenas a localizao dos pontos. O centro mdio representa o centro gravitacional de um conjunto de pontos,
independente da intensidade de ocorrncia dos pontos. Entretanto, em certas ocasies imperativo levar em
considerao os pesos dos diversos fenmenos associados reas especficas.
Ex1: no basta saber a localizao das indstrias, mas importante levar em conta a sua produo;
Ex2: no basta saber a localizao das cidades, mas importante levar em conta a sua populao;
Ex3: no basta saber a localizao dos tornados ou terremotos, mas importante levar em conta a sua
magnitude ou intensidade.
Portanto, o valor de ponderao, em geral, a intensidade de ocorrncia de um determinado fenmeno.
Procedimentos
Replicar as etapas 1-3 do clculo do centro mdio
Aplicar as seguinte frmulas

X w=

ixi

Yw=

wi

iyi
wi

Obs: a localizao do ponto mdio e do ponto mdio ponderado afetada pela localizao de cada ponto em
particular, assim como o peso de cada localizao. Pontos com localizaes extremas, ou com pesos altos
atraem para si o centro de distribuio.

3.0 Distncia Padro ou Raio Padro


No basta saber a mdia central de uma distribuio. Assim como na estatstica descritiva no espacial,
distribuies distintas podem apresentar o mesmo ponto central. Por isso, as medidas de variabilidade ou
disperso, tendo como base o ponto central so teis no estudo de distribuies geogrficas.
Enquanto na estatstica no espacial a disperso medida acima e abaixo do ponto central (mdia), na
estatstica espacial a disperso medida em torno do ponto central. A distncia padro, porm representa o
raio dinmico, ou raio padro, que representa a variabilidade de um conjunto de pontos em torno de um valor
mdio central. Ao logo do processo, obtm-se um crculo, centrado no centro mdio, cujo raio a distncia
padro.
A distncia padro equivalente ao desvio padro. No entanto, o desvio padro unidimensional tem por base
diferenas ou distncias quadrticas de cada valor de X mdia do conjunto. A distncia padro ter a mesma
fundamentao, porm em relao a dois eixos: X e Y.
.
Distncia padro =

- Mdia de X)2 +
N

- Mdia de Y)2

Obs1: Assim como o desvio padro mensurado na unidade de medida dos dados originais, tambm a
distncia padro expressa nas unidades de medida de X e Y (Cm, Km, Milhas, Graus, etc.)
Obs2:Valores muito discrepantes do conjunto de dados costumam influenciar o valor da distncia padro, uma
vez que as suas distncias so elevadas ao quadrado.

4.0 Distncia padro ponderada


O clculo anterior no levou em considerao a magnitude, ou peso das localidades. Utilizou-se apenas a
localizao dos pontos.
Quando a magnitude do fenmeno localizado nos pontos for relevante, deve-se utilizar para o clculo a
frmula:
Distncia padro =

- Mdia de Xw)2 +

- Mdia de Yw)2

Onde o centro mdio ponderado dado por:


X w=

ixi

wi

Yw=

iyi
wi

Obs: As distncias ponderadas e no ponderadas nem sempre so coincidentes. O tamanho do raio


proporcional ao grau de disperso das distribuies e ao peso dos fenmenos nos pontos em questo.

5.0 Disperso relativa


Quando um fenmeno estudado em reas de tamanho diferente, deve-se resistir tentao de comparar os
resultados relativos disperso. A tcnica muito sensvel s distncias, e consequentemente ao tamanho da
rea de estudo. A disperso relativa, no entanto, oferece uma soluo para este problema. A tcnica
assemelha-se ao coeficiente de variao. O seu clculo envolve alm da distncia padro, a rea efetiva na
qual a distncia padro foi mensurada, que pode tambm ser representada por um raio ou crculo. Portanto,
Disperso relativa = Distncia padro
ra
Onde,
ra Raio da rea efetiva de mensurao do fenmeno estudado

Em IDRISI, CENTER calcula a mdia ponderada e no ponderada e o raio padro de um conjunto de pontos
expressos como freqncias de clulas. No processo, o coeficiente de disperso relativa tambm calculado.
A rotina CENTER requer que se revele o nome da imagem a ser avaliada. No processo, a rotina assume que
os valores presentes na imagem representem o nmero de pontos em cada clula (para o clculo da mdia
central), ou pesos a serem aplicados posio da clula (para o clculo da mdia central ponderada).
Os resultados trazem o centro mdio ponderado pelos valores das clulas, levando-se em considerao as sua
posio em relao s linhas e colunas, bem como em relao ao sistema de coordenadas utilizados. Da
mesma maneira, o raio padro expresso em termos de clulas e unidades de referncia. CENTER tambm
indica o coeficiente de disperso relativa (CRD). O CRD expressa o grau de disperso relativa em uma dada
rea. Ele calculado a partir da razo entre o raio padro e o raio de um crculo que contenha a mesma rea
sendo estudada, vezes 100.

Anlise de Tendncia de Superfcie

Tcnica similar anlise de regresso mltipla, na qual as variveis independentes so compostas pelas
coordenadas espaciais dos diversos pontos em questo. O objetivo identificar a tendncia distributiva de um
dado fenmeno em uma determinada regio, a partir da identificao de tendncias relativas latitude e
longitude. Tal objetivo atingido a partir do clculo de equaes polinomiais lineares, quadrticas e cbicas
para um conjunto de pontos.
Exemplo:
O tamanho mdio dos seixos encontrados a partir de pontos amostras em uma praia. Existe uma tendncia
espacial em relao a esta distribuio?

Ao produzirmos uma anlise de regresso simples, utilizando o tamanho mdio dos seixos como varivel
dependente (Y) e as duas coordenadas dos pontos (U) e (V) teremos:
Y= 1.45 + 0.71U
Y= 1.45 + 0.71V

rYU= 0.85
rYV=0.85

A primeira dessas equaes indica uma forte tendncia de crescimento no tamanho mdio dos seixos em
relao ao leste ao longo da praia. Por outro lado, a segunda equao sugere a presena de uma forte
tendncia ao aumento no tamanho mdio dos seixos em direo ao norte da praia.

No entanto, ao analisarmos mais detidamente a distribuio de pontos, percebe-se um incremento no tamanho


mdio dos seixos na direo sudoeste nordeste. Introduzindo-se as duas medidas simultaneamente na
equao tem-se:

Y=0.0 + 0.5U + 0.5V

RY.UV = 1.0

Obs: Como se est utilizando a mesma unidade de medida para U e V (graus), pode-se comparar os
coeficientes de regresso.
Portanto, neste exemplo acabamos de demonstrar a utilizao de uma equao polinomial linear, na qual
Z = b0 + b1x + b2y
Ou seja, trabalhamos com tendncias unidirecionais (Norte-Sul x Leste-Oeste). Entretanto, pode-se trabalhar
com padres espaciais mais complexos com a ajuda de outras equaes. Neste sentido, poder-se-ia ter
relaes como essas:
Y= a + b1U b2U2 +/- e
Indicando que o tamanho mdio dos seixos aumentaria ao nos distanciarmos da paria no sentido leste e depois
voltaria a diminuir. Ou ainda,
Y= a - b1V b2V2 +/- e
Indicando que o tamanho mdio dos seixos diminuiria e depois aumentaria no sentido norte.
Adicionando-se as duas frmulas demanda a incorporao de um termo de interao entre U e V de modo que
se tem uma relao quadrtica:
Y = a + b1U + b2U2 + b3UV + b4V +b5V2 +/- e
Tal equao produz uma tendncia de superfcie quadrtica, cuja forma se assemelha a de um domo.
Superfcies de grandeza maior devem ser produzidas onde os padres espaciais forem excessivamente
complexos. Na maioria dos casos tais superfcies so utilizadas para descrever padres de maneira mais
apurada, j que o significado dos coeficientes de regresso so mais difceis de serem interpretados.
Em IDRISI o mdulo TREND calcula e produz superfcies de tendncia com base em equaes polinomiais
lineares, quadrticas e cbicas. O mdulo TREND, alm de produzir a imagem, tambm traz informaes
sobre a equao polinomial produzida, bem como o seu poder de predio. O nmero de clulas utilizadas
para determinar a imagem de tendncia informada, seguido dos coeficientes da equao polinomial. O

coeficiente "b0" representa o termo interceptor, e os coeficientes "bn" so os coeficientes de inclinao (b)
associados ordem da equao polinomial selecionada. O grau de predio do modelo expresso em
percentagem e acompanhado pelo valor de F e os graus de liberdade.

Mtodos para o estudo de dados relativos reas


Na parte anterior ns estvamos preocupados com a variao espacial de um atributo localizado em pontos
especficos da superfcie, ou com atributos que variavam continuamente no espao, mas que foram
amostrados em pontos especficos da superfcie. Neste mdulo, porm, voltaremos a ateno para atributos
que no variam continuamente, mas que tm valores especficos para sub-reas que compem uma dada
regio de estudo. Essas entidades fixas podem constituir unidades de rea como estados, municpios, distritos,
setores censitrios, ou at mesmo pixels.
Neste sentido, no estamos interessados em estimar valores de atributos vinculados a certos pontos no espao
nos quais observaes so feitas. Primeiro, porque no existem valores entre as reas de anlise, e depois
porque os valores, no mais das vezes, j foram observados em todas as reas possveis. Aqui estamos mais
interessados na deteco e possveis explicaes para o padro espacial ou tendncia de distribuio para
esses valores de rea.

Cruzamento de dados categricos


1.0 O teste de Qui-quadrado
Avalia se freqncias obtidas empiricamente diferem significativamente daquelas esperadas com base em
suposies tericas. Testa a relao entre duas variveis nominais com base em uma tabela de contingncias.
Ex: relao entre a localizao residencial e modalidade de domiclio.
X1 = centro x periferia
X2 = domiclios chefiados por homens x domiclios chefiados por mulheres

Tipo de domiclio
Mulheres
Homens
Total

Centro
60
175
235

Periferia
40
250
290

Total
100
425
525

H1: Existe uma relao entre o tipo predominante de domiclio e a localidade no mbito da cidade
H0: No existe relao alguma entre o tipo predominante de domiclio e a localidade no mbito da cidade
Com base nos dados acima, sabe-se que:
25,53% dos domiclios do centro so chefiados por mulheres, contra 13,79% daqueles situados na periferia.
Esta diferena estatisticamente significativa? Atravs do teste de Qui-quadrado pode-se testar esta suspeita.

X2 =

(Oij-Eij)2
Eij

Onde,
c
Somatrio das colunas
l
- Somatrio das linhas
Oij Valores observados
Eij - Valores esperados caso nenhuma relao existisse

Para gerar a tabela de freqncias esperadas:


A
C
A+ C

B
D
B+D

A+B
C+D
A+B+C+D = N

Nmero esperado na clula A


(A+B) (A+C)
(235) (100)
N
525

44.76

Nmero esperado na clula B


(A+B) (B+D)
(290) (100)
N
525

55.24

Nmero esperado na clula C


(C+D) (A+C)
(235) (425)
N
525

190.24

Nmero esperado na clula D


(C+D) (B+D)
(425) (290)
N
525

234.76

Valores esperados
Tipo de domiclio Centro Periferia
Mulheres
44.76
55.24
Homens
190.24 234.76
Total
235
290

Total
100
425
525

Inserindo os valores na frmula:


X2 = (60 - 44.76)2 +
44.76

(40-55.24)2
55.24

+ (175-190.24)2
190.24

(250-234.76)2
234.76

X2 = 5.19 + 4.20 + 1.22 + 0.99


X2 = 11.6

Graus de liberdade:
CeL>1
C=1eL
C

GL= (C-1) (L-1)


GL= (L-1) (1)
GL= (C-1) (1)

C = N de colunas
L = N de linhas
Comparar valor computado com valor crtico

10

X2 crtico = 6.635
X2 computado = 11.60
Concluso: Confirma-se a presena de uma relao estatstica
Obs:
Amostras devem ser independentes
N por clula deve ser maior ou igual a 5

2.0 Coeficiente de V de Cramer


Medida de grau de associao entre variveis nominais, configurando-se como um coeficiente de correlao
que oscila entre 0, indicando ausncia de correlao, e 1 ,indicando uma correlao perfeita. Utilizado
quando se trabalha com tabelas retangulares (4X; 5X7).
Produzido a partir da seguinte frmula:

Cramers V =

X2
.
N (k-1)

Sendo que o valor mnimo se refere ao menor nmero de colunas e linhas presentes na anlise.
Com base nos dados acima:
Cramers V =

11.6 .
525 (1)

Cramers V = 0.1486

3.0 Kappa
Permite confirmar a relao entre duas variveis categricas que possuem classes similares. O coeficiente
de Kappa oscila entre 0 e 1, com interpretao similar de Cramers V.
Ex: Dois supervisores classificaram o desempenho em sala de aula de 72 monitores de acordo com os
seguintes critrios: autoritrio, democrtico e permissivo. Os resultados finais so apresentados abaixo:

Supervisor 1
Autoritrio
Democrtico
Permissivo
Total

Supervisor 2
Autoritrio Democrtico
17 (23.6)
4 (5.6)
5 (6.9)
12 (16.7)
10 (13.9)
3 (4.2)
32 (44.4)
19 (26.4)

Permissivo
8 (11.1)
13 (18.1)
21 (29.2)

Total
29 (40.3)
17 (23.6)
26 (36.1)
72 (100.0)

A media mais simples de concordncia entre as duas avaliaes seria simplesmente a proporo de avaliaes
que so comuns entre os dois supervisores. Neste caso o resultado seria 58.3%. Entretanto, esta metodologia
no leva em considerao o fator chance no processo de coincidncia entre as avaliaes.
Para corrigir este erro, pode-se computar a proporo de casos coincidentes que se esperaria encontrar caso as
avaliaes fossem independentes. Por exemplo, o supervisor 1 classificou 40.3% dos monitores como
autoritrios, enquanto o supervisor 2 classificou 44.4% dos monitores como autoritrios. Caso as avaliaes
fossem independentes, voc esperaria que 17.9% (40.3% x 44.4%) dos monitores fossem classificados como

11

autoritrios por ambos supervisores. Da mesma forma 6.2% (23.6% x 26.4%) seriam classificados como
democrticos e 10.5% (36.5% x 29.2%) como permissivos. Portanto, 34.6% de todos os monitores seriam
classificados da mesma forma por pura chance.
A diferena entre a proporo observada de casos nos quais as avaliaes coincidem e aquela que ocorre ao
acaso 0.237 (0.583-0.346). O coeficiente de Kappa nomaliza esta diferena ao dividi-la pela diferena
mxima possvel aos totais marginais. Neste exemplo, o maior valor possvel de concordncia real de 10.346 ( nvel de chance). Portanto,
Kappa = 0.237/ (1-0.346) = 0.362

Kappa = diferena entre concordncia observada e concordncia ao acaso


(1-concordncia ao acaso)

Em Idrisi, a opo CROSSTAB executa duas operaes. Primeiramente, o programa executa um cruzamento
de imagens na qual as categorias de uma imagem so comparadas s categorias de uma segunda imagem em
forma de tabela. Nesta tabela so apresentadas todas as formas de combinao. O resultado desta operao
uma tabela que traz os totais tabulados, bem como duas medidas de associao entre as imagens.
A primeira desta medidas o Cramer's V. Alm disso, a estatstica de Chi-quadrado tambm produzida
juntamente com os graus de liberdade apropriados para que a significncia de Cramer's V possa ser testada.
Se o Chi-quadrado significante, o mesmo vale para Cramer's V.
Caso as duas imagens tenham o mesmo nmero de categorias, uma outra medida de grau de associao
est disponvel: Kappa. Esta medida tambm varia entre 0.0 e 1.0 com a mesma interpretao. Entrementes,
Kappa s pode ser utilizada quando as categorias atinentes s imagens em questo expressem o mesmo tipo
de dados, com o mesmo nmero de classes.
A Segunda operao a cross-classificao de imagens. Tal operao pode ser definida como uma
justaposio (OVERLAY) mltipla, demonstrando todos os tipos de combinao. O resultado uma nova
imagem que demonstra os locais de todas as combinaes entre categorias presentes nas imagens originais.
No processo, uma legenda automaticamente produzida demonstrando essas combinaes.

Obs1. As imagens de entrada no podem possuir mais do que 128 categorias.


Obs2. A imagem de sada no pode possuir mais do que 256 categorias.

Anlise de Regresso Linear Mltipla


Ver apostila de estatstica bsica
Anlise de Componentes Principais
Ver apostila de estatstica bsica
Anlise de Regresso Logstica
Em regresso logstica, a varivel dependente discreta, tal qual o uso e ocupao do solo, por exemplo. Se a
varivel dependente dicotmica, o valor de Y toma apenas dois valores 1 e 0. Ao estimarmos mudanas na
cobertura florestal, por exemplo, Y=1 representaria eventos nos quais a floresta se modificou, enquanto Y=0
representaria eventos nos quais as florestas permaneceram da mesma forma no perodo em questo.

12

No caso de trs variveis independentes, a regresso logstica definida da seguinte forma:

logit(p)=a+b1*x1+b2*x2+b3*x3
Onde,
logit(p) = ln(p/(1-p)) (L na figura acima), p a varivel dependente, a probabilidade de que um determinado
evento tenha ocorrido. Os demais componentes tm o mesmo significado que em regresso linear mltipla.
A relao entre uma varivel dependente e outra independente segue uma curva logstica como representado a
figura acima.
Note-se que a transformao logstica de dados dicotmicos garante que a varivel dependente da regresso
seja contnua, e que a nova varivel (a probabilidade de ocorrncia de um determinado fenmeno) seja
irrestrita, sem fronteiras. Alm do mais, a transformao tambm garante que as estimativas de probabilidade
sejam contnuas oscilando entre 0-1.
O mtodo para determinar a relao logstica utilizado no modelo LOGITREG o mtodo nos quadrados
mnimos com introduo de pesos, que segue os seguintes procedimentos:
(1). LOGITREG transforma a probabilidade de se produzir uma nova varivel dependente L (tambm
chamada de razo de probabilidades):
Li = logit(pi) =ln(pi/(1-pi))
Onde pi a probabilidade para observao i (note-se que LOGIT significa unidades logsticas)
(2). Introduz pesos para cada observao (para variveis dependentes e independentes) usando:
Wi =

* pi*(1-pi)

Onde,
Wi o peso para cada observao i,
Ni o tamanho da amostra a partir da qual a probabilidade para cada observao foi calculada.
(3). Aplica-se o mtodo dos quadrados mnimos seguinte equao linear:
Wi * Li =

* bk * Xik)

Onde,
K o nmero de variveis independentes

13

Xik o valor da varivel Kn para cada observao i


bk o coeficiente para a varivel Kn
(4) Para estimar pi a partir do Li predito para cada observao i:
Pi = exp(Li)/1+exp (Li)
A regresso logstica tem os mesmo pr-requisitos em relao s variveis do que a regresso linear mltipla.
Portanto, quando se utilizar de imagens neste mdulo, verifique se estas no so espacialmente
autocorrelacionadas. Por esta razo, os graus de liberdade verdadeiros no so calculveis (por isto os graus
de liberdade aparentes so computados. Para reduzir o impacto da dependncia espacial entre observaes,
pode-se tratar as imagens antes de se gerar o modelo LOGITREG.
Neste sentido, pode-se
(1) usar o refinamento de pixels, a partir do mdulo CONTRACT para se tomar apenas pores de amostras
(2) produza amostras de uma imagem e extraia os valores das variveis dependente e independente para a
produo de arquivos de dados
(3) usar uma imagem mscara para eliminar certos pixels da anlise

Em Idrisi o mdulo LOGITREG produz regresso logstica e estimativas a partir de imagens ou arquivos de
dados. LOGITREG demanda que se indique o tipo de regresso a ser produzido, entre imagens ou arquivos de
dados.
A varivel dependente deve ser uma imagem cujo formato real binrio, demonstrando probabilidades que
oscilam entre 0 e 1. J as imagens independentes devem estar em formato real. A imagem mscara, quando
utilizada, deve estar m formato byte-binrio com 1s em todas as clulas que devero compor a regresso e 0
nos demais locais.
tambm necessrio estabelecer um nvel de confiana que oscila entre 0 e 1 (a medida em que eventos
futuros correspondero imagem indicada). Uma outra tarefa importante definir o tamanho da amostra para
o clculo de probabilidade (nmero inteiro) a partir dos quais sero calculadas probabilidades associadas a
todos os pontos.
J a rotina LOGITREG, demanda como varivel dependente uma imagem probabilstica, representando a
probabilidade de ocorrncia de um certo evento. A probabilidade pode ser obtida a partir da freqncia na
qual o evento ocorreu em uma amostra de clulas, ou ao combinar-se evidncia indireta com julgamentos
subjetivos do tipo Bayesian and Dempster-Shafer uncertainty.
O tamanho da amostra um parmetro demandado pela rotina LOGITREG. Caso voc tenha apenas uma
imagem Booleana para um determinado evento, pode-se produzir uma imagem de probabilidade utilizandose a rotina FILTER a partir de um tamanho de kernel definido. Isto assume que cada pixel no filtro de kernel
uma amostra para o pixel central, e que o tamanho da amostra o conjunto de pixels inseridos no filtro de
kernel.

14

Bibliografia Bsica
Bailey, T and Gatrell, A. Interactive Spatial Data Analysis. New York Longman Scientific & Technical
1995.
Barber, G. Elementary Statistics of Geographers New York The Guilford Press 1988.
Clif, A and Ord, J. Spatial Autocorrelation London Pion Limited - 1973
Collett, D. Modelining Binary Data London Chapman & Hall - 1991
Eastman, J. Idrisi 32 Tutorial Worcester, Ma. Clark Labs 1999.
Hammond, R. and Mccullagh, P. Quantitative Techniques in Geography: an introduction. London,
Oxford University-1975.
Gerardi, L. Silva, B. Quantificao em Geografia So Paulo Difel - 1981
Johnston, R.J. Multivarite Statistical Analysis in Geography. New York Longman Scientific &
Technical. 1978.
King, L. Statistical Analysis in Geography. Englewood Cliffs, N.J. Prentice Hall Inc.- 1969.
Mongomery, D. and Peck E. Introduction to Linear Regression Analysis. New York John Wiley & Sons,
INC. 1992.
Wrigley, N. Statistical Applications in the Spatial Sciences. London Pion Limited 1979.

15

Você também pode gostar