Você está na página 1de 50

Análise estatística de dados

georreferenciados
(pontos)

Christovam Barcellos
Análise espacial - Etapas

georreferenciamento
Colocando dados no mapa

Organização de dados em SIG


Interrelacionando dados entre camadas

Análise de dados
Medição de associação, fluxos
e aglomerados
Técnicas de análise estatística de pontos

Medidas com base na distância


• Medidas descritivas
• Agrupamento hieráquico de vizinhos mais próximos (NNHSC)
• Estimativa Kernel (densidade)

Medidas considerando a população


• Grupos significativos em um círculo (Teste Scan)
• Estimativa Kernel dual (incidência)
• Interpolação (kernel ou kriging) de valores de pontos
Áreas Pontos

Uma das formas mais tradicionais de se elaborar mapas de interesse para


a Saúde Pública é a representação de eventos de saúde em forma de
pontos. O uso de pontos para localização de eventos, no momento da
construção da base de dados geográfica e durante o procedimento de
análise minimiza problemas associados com as barreiras impostas pela
delimitação de áreas administrativas artificiais.
Pontos
Pontos - Eventos em saúde

Se estes eventos estiverem


concentrados no espaço é bem provável
que exista uma determinação espacial
deste evento e que encontrando os
locais com maior concentração, temos
uma pista para identificar fatores
ambientais, sociais ou ligados à própria
assistência à saúde que podem ser
objeto de ação da vigilância em saúde.
• Acidentes de trânsito (-)
• Casos de sarampo (-)
• Internações por algum agravo (-)
• Pessoas vacinadas (+)
Cólera em Londres, 1854
Os pontos
estão
próximos?

Existe um
“padrão
espacial” de
pontos?

Os eventos
estão
aglomerados
(“cluster”)?
Medidas descritivas de pontos

• Média espacial
• Mediana espacial
• Desvio padrão espacial (elipse
envolvente)
Medidas descritivas de pontos

Média e desvio (elipse)


Mostram locais centrais
São diferentes?
Medidas descritivas de pontos
Escolha do número de desvios
300

200

100

Std. Dev = 23816,68


Mean = 48431,5
0 N = 2440,00

10
10

20

30

40

50

60

70

80

90

00
00

00

00

00

00

00

00

00

00
0,

00
0

0,

0,

0,

0,

0,

0,

0,

0,

0,

,0
0

0
1 DP
Total Appraised Value
2 DP
Investigação de hepatite A no município de Macapá

933 pontos que


representam o
local de residência
de casos de
hepatite A

Existe um
padrão?

Neri, 2004
Investigação de hepatite A no município de Macapá

O padrão da distribuição
de pontos é diferente do
aleatório?

Aglomerado Regular Aleatório


Análises baseadas na distância entre pontos ou
análise de cluster

Y1
X1

Y2

X2

d (x 1 - x 2 ) 2
 (y 1 - y 2 ) 2

Análises baseadas na distância entre pontos ou
análise de cluster
Aglomerado Regular Aleatório

Distância média Desvio padrão da distância


(em m) (em m)
Aglomerado 358 688
Regular 1094 321
Aleatório 890 643
Técnicas de análise estatística de pontos

Medidas com base na distância


• Medidas descritivas
• Agrupamento hieráquico de vizinhos mais próximos (NNHSC)
• Estimativa Kernel (densidade)

Medidas considerando a população


• Grupos significativos em um círculo (Teste Scan)
• Estimativa Kernel dual (incidência)
• Interpolação (kernel ou kriging) de valores de pontos
Análise de agrupamento hierárquico
Nearest Neighbor Hierarchical Spatial Clustering NNHSC

• As distâncias de cada ponto para todos os


demais é comparada com o intervalo de
confiança.
• Os pares de pontos com distância menor que o
intervalo de confiança são usados como
centros dos agrupamentos.
• São calculadas as distâncias entre os pontos e
esses centros.

• Estipulado pelo usuário:


– A probabilidade para definir intervalos de confiança,
– O número mínimo de pontos para os agrupamentos.
Nearest Neighbor Hierarchical Clustering
Ponto 1

3 pontos agrupados com o ponto 1


Distância entre o ponto 1 e os outros maior que o intervalo de confiança
Distância entre o ponto 1 e os outros menor que o intervalo de
confiança, selecionados como agrupados ao ponto 1
Nearest Neighbor Hierarchical Clustering
Ponto 2

4 pontos agrupados com o ponto 2


Distância entre o ponto 2 e os outros maior que o intervalo de confiança
Distância entre o ponto 2 e os outros menor que o intervalo de
confiança, selecionados como agrupados ao ponto 2
Nearest Neighbor Hierarchical Clustering
Ponto 3

2 pontos agrupados com o ponto 3

Distância entre o ponto 3 e os outros maior que o intervalo de confiança


Distância entre o ponto 3 e os outros menor que o intervalo de
confiança, selecionados como agrupados ao ponto 3
Nearest Neighbor Hierarchical Clustering

Agrupamento de 2a ordem

Agrupamento de 1a ordem

Crimestat
Detecção de aglomerados de casos de hepatite A
no Rio de Janeiro
Técnicas de análise estatística de pontos

Medidas com base na distância


• Medidas descritivas
• Agrupamento hieráquico de vizinhos mais próximos (NNHSC)
• Estimativa Kernel (densidade)

Medidas considerando a população


• Grupos significativos em um círculo (Teste Scan)
• Estimativa Kernel dual (incidência)
• Interpolação (kernel ou kriging) de valores de pontos
Estimativa de densidade

Leptospirose
em Porto Alegre

SMS-Poa, 2002
Estimador de densidade
“Kernel Estimation”
2
n
3  h 2

τ ( s)   2 I 1  2 
ˆ i

i 1    

kernel
S
Si hi 
Estimador de densidade
“Kernel Estimation”

Camada de pontos Grade de Intensidade Superfície de saída

Observações

kernel

Ponto a ser estimado

Câmara, 2002
Estimador de densidade
Kernel – efeito do raio

Menor raio (τ= 200 m) Maior raio (τ= 1000 m)


Detecção de aglomerados de
pontos (clusters)

- Um “aglomerado” pode ser definido


como um excesso de densidade de
pontos no espaço.
- Ou um excesso relativo ao número
esperado
Estudos caso /controle espaciais

Onde está a população?

-População de referência
-Casos e controles
-Positivos e negativos

Long, 2000
www.sph.umich.edu/geomed/grabber
Estudos caso /controle espaciais

Onde está a população?

Uma alternativa:
Selecionar controles
- Precisam ter as mesmas
características dos “casos”
(sexo, idade, renda,…);
- Espalhados por toda a área de
estudo.
- Usar a mesma fonte de
informação
Teste de aglomerados em torno de um ponto

• Construir círculos
(buffers) em torno do
ponto;
• Calcular taxas dentro
e fora do círculo.
• Comparar taxas
Antenas do Vaticano
Clusters around emission sources
Adult and Childhood Leukemia near a High-Power Radio Station in Rome

Michelozzi et al., 2002


Clusters around emission sources
Adult and Childhood Leukemia near a High-Power Radio Station in Rome

SMR

Distance

Michelozzi et al., 2002


Teste de aglomerados em torno de um
ponto
• Nem sempre os
círculos representam
os processos
espaciais.
Alternativas:
Incorporar modelos
dentro do SIG
Usar círculos móveis
Técnicas de análise estatística de pontos

Medidas com base na distância


• Medidas descritivas
• Agrupamento hieráquico de vizinhos mais próximos (NNHSC)
• Estimativa Kernel (densidade)

Medidas considerando a população


• Grupos significativos em um círculo (Teste Scan)
• Estimativa Kernel dual (incidência)
• Interpolação (kernel ou kriging) de valores de pontos
Detecção de aglomerados (clusters)
• Construir um círculo que se move pela área de
estudo;
• Contar o número de eventos dentro do círculo
(observado);
• Somar a população dentro do círculo;
• Calcular o número esperado de eventos no
círculo;
• O número observado é significativamente
diferente do esperado?
– Não – Mudar a posição e raio do círculo
Satscan, www.satscan.org
– Sim – Marcar o aglomerado
Detecção de aglomerados (clusters)

Taxa significativa baixa Taxa significativa alta

Satscan, www.satscan.org
Detecção de aglomerados (clusters)
- O valor esperado é comparado com o
observado baseado na população de
referência ou controles.
- A significância estatística é testada
através de regressão de Poisson.
Técnicas de análise estatística de pontos

Medidas com base na distância


• Medidas descritivas
• Agrupamento hieráquico de vizinhos mais próximos (NNHSC)
• Estimativa Kernel (densidade)

Medidas considerando a população


• Grupos significativos em um círculo (Teste Scan)
• Estimativa Kernel dual (incidência)
• Interpolação (kernel ou kriging) de valores de pontos
Distribuição espacial da infecção
Goiânia, 2002

Martelli et al., 2004


Kernel de pontos com valores dicotômicos
Estimativa de prevalência

Martelli et al., 2004


Técnicas de análise estatística de pontos

Medidas com base na distância


• Medidas descritivas
• Agrupamento hieráquico de vizinhos mais próximos (NNHSC)
• Estimativa Kernel (densidade)

Medidas considerando a população


• Grupos significativos em um círculo (Teste Scan)
• Estimativa Kernel dual (incidência)
• Interpolação (kernel ou kirging) de valores de pontos
Dados de valores em pontos
(geoestatística)
• Envolve análise e inferência de variáveis distribuídas no
espaço.

• • • • • • • • •
Limite da área • • • • • • • • • • •
Amostras de
• • • • • • • • • • • • •
de estudo • • • • • • • • • • • • campo
• • • • • • • • • • • •
• • • • • • • • • • •
• • • • • • • • • • • •
• •





• • • • • • • •
• • • • • • •
Inferências
• • •

 Análise: estudar ou descrever a variabilidade espacial do


fenômeno, neste contexto denominado de análise
estrutural ou modelagem do semivariograma.
 Inferência: conjunto de técnicas usadas para inferir
valores, de uma variável distribuída no espaço, em locais
não amostrados. Neste contexto denominado de
Krigeagem.
Pontos (valores)
Comparação entre métodos
Valores absolutos Valores ponderados
Vizinhos mais próximos
Scan

Kernel simples Kernel dual


Outros recursos de um SIG

• Aglomerados de casos de hepatite A segundo o método do vizinho mais


próximo (em pequenas elipses vermelhas).
• Proporção de domicílios sem banheiro nos setores censitários (em tons
de verde).
Outros recursos de um SIG

Coordenadas do centro do
aglomerado

Raio de 1 km

• Aglomerado de casos de hepatite A segundo técnica Scan


• Imagem de satélite Google Earth
Softwares de estatística espacial

• Geoda (áreas),
http://sal.agecon.uiuc.edu/geoda_main.php

• Epimap/Epinfo (áreas), www.cdc.gov/epinfo

• Infomap (áreas e pontos) (Bailey e Gatrell, 1995)

• Crimestat (pontos) (Levine, 2002)


www.icpsr.umich.edu/NACJD/crimestat

• Stascan (pontos) (Kulldorff, 2001) www.satscan.org


Geoprocessamento

Cartografia digital Estatística

Vetores Superfície

Coordenadas
Códigos
SIG
Superfície

Coordenadas Imagem

georreferenciamento Sensoriamento remoto


Algumas referências...
Bailey, T.C. & Gatrell, A. (1995) Interactive Spatial Data
Analysis, Longman Scientific & Technical.

Cressie, N.A.C. (1993) Statistics for Spatial Data, Wiley-


Intersciences.

Diggle, P.J. (2003) Statistical Analysis of Spatial Point


Patterns, Oxford University Press.

Câmara, G.; et al. Geoprocessamento: Teoria e Aplicações.


INPE, 1999 (http://www.dpi.inpe.br/gilberto/livro).

Você também pode gostar