Você está na página 1de 41

Anlise de Dados de rea:

Suavizao de Taxas e Propores


Instabilidade de
Taxas para
Pequenas reas:
Como Tratar ??
Contribuies (em slides e textos):
Renato Assunao, LESTE-UFMG
Wayner Vieira, CPqAM-Fiocruz
Oswaldo Cruz, PROCC-Fiocruz
Ilka Reis, Depto Est.-UFMG

Antes
Ainda em Autocorrelao
Espacial
Em
estudos
Como Tratar Taxas e Razes??

epidemiolgicos, os valores
considerados
nos
mapas
usualmente so taxas ou
razes. Se Ni o nmero de
pessoas em risco e se yi o
nmero de casos ocorridos
na rea i, a taxa definida

Quando as populaes em
risco so diferentes entre as
reas, como de praxe,
ento as taxas possuem
varincias diferentes e a
hiptese subjacente ao teste
baseado no ndice I de Moran
de que as variveis so i.i.d.
violada.

i.i.d.

independent
identically distributed

and

i.i.d. : Variveis aleatrias

independentes e idnticoUma sequncia (lista ordenada de objetos ou eventos)


eventos
distribudas

a outra coleo of Variveis Aleatrias [VR uma


forma de associar um valor (ex.: x nos Reais) para
cada possvel resultado de certo evento aleatrio.]
independente e idntico-distribuda se cada VR tem
a mesma Distribuio de Probabilidade de todas as
outras na sequncia ou coleo e alm disso so
TODAS mutualmente independentes ( a ocorrncia
de um evento no altera a probabilidade de
ocorrncia de nenhum outro).

permutao, a suposio de
distribuio
invariante
sob
permutao violada pois no
verdade que as reas tenham
a mesma chance de receber
qualquer das taxas observadas.
reas
com
populaes
pequenas possuem taxas com
maior
varincia
e
mais
propensas a assumir os valores
mais
extremos
entre
os
Renato
Assuno,
Assuno&Reis,
observados.

Extratos de Livro em Construo, Captulo 5. (Comunicao Pessoal, Out. 2009)


NEW PROPOSAL TO ADJUST MORAN'S I FOR POPULATION DENSITY, Statist. Med. 18, 2147-2162 (1999)

Pequenas reas:
Motivao

Mapeamentos Geodemogrficos
incluem indicadores de taxas e propores

taxas podem variar muito com o


denominador , em geral populao
Ex: Mortalidade infantil nos Bairros do

Rio

min = 13 nascidos
max = 6980 nascidos
mdia da taxa = 16% ( 0%< t < 87% )
alta instabilidade qdo populao pequena

Instabilidade de Taxas Efeito Funil

Instabilidade em pequenas
reas
B o x p lo t d a T a x a s d e m o r ta lid a d e p o r
A c id e n te s d e T r a n s p o r te B r a s il - 2 0 0 4

Pode-se observar melhor

200
100

ser levados a falsas


interpretaes pelos
mapas de taxas brutas

T a x a p o r 1 0 0 .0 0 0 h a b .

podemos com frequncia

300

este fenmeno
construindo um boxplot
em intervalos da
populao.

maneiras de se
contornar o problemas
uma das mais frequentes
a a mdia trienal.

Existem algumas

< 5

5 -1 0

1 0 -5 0

5 0 -1 0 0

P o p u la o X 1 .0 0 0

1 0 0 -1 .0 0 0

> 1 .0 0 0

taxa acidentes de
transporte por 100.000 hab
2004

taxa acidentes de
transporte por 100.000 hab
trinio 2003-2005

Instabilidade em pequenas
reas
Outras tcnicas que podem
tambm ser aplicadas para
lidar
com
problemas
de
instabilidade
em
pequenas
reas:
agregao de reas
media mvel espacial
bayes emprico global e local

Problema na Anlise
Um
grande
problema
associado ao uso de taxas,
porm, a alta instabilidade
que
elas
possuem
para
expressar o risco de um
determinado evento quando ele
raro e a populao da regio
de ocorrncia pequena.

Alexandre E. dos Santos, Alexandre L. Rodrigues, Danilo L. Lopes,


Aplicaes de Estimadores Bayesianos Empricos para Anlise Espacial de Taxas de Mortalidade,
II Simpsio Brasileiro de Geoinformtica, Campos do Jordo, Brasil, 20-23 novembro 2005, INPE, p. 300-309

Problema na Anlise
As variaes bruscas que
ocorrem com estas taxas
podem nada ter a ver com o
fenmeno e sim com uma
variabilidade associada s
observaes

Problema na Anlise
Flutuaes aleatrias casuais,
como a ocorrncia de um ou
dois casos do evento a mais ou a
menos numa localidade, causam
variaes substanciais nas taxas
brutas se a sua populao for
pequena,
efeito
este
no
verificado em localidades de
populao grande.

Problema na Anlise
Alm disso, para situaes em que
no ocorrem casos do evento em
algumas regies, a taxa bruta
estima o risco de ocorrncia do
evento como zero, algo irreal
tratando-se de dados como doenas
ou crimes. Mapas de eventos
baseados
diretamente
nessas
estimativas brutas so de difcil
interpretao
e
freqentemente
geram falsas concluses.

Modelos Espaciais
Bayesianos
Basicamente
tcnicas

de
mapeamento de reas onde se
incorpora o conhecimento a priori
do investigador.

A principal caracterstica procurar

identificar o processo que gerou


aqueles dados, e no apenas aquela
realizao dos dados, filtrando a
variabilidade aleatria.
RENATO M. ASSUNO et al. - Mapas de taxas epidemiolgicas:uma abordagem Bayesiana,
Cad. Sade Pblica, Rio de Janeiro, 14(4):713-723, out-dez, 1998

Modelos Espaciais
Bayesianos
Para

isso incorpora-se informao


das reas vizinhas: vizinhos so
parecidos

mais
utilizado
mtodo
de
estimativa - Markov Chain Monte
Carlo
(MCMC)
atravs
de
simulaes permite estimar no s o
valor esperado da distribuio da
varivel estudada em cada rea, mas
outros parmetros tambm.

Estimador Bayesiano
Emprico
Idia
conhecimento a priori - o valor
medido da taxa
conhecimento
a
posterioria
distribuio da taxa
Distribuio da Taxa

hiptese: taxa tem distribuio


ti ~ D( i , i)

Padronizao
Para

permitir comparaes entre


diferentes populaes no espao ou
no tempo, variveis devem ser
padronizadas.
padronizadas

Padronizar as

populao em risco
por tamanho, estrutura etria e sexo
o mais comum.

Padronizao pode ser tambm por

rea, por tempo de exposio, etc.

Padronizando os tamanhos de
Populao
i

= ndice das reas


Em cada rea i :

O1 Pop1
O3 Pop3

O2 Pop2

Oi = nmero de eventos
em i
Popi = pop sob risco em
i

O4 Pop4

r i = Oi / Popi = taxa em
i

s vezes, usa-se ti =
100000 * ri, taxa por
100 mil em i

Problemas de Estimao em reas


Pequenas
Valores extremos ocorrem nas reas

com pequenas populaes

O que mais chama a ateno num

mapa (os valores extremos), o


menos confivel !

As maiores oscilaes no estaro,

em geral, associadas com variaes


no risco subjacente; sero apenas
flutuao aleatria casual.

EFEITO DA INSTABILIDADE
Exemplo

de mortalidade
municpio em MG

15 municpios com:

nascidos vivos.

infantil

0 mortes

por

< 30

Se uma nica morte registrada, taxas

passam de 0 para valores entre 116 e


1048!!!

O valor extremo anterior era 608.9

Abordagem Bayesiana
Emprica
Assumir que riscos das diferentes

reas
no
so
totalmente
desconectados e assim pedir
uma fora pros vizinhos (to borrow
strength from the neighbours)
neighbours
Idia: contrair taxa em direo

mdia global.
global Fator de contrao
depende da populao da rea.

Proposta de Marshall (1991)


Fcil

de ser implementada e produz


resultados similares ao de mtodos mais
sofisticados

Idia: cada rea i possui um taxa subjacente

i desconhecida.
desconhecida Embora diferentes, estas
taxas possuem certa estrutura.

Se pudssemos fazer um histograma desses

riscos subjacentes, deveramos


algo semelhante a qu ?

observar

Proposta de Marshall (1991)

70
60

frequncia

50
40
30
20
10
0
0

50

100

150

200

250

risco relativo teta * 100

300

350

Objetivo: recuperar i
Numa
rea,
observa-se
um
nmero aleatrio Oi de casos.
NO assumimos risco constante:
Oi tem distribuio de Poisson
Popide
i casos
com nmero esperado
igual a

Objetivo: recuperar i
Assume-se que as taxas i possuem

distribuio com mdia m e varincia V.

Qual a melhor estimativa

possvel
dos i ? Melhor em que sentido ?

Melhor no sentido de minimizar a soma

dos erros de estimao de todas as


reas:

i i

Simplificar o Problema
Buscar estimativa tima APENAS
DENTRE as estimativas que podem
ser
escritas
como
mdias
ponderadas de m e da taxa
observada na rea i
Soluo:

i wi ri (1 wi )m onde wi

V
m
V
Popi

Simplificar o Problema

Problema: V e m no so conhecidos.
Bayes emprico estima estes valores a
partir dos dados (da vem o nome
emprico)

Estimando m e V
O

m
Pop
i

taxa global

Popi ri m

Popi

Pop mdia

Rotinas para o clculo de taxas


bayesianas global e local esto
disponveis dentro do pacote
spdep do ambiente estatstico
livre
R
(http://www.rproject.org/) e tambm dentro
do
software
livre
de
geoprocessamento TerraView

Slides Extras

Alexandre E. dos Santos, Alexandre L. Rodrigues, Danilo L. Lopes,


Aplicaes de Estimadores Bayesianos Empricos para Anlise Espacial de Taxas de Mortalidade,
II Simpsio Brasileiro de Geoinformtica, Campos do Jordo, Brasil, 20-23 novembro 2005, INPE, p. 300-309

A metodologia estima taxas


corrigidas a partir dos valores
observados
utilizando-se
conceitos
de
inferncia
bayesiana. O estimador Bayes
emprico global calcula uma
mdia ponderada entre a taxa
bruta da localidade e a taxa
global da regio (razo entre o
nmero total de casos e a
populao total).

O estimador Bayes emprico


local inclui efeitos espaciais,
calculando
a
estimativa
localmente, utilizando somente
os vizinhos geogrficos da rea
na qual se deseja estimar a
taxa, convergindo em direo a
uma mdia local em vez de
uma mdia global.

As taxas corrigidas so menos


instveis, pois levam em conta
no seu clculo no s a
informao
da
rea,
mas
tambm a informao de sua
vizinhana. Mapas baseados
nessas estimativas so mais
interpretativos e informativos.

Bayesiano
Problema das taxas populao pequena
Bayesiano alternativa para melhorar o

problema suavizao
A
estatstica
bayesiana
usa
o
conhecimento ou crena sobre os
parmetros de interesse ao estim-los.
Converte-se
uma
distribuio
de
probabilidade a priori em uma a
posteriori usando o dado observado.

/ D p L / D

Mtodo Bayesiano Emprico


A taxa observada
quando a
ri yi ni
populao pequena => flutuao
aleatria.
Imagine que a taxa real i desconhecida
tenha, para cada rea, mdia i e
varincia i2

No contextobayesiano,
melhor
i wi ri (1 ow
i ) i

Mtodo Bayesiano Emprico


A distribuio a priori baseada em aspectos
globais do dado.

ii wii rii (1 wii ) ii


observada

Taxa em cada rea

iw
2

ni ri 2 i
i

2 n

i ii / ni

priori
Se para cada i temos a
distribuio a priori (i , i2)

Mtodo Bayesiano Emprico


Global
Como se desconhece a distribuio, mdia e
varincia, das taxas internas a cada polgono, uma
suposio simples assumir que todos tenham a
mesma mdia e varincia de todo o conjunto de
polgonos. Assim, assume-se que:

yyii

nni
i

ni ri i 2
i 2 ni ri i
i
n
ni
ni
n
2

i =

Bayesiano Emprico Local


Considera uma vizinhana
Estimativa bayesiana local
Converge para uma mdia local ao

invs de uma mdia global


As taxas da vizinhana da rea i possuem
mdia i varincia i2

i wi ri (1 wi ) i

Mtodo Bayesiano Emprico


(local)
Seja:

m k

sk

ri yi ni

vizinhos
2

m k

1
k

a taxa mdia entre k


ni
1

a varinciask

n
(
r

m
)
i i k

ni

A taxa corrigida ser:



i

m k

wi ri 1 wi m k

Exemplo Bayesiano
emprico