Você está na página 1de 61

Estatstica Espacial Aplicada

Renato M. Assun c ao LESTE - Laborat orio de Estat stica Espacial Departamento de Estat stica - UFMG
assuncao@est.ufmg.br

http://www.est.ufmg.br/~assuncao

Introduo Instrutor: Renato Assuno Professor da UFMG, Departamento de Estatstica. Coordenador do Laboratrio de Estatstica Espacial - LESTE Vice-diretor do CRISP - Centro de Estudos de Criminalidde e Segurana Pblica Pblico-Alvo:
Alunos de ps-graduao em Analise e Modelagem de Sistemas Ambientais do IGC Alunos de ps-graduao, exceto estatstica Alunos de graduao de estatstica e aturia

Aulas toda quarta-feira, de 13:30 as 17:30, sala 1019 no ICEx

Plano da Apresentao Introduo genrica Tipologia dos dados espaciais GIS e algoritmos geomtricos Dados de rea Dados de processos pontuais Dados de superfcies aleatrias Dados de interao espacial

Um curso extra muito bom http://www.dpi.inpe.br/cursos/ser301/

O que Estatstica Espacial? Toda observao possui referncia temporal e espacial.


Dados obtidos por entrevista sobre indivduo que vive em Belo Horizonte. Dados sobre certo municpio de Minas. Dados sobre rebanho em certa regio do Pantanal. Dados sobre extrao de minrio de ferro numa mina nos arredores de Belo Horizonte Dados sobre telefonemas entre municpios

Muitos estudos no fazem uso da informao espacial. NO entanto, em alguns casos, essas referncias espaciais so importantes na anlise. Estatstica Espacial o conjunto de mtodos de anlise de dados em que a localizao geogrca usada explicitamente na anlise.

Est Esp s se USAR o espao Assim, no basta que o dado seja espacial, pois todos os dados, de uma forma ou de outra, possuem uma referncia geogrca.
Por exemplo, a regresso linear do nvel de arrecadao de ICMS versus a renda per capita municipal NO parte de estatstica espacial. Embora os municpios possuam localizao espacial, esta localizao no usada na regresso.

O que determina se algo faz parte da estatstica espacial uma propriedade do mtodo de anlise, e NO do dado utilizado na anlise.

Estatstica Espacial: quando usar Se todo dado estocstico possui referncia geogrca ... necessrio usar estatstica espacial? sempre

Resposta: Deve ser usada se existirem perguntas ou hipteses sobre o mecanismo gerador dos dados que envolvam alguma caracterstica espacial ou geogrca. 'E ineciente no us-la? (Veremos o signicado de ecincia mais tarde) Resposta: Deve ser usada se a correlao espacial aparece como rudo (nuisance) em modelo usual de regresso causados por efeitos de variveis no-observadas, efeitos de transbordamento (spill-over) por causa do mismatching entre unidades geogrcas de mensurao e as unidades geogrcas onde o fenmeno ocorre.

Exemplos: Crimes Crimes no acontecem totalmente ao acaso. preciso um ofensor, uma vtima potencial e uma oportunidade. Existem grandes diferenas no risco de ser vtima de um crime dependendo da idade, do sexo, da hora do dia, dia da semana, ms no ano, etc. Existem tambm grandes diferenas geogrcas dentro de uma cidade. Estas diferenas dependem do tipo de crime: crimes contra o patrimnio atingem mais as reas ricas enquanto que crimes contra a pessoa atingem mais as reas pobres. Todos os dados de crimes registrados pela Polcia Militar dentro de Belo Horizonte e Juiz de Fora hoje em dia so georeferenciados ao nvel da localizao exata (coordenadas latitude-longitude) do evento.

Exemplo: Crimes em BH

Homicdios ocorridos em BH em 1997, regio central

Exemplos: Linchamentos raciais nos EUA Os linchamentos de negros no sul dos EUA nas dcadas de 40-50 seguiam algum padro no espao e no tempo? Duas teorias para explicar este comportamento violento de massa:
um efeito de contgio (real ou aparente). Isto :

um linchamento ocorrendo aqui e agora estimula ou est associado ocorrncia de outros linchamentos nos arredores nos momentos seguintes
Um efeito de associao negativa. Isto :

um linchamento inibe a ocorrncia de outros linchamentos nos arredores nos momentos seguintes a reao seria de procurar no dar motivos para violncia adicional ou haveria um maior controle dos mais violentos

Exemplos: Linchamento de Negros nos EUA

Centrides dos condados onde ocorreram linchamento. REF??

Exemplos: Processos Ecolgicos Processos de colonizao por plantas de reas devastadas. rvores tendem a inibir ou a estimular a presena de outras rvores ao seu redor ? Se existe competio entre as plantas, at que distncia esta competio pode alcanar ? Este padro espacial depende da idade da oresta ? rvores pequenas (mais jovens) tendem a estar prximas de rvores grandes (mais velhas) ? E se as espcies so diferentes, como o seu relacionamento ? De competio tambm ?

Plantas adultas (acima) e Plntulas (abaixo)

Note a interao bvia entre elas: onde h muita planta adulta, poucas plntulas aparecem. REF??

Exemplos: Epidemiologia Espacial A distribuio dos casos de uma doena forma um padro no espao ? Descrevendo o desenvolvimento de uma epidemia no espao e no tempo: sugere formas de controlar e combater. Caracterizando a localizao de servios de sade: a demanda pelos servios est sendo atendida adequadamente ? Poderia ser feita uma nova alocao geogrca de recursos que seja mais eciente ? H alguma associao entre a localizao dos casos de uma doena e a posio de alguma fonte suspeita (rio, estao nuclear, fbrica,..) ?

Exemplos: Cncer de Pulmo nos EUA Publicao do National Institute of Health / National Institute of Cancer

Mapa do Atlas de Mortalidade por Cncer de Pulmo nos EUA, 1950/1994

Exemplos: Geoestatstica Moura et al (2006) estudaram um surto de toxomoplasmose em Santa Isabel do Ivai, no sul do Paran. A suspeita era que gua era o modo de diseminao de Toxoplasma gondii. Foi realizado um estudos de caso-controle. Dois reservatrios de gua serviam a cidade, cobrindo r egies distintas. Era signicativamente mais comum que casos consumissem gua do reservatrio A e que consumissem mais sorvetes que controles. Odds-ratio = 3.72 com p-valor = 0.016 Reservatrio Casos Controle Total A 152 198 350 B 4 22 26 Total 156 220 376

Exemplos: Geoestatstica Como estimar o volume total de um depsito mineral numa regio ? Conhecemos apenas a densidade num pequeno nmero de amostras localizadas em alguns poucos pontos do terreno. Como prever a precipitao pluviomtrica (ou a temperatura) num dado ponto do mapa ? Possuimos medies apenas em algumas poucas estaes espalhadas pelo mapa. Onde colocar uma nova estao de coleta de medies de forma tima ?

Exemplos: Reconstruo de depsitos minerais Superfcie de densidade de minrio de ferro reconstruda por interpolao

Exemplos: Reconstruo - 2 Superfcie de curvas de nveis superimposta imagem do terreno

Exemplos: Espao, no s geograa Em um experimento para entender o cncer de colon, todos os animais foram expostos a um carcinoma. Metade deles foram tambm expostos radiao. Espacialmente foi medida a existncia de focos precursores de cnceres. A questo de interesse saber se as localizaes desses focos esto espacialmente prximas. Se sim, ento os danos ao colon causado pelo carcinoma e pela radiao so localizados e devem ser tratado levando isto em conta. H diferenas nos padres espaciais de irradiados e no irradiados?

Exemplos: Imagens

Exemplos: Imagens Imagens de satlite ou fotogrcas devem ser "limpas"para obter uma visualizao melhor. A partir das imagens, objetos devem ser identicados e "recortados". Como fazer isto de forma automtica e eciente?

Exemplos: Espao no geogrco Chen e Conley (2001, Journal of Econometrics): A new semiparametric spatial model for panel time series
n agentes econmicos. Para cada agente i, uma srie temporal Xit, t = 1, . . . , T

Em cada instante t, os valores X1t, . . . , Xnt das sries so correlacionados Correlao entre sries depende da distncia econmica entre os agentes. Esta distncia pode mudar no tempo. Exemplos:
Agentes: setores econmicos; proximidade entre i e j : distncia euclidiana entre entre vetores de propores dos inputs dos setores i e j Agentes: rmas; proximidade entre i e j : overlap das reas de mercado Agentes: estados/pases/municpios; proximidade entre i e j : volume de transaes comerciais ou custo de transporte

Exemplos: interao/competio/redes sociais Indivduos interagem de formas variadas, entre as quais interaes no mercado Um conjunto de indivduos que so os ns de uma rede os arcos ou arestas da rede reetem as relaes entre os indivduos Indivduos fazem escolhas e agem a partir de um conjunto de alternativas Existe incerteza sobre os ganhos obtidos de cada ao Eles usam informao prpria e informao obtida de seus vizinhos, os indivduos ligados a eles de alguma forma. Escolhem ao que maximiza utilidade individual A estrutra da rede (SUA TOPOLOGIA) inuencia as decises individuais e sociais. A topologia da rede induz distribuies de probabilidade que levam em conta essa congurao espacial de interrelaes.

Exemplos: redes Escolha de produtos por consumidor:


Deciso sobre que marca comprar no possui conhecimento completo sobre alternativas preo, caractersticas e ... informao de conhecidos

Inovao mdica:
Mdicos decidem recomendar produtos sem conhecimento completo buscam informao na literatura prossional e de amigos ceteris paribus, os mdicos mais conectados so aqueles que passam a recomendar produtos melhores mais rapidamente

Exemplos: WWW

Conectividade da Internet: principais backbone ISPs (Internet Service Provider) coloridos separadamente

Exemplos: Sociedade Adolescente

Topologia: Grafo de amizade recproca entre meninos de uma escola americana

Exemplos: Sociedade Adolescente - 2

Grafo de amizade recproca entre meninas de uma escola americana

Tipos de Dados Espaciais

Taxonomia dos Dados Espaciais O fundamental identicar o que o componente aleatrio em cada tipo de dado. Este componente aleatrio que ser modelado com distribuies de probabilidade. Os 4 Tipos de Dados Espaciais:
Dados de Superfcie aleatria Dados de Processos Pontuais Dados de rea Dados de Interao Espacial

Dados de Superfcie aleatria

Dado tpico de estudos ambientais, geolgicos e de cincias naturais. Superfcie Y (s) DEFINIDA em todo ponto s = (s1, s2) de uma regio do plano. Exemplos: Temperatura, Ph de gua de lago, acidez do solo...

Uma superfcie aleatria: temperatura

Amostrando uma Superfcie Aleatria Superfcie Y (s) DEFINIDA em todo ponto s = (s1, s2) da regio. Mas... OBSERVADA apenas em alguns locais: n estaes de coleta ou monitoramento. Estaes i = 1, . . . , n em posies FIXAS e CONHECIDAS (noaleatrias). Estao i est localizada em si = (s1i, s2i) e Y (si) o valor da superfcie na estao. Interesse em Y (s) onde s localizao no monitorada. Aleatrio o valor da superfcie.

Problemas tpicos predizer superfcie em posies novas interpolao escolher posio para instalar uma nova estao. Krigagem o mtodo chave: regresso com erros correlacionados por distncia. Correlao de erros denida pelo variograma (ou correlograma): funo (d) que mede o grau de independncia (correlao) entre os erros de acordo com distncia d entre posies. A funo de correlao (d) deve satisfazer restries severas para que, dado qualquer conjunto de n posies no plano, a matriz de correlao n n resultante seja denida positiva Mostra-se que (d) deve ser representada como uma integral de uma funo de Bessel generalizada

Mapa topogrco de vulco na Nova Zelndia. Pontos so os locais onde existe uma medio aproximada.

Imagem a partir do mapa topogrco de vulco na Nova Zelndia.

Padres de Pontos Aleatrios Num padro espacial de pontos, o que aleatrio ? A prpria posio dos pontos ou eventos. Modelo estocstico deve explicar a congurao espacial dos eventos: h interao entre os eventos tal como atrao ou inibio ? Problemas Tpicos
Existe aglomerao de casos ou eles esto dispostos ao acaso (proporcional populao sob risco) ? Estar prximo ao rio aumenta o risco de tornar-se um caso? Interao espao-temporal: Eventos esto em 3 dimenses incluindo o tempo. Casos prximos no espao tendem a estar prximos no tempo tambm ? Eventos de dois tipos diferentes. Por exemplo: casos e controles ou homicdios e roubo. Anlise compara os padres espaciais de cada tipo e testa se eles so similares.

Processo Pontuais na prtica - TEMPO Caso uni-dimensional: "espao" a reta representando o tempo. Processos pontuais no tempo: eventos aleatrios no tempo. Muita teoria E muitas aplicaes em diversas reas. Teoria moderna usa a estrutura ordenada do tempo e as ferramentas so martingalas, ltragens, etc. Valores Extremos ou Sinistros no tempo: abordagem de processos pontuais em Finanas, seguros, hidrologia, estudos ambientais, etc. Ocorrncias raras em muitas pessoas: estudos de dados longitudinais. Demograa: tempos entre sucessivos nascimentos de mulheres de uma populao. Anlise com base numa amostra de mulheres. Economia: perodos de alternncia entre emprego e desemprego. Epidemiologia: tempos entre reinternaes sucessivas.

Processo Pontuais na prtica - espao No espao: Produo terica menor que no tempo: implica em menos aplicaes tambm. anlise ambiental: previso e controle de queimadas em orestas. Previso de terremotos, enchentes ao longo de rios ... Anlise reas de maior incidncia de crimes. Epidemiologia: padro espacial de uma doena. Existem reas de maior incidncia? Comparao de dois padres.

HTLV (esq) e controles (dir) em BH

Os casos de HTLV possuem a mesma disperso espacial que os controles

HTLV (esq) e controles (dir) em BH

Os casos de HTLV possuem a mesma disperso espacial que os controles

Dados de Interao Espacial Exemplos:


Migrao de mo de obra Fluxo de bens entre centros urbanos Trfego de comunicao Web numa rede Rede social trafegando informao, status, etc.

Muito comum em Economia Urbana, Economia Regional, etc. De Origem i ui para Destino j Fluxo aleatrio Yij entre posies i e j Cada medio Yij refere-se a um PAR ORDENADO de posies (i, j ) e NO apenas a um local especco i

Topologia um grafo: vizinhana dos bairros de Belo Horizonte

Interao Espacial Problemas tpicos:


Que caractersticas de i e j determinam o volume do uxo? Como os uxos podem afetar caractersticas do local i ? Onde colocar novo centro para minimizar custo ? Como um tipo de uxo afeta outros tipos de uxos ?

Modelo tpico o gravitacional


E (Yij ) g (xi) g (xj )/d ij onde xi so as caractersticas de i g (xi) uma funo das caractersticas da rea i dij a distncia entre i e j .

Outra abordagem possvel mas pouco usada: Campos aleatrios de Markov

Dados de rea Regio R particionada em n reas Em cada rea feita uma observao aleatria Yi Exemplos:
PIB per capita no municpio i nmero de desempregados no municpio i preo mdio de imvel de certo perl no bairro i nmero de crimes no bairro i

Este o tipo de dado mais comum em econometria espacial Restante desse curso s trata desse tipo de dado

Cncer de pulmao:EUA

Idosos por setor censitario em BH

Natal: % com 15 ou mais anos de escolaridade

Velocidade da Queda de Fecundidade: mais negativo, mais rapido

Dados de rea - 2 Regio R =


n i=1 Ai

com Ai Aj = se i = j

Em cada rea feita uma observao aleatria Yi Via de regra, Yi uma agregao, uma soma ou uma integral sobre a rea Ai Medies referem-se a toda a rea Ai, no a um ponto particular dentro dela No faz sentido "interpolar" entre reas Problema tpico: regresso de Yi em variveis explicativas xi mas variveis Yi so correlacionadas Estrutura de correlao do vetor Y determinada pela topologia: posio no plano, indicadores binrios de vizinhana espacial, ou distncia entre todos os possveis pares de reas.

Exemplos com dados de rea: preos hednicos Preos Hednicos em mercado imobilirio e mercado de trabalho: ambos possuem um forte componente espacial Existem trs coisas que inuenciam o preo de um imvel: localizao. Salrios e aluguis ou valores imobilirios variam bastante dentro de uma cidade. Um mesmo tipo de imvel (idade, tamanho, qualidade de acabamento, etc.) ter preos muito diferentes no Meyer, em Botafogo, no Leblon e na Barra. Tudo o mais igual, reas vizinhas tendem a ter preos parecidos. Controlando por fatores conhecidos, preos tero erros espacialmente correlacionados. O uso de espao ajuda a controlar variveis no mensuradas que possuem uma estrutura espacial: crime, poluio do ar, acesso/transporte, e outras externalidades. Ver, por exemplo, Basu e Thibodeau (1998) Analysis of Spatial Autocorrelation in House Prices. Journal of Real Estate Finance and Economics, 17, 61-85.

Econometria com dados de rea: loteria Coughlin, Garrett e Hernandez-Murillo (2003) Spatial probit and the geographic patterns of state lotteries Working Papers from Federal Reserve Bank Alguns estados americanos correm uma loteria e outros no O que diferencia uns dos outros ? Modelo Probit espacial algumas variveis explicativas: evidnvia de superdisperso (efeito misto): variabilidade extra binomial Esta variao extra-binomial tem estrutura espacial: reas prximas tendem a ter probabilidades desviando-se do preditor linear de forma similar

Regionalizao Em economia regional, um problema constante agrupar reas que sejam similares ou homogneas com respeito a um certo nmero de variveis Problema dual: idenicar fronteiras entre regies homogneas Assuno et al. (2001) propuseram mtodo baseado em teoria de grafos. Implementado no software SKATER: Spatial K-lustering Analysis Through Edge Removal Disponvel em www.est.ufmg.br/leste

Exemplo de Regionalizao

So Joo do Meriti - RJ. Setores Censitrios agregados com base em 15 variveis sociais e econmicas do Censo Demogrco, 1991

Você também pode gostar