Você está na página 1de 5

http://maisig.org.pt/Menu/Clusters.

htm

PADRES ESPACIAIS CLUSTERS

A seguinte descrio parte da ajuda includa na ferramenta Cluster Analyses do software ArcGIS 9.3 da ESRI, disponibilizado nesta aplicao via Web e adaptado pelo NIDAMTE da Direco-Geral de Administrao Interna, em 2009.

O resultado da anlise de padres espaciais (Clusters) e casos atpicos (Outliers) apresenta um indicador de associao/autocorrelao espacial Local de Moran (Local Morans I), o nvel de significncia observado (P-value), os valores do desvio padro em relao mdia (Z-score) e a tipologia de padres (COType) para cada entidade do tema geogrfico. Esta funo origina os seguintes resultados de sada com os seguintes nomes, a saber: L_Index, Z-score, P-value, e COType. Os valores de Z-score e P-value so medidas de significncia estatstica que permitem aceitar ou rejeitar a hiptese nula, entidade por entidade num tema. Eles, na verdade, indicam se h similaridade aparente (ou dissimilaridade) nos valores de cada entidade e os seus vizinhos e se maior do que seria de esperar numa distribuio aleatria. O Z-score baseado num processo de clculo da distribuio aleatria da hiptese nula. Para obter mais informaes sobre o Z-score, consulte: Ver o que o Z-score? Ver o que o P-value? Numa entidade, um valor positivo e elevado de Z-score indica que as restantes entidades com proximidade geogrfica tm valores semelhantes (ou valores elevados ou de baixo valor). O atributo COType indica se a entidade apresenta uma tipologia de cluster alta-alta (HH) para um nvel de significncia estatstica (nvel 0,05) de valores elevados e uma tipologia baixa-baixa (LL) para um nvel de significncia estatstica (nvel 0,05) de baixos valores. Numa entidade, um valor negativo e baixo de Z-score indica um nvel de significncia estatstica (nvel 0,05) atpica. O atributo COType indica se a entidade apresenta valores elevados e proximidade geogrfica com entidades com valores baixos, tipologia alta-baixa (HL), ou se a entidade apresenta valores baixos e proximidade geogrfica com entidades com valores elevados, tipologia baixa-alta (LH). Para uma entidade em linha ou polgono, h um clculo geomtrico real ao centride dessa entidade. O campo de entrada deve conter uma variedade de valores no-negativos. A matemtica para essa estatstica requer alguma variao na varivel que se est a analisar; por exemplo, no pode ser resolvida se todos os valores de entrada forem iguais a 1 (um). Se o analista tiver uma base de dados de incidentes, e pretender analisar a intensidade dos incidentes, considere agregar os incidentes ou utilize a Integrao com a ferramenta de Colecta de Eventos, antes de proceder anlise. Sempre que utilizar temas geogrficos (shapefiles), lembre-se que estes no podem armazenar valores nulos ou em branco. Ferramentas ou outros procedimentos que criam shapefiles com base numa tabela alfanumrica podem armazenar valores nulos ou interpretar estes como zero. Isto pode levar a resultados inesperados. A Contextualizao de relaes espaciais utilizadas para a anlise deve ser baseada na compreenso individual de interaces espaciais entre as entidades que esto a ser analisadas. Opes para a contextualizao da Distncia Inversa (Inverse Distance): quando o valor de zero (0) entra para o parmetro da Distncia de banda ou limiar de distncia (Distance Band or Threshold Distance), todas as entidades so consideradas vizinhas de todas as outras entidades; quando este parmetro deixado em branco, ser

1 de 5

15/10/2013 20:51

http://maisig.org.pt/Menu/Clusters.htm

aplicado um limiar de distncia predefinido. Quando a conceptualizao espacial um mtodo de Distncia Inversa (Inverse Distance, Inverse Distance Squared, or Zone of Indifference) a quaisquer dois pontos que sejam coincidentes ser dado um peso de 1 (um) de forma a evitar uma diviso por zero (0). Esta operao assegura a no existncia de entidades excludas da anlise. Com a contextualizao da distncia inversa, os valores para distncias menores que 1 (um) tornam-se instveis. A ponderao de entidades separadas por menos de uma (1) unidade de distncia (comum com o sistema de projeco de coordenadas geogrficas), dado um valor de 1 (um). A anlise sobre entidades com um sistema de projeco de coordenadas geogrficas no recomendada com quaisquer mtodos de contextualizao espacial baseados na distncia inversa.

Como Funciona a Anlise de Padres Espaciais e casos Atpicos: ndice Local de Moran por Anselin (Estatsticas Espaciais) Dando um conjunto de funcionalidades ponderadas, a anlise de Padres e casos Atpicos identifica padres de entidades com valores de magnitude similar. Para tal, a ferramenta calcula um valor de ndice Local de Moran, o Z-score, o P-value e um cdigo que representa a tipologia de cluster/padro para cada tipo de entidade. O Z-score e o P-value representam a significncia estatstica do ndice calculado para cada valor.

Clculos

Os valores de P-value so aproximaes numricas da rea sob a curva de uma distribuio conhecida, limitada pelo teste estatstico. Ver o que o Z-score? Ver o que o P-value?

2 de 5

15/10/2013 20:51

http://maisig.org.pt/Menu/Clusters.htm

Interpretao Um valor positivo para o ndice I indica que a entidade est rodeada por entidades com valores semelhantes. Essa entidade faz parte de um cluster/padro. Um valor negativo para I indica que a entidade est rodeada por entidades com diferentes valores. Essa entidade um caso atpico. O ndice Local de Moran s pode ser interpretado num contexto de clculo do Z-score e do P-value Ver o que o Z-score? Ver o que o P-value?. A tipologia de padro espacial distingue-se entre uma significncia estatstica (nvel 0,05) de padro com valores elevados (HH), padro de valores baixos (LL), um caso atpico onde um valor elevado rodeado principalmente por valores baixos (HL), e um caso atpico onde um valor baixo principalmente rodeado por valores elevados (LH).

As potenciais aplicaes Podem ser aplicadas em economia, gesto dos recursos, fitogeografia, geografia poltica e demografia (entre outras).

Recursos adicionais: - Mitchell, Andy. A ESRI Guide to GIS Analysis, Volume 2. ESRI Press, 2005. - ANSELIN, Luc. "Local Indicators of Spatial Association - LISA", Geographical Analysis, 27 (2): 93-115, 1995.

O que o Z-score? O que o P-value? A maioria dos testes estatsticos comear por identificar uma hiptese nula. A hiptese nula para a ferramenta de anlise de padres, essencialmente afirma que no h padro espacial entre as entidades, ou entre os valores associados s entidades, na rea de estudo. Explicando de outra forma: o padro esperado apenas uma das muitas verses possveis de uma completa aleatoriedade espacial. O Z-score um teste de significncia estatstica que ajuda o analista a decidir se quer ou no rejeitar a hiptese nula. O P-value a probabilidade de que o analista falsamente rejeitou a hiptese nula. Z-score so medidas de desvio padro. Por exemplo, se uma ferramenta d um retorno de um Z-score positivo de 2,5, interpretado como "2,5 desvios padro em relao mdia". P-value so probabilidades. Ambas as estatsticas esto associadas a uma distribuio de padro normal. Esta distribuio diz respeito a desvios padro com probabilidades que permitem uma significncia e confiana que podem ser anexas a Z-score e P-value.

3 de 5

15/10/2013 20:51

http://maisig.org.pt/Menu/Clusters.htm

Valores muito altos ou muito baixos (negativos) de Z-score, associados com valores muito baixos de P-value, encontram-se na cauda da distribuio normal. Quando executar uma anlise de padres por entidades que produz valores baixos de P-value e quer valores muito altos ou muito baixos (negativos) de Z-score, isto indica que muito improvvel que o padro observado alguma verso do padro terico da aleatoriedade espacial representada pela hiptese nula. Para rejeitar a hiptese nula, o analista deve fazer um julgamento subjectivo quanto ao grau de risco que est disposto a aceitar para estar errado. Este grau de risco dado frequentemente em termos de valores crticos e / ou nveis de confiana.

Para dar um exemplo: os valores crticos de Z-score quando se utiliza um nvel de confiana de 95% so de -1,96 e +1,96 desvios-padro. O P-value associado a um nvel de confiana de 95% de 0,05. Se o seu Z-score entre -1,96 e +1,96, o P-value ser maior do que 0,05, no podendo rejeitar a hiptese nula; o padro exibido um padro que poderia muito provavelmente ser uma verso de um padro aleatrio. Se o Z-score ficar fora desse intervalo (por exemplo -2,5 ou +5,4), o padro apresentado provavelmente muito incomum para ser apenas mais uma verso da aleatoriedade e o P-value ser reduzido para reflectir essa situao. Neste caso, possvel rejeitar a hiptese nula e prosseguir com a descoberta do que poder estar a causar o padro espacial de significncia estatstica.

A ideia-chave aqui que os valores que se apresentam no meio da distribuio normal (valores de Z-score de +0,19 ou -1,2 por exemplo), representam o resultado esperado (a norma geralmente desinteressante...). Quando o valor absoluto do Z-score elevado (no topo da distribuio normal) e as probabilidades so pequenas, poder estar a ver algo incomum e geralmente muito interessante. Por exemplo, para a ferramenta de anlise de pontos / locais quentes Hot Spot Analysis, "pouco usual" tanto quer dizer um local quente ou um local frio com significncia estatstica.

A hiptese nula Muitas das estatsticas da caixa de ferramentas de estatsticas espaciais so tcnicas de anlise de padres espaciais inferenciais (ou seja, ndice Global de Moran, ndice Local de Moran, ndice de Gini). As estatsticas inferenciais baseiam-se na teoria da probabilidade. Probabilidade uma medida de hiptese, subjacente a todos os testes estatsticos (directa ou indirectamente) so clculos de probabilidade que avaliam o papel do acaso sobre os resultados da anlise. Normalmente, com a estatstica tradicional (no-espacial / alfanumrica), o analista trabalha com uma amostra aleatria e tenta determinar a probabilidade da sua amostra de dados ser uma boa representao da populao em geral ( reflectivo). Como exemplo, pode perguntar: "Quais so as hipteses de que os resultados de sada da minha sondagem (talvez mostrando o candidato A derrotando o candidato B por uma pequena margem) ir reflectir a preferncia dos resultados finais?" Mas com muitas estatsticas espaciais, incluindo o tipo

4 de 5

15/10/2013 20:51

http://maisig.org.pt/Menu/Clusters.htm

de estatsticas de autocorrelao espacial listadas acima, muitas vezes trabalha-se com todos os dados disponveis para a rea de estudo (todos os crimes, todas os casos de doenas, os atributos de cada seco e subseco estatstica, e assim por diante). Quando faz um clculo estatstico (a mdia, por exemplo) para toda a populao, j no voltar a ter uma estimativa. Voc tem um acontecimento / uma ocorrncia. Consequentemente, no faz mais sentido falar de "semelhana" ou "probabilidades". Ento o que se pode fazer no caso de ter todos os valores de dados para uma rea de estudo? Poder avaliar as probabilidades de postular, atravs da hiptese nula, que os seus dados espaciais, so na realidade, parte de uma grande populao. Se for caso disso, as ferramentas da caixa de ferramentas de estatsticas espaciais utilizam a aleatoriedade da hiptese nula como base para testar a significncia estatstica. Aleatoriedade da hiptese nula postula que a observao do padro espacial dos dados representa um dos muitos (n) possveis arranjos espaciais. Se pudesse retirar os valores dos seus dados e coloc-los nas entidades da sua rea de estudo, teria possivelmente um arranjo espacial. A aleatoriedade da hiptese afirma que se o analista pudesse fazer esta operao sistematicamente e vezes sem conta (retir-los e coloc-los), a maior parte do tempo iria ser produzido um padro que no seria significativamente diferente do padro observado (os dados reais). De vez em quando, acidentalmente, poder enviar todos os valores mais elevados para uma rea especfica da sua rea de estudo, mas as probabilidades de tal acontecer so muito reduzidas. A aleatoriedade da hiptese nula afirma que os dados em anlise so uma das muitas, muitas, muitas possibilidades de verses completas de aleatoriedade espacial. Os valores dos dados so fixos, apenas pode variar o seu arranjo espacial. Uma alternativa comum hiptese nula, no implementada na caixa de ferramentas de estatsticas espaciais, a normalizao da hiptese nula. A normalizao da hiptese nula postula que os valores observados derivam de um grande infinito, normalmente distribudos atravs de alguns valores da populao num processo de amostragem aleatria. Com uma amostra diferente obtm-se valores diferentes, mas ainda assim se espera que os valores sejam representativos de uma maior distribuio. A normalizao da hiptese nula afirma que os valores representam uma amostra das muitas possibilidades de valores. Se o analista pudesse colocar os dados observados numa curva normal e em seguida seleccionasse aleatoriamente valores para colocar na rea de estudo, a maior parte do tempo iria produzir um padro e uma distribuio de valores que no seriam significativamente diferentes do padro observado / distribuio (os dados reais). A normalizao da hiptese nula afirma que os dados e a sua organizao so uma das muitas, muitas, muitas possibilidades de uma amostragem aleatria. Nem os dados, nem os seus valores apresentam um arranjo espacial fixo. A normalizao da hiptese nula s adequada quando os valores dos dados apresentam uma distribuio normal.

Recursos adicionais: Ebdon, David. Statistics in Geography. Blackwell, 1985. Mitchell, Andy. The ESRI Guide to GIS Analysis, Volume 2. ESRI Press, 2005. Goodchild, M.F., Spatial Autocorrelation. Catmog 47, Geo Books, 1986

Para qualquer esclarecimento contacte atravs do nmero +351 21 394 71 02 ou atravs do seguinte endereo electrnico: NIDAMTE@dgai.mai.gov.pt

2011 DGAI / NIDAMTE - Todos os direitos reservados Avisos Legais

5 de 5

15/10/2013 20:51

Você também pode gostar