Você está na página 1de 11

MBA em Business Analytics e Big Data – Estatística Espacial 1º Sem 2023

Exploração GeoDA – Estatística Espacial:


Auto-Correlação Espacial, Clusters
Espaciais, Regressão (OLS e SAR)

Vamos explorar o conjunto de ferramentas de estatística espacial do GeoDA.

Inicie o GeoDA e note que uma pequena janela contendo uma barra de menus e uma barra
de botões é apresentada na tela. Você pode utilizar o GeoDA 1.10 ou versões mais atuais
da ferramenta.

Vamos abrir um shapefile, criar uma matriz de vizinhança e explorar a autocorrelação


espacial (global e local) através dos diversos resultados apresentados pelo GeoDA.

Abra o shapefile areacens_sp_proj.shp com as 456 áreas de ponderação do Censo


Demográfico 2000 do município de São Paulo, através da janela “Connect to Data Source”

e aba “File” acionada através do botão “Open” .

Caso apareça a mensagem de erro: “There was a problem reading in the DBF file.”, isso
é provavelmente devido ao caminho longo no nome da pasta (diretório) em que se
encontra o shapefile. Reposicione os arquivos do shapefile (p.e., coloque-os em seu pen
drive) e tente abri-los novamente. Em caso de sucesso, o mapa de áreas censitárias de São
Paulo (áreas de ponderação) será carregado no GeoDA e apresentado conforme abaixo.

Eduardo de Rezende Francisco – eduardo.francisco@fgv.br 1


MBA em Business Analytics e Big Data – Estatística Espacial 2º Sem 2018

Vamos produzir um mapa de renda baseado nos limites do boxplot para avaliarmos se há
concentração espacial de distritos de alta ou baixa renda. Para tal, selecione Map -> Box
Map -> Hinge 1.5 . Escolha RENDA como “First Variable (X)” e pressione OK.

Vamos produzir um mapa chamado Cartograma, que utiliza a localização espacial dos
distritos como referência, mas inova na representação espacial com o uso de círculos

proporcionais à variável utilizada. Selecione Map -> Cartogram (ou o botão )e


escolha a variável RENDA como “Circle Size” e MOR_DOM (número médio de
moradores por domícilio) como “Circle Color”.

Eduardo de Rezende Francisco – eduardo.francisco@fgv.br 2


MBA em Business Analytics e Big Data – Estatística Espacial 2º Sem 2018

Explore depois outros cartogramas envolvendo outras variáveis.


Explore também (oportunamente) outras opções de visualização de mapas do GeoDA
através do menu Map: Quantile Map, Percentile Map, Standard Deviation Map, Unique
Values Map, Natural Breaks Map e Equal Intervals Map.

Escolha a opção Explore -> Bubble Chart (ou pressione ou botão ) e preencha os
campos da janela “Bubble Chart Variables” conforme abaixo:

Eduardo de Rezende Francisco – eduardo.francisco@fgv.br 3


MBA em Business Analytics e Big Data – Estatística Espacial 2º Sem 2018

Pressione OK e veja o resultado. Note que o gráfico está ligado ao mapa e às outras
representações do shapefile (tabela e outros gráficos).

Crie uma matriz de vizinhança baseada em contiguidade através do botão Weights

Manager (ou do menu Tools -> Weights Manager) e do botão “Create” na janela
que se abrir. Você pode também selecionar matrizes de vizinhança previamente criadas
através do botão “Load”.

Na janela “Weights File Creation”, escolha o campo RECNUM como “Weights File ID
Variable” e escolha “Queen Contiguity” com 1 (um) como “Order of contiguity” como
sendo o tipo de matriz de vizinhança a ser criado. Note que podem ser criadas matrizes
de contiguidade (Contiguity Weight) do tipo Queen e Rook, baseadas em distância
(Distance Weight), com larguras de banda fixas (Threshold Distance) ou vinculadas a um
número fixo de vizinhos (k-Nearest Neighbors).

Eduardo de Rezende Francisco – eduardo.francisco@fgv.br 4


MBA em Business Analytics e Big Data – Estatística Espacial 2º Sem 2018

Pressione o botão “Create”. Defina o nome e diretório do arquivo GAL que será criado
(p.e., areacens_sp_proj.gal) e pressione “Create”.

Pressione OK. Em seguida, feche a janela “Weights File Creation” pressionando o botão
“Close”. Veja na janela “Weights Manager” a descrição da matriz de vizinhança criada.

Explore (oportunamente) as características da matriz de vizinhança através dos botões


“Histogram” e “Connectivity Map”.

Eduardo de Rezende Francisco – eduardo.francisco@fgv.br 5


MBA em Business Analytics e Big Data – Estatística Espacial 2º Sem 2018

Vamos computar a autocorrelação espacial global e local da variável RENDA. Escolha o


menu Space -> Univariate Local Moran´s I ou através do botão Cluster Maps .

Escolha RENDA como “First Variable (X)” na janela “Variables Settings” e pressione
OK.

Marque todas as opções na janela “What windows to open?” (Significance Map, Cluster
Map e Moran Scatter Plot). Pressione OK.

Os resultados são apresentados em janelas separadas. O valor do Moran´s I (77,22%) é


apresentado em conjunto com o diagrama de dispersão (scatter plot) da RENDA e da
lagged RENDA (média de renda dos vizinhos, para cada área de ponderação).

Eduardo de Rezende Francisco – eduardo.francisco@fgv.br 6


MBA em Business Analytics e Big Data – Estatística Espacial 2º Sem 2018

O mapa com o LISA (I local) é apresentado de acordo com as categorias HH (áreas de


alta renda avizinhadas por alta renda), LL (áreas de baixa renda avizinhadas por baixa
renda), LH (baixa renda avizinhada por alta renda) e HL (alta renda avizinhada por baixa
renda). Um mapa com a significância estatística do I local de cada área de ponderação é
também apresentado.

Eduardo de Rezende Francisco – eduardo.francisco@fgv.br 7


MBA em Business Analytics e Big Data – Estatística Espacial 2º Sem 2018

O GeoDA utiliza permutações para calcular significância estatística e utiliza p-values para
significância - pseudo-significância usando uma distribuição através de permutações dos
atributos (999) ao longo das áreas.

Vamos agora realizar uma regressão linear simples através da ferramenta GeoDA.

Selecione Methods -> Regression ou pressione o botão Regression .

Na janela “Regression”, coloque RENDA como Dependent Variable, e ENERGIA como


Independent Variable e não marque um “Weights File”. Mantenha a opção “Classic” na
área “Models”, conforme janela a seguir.

Pressione Run. Veja o resumo da regressão em “Regression Report”.

Eduardo de Rezende Francisco – eduardo.francisco@fgv.br 8


MBA em Business Analytics e Big Data – Estatística Espacial 2º Sem 2018

O relatório da regressão pode ser salvo em um arquivo (botão “Save to File”) e s


resultados podem ser salvos e os valores previstos e os resíduos do modelo podem ser
salvos em tabela (botão “Save to Table”).

Note que o R2 é alto: 86,80% , sinalizando força no modelo linear de explicação da renda
pelo consumo de energia elétrica. Atente para os parâmetros (coeficientes) da regressão:
0 = -3034,7 e 1 = 19,55 .

Vamos agora realizar uma regressão espacial através da ferramenta GeoDA. Selecione

novamente Methods -> Regression ou pressione o botão Regression .

Na janela “Regression”, coloque RENDA como Dependent Variable, e ENERGIA como


Independent Variable e escolha o arquivo areacens_sp_proj.gal como “Weights File”.
Escolha a opção “Spatial Lag” na área “Models”, conforme janela a seguir.

Eduardo de Rezende Francisco – eduardo.francisco@fgv.br 9


MBA em Business Analytics e Big Data – Estatística Espacial 2º Sem 2018

Pressione Run. Veja o resumo da regressão em “Regression Report”.

Eduardo de Rezende Francisco – eduardo.francisco@fgv.br 10


MBA em Business Analytics e Big Data – Estatística Espacial 2º Sem 2018

Note que o R2 aumentou para 94,44%, fortalecendo ainda mais o modelo de predição com
a incorporação da variável auto-regressiva “renda dos vizinhos” ao modelo. Os
parâmetros (coeficientes) agora são: 0 = -2258,9 , 1 = 12,60 e  = 0,4947 .

Note que a ferramenta GeoDA realiza regressões espaciais do tipo SAR (Spatial Auto-
Regressive models) apenas com matrizes simétricas (normalmente, os arquivos .GAL
armazenam matrizes com essa característica). Caso tenhamos necessidade de criar
modelos com matrizes não simétricas (p.e., baseados em distâncias) deveremos utilizar
outras ferramentas como o R ou o GeoDA Space.

Eduardo de Rezende Francisco – eduardo.francisco@fgv.br 11

Você também pode gostar