Escolar Documentos
Profissional Documentos
Cultura Documentos
Tutorial
1 / 173
Sumrio
Introduo ....................................................................................................................................................... 4
O que o IpeaGEO ...................................................................................................................................... 4
Quem somos ............................................................................................................................................... 4
Instalao do IpeaGEO .................................................................................................................................... 6
Onde Encontrar ........................................................................................................................................... 6
Requisitos Tecnolgicos .............................................................................................................................. 6
Utilizando o IpeaGEO ...................................................................................................................................... 7
Iniciando o IpeaGEO .................................................................................................................................... 7
Arquivo Shape (Malha Digital)..................................................................................................................... 9
Importar Malha ....................................................................................................................................... 9
Adicionar Camadas (Layers) Auxiliares.................................................................................................. 14
Alterando as Propriedades das Camadas (Layers) ................................................................................ 17
Base de Dados ........................................................................................................................................... 24
Importar Dados ..................................................................................................................................... 24
Exportar Dados ...................................................................................................................................... 35
Funcionalidades......................................................................................................................................... 37
Mapa Temtico.......................................................................................................................................... 40
Funes Estatsticas do IpeaGEO .................................................................................................................. 45
Anlise Exploratria dos Dados ................................................................................................................. 45
Anlise Grfica ....................................................................................................................................... 45
Calculadora ............................................................................................................................................ 51
Correlaes ............................................................................................................................................ 55
Estatsticas Descritivas .......................................................................................................................... 57
Gerao de Variveis Dummy ............................................................................................................... 60
Matriz de Vizinhana ............................................................................................................................. 63
Tabelas de Frequncia........................................................................................................................... 72
Tabulaes Cruzadas ............................................................................................................................. 74
Analise Multivariada.................................................................................................................................. 78
Analise de Clusters ................................................................................................................................ 78
Analise de Componentes Principais ...................................................................................................... 82
Analise Fatorial ...................................................................................................................................... 86
Clculo de Taxas ........................................................................................................................................ 91
Econometria Bsica ................................................................................................................................... 93
Propensity Score Matching ................................................................................................................... 93
Regresso com Dados Binrios ............................................................................................................. 98
Regresso Linear ................................................................................................................................. 102
Modelos Lineares Generalizados ........................................................................................................ 107
2 / 173
3 / 173
Introduo
O que o IpeaGEO
O IpeaGEO um software desenvolvido pela Assessoria de Mtodos
Quantitativos da Diretoria de Estudos e Polticas Regionais, Urbanos e Ambientais do
Ipea - Dirur.
Ele funciona como uma ferramenta gratuita de anlises estatsticas, voltada
especialmente para anlises espaciais. A incluso de tcnicas espaciais consolidadas e
foco no territrio nacional so alguns dos diferenciais do programa.
Quem somos
Instituto de Pesquisa Econmica Aplicada - Ipea
O Instituto de Pesquisa Econmica Aplicada (Ipea) uma fundao pblica
federal vinculada Secretaria de Assuntos Estratgicos da Presidncia da Repblica.
Suas atividades de pesquisa fornecem suporte tcnico e institucional s aes
governamentais para a formulao e reformulao de polticas pblicas e programas de
desenvolvimento brasileiros. Os trabalhos do Ipea so disponibilizados para a sociedade
por meio de inmeras e regulares publicaes e seminrios e, mais recentemente, via
programa semanal de TV em canal fechado.
4 / 173
Responsveis tcnicos:
Equipe de desenvolvimento:
5 / 173
Instalao do IpeaGEO
Onde Encontrar
O download do software IpeaGEO gratuito e est disponvel no seguinte
endereo: http://www.ipea.gov.br/IpeaGEO
Requisitos Tecnolgicos
Requisitos Mnimos de Hardware/Software:
HARDWARE : Mnimo de 2 GB de disco rgido, 512 MB de memria RAM e processador
de 1 GHz.
SISTEMA OPERACIONAL : Windows XP com Service Pack 2, Windows 2003, Windows
Vista ou superior.
Microsoft .NET Framework 4 Client Profile (caso o usurio no possua, o IpeaGEO o
encaminha para o site de download).
Conexo com a Internet necessria para carregamento de dados e mapas hospedados
no site do IPEA.
6 / 173
Utilizando o IpeaGEO
Iniciando o IpeaGEO
Viso Geral
Tela inicial do IpeaGEO
Abrir ShapeFile (Ctrl + A) - Permite abrir um arquivo do tipo malha digital (shape)
do seu computador.
Dados para Download Permite ao usurio abrir um arquivo do tipo malha digital
(shape) e dados j existentes no site do Ipea.
Janelas Caso haja mais de uma janela aberta no programa, essa opo permite
ao usurio organiza-las de acordo com sua preferncia.
8 / 173
Importar Malha
Viso Geral
No IpeaGEO, possvel importar a malha digital de duas maneiras: diretamente
de um arquivo armazenado no computador do usurio ou realizar o download no prprio
programa.
Exemplo
Importando o arquivo malha do Ipea
Para importar um arquivo de malha digital do Ipea clique em Dados para
Download
9 / 173
10 / 173
11 / 173
Aps clicar no boto pesquisar uma nova aba ficar disponvel com os dados
encontrados na pesquisa.
12 / 173
13 / 173
Para que a malha seja importada corretamente, os arquivos com extenses .dbf
e .shx tambm precisam estar na pasta onde est localizado o arquivo .shp.
14 / 173
Exemplo
Aps importar a malha digital por quaisquer das maneiras descritas no tpico
"Importar Malha", possvel adicionar camadas (layers) auxiliares para serem
trabalhadas conjuntamente com a malha digital principal. Existem duas maneiras
diferentes para importao dessas camadas (layers):
Clique no boto "Adio de layers auxiliares ao mapa"
, ou clique com o
boto direito do mouse, sobre o mapa que representa a camada (layer) principal e, em
seguida, clique em "Adicionar layer de visualizao"
15 / 173
16 / 173
Exemplo
Aps importar a malha digital por quaisquer das duas maneiras descritas em
"Importar Malha" ou aps adicionar as camadas auxiliares conforme descrito em
"Adicionar Layers Auxiliares", possvel alterar as respectivas propriedades clicando
sobre a camada correspondente com o boto direito do mouse, selecionando
"Propriedades dos elementos do layer" e, em seguida, "Propriedades para todos os
elementos".
17 / 173
Labels;
Visualizao;
Linha;
Informaes do Layer;
Dados do Mapa;
Filtro de Seleo.
18 / 173
19 / 173
20 / 173
22 / 173
23 / 173
Base de Dados
Importar Dados
Viso Geral
No IpeaGEO, o usurio pode importar sua tabela de dados para trabalhar
conjuntamente com um arquivo de malha digital ou ainda, caso prefira, pode realizar
anlises somente com sua tabela de dados.
Exemplos
24 / 173
25 / 173
Importar uma tabela de dados para concatenar com uma malha (shape)
26 / 173
Para isso, com a malha digital j aberta, o usurio deve clicar no cone
denominado "Adicionar tabela a partir de dados externos"
seguinte formulrio se abre:
. Neste momento o
27 / 173
28 / 173
Caso a tabela contenha dados faltando (dados missing), iro aparecer duas novas
abas: Dados Missing e Obs. Missing:
29 / 173
30 / 173
Caso a opo desejada seja Substituir valor missing por mdia dos vizinhos, o
seguinte formulrio contido na aba Mdia dos vizinhos ir se abrir.
31 / 173
Neste formulrio, aps definir as opes para manipulao das variveis que
contenham dados missing, clique no boto Atualizar.
Caso a opo desejada seja Substituir valor missing por mdia do sub-grupo, o
seguinte formulrio, contido na aba Mdia do Subgrupo ir se abrir.
32 / 173
Ao clicar no boto Relatrio uma nova aba de mesmo nome se abrir, contendo
as informaes definidas anteriormente.
Por fim, clique no boto Atualizar para atualizar o relatrio de acordo com o
tratamento escolhido e em seguida clique em Executar.
33 / 173
34 / 173
O prximo passo definir qual a tabela que se deseja importar. Para isso, escolha
uma dentre as tabelas disponveis em "Tabela no Arquivo" e clique em "Importar
Tabela". Aps a importao, necessrio selecionar as variveis chaves e realizar o
mesmo procedimento descrito no tpico anterior.
Exportar Dados
Viso Geral
O IpeaGEO oferece a opo de exportar a tabela de dados que est se
trabalhando a qualquer momento, seja aps alterar sua base original ou realizar os
resultados de uma anlise estatstica nessa base.
Exemplos
possvel exportar a base de dados de duas maneiras:
Opo 1: Clique com o boto direito do mouse sobre a tabela e, em seguida, em
"Exportar tabela de dados".
35 / 173
36 / 173
Funcionalidades
Viso Geral
Aps o usurio abrir um arquivo de malha digital e concatenar com uma tabela de
dados, os seguintes cones so habilitados:
37 / 173
Descrio
Adicionar uma tabela a partir de dados j existentes no IpeaGEO.
Adies de layers auxiliares ao mapa Adiciona camadas (layers) que
podem ser sobrepostos ao mapa.
Salvar Mapa.
Adicionar uma tabela a partir de dados externos.
Inserir dados em um painel espacial.
Exportar tabela de dados Exporta a tabela de dados para os formatos
Microsoft Excel (*.xls), Microsoft Access (*.mdb), XML (*.xml) e texto
(*.txt).
Abrir tabela de dados em planilha Excel - Abre automaticamente a planilha
de dados no Excel.
Atualizar tabela e mapa.
Mover o mapa Permite mover o mapa a todas as direes.
Adiciona Zoom Aplica zoom no mapa inteiro.
Remove Zoom Remove zoom no mapa inteiro.
Zoom Aplica zoom na rea selecionada do mapa.
conjunto
Permite
selecionar
reas
do
mapa
Seleciona individualmente
individualmente.
38 / 173
Permite
selecionar
reas
do
mapa
39 / 173
Mapa Temtico
Viso Geral
Mapas temticos so mapas personalizados que tm como objetivo identificar a
distribuio espacial de eventos fsicos, polticos, culturais, econmicos, sociolgicos ou
qualquer outro aspecto que se deseja investigar, de uma determinada rea geogrfica
de interesse, como, por exemplo, municpios, microrregies, unidades de federao, etc.
O mapa dividido em classes, no necessariamente com o mesmo tamanho e
amplitude, no qual cada classe possui a sua cor.
Os mtodos disponveis para gerar os mapas temticos so:
Quantil: Intervalos so selecionados de modo que o nmero de observaes em
cada intervalo igual.
Equal: Os valores so divididos em k classes com intervalos iguais com o mesmo
tamanho (w) em que w = Amplitude k.
Jenks (Natural breaks): o mtodo mais utilizado nos pacotes de anlise
espacial. Sua composio tem como objetivo criar classes com a menor varincia interna
e maior variabilidade externa. Pode demandar muito tempo de clculos.
Valores nicos: Cada valor considerado uma classe e apresentado no mapa
com uma cor diferente.
Exemplo
Aps importar a tabela de dados no IpeaGEO (ver tpico Importao de dados) e
concatenar o arquivo de malha digital com a tabela de dados (ver tpico de
concatenao), clique no boto Mapas Temticos
opes exibidas abaixo.
40 / 173
Variveis Quantitativas
Ao selecionar a opo Variveis Quantitativas, abrir a nova janela.
41 / 173
42 / 173
Imediatamente surgir uma nova janela informando a criao do novo mapa. Clique em
OK duas vezes para visualizar o mapa gerado.
Mapa gerado:
Variveis Categricas
Para gerar um Mapa Temtico para Variveis Categricas, basta repetir o
mesmo procedimento descrito para as Variveis Quantitativas onde o nico
44 / 173
mtodo disponvel para exibio dos dados no mapa o mtodo dos Valores
nicos.
Anlise Grfica
Viso Geral
A anlise grfica uma ferramenta que auxilia na anlise exploratria dos dados,
onde o usurio pode verificar, por meio de grficos, o comportamento dos dados em
estudo.
Exemplo
Aps importar a tabela de dados no IpeaGEO (ver tpico Importao de dados) ou
concatenar o arquivo de malha digital (shape) com a tabela de dados (ver tpico de
concatenao), clique na opo Anlise Exploratria e manipulao de dados
45 / 173
46 / 173
Varivel Numrica;
Varivel Categrica.
47 / 173
48 / 173
49 / 173
50 / 173
Calculadora
Viso Geral
A Calculadora do IpeaGEO permite a aplicao de diversas funes em um
conjunto de dados.
Exemplo
Aps importar a tabela de dados no IpeaGEO (ver tpico Importao de dados)
ou concatenar o arquivo de malha digital com a tabela de dados (ver tpico de
concatenao), clique na opo Calculadora localizada no boto "Anlise Exploratria
e Manipulao de Dados"
51 / 173
52 / 173
53 / 173
Caso o usurio esteja trabalhando com os dados concatenados com uma malha
digital, possvel obter as seguintes medidas para os polgonos: rea do Polgono,
Permetro do Polgono, Coordenada do Centroide, as coordenadas do retngulo limite do
polgono (Bounding Box), a distncia entre uma determinada varivel e o polgono
escolhido; tambm permitido gerar a matriz de distncias entre polgonos.
Ao clicar no boto "Executar", sero acrescentadas na tabela de dados principal
novas colunas com as selees de medidas feitas.
54 / 173
Correlaes
Viso Geral
O formulrio de correlaes do IpeaGEO permite ao usurio verificar a existncia
de correlaes entre as variveis disponveis na tabela de dados utilizada.
55 / 173
Exemplo
Aps importar sua tabela de dados no IpeaGEO (ver tpico Importao de dados)
ou concatenar o arquivo de malha digital com sua tabela de dados (ver tpico de
concatenao) clicando na opo Anlise Exploratria e manipulao de dados
e, em seguida, em Correlaes.
Estatsticas Descritivas
Viso Geral
As estatsticas descritivas so medidas resumo importantes para a anlise
exploratria dos dados. Elas permitem, por exemplo, que o pesquisador conhea o
comportamento dos dados que esto sendo analisados e identifique inconsistncias,
presena de valores extremos (outliers), dentre outros problemas comuns que se pode
ter em um conjunto de dados.
As estatsticas disponveis no IpeaGEO so: Mdia, Mediana, Desvio Padro,
Varincia, Mximo, Mnimo, Coeficiente de Assimetria, Coeficiente de Curtose, o
tamanho amostral (Nmero de Observaes), o primeiro (1 quartil) e terceiro (3 quartil)
quartil (tendo em vista que a mediana o segundo quartil) e o Intervalo interquartlico,
que a diferena entre o terceiro e o primeiro quartil. O IpeaGEO ainda permite ao
usurio definir quatro percentis livre escolha, chamados de Percentil 1, Percentil 2,
Percentil 3 e Percentil 4.
57 / 173
Exemplo
Aps importar a tabela de dados no IpeaGEO (ver tpico Importao de dados)
ou concatenar a malha digital com a tabela de dados (ver tpico de concatenao),
clique na opo Estatsticas Descritivas localizada no boto "Anlise Exploratria e
Manipulao de Dados"
58 / 173
59 / 173
60 / 173
Matriz de Vizinhana
Viso Geral
No IpeaGEO possvel gerar uma matriz de vizinhana ou ainda importar a
matriz j calculada diretamente do seu computador.
Exemplo
Aps importar a tabela de dados no IpeaGEO (ver tpico Importao de dados) ou
concatenar o arquivo de malha digital com a tabela de dados (ver tpico de
concatenao), clique na opo Matriz de Vizinhana localizada no boto "Anlise
Exploratria e Manipulao de Dados"
63 / 173
64 / 173
65 / 173
Aps importar sua tabela de dados no IpeaGEO (ver tpico Importao de dados)
ou concatenar seu arquivo de malha digital com sua tabela de dados (ver tpico de
concatenao), clique na opo Importar Matriz de Vizinhana localizada no cone
Ferramentas
66 / 173
68 / 173
Aps importar sua tabela de dados no IpeaGEO (ver tpico Importao de dados)
ou concatenar seu arquivo de malha digital com sua tabela de dados (ver tpico de
concatenao), clique na opo Exportar Matriz de Vizinhana fixada no cone
Ferramentas
. A opo Exportar Matriz de Vizinhana fica disponvel aps a
matriz de vizinhana ser gerada, como explicado nos tpicos anteriores deste tutorial.
69 / 173
70 / 173
71 / 173
Tabelas de Frequncia
Viso Geral
As tabelas de frequncia permitem ao usurio verificar, em seu conjunto de
dados, a existncia de valores missings, outliers, isto , a distribuio dos dados em que
est trabalhando.
Exemplo
Aps importar a tabela de dados no IpeaGEO (ver tpico Importao de dados) ou
concatenar o arquivo de malha digital com a tabela de dados (ver tpico de
concatenao), clicar na opo Tabelas de Frequncia, presente dentro do cone
"Anlise Exploratria e Manipulao de Dados"
72 / 173
73 / 173
Tabulaes Cruzadas
Viso Geral
As tabulaes cruzadas permitem ao usurio verificar a distribuio de
74 / 173
Usando o boto
possvel selecionar uma varivel. O boto
todas as variveis disponveis.
75 / 173
seleciona
Para efetuar o clculo preciso selecionar duas variveis. No lado inferior direito
esto localizadas as opes que permitem acrescentar ao resultado as frequncias
absolutas e os percentuais nas linhas, colunas e do total.
76 / 173
77 / 173
Analise Multivariada
Analise de Clusters
Viso Geral
A anlise de clusters ou de agrupamento uma tcnica estatstica multivariada
que tem por objetivo agrupar elementos amostrais de acordo com alguma medida de
similaridade definida em funo de um conjunto de variveis. Tal agrupamento
realizado de modo que a variabilidade dentro dos grupos seja a menor possvel,
enquanto que a variabilidade entre os grupos seja maximizada.
Existem duas famlias de mtodos para realizar a anlise de clusters, os mtodos
hierrquicos e o no hierrquicos.
No agrupamento hierrquico calculada uma matriz de distncias (similaridades)
para cada par de elementos amostrais; o processamento se inicia com o agrupamento
do par de elementos com a menor distncia (maior similaridade). A cada passo a matriz
de distncias recalculada considerando os grupos formados nos passos anteriores. O
processamento termina quando houver apenas um grupo que concentra toda a amostra.
No agrupamento no hierrquico os elementos amostrais so distribudos
aleatoriamente em um nmero fixo de grupos. A cada passo o centroide de cada grupo
calculado, assim como a distncia dos elementos amostrais com relao a cada
centroide dos grupos. Se houver algum elemento alocado em um grupo, mas que tenha
uma distncia menor para o centroide de outro grupo, tal elemento deslocado para o
grupo de menor distncia. Neste ponto os centroides dos grupos envolvidos com o
deslocamento do elemento amostral so recalculados. O processamento termina quando
todos os elementos amostrais estiverem nos grupos cujas distncias para os centroides
sejam mnimas.
As principais fundamentaes dessa metodologia podem ser vistas em Johnson
e Wichern (2007) e Mingoti (2005).
Exemplo
Aps importar sua tabela de dados no IpeaGEO (ver tpico Importao de dados)
ou concatenar o arquivo de malha digital com sua tabela de dados (ver tpico de
concatenao) clique na opo Ferramentas
Anlise de Clusters -> K-Means.
78 / 173
79 / 173
80 / 173
81 / 173
82 / 173
matriz de correlao.
As seguintes opes tambm esto disponveis aos usurios:
84 / 173
85 / 173
Analise Fatorial
Viso Geral
A anlise fatorial uma tcnica multivariada paramtrica que permite expressar a
matriz de varincia-covarincia ou a matriz de correlao dos dados originais como a
soma de dois componentes: uma matriz que depende apenas da combinao linear das
variveis originais e uma matriz que representa a variabilidade residual. Desta forma,
possvel criar variveis latentes, chamadas de fatores, que so combinaes lineares
das variveis originais semelhante aos modelos de regresso linear de modo que a
matriz de variabilidade associada a uma quantidade menor de fatores que das variveis
originais represente uma parcela significativa da variabilidade total. Esta tcnica permite
reduzir a dimenso do conjunto de dados, bem como identificar variveis latentes que
podem ter significados prticos. Observe que a semelhana com o mtodo dos
componentes principais no por acaso, tendo em vista que os componentes principais
um dos mtodos usados para se extrair os fatores.
O IpeaGEO permite a estimao da matriz de coeficientes (chamada de matriz de
cargas fatoriais) pelos mtodos dos componentes principais, fatores principais e pela
mxima verossimilhana. Os escores podem ser calculados por mnimos quadrados
ponderados ou por regresso. Alm disso, possvel aplicar as seguintes rotaes aos
dados: quartimax, varimax, entropia mnima, quatimin, bi-quartimin e covarimin. Na
apresentao dos resultados possvel exibir o screeplot, os autovalores e as
comunalidades, as matrizes de varincia-covarincia e de correlao, os valores
estimados para os coeficientes (cargas fatoriais), a matriz residual e a inversa da matriz
de correlao. Existe tambm a possibilidade de se realizar o teste de Bartlett para
verificar se as variveis originais so correlacionadas; caso sejam no correlacionadas
tais variveis formam uma base ortogonal e sero idnticas aos fatores.
Exemplo
Aps importar sua tabela de dados no IpeaGEO (ver tpico Importao de dados)
ou concatenar seu arquivo de malha digital (shape) com sua tabela de dados (ver tpico
de concatenao) clicando na opo Ferramentas
Anlise Fatorial.
86 / 173
87 / 173
possvel definir o mtodo de clculo dos escores fatoriais, que pode Mnimos
Quadrados Ponderados ou Regresso.
88 / 173
Scree Plot;
Autovalores e Comunalidades;
Matriz de Correlao;
89 / 173
Matriz Residual;
90 / 173
Clculo de Taxas
Viso Geral
O mapeamento da taxa de ocorrncia de eventos uma importante ferramenta
para o direcionamento de polticas pblicas. O clculo de taxas brutas pode levar a
distores como, por exemplo, para de municpios muito pequenos. Nesses casos a
estimao de taxas brutas pouco vivel, pois o pequeno nmero de observaes pode
levar a distores nas estimativas das taxas, inclusive com a inflao na variabilidade
estimada.
Clayton e Kaldor (1987) solucionaram tal problema por meio da suavizao
Bayesiana. Alm desse trabalho, Marshall (1991) props uma estimativa de taxas de alta
estabilidade, que inclui a localizao geogrfica do municpio como informao adicional.
Tais metodologias so chamadas de empricas uma vez que, em ambos os casos, os
dados auxiliares so obtidos da prpria amostra. Pringle (1996) faz uma reviso de
tcnicas Bayesianas empricas tendo como base estudos de caso de cncer e
mortalidade neonatal.
Nesse mdulo, so apresentadas rotinas para clculo de taxas nas quais a
Estatstica Bayesiana e a Espacial so as ferramentas metodolgicas bsicas. Com isso,
tm-se estimativas com menor variabilidade e, por isso, mais indicadas.
O formulrio de Clculo de Taxas do IpeaGEO contm as seguintes opes de
metodologia (veja detalhes abaixo):
91 / 173
Taxa bruta;
Taxa espacial;
Taxa Bayesiana emprica;
Taxa Bayesiana emprica espacial;
Risco relativo;
Risco relativo Bayesiano (Clayton e Kaldor);
Taxa Bayesiana (Clayton e Kaldor);
o Priori Gamma;
o Priori Log-Normal;
o Priori Gamma Espacial;
o Priori Log-Normal Espacial;
Exemplo
O formulrio de clculo de Taxas est disponvel no seguinte local: Aps
concatenar um arquivo de malha digital (shape) com os dados, clicar em Ferramentas
-> Clculo de Taxas.
Econometria Bsica
Propensity Score Matching
Viso Geral
O propensity score matching (PSM) uma tcnica estatstica utilizada para a
construo de grupos com o objetivo de fazer comparaes estatsticas entre grupos.
Esta tcnica baseada em um modelo de probabilidade da participao de um individuo
em um determinado grupo ou tratamento, usando caractersticas observadas.
Os participantes so ento associados (matched) com base na probabilidade
estimada de participao em cada grupo, ou com base no escore de propenso
(propensity score).
O efeito mdio do tratamento (average treatment effect - ATE) de um programa
ento calculado como a diferena mdia entre os resultados (outcomes) para os dois
grupos estudados: participantes e no participantes do programa.
A validade do PSM depende de duas condies:
93 / 173
Exemplo
No boto Ferramentas, clique na opo Econometria Bsica e, em seguida, na
opo Propensity Score Matching.
94 / 173
95 / 173
96 / 173
Exemplo
Aps importar sua tabela de dados no IpeaGEO (ver tpico Importao de dados)
ou concatenar seu arquivo de malha digital com sua tabela de dados (ver tpico de
concatenao), clique na opo Econometria Bsica e em seguida na opo
Regresso com Dados Binrios.
99 / 173
Incluir Intercepto;
100 / 173
Anlise de multicolinearidade;
101 / 173
Regresso Linear
Viso Geral
O formulrio do IpeaGEO para regresso linear ajusta uma reta de regresso
linear simples(apenas uma varivel independente) ou mltipla(mais que uma varivel
independente). Os coeficientes da equao de regresso so estimados pelo mtodo de
102 / 173
mnimos quadrados.
Esto disponveis, tambm, as seguintes opes: anlise de multicolinearidade e
heterocedasticidade (por meio do teste de White, resduos e presena de observaes
influentes); e anlise grfica de resduos (histograma e P-P plot dos resduos).
Para a anlise de ajuste do modelo so calculados os seguintes coeficientes:
coeficiente de determinao (R2), coeficiente de determinao ajustado (R2 ajustado),
critrio de informao de Akaike (AIC Akaike Information Criteria), critrio de
informao de Akaike para pequenas amostras (AICc Akaike Information Criteria
Corrected), critrio de informao bayesiano (BIC Bayesian Information Criteria) e
estatstica de Wilk (-2 * log-verossimilhana).
Exemplo
Aps importar a tabela de dados no IpeaGEO (ver tpico Importao de dados)
ou concatenar o arquivo de malha digital com a tabela de dados (ver tpico de
concatenao), clique no cone Ferramentas
em seguida na opo Regresso Linear.
103 / 173
106 / 173
107 / 173
108 / 173
109 / 173
Estatstica Bsica
Anlise e testes para mdias
Viso Geral
Esse formulrio do IpeaGEO permite ao usurio a aplicao de testes estatsticos
paramtricos, no paramtricos e testes de ajuste.
De acordo com Bussab & Morettin (2002), os testes de hipteses utilizam
amostras para verificar a adequao desta hiptese ao universo real, ou seja,
populao da qual foi amostrada. Tm como objetivo fornecer uma metodologia que
permita o usurio verificar se os dados amostrais trazem evidncias que apoiam ou no
uma hiptese estatstica formulada.
Estes testes servem essencialmente para descrever uma populao a partir de
uma amostra, comparar essa populao a um valor hipottico, comparar duas ou mais
amostras independentes ou pareadas, comparao de mdias ou de varincias, dentre
outros.
110 / 173
Teste de qui-quadrado;
Exemplo
Existem duas maneiras para realizar tais testes no IpeaGEO:
Ao clicar em Anlise e Testes para Mdias abrir uma aba chamada Tabela de
Dados, na qual o usurio tem que importar um arquivo de dados do seu computador,
clicando em "Arquivo" e em seguida em "Importar arquivo de dados".
111 / 173
112 / 173
. O boto
seleciona
115 / 173
116 / 173
Caso deseje voltar aba anterior para mais testes, basta clicar na aba
Especificaes.
118 / 173
Distribuies Contnuas
Viso Geral
O IpeaGEO permite verificar o ajuste de variveis aleatrias contnuas com as
seguintes distribuies: Normal, Exponencial, Gama, Cauchy, F, Qui-quadrado, Beta,
Qui (Chi), Weibull e Logstica.
Exemplo
Existem dois modos para realizar essa anlise no IpeaGEO:
119 / 173
120 / 173
121 / 173
. O boto
122 / 173
Distribuies Discretas
Viso Geral
O IpeaGEO permite verificar o ajuste de variveis aleatrias discretas com as
seguintes distribuies: Bernoulli, Binomial, Geomtrica, Pascal e Poisson.
Exemplo
Assim como para as distribuies contnuas, existem dois modos para realizar essa
anlise no IpeaGEO:
123 / 173
124 / 173
126 / 173
Aps clicar em Executar se abrir uma aba contendo os resultados dos testes.
Exemplo
Aps importar a tabela de dados no IpeaGEO (ver tpico Importao de dados) ou
concatenar o arquivo shape com a tabela de dados (ver tpico de concatenao), clique
na opo Mtodos de Apoio Deciso localizada na caixa Ferramentas
128 / 173
O boto
permite selecionar uma nica varivel, enquanto que o boto
permite selecionar todas as variveis disponveis.
129 / 173
Famlia Geral:
Algbrico;
Componentes principais.
130 / 173
Famlia AHP:
131 / 173
Famlia Promthe:
Promthe 1;
Promthe 2;
Promthe 3;
Promthe 4.
132 / 173
133 / 173
Exemplo
No boto Ferramentas, clique na opo reas Mnimas Comparveis e, em
seguida, na opo Compatibilizao de Variveis.
135 / 173
Para importar a tabela que ser usada no formulrio clique no boto Dados. O
formulrio de importao de tabela de dados ir se abrir.
136 / 173
Posteriormente, deve ser escolhido o ano para as AMCs e o ano (padro) para a
tabela de dados.
137 / 173
138 / 173
Uma nova aba contendo a associao das AMCs ir aparecer com os dados das
variveis e anos selecionados.
139 / 173
140 / 173
Conglomerados Espaciais
Hierrquico
Viso Geral
Em minerao de dados, a anlise de agrupamentos hierrquicos um mtodo
de anlise de clusters que visa construir uma hierarquia de conglomerados. As
estratgias de agrupamento hierrquico geralmente se enquadram em dois tipos:
aglomerativo e divisionista.
Nos algoritmos tradicionais de clusterizao (hierrquica ou no), quando so
agrupadas unidades geogrficas do tipo municpios ou setores censitrios, no
necessariamente os grupos homogneos so formados por municpios ou setores
censitrios estritamente vizinhos. Pode acontecer que, em um mesmo agrupamento
(cluster), existam municpios geograficamente separados. A formao de agrupamentos
homogneos de municpios, com componentes no necessariamente contguos, pode
no ser um problema em muitas das aplicaes. De fato, pode acontecer que o analista
ou pesquisador esteja interessado justamente em identificar se existem regies (setores
censitrios, reas de ponderao) na periferia de So Paulo, por exemplo, que so
semelhantes, em termos de atributos socioeconmicos, a regies no centro da cidade.
Os algoritmos de agrupamento hierrquico espacial so criados por meio de
modificaes no mtodo de agrupamento tradicional, de forma a incorporar a restrio
de unidades geogrficas (por exemplo, municpios, setores censitrios, Unidades da
Federao, reas de ponderao) contguas.
Exemplo
141 / 173
Aps concatenar o arquivo de malha digital (shape) com a tabela de dados (ver
tpico de concatenao), clique no cone Ferramentas
Espaciais e, em seguida, na opo Hierrquico.
, opo Conglomerados
questo.
143 / 173
144 / 173
Na parte Outras opes escolha qual o tipo de mtodo a ser aplicado para a
definio da matriz de vizinhana e quais as cores a serem utilizadas na construo do
mapa com os resultados da anlise. Caso seja de interesse, pode-se optar pelas opes
Cores Aleatrias e Gerar relatrio. Definidos os parmetros, clique no boto Gerar
rvore de conglomerados.
145 / 173
No grfico possvel dar zoom ou selecionar apenas uma parte do grfico para
melhor visualizao. Essas manipulaes so feitas com o mouse. Ao se utilizar o zoom
os eixos do grfico so ajustados automaticamente.
146 / 173
Mapa gerado:
Dependncia Espacial
Viso Geral
Uma etapa fundamental na anlise espacial a mensurao da dependncia
espacial entre as observaes, ou seja, testar se h ou no dependncia geogrfica
entre os eventos de estudo. Para isso, se utiliza duas abordagens diferentes: (1)
possvel estimar o quanto um determinado elemento est relacionado com seus vizinhos
147 / 173
de fronteira, de acordo com uma varivel de interesse essa relao pode ser avaliada
pelos ndices de autocorrelao espacial, tais como os ndices de Moran, Geary e GetisOrd Gi; (2) em alguns casos importante verificar se existem agrupamentos de unidades
geogrficas similares quanto s variveis em anlise isso pode ser feito por meio dos
indicadores de conglomerados espaciais de Tango e Rogerson.
ndices Globais
Viso Geral
Os indicadores globais so teis por apresentarem uma nica medida de
tendncia espacial para toda a regio em estudo. Assim, so as tcnicas mais utilizadas
na fase inicial de anlises exploratrias de dados de rea. Alm do teor exploratrio,
permitem ainda efetuar testes de hiptese, cuja hiptese nula que no h dependncia
espacial entre as unidades geogrficas, de acordo com as variveis originais.
Exemplo
Aps importar a tabela de dados no IpeaGEO (ver tpico Importao de dados) ou
concatenar o arquivo de malha digital (shape) com a tabela de dados (ver tpico de
concatenao), clique no cone Ferramentas
em seguida, na opo ndices Globais.
148 / 173
149 / 173
150 / 173
ndices Locais
151 / 173
Viso Geral
Quando muitos polgonos so analisados provvel que ocorra diferentes
regimes de autocorrelao espacial na regio em estudo. Nesses casos, apenas os
ndices globais no seriam suficientes para entender a estrutura dos dados analisados.
Portanto, importante apresentar tambm, para cada polgono, uma medida de
autocorrelao espacial. Essas estatsticas locais, em geral, derivam de algum dos
ndices de dependncia global apresentados no mdulo de ndices Globais.
As opes de Indicadores para os usurios do IpeaGEO so:
Exemplo
Aps importar a tabela de dados no IpeaGEO (ver tpico Importao de dados) ou
concatenar o arquivo de malha digital (shape) com a tabela de dados (ver tpico de
concatenao), clique no cone Ferramentas
em seguida, na opo ndices Locais.
152 / 173
153 / 173
154 / 173
155 / 173
Econometria Espacial
Cross-Section
Viso Geral
O formulrio de dados cross-section espaciais tratam modelos de regresso para
observaes, em um momento do tempo, referentes a um conjunto de unidades
geogrficas. O objetivo principal desses modelos incorporar a possvel presena de
correlaes espaciais entre as unidades geogrficas. Para isso, existem diversas opes
disponveis para representao da dependncia espacial entre as unidades.
Alm das diferentes opes para determinao da estrutura de dependncia
espacial entre os vizinhos, possvel optar por diferentes mtodos de estimao para os
modelos de regresso disponveis. Essas opes so aplicveis para diferentes
situaes, dependendo, por exemplo, do tipo de informaes disponveis. As opes de
modelagem disponveis no formulrio de regresso para dados cross-section espaciais
so:
156 / 173
Exemplo
Existem dois modos para realizar essa anlise no IpeaGEO:
158 / 173
159 / 173
160 / 173
Para tornar as opes Tipo de matriz de vizinhana, Clculo do logdeterminante, Matriz de covarincia no estimador de Kelejian-Prucha e Funo kernel
(HAC) habilitadas, necessrio, inicialmente, determinar a matriz de vizinhana
desejada (ver tpico Matriz de Vizinhana).
161 / 173
tabela de dados.
Para estimar os modelos clique em Estimar. Duas novas abas se abriro: a
primeira contendo os Resultados da Estimao e a segunda os Novos Valores
Gerados.
163 / 173
Exemplo
Aps concatenar o arquivo de malha digital (shape) com a tabela de dados (ver
tpico de concatenao), clique no boto Ferramentas
, opo Indicadores
Espaciais e, em seguida, na opo ndices de Segregao Espacial.
164 / 173
165 / 173
Segreration ndex;
Segregation ndex adjusted for contiguity;
Indicador de Entropia;
166 / 173
Coeficiente de Gini;
ndice de Atkinson.
Tipo exposition:
Isolation ndex;
Correlation ratio.
Tipo clustering:
Absolute clustering;
Mean proximity between members of group X;
Mean proximity between members of one group (exp);
Distance decay isolation index.
Tipo exposition:
Interation ndex.
Tipo clustering:
Dissimirarity;
Coeficiente de Gini;
Information Theory.
Tipo exposition:
168 / 173
Normalized Exposure;
Relative Diversity;
Squared coefficient of variation.
169 / 173
170 / 173
Referncias Bibliogrficas
AGRESTI, A. Categorical data analysis. 2 edio. New York: Wiley, 2002.
AGRESTI, A. Introduction to the Analysis of Categorical Data. New York: Wiley, 1995.
ANSELIN, L. Local indicators of spatial association LISA. Geographical Analysis, 27,
93-115. 1995.
ANSELIN, L.; LE GALLO, J.; JAYET, H. Spatial panel econometrics. The Econometrics
of Panel Data. In Mtys, L., Sevestre, P. (eds.). Springer-Verlag, 2008.
ANSELIN L., Luc Spatial Econometrics: Methods and Models. Kluwer Academic
Publishers, Dordrecht, 1988.
BAILEY, T.; GATRELL, A. Interactive Spatial Data Analysis. Longman, Har-low 1995.
BALTAGI, B.; EGGER, P.; PFAFFERMAYR, M. A generalized spatial panel data model
with random effects. Syracuse University, Working Paper, 2007a.
BALTAGI, B.; SONG, S. H.; JUNG, B. C.; KOH, W. Testing for serial correlation, spatial
autocorrelation and random effects using panel data. Journal of Econometrics, v. 140,
2007b.
BUSSAB, W. O.; MORETTIN, P. A. Estatstica Bsica. 5 Ed. So Paulo: Saraiva, 2002.
536p.
CARON, R. Regresso de dados binrios: distribuio weibull. So Carlos: UFSCar,
2010.
CARVALHO, A. X. Y, ALBUQUERQUE, P. H. M., ALMEIDA JNIOR, G. R.,
GUIMARES, R. D., LAURETO, C. R. Clusterizao Hierrquica Espacial com Atributos
Binrios.
Texto
para
Discusso
no.
1428.
Ipea.
2009.
http://www.ipea.gov.br/sites/000/2/publicacoes/tds/td_1428.pdf.
CLAYTON, D.; KALDOR, J. Empirical bayes estimates of age-standardized relative risks
for use in disease mapping. Biometrics, v. 43, n. 3, p. 671-681, 1987.
CONNOVER, W. J. Practical Nonparametric Statistics. John Wiley & Sons, 2 ed., 1980.
CRESSIE, N. A.C. Spatial Statistics. John Wiley, New York, 1993.
CMARA, G.; DAVIS C.; MONTEIRO, A.M.; D'Alge, J. C. Introduo Cincia da
Geoinformao. So Jos dos Campos, INPE, 2001.
DEMTRIO, C. G. B. Modelos Lineares Generalizados em Experimentao Agronmica.
ESALQ/USP, 2002.
DEMPSTER, A. P.; LAIRD, N. M.; RUBIN, D. B. Maximum likelihood for incomplete data
via the EM algorithm (with discussion). Journal of the Royal Statistical Society, v. 39, n. 1,
p. 1-38, 1977 (Series B).
DOANE, D.P. Aesthetic frequency classifications. Amer. Statist. 30-4, 181- 183. 1976.
DRUCK, S. CMARA, G. e MONTEIRO, A.M. Anlise espacial de dados geogrficos.
Embrapa, Planaltina, 2004.
171 / 173
analysis
of
segregation
37, 17-33.
MORI,T. An optimal length of class interval for histogram. Japan.J.Applied Statistics , 4-1,
17-24. 1974.
MUTL, J. Dynamic panel data models with spatially correlated disturbances. Ph.D. thesis,
University of Maryland, College Park, 2006.
MUTL, J.; PFAFFERMAYR, M. The spatial random effects and the spatial fixed effects
model: the Hausman test in a Cliff and Ord panel model. Manuscript, Institute of
Advanced Studies, Vienna, 2008.
NELDER, J. A.; WEDDERBURN, R. W. M. Generalized Linear Models. Journal of the
Royal Statistical Society. Series A (General), v. 135, n. 3, 1972.
PAULA, G. A. Modelos de Regresso com apoio computacional. So Paulo: IME/USP,
2010.
PRINGLE, D. G. Mapping disease risk estimates based on small numbers: An
assessment of empirical bayes techniques. Economic and Social Review, v. 27, p. 341363, 1996.
RIPLEY, B. D. Spatial Statistics. John Wiley, New York, 1981.
172 / 173
ROGERSON, P. The detection of clusters using a spatial version of the chi squared
goodness-of-fit test. Geographical Analysis, 31, 130-147, 1999.
ROGERSON, P.; YAMADA, I. Statistical Detection and Surveillance of Geo-graphic
Clusters. Chapman and Hall, 2008.
SATTERTHWAITE, F. E. An approximative distribution of estimates of variance
componentes. Biometrics Bulletin, v. 2, p. 110 114, 1947.
STEVENSON, W.J. Estatstica: Aplicada Administrao. So Paulo: Harbra, 2001.
511p.
STURGES, H.A. The choice of a class interval. J.Amer.Statist.Assoc. 21.65-66. 1926.
TANGO, T. A class of tests for detecting generaland fo-cusedclustering of rare
diseases. Statistics in Medicine, 7, 649-660. 1955.
WALLER, L. A.; TURNBULL, B. W.; CLARK, L. C.; NASCA, P. Chronic disease
surveillance and testing of clustering of disease and exposure: Application to leukemia
incidence and TCE-contaminated dumpsites in upstate New York. Environmetrics 3, 281300, 1992.
WELCH, B. L. The generalization of students problem when several different
population variances are involved. Biometrika, v. 34, p. 28 35, 1947.
WONG, D. W. S. Geostatistics as measures of spatial segregation. Urban Geography,
20 (7), 635-647, 1999.
YU, J., LEE, L. F. (2010). Some recent developments in spatial panel data models.
Regional Science and Urban Economics, v. 40, pp. 255-271.
173 / 173