Você está na página 1de 2

Escola Nacional de Ciências Estatísticas - ENCE

Curso de Pós Graduação em População, Território e Estatísticas Públicas

Disciplina: Geoprocessamento

Resenha

RAMOS, A. P. M. et al. Avaliação Qualitativa e quantitativa de métodos de classificação de dados para o


mapeamento coroplético. Revista Brasileira de Cartografia. Rio de Janeiro. N. 68/3, p.609-629,
Mar/Abr/2016.

Temas problematizados:

Mapa coroplético - representação espacial da distribuição de fenômenos cujos dados quantitativos associam-
se a unidades de enumeração (países, estados, cidades etc.).

Inadequado para expressar heterogeneidade intraclasse e distribuições de dados absolutos.

Informação fortemente influenciada por: (a) método de classificação de dados; (b) número de classes que
expressam a variação do fenômeno.

Classificação prévia de dados permite:


Compreender sua distribuição, identificar o número de classes mais adequado para representar a distribuição
espacial do fenômeno e expressar heterogeneidade interclasses e homogeneidade intraclasses.

Objetivos:
(1) Aplicação de quatro métodos de classificação em distribuições de densidade demográfica para os estados
de São Paulo e Mato Grosso do Sul; (2) Avaliação qualitativa e quantitativa dos métodos, identificando
vantagens e desvantagens associadas aos seu uso.

Conceitos associados à classificação dos dados:


(a) Tipo e natureza do dado (qualitativo, ordinal ou quantitativo): condiciona formas específicas de
representação do fenômeno.
(b) Estatísticas descritivas (medidas centrais, de dispersão, outliers etc): insumo para escolha do método mais
condizente com o perfil dos dados.
(c) Distribuições de frequência (normal, assimétrica etc): compreensão do perfil do conjunto de observações.
(d) Amplitude útil (representação de outliers em classes de dados separadas): alternativa ao uso da amplitude
total para dados com ampla variação.

Número de classes
Ausência de critério estatístico de definição. Porém: (a) Número elevado = mapa de difícil leitura; (b)
Quantitativo pequeno = “falsa” homogeneidade do conjunto de dados.
Fatores a considerar: (a) demanda do usuário; (b) aspectos da percepção visual (incapacidade de
discriminação, pelo olho humano, de pequenas variações cromáticas e acromáticas); (c) abordagem de
Sturges.

Método do Intervalo Igual


Definição de classes de amplitude constante.
Vantagens: (a) simplicidade de cálculo; (b) facilidade de interpretação; (c) legenda de fácil compreensão
(valores ordenados e contínuos).
Desvantagens: (a) definição de intervalos de classes não se baseia na distribuição dos dados; (b) não
recomendada para distribuições assimétricas com concentração de observações em uma ou duas classes; (c)
possibilidade de gerar classes sem observações.
Adoção da amplitude útil minimiza os efeitos supracitados.

Método do Quantil
Classes de dados com variação de amplitude e mesmo número de elementos.
Vantagem: (a) ênfase em diferenças intraclasse; (b) cálculo matemático simples.
Desvantagens: (a) existência eventuais “vazios” entre uma classe e outra, causando dificuldades de
compreensão para o usuário; (b) observações de igual valor distribuídas em classes distintas, gerando uma
classificação ambígua (solução - definição dos limites das classes pela média aritmética entre o último valor
da classe e o primeiro valor da próxima).
Recomendada para dados com distribuição retangular e valores não muito repetitivos.

Método do desvio padrão


Classes de dados organizadas a partir da média, com adição ou subtração de desvios padrão a ela.
Vantagens: (a) ausência de descontinuidades na legenda; (b) Máximo de seis classes utilizadas para
representar o conjunto de dados.
Desvantagens: (a) exigência de dados com distribuição normal; (b) necessidade de operações matemáticas
adicionais para transformação dos dados em uma distribuição normal.

Método de otimização de Jenks


Processo de homogeneização intraclasse (suavização das diferenças internas) e “heterogeneização”
interclasses.
Definição de classes a partir do índice “Melhor Ajuste de Variância” (GVF).
Vantagem: limites de classes ajustados aos padrões de agrupamento dos dados.
Desvantagens: (a) eventualmente disfarça diferenças internas dos dados/real apresentação do fenômeno; (b)
multiplicidade de etapas do processo; (c) complexidade conceitual e matemática.

Avaliação qualitativa = atribuição de respostas “sim” / “não” a um conjunto de critérios associados a vantagens
ou desvantagens de cada método.

A avaliação quantitativa = estimar o melhor GVF para cada método.

Inexistência de método ideal e oportuno para classificação de dados.

Métodos distintos = diferentes representações. Necessário conhecer: (a) propósitos do usuário; (b) conjunto
de dados; (c) características de cada método.

Definição do melhor método: ajuste entre vantagens e desvantagens de cada um, propósitos do usuário e
particularidades dos dados.

Avaliação quali-quantitativa subsidia a seleção do método mais apropriado.

Desafio da classificação de dados: homogeneidade intraclasses e heterogeneidade interclasses.

Conjuntos de dados com valores díspares: recomendação de substituição da amplitude total pela útil.

O texto é claro na definição e problematização dos objetivos propostos. Apresenta conceitos


estatísticos relevantes para a compreensão, pelo leitor iniciante no tema, da relação entre o perfil dos dados
na sua representação em mapas.

Você também pode gostar