Escolar Documentos
Profissional Documentos
Cultura Documentos
net/publication/353353279
CITATIONS READS
0 170
5 authors, including:
Some of the authors of this publication are also working on these related projects:
Environmental impacts: studies of current scenarios as basis for mitigation and monitoring View project
All content following this page was uploaded by Enzo Luigi Crisigiovanni on 21 July 2021.
DOI:10.34117/bjdv7n7-437
Danielli Batistella
Mestre em Geomática
Departamento de Agrimensura, Universidade Tecnológica Federal do Paraná
Via do Conhecimento, s/n - KM 01 - Fraron, Pato Branco - PR, 85503-390
E-mail: batistella@utfpr.edu.br
RESUMO
A detecção e classificação de telhados é um problema que tem recebido bastante atenção
na última década. Conhecer a distribuição espacial dos telhados em uma cidade é
importante para o planejamento e cadastro urbano. Este estudo teve como objetivo utilizar
a análise de imagens de satélite por geoprocessamento associado a dois algoritmos de
aprendizado de máquina para detecção e classificação de telhados em bairros da cidade
de Pato Branco–PR. Objetivou-se também a comparação entre dois algoritmos para
ABSTRACT
The detection and classification of rooftops is a problem that has been receiving
increasing attention in the past decade. Knowing the spatial distribution of the rooftops
in a city is essential for urban planning and cadastral surveying. This study aimed to use
geoprocessing-based image analysis and two machine learning algorithms to detect and
classify rooftops in neighborhoods of Pato Branco – PR. We compared two classifiers in
the study area: random forests (RF) and convolutional neural networks (CNN). We used
three rooftop classes in this study: clay tile roofs, fiber cement tile roofs, and zinc tile
roofs. The results follow the state-of-the-art trend. Random forests showed promising
results during training and validation steps, but the model failed when applied to a real-
world situation. Convolutional neural networks presented better results when compared
to the RF model, with a kappa index of 0.94 in the study raster classification. The
convolutional networks detected 18,880 rooftops in the study area. The results using CNN
were promising. Therefore, we recommend the use of CNN to classify rooftops in
Brazilian municipalities. City Halls can use this approach to map and identify the rooftops
in regions of interest, using georeferenced imagery and software available on the net.
1 INTRODUÇÃO
Um dos grandes desafios das Geociências é a extração automática de elementos
que compõem a paisagem urbana através do processamento digital de imagens
(POLIDORIO, 2007). Os edifícios são uma parte essencial da paisagem e são um
elemento básico da infraestrutura humana, e a detecção de telhados é um problema em
aberto. Mapear edifícios de forma adequada possibilita análises espaciais
socioeconômicas, auxilia no planejamento urbano e no desenvolvimento sustentável
2001), são rápidas no processamento (BELGIU; DRĂGUŢ, 2016), e são capazes de fazer
diferentes análises em grandes conjuntos de dados, de forma eficaz (RODRIGUEZ-
GALIANO et al., 2012).
Nesse trabalho também foram utilizadas redes neurais convolucionais (no inglês
Convolutional Neural Network - CNN) para a classificação de telhados. A base das redes
neurais envolve neurônios artificiais organizados em camadas. Cada neurônio recebe um
dado de entrada e executa operações (aplicando pesos, vieses, funções de ativação, etc.),
gerando uma saída. Os pesos dos neurônios podem ser ajustados recursivamente, o que
significa que eles podem se auto-aprimorar durante a etapa de treinamento (O’SHEA;
NASH, 2015).
Redes neurais que têm muitas camadas de neurônios realizam o chamado
aprendizado profundo — deep learning. Rede Neural Convolucional (RNC) é um tipo
específico de rede profunda que tem sido muito eficaz na detecção de objetos,
reconhecimento visual e classificação de imagens (MARETTO, 2020).
As RNCs aprendem conceitos complexos dividindo-os hierarquicamente em
componentes simples. Dessa forma, uma RNC pode aprender características altamente
abstratas (MARETTO, 2020; ZHANG; ZHANG; DU, 2016) através de suas camadas. A
extração de características é feita a partir de camadas convolucionais, camadas de
2 MATERIAL E MÉTODOS
2.1 ÁREA DE ESTUDO
A área de estudo tem cerca de 123 km2, compreendendo a cidade e áreas próximas
da zona urbana do município de Pato Branco – PR (Figura 3). O município está localizado
ao sudoeste do estado do Paraná, na microrregião de Pato Branco. Encontra-se na latitude
26°13'43.04"S e longitude 52°40'24.40"O, a uma altitude de 760m (FEPESE, 2020). A
imagem adquirida do satélite Pleiades HR-1B tem 12 bits de resolução radiométrica e as
bandas PAN, B, G, R e NIR (Quadro 1). Para o tratamento dessa imagem, foram
utilizados os seguintes software: QGIS 3.12.2, ENVI 5.3, Orfeo Toolbox 7.1.0, R Studio
1.4 e Picterra.
Fonte: Imagem cedida pelo Departamento de Agrimensura da UTFPR-PB (DAAGR). Mapa de autoria
própria.
2.2 METODOLOGIA
A metodologia utilizada consiste, resumidamente, em quatro etapas (Figura 4). A
partir da imagem georreferenciada, foi feito o pré-processamento e a seleção de amostras,
ou seja, a delimitação de feições de interesse. Em seguida, após testes de diferentes
parâmetros, foi feita a classificação da imagem utilizando os algoritmos floresta
randômica e redes neurais convolucionais. Por fim, analisou-se a performance das
classificações realizadas pelos algoritmos de aprendizado de máquina FR e RNC.
Figura 5 - Caracterização dos diferentes tipos de telhados amostrados na região de Pato Branco-PR. a)
Telhado de barro, b) telhado de fibrocimento e c) telhado de zinco
espaço de cores 8-bit RGBA, a normalização do raster e a conversão deste para o sistema
de coordenadas WGS-84 (EPSG: 4326). Outra etapa que o algoritmo realiza é o aumento
artificial dos dados (data augmentation), processo que busca incrementar e balancear os
dados de treinamento, aumentando a capacidade efetiva do modelo. Além disso, os
detectores-base são pré-treinados com milhares de amostras genéricas, o que faz com que
o usuário não precise delinear manuelmente grandes volumes de amostras. Outra
vantagem é a possibilidade de treinar detectores sem conhecimento de programação e
sem hardware específico. O processamento é feito em nuvem, então não é necessário que
o usuário tenha uma GPU potente em mãos. O pós processamento também é integrado,
de forma que a saída do classificador é um conjunto de objetos vetoriais compatíveis com
sistemas de informação geográfica (SIG).
As maiores desvantagens são i) a limitação de utilizar apenas 3 bandas em um
raster; ii) a baixa possibilidade customização dos detectores; e iii) a limitação de distinguir
apenas entre objetos-alvo e outros objetos que não se deseja detectar. Por esse motivo,
um detector para cada tipo de telhado foi criado: um para TB, um para TFC e outro para
TZn.
3 RESULTADOS E DISCUSSÃO
3.1 CLASSIFICAÇÃO POR FLORESTA RANDÔMICA (FR)
A matriz de confusão da fase de treinamento e as métricas de performance
calculadas a partir dessa matriz (Quadro 2) mostram o desempenho do modelo.
não detectou adequadamente o telhado-alvo. Esse problema pode estar relacionado pela
variedade de telhados existentes em uma cidade extensa como Pato Branco. Porém, uma
quantidade maior de amostras de treinamento poderia ser utilizada para contornar esse
tipo de problema.
Análises pós-classificação foram também realizadas quando utilizou-se esse
algoritimo. Foi realizada a contagem de telhados por bairro a partir da extração dos
centroides dos polígonos e da associação de atributos por local. Usou-se o vetor do limite
dos bairros, disponibilizado pelo Departamento de Agrimensura da UTFPR-PB
(DAAGR). Dessa forma, o polígono cujo centroide encontra-se dentro de um bairro foi
considerado pertencente a tal bairro. No total, o algoritmo detectou 18.880 telhados em
Pato Branco. Calculou-se o percentual total dos telhados de cada classe por bairros
(Figura 7) e o percentual do total de telhados detectados por bairro (Figura 8). Por fim,
produziu-se um mapa de calor (Figura 9).
De acordo com as classificações (Figura 7A), observa-se que mais de 12% dos
telhados de barro (TB) encontram-se fora do limite da cidade (FLC). Isso pode ser
explicado pela expansão da cidade de Pato Branco. Conjuntos habitacionais, como o que
pode ser visto a oeste da cidade (Figura 9, na parte central esquerda do mapa TB), foram
instalados fora do que era considerado a zona urbana na data de aquisição da imagem.
Também observa-se que os bairros Centro, La Salle e Santa Terezinha têm grandes
concentrações de TB. Isto pode ocorrer devido à alta população desses bairros. Outro
fator que pode ter influenciado a alta densidade TB nesses bairros é a renda média alta
nestes bairros. Segundo dados do Censo Demográfico de 2010 (IBGE, 2010), os três
bairros apresentaram renda média domiciliar maior que cinco salários mínimos. Os
bairros Dall Ross e Bela Vista apresentaram as menores porcentagens de telhados de
barro.
Os bairros Planalto e Alvorada foram os que mais concentraram telhados de
fribrocimento (Figura 7B). Isso poderia ser explicado pela grande densidade populacional
e pela característica residencial desses bairros. Os bairros Alto da Glória, Pinheiros e Dall
Ross apresentaram as menores concentrações desse tipo de telhado.
Aponta-se que 14,24% dos telhados de zinco encontram-se fora da zona urbana
(Figura 7C). Um motivo possível para essa distribuição espacial é que telhados de zinco
são utilizados principalmente em barracões que encontram-se na zona industrial. Outros
pontos de destaque foram os bairros Alvorada, Planalto e o Centro da cidade, que
poderiam ser explicados pela grande população desses bairros.
Figura 8 - Porcentagem total de telhados detectados por bairro na área amostrada de Pato Branco – PR.
Figura 9 - Mapa de calor dos diferentes tipos de telhados detectados nas áreas amostradas
4 CONCLUSÃO
Em resumo, os pontos-chave desse trabalho são:
1) A banda R teve maior importância no algoritmo FR na tarefa de classificação de
telhados, enquanto a banda G teve a menor importância, segundo o índice de Gini;
1
http://image-net.org/
2
https://groups.csail.mit.edu/vision/datasets/ADE20K/
3
https://www.cityscapes-dataset.com/
4
https://www.openstreetmap.org/
5
http://gpcv.whu.edu.cn/data/
6
https://project.inria.fr/aerialimagelabeling/
7
https://www.crowdai.org/challenges/mapping-challenge
8
https://spacenet.ai/
9
Microsoft - US Building Footprints; NY Times - A Map of Every Building in America
REFERÊNCIAS
AIRBUS DEFENSE AND SPACE. Pléiades Imagery – User Guide. Airbus Defence and
Space Intelligence, France: CNES, Airbus Defence and Space Intelligence, 18 out. 2012.
Disponível em: <http://www.engesat.com.br/wp-content/uploads/PleiadesUserGuide-
17062019.pdf>. Acesso em: 8 mar. 2021.
BORRA, S.; THANKI, R.; DEY, N. Satellite Image Classification. In: BORRA, S.;
THANKI, R.; DEY, N. (Eds.). Satellite Image Analysis: Clustering and Classification.
SpringerBriefs in Applied Sciences and Technology. Singapore: Springer, 2019. p. 53–
81.
LI, Z.; WEGNER, J. D.; LUCCHI, A. Topological Map Extraction from Overhead
Images. arXiv:1812.01497 [cs], 29 nov. 2019.
LIN, J. et al. ESFNet: Efficient Network for Building Extraction from High-Resolution
Aerial Images. arXiv:1903.12337 [cs], 19 abr. 2019.
LIU, H. et al. DE-Net: Deep Encoding Network for Building Extraction from High-
Resolution Remote Sensing Imagery. Remote Sensing, High Spatial Resolution Remote
Sensing: Data, Analysis, and Applications. v. 11, n. 2380, p. 20, 2019a.
LIU, P. et al. Building Footprint Extraction from High-Resolution Images via Spatial
Residual Inception Convolutional Neural Network. Remote Sensing, v. 11, n. 7, p. 830,
7 abr. 2019b.
WU, G.; GUO, Z. Geoseg: A Computer Vision Package for Automatic Building
Segmentation and Outline Extraction. arXiv:1809.03175 [cs], 10 set. 2018.
ZHANG, L.; ZHANG, L.; DU, B. Deep Learning for Remote Sensing Data: A Technical
Tutorial on the State of the Art. IEEE Geoscience and Remote Sensing Magazine, v. 4, n.
2, p. 22–40, jun. 2016.
ZHU, Q. et al. MAP-Net: Multi Attending Path Neural Network for Building Footprint
Extraction from Remote Sensed Imagery. IEEE Transactions on Geoscience and Remote
Sensing, p. 1–13, 2020.