Chammaetal Crisigiovanni 2021

See discussions, stats, and author profiles for this publication at: https://www.researchgate.
net/publication/353353279
Aprendizado de máquina aplicado em imagens de satélite para classiﬁcação de

telhados
Article in Brazilian Journal of Development · July 2021

DOI: 10.34117/bjdv7n7-437
CITATIONS READS
0 170
5 authors, including:
Willian Chamma Enzo Luigi Crisigiovanni

EEmovel Inteligência Imobiliária Universidade Estadual do Centro-Oeste do Paraná (UNICENTRO)
1 PUBLICATION 0 CITATIONS 17 PUBLICATIONS 11 CITATIONS
SEE PROFILE SEE PROFILE
Heloísa Victorino Vanderlei A Lima

Federal University of Technology - Paraná/Brazil (UTFPR) Federal University of Technology - Paraná/Brazil (UTFPR)
3 PUBLICATIONS 1 CITATION 67 PUBLICATIONS 294 CITATIONS
SEE PROFILE SEE PROFILE
Some of the authors of this publication are also working on these related projects:
Environmental impacts: studies of current scenarios as basis for mitigation and monitoring View project
Synchronism and complexity of the Fiddler Crab's wave View project
All content following this page was uploaded by Enzo Luigi Crisigiovanni on 21 July 2021.
The user has requested enhancement of the downloaded file.

Brazilian Journal of Development 72558
ISSN: 2525-8761
Aprendizado de máquina aplicado em imagens de satélite para

classificação de telhados
Machine learning applied to satellite imagery for rooftop

classification
DOI:10.34117/bjdv7n7-437
Recebimento dos originais: 20/06/2021

Aceitação para publicação: 20/07/2021
Willian Douglas Sbitkowski Chamma

Formando do Curso Técnico-Integrado em Agrimensura
Universidade Tecnológica Federal do Paraná
Via do Conhecimento, s/n - KM 01 - Fraron, Pato Branco - PR, 85503-390
E-mail: willsbit@gmail.com
Danielli Batistella
Mestre em Geomática
Departamento de Agrimensura, Universidade Tecnológica Federal do Paraná
E-mail: batistella@utfpr.edu.br
Enzo Luigi Crisigiovanni

Doutor em Ciências Florestais
Programa de pós-graduação em Ciências Florestais, Universidade Estadual do Centro-
Oeste
Rua Professora Maria Roza Zanon de Almeida, s/n, Engenheiro Gutierrez, Irati-PR,
84505-677
E-mail: enzocrisigiovanni@gmail.com
Heloísa da Silva Victorino

Mestre em Sensoriamento Remoto
Departamento de Agrimensura, Universidade Tecnológica Federal do Paraná
E-mail: hvictorino@utfpr.edu.br
Vanderlei Aparecido de Lima

Doutor em Engenharia Química
Departamento de Química, Universidade Tecnológica Federal do Paraná
E-mail: valima@utfpr.edu.br
RESUMO
A detecção e classificação de telhados é um problema que tem recebido bastante atenção
na última década. Conhecer a distribuição espacial dos telhados em uma cidade é
importante para o planejamento e cadastro urbano. Este estudo teve como objetivo utilizar
a análise de imagens de satélite por geoprocessamento associado a dois algoritmos de
aprendizado de máquina para detecção e classificação de telhados em bairros da cidade
de Pato Branco–PR. Objetivou-se também a comparação entre dois algoritmos para
Brazilian Journal of Development, Curitiba, v.7, n.7, p.72558-72576 jul. 2021

ISSN: 2525-8761
classificar telhados na região amostrada, floresta randômica (FR) e redes neurais

convolucionais (RNC). Três classes de telhados foram utilizadas nesse estudo: telhados
de barro, telhados de fibrocimento e telhados de zinco. Os resultados seguiram a tendência
do estado-da-arte. Floresta randômica apresentou bons resultados de classificação nos
conjuntos de treino e validação, mas o modelo falhou ao ser aplicado em uma situação do
mundo real. Rede neural convolucional apresentou os melhores resultados quando
comparados à FR, apresentando kappa global de 0,94 na classificação do raster utilizado.
No total, foram detectados 18.880 telhados pelo algoritmo RNC. Os resultados por RNC
foram promissores. Assim, recomendamos as RNC para classificação de telhados em
bairros de municípios brasileiros. Esse tipo de abordagem pode ser utilizado por
prefeituras para mapeamento e identificação de tipos de telhados em áreas de interesse
nos municípios, apenas com uso de imagens georreferenciadas e software livres
disponíveis na rede.
Palavras-Chave: Processamento Digital de Imagens, Geoprocessamento, Imageamento,

Sensoriamento Remoto, Distribuição Espacial.
ABSTRACT
The detection and classification of rooftops is a problem that has been receiving
increasing attention in the past decade. Knowing the spatial distribution of the rooftops
in a city is essential for urban planning and cadastral surveying. This study aimed to use
geoprocessing-based image analysis and two machine learning algorithms to detect and
classify rooftops in neighborhoods of Pato Branco – PR. We compared two classifiers in
the study area: random forests (RF) and convolutional neural networks (CNN). We used
three rooftop classes in this study: clay tile roofs, fiber cement tile roofs, and zinc tile
roofs. The results follow the state-of-the-art trend. Random forests showed promising
results during training and validation steps, but the model failed when applied to a real-
world situation. Convolutional neural networks presented better results when compared
to the RF model, with a kappa index of 0.94 in the study raster classification. The
convolutional networks detected 18,880 rooftops in the study area. The results using CNN
were promising. Therefore, we recommend the use of CNN to classify rooftops in
Brazilian municipalities. City Halls can use this approach to map and identify the rooftops
in regions of interest, using georeferenced imagery and software available on the net.
Keywords: Digital Image Processing, Geoprocessing, Imaging, Remote Sensing, Spatial

Distribution.
1 INTRODUÇÃO
Um dos grandes desafios das Geociências é a extração automática de elementos
que compõem a paisagem urbana através do processamento digital de imagens
(POLIDORIO, 2007). Os edifícios são uma parte essencial da paisagem e são um
elemento básico da infraestrutura humana, e a detecção de telhados é um problema em
aberto. Mapear edifícios de forma adequada possibilita análises espaciais
socioeconômicas, auxilia no planejamento urbano e no desenvolvimento sustentável

ISSN: 2525-8761
(QIN et al., 2019), permite a atualização periódica de dados cadastrais, a criação de

modelos digitais, entre outras aplicações.
Para que seja possível realizar os processamentos referentes à detecção e
classificação de telhados em ambientes urbanos, primeiro deve-se tratar a imagem de
sensoriamento remoto (SR) utilizando procedimentos de processamento digital de
imagens (PDI). Os principais procedimentos são: correção, realce, transformação e
classificação. As correções podem ser direcionadas a degradações atmosféricas ou a
distorções planimétricas. O realce busca melhorar a qualidade visual das imagens,
facilitando a discriminação entre objetos, enquanto a transformação procura derivar novas
imagens através do tratamento matemático de uma imagem bruta e.g. índices de
vegetação (ROSA, 2013).
A classificação associa um rótulo (ou seja, uma classe ou grupo) a cada pixel ou
conjuntos de pixels da imagem. Assim, a classificação busca interpretar uma imagem,
detectando os padrões contidos nela. A classificação divide-se em dois tipos principais:
supervisionada e não-supervisionada. Na classificação supervisionada, o algoritmo utiliza
exemplos de treinamento previamente rotulados para aprender a distinguir as classes.
Depois, o classificador associa cada pixel a uma das classes designadas na fase de
treinamento (BORRA; THANKI; DEY, 2019; RODRIGUES et al., 2020). Recentemente,
as áreas de Inteligência Artificial e Aprendizado de Máquina (AM) têm revolucionado a
classificação de imagens. O crescimento explosivo dessa área do conhecimento nas
últimas décadas levou ao desenvolvimento de vários algoritmos classificadores, como as
florestas randômicas e as redes neurais convolucionais.
Floresta randômica (no inglês random forest - RF) é formada por várias árvores
de decisão. Cada árvore é um classificador individual que emite um voto para o rótulo
correspondente para uma entrada. Os votos das n árvores individuais são computados e a
classe que tem a maioria dos votos é eleita como rótulo definitivo do valor de entrada
(Figura 1). As árvores de decisão são construídas de forma randômica, utilizando
exemplos de treinamento e características aleatórias do conjunto de dados de treinamento.
Isso faz com que cada classificador individual seja relativamente robusto, mas tenha
pouca correlação com qualquer outra árvore de decisão da floresta randômica
(BREIMAN, 2001).
A comunidade de sensoriamento remoto têm dado bastante atenção a esse
classificador, já que as florestas randômicas são intuituvas, não sofrem sobreajuste
(overfitting), têm estimativas de erro não-enviesados (erro out-of-bag) (BREIMAN,

ISSN: 2525-8761
2001), são rápidas no processamento (BELGIU; DRĂGUŢ, 2016), e são capazes de fazer
diferentes análises em grandes conjuntos de dados, de forma eficaz (RODRIGUEZ-
GALIANO et al., 2012).
Figura 1 - Representação esquemática de uma floresta randômica
Fonte: Adaptado de Sharma (2020).
Nesse trabalho também foram utilizadas redes neurais convolucionais (no inglês
Convolutional Neural Network - CNN) para a classificação de telhados. A base das redes
neurais envolve neurônios artificiais organizados em camadas. Cada neurônio recebe um
dado de entrada e executa operações (aplicando pesos, vieses, funções de ativação, etc.),
gerando uma saída. Os pesos dos neurônios podem ser ajustados recursivamente, o que
significa que eles podem se auto-aprimorar durante a etapa de treinamento (O’SHEA;
NASH, 2015).
Redes neurais que têm muitas camadas de neurônios realizam o chamado
aprendizado profundo — deep learning. Rede Neural Convolucional (RNC) é um tipo
específico de rede profunda que tem sido muito eficaz na detecção de objetos,
reconhecimento visual e classificação de imagens (MARETTO, 2020).
As RNCs aprendem conceitos complexos dividindo-os hierarquicamente em
componentes simples. Dessa forma, uma RNC pode aprender características altamente
abstratas (MARETTO, 2020; ZHANG; ZHANG; DU, 2016) através de suas camadas. A
extração de características é feita a partir de camadas convolucionais, camadas de

ISSN: 2525-8761
ativação e de amostragem máxima de recursos (max-pooling), campos receptivos locais

e compartilhamento de pesos entre neurônios (Figura 2).
Figura 2 - Exemplo da estrutura de uma RNC
Fonte: Adaptado de Saha (2018).
Dessa forma, a rede aproveita-se das características intrínsecas de uma imagem

ao mesmo tempo em que reduz a complexidade dos dados. O corolário é que o custo
computacional diminui, o que torna as RNCs aplicáveis na prática.
Este trabalho apresenta como objetivo analisar dois tipos de abordagens
implementadas para detecção e classificação automática de três tipos de telhados: de barro
(TB), de zinco (TZn) e telhados de fibrocimento (TFC), por meio do processamento
digital de imagens de satélites e aprendizado de máquina (algoritmos de floresta
randômica e redes neurais convolucionais). Buscou-se ainda compreender a distribuição
espacial dos diferentes tipos de telhados no município de Pato Branco – PR.
2 MATERIAL E MÉTODOS
2.1 ÁREA DE ESTUDO
A área de estudo tem cerca de 123 km2, compreendendo a cidade e áreas próximas
da zona urbana do município de Pato Branco – PR (Figura 3). O município está localizado
ao sudoeste do estado do Paraná, na microrregião de Pato Branco. Encontra-se na latitude
26°13'43.04"S e longitude 52°40'24.40"O, a uma altitude de 760m (FEPESE, 2020). A
imagem adquirida do satélite Pleiades HR-1B tem 12 bits de resolução radiométrica e as
bandas PAN, B, G, R e NIR (Quadro 1). Para o tratamento dessa imagem, foram
utilizados os seguintes software: QGIS 3.12.2, ENVI 5.3, Orfeo Toolbox 7.1.0, R Studio
1.4 e Picterra.

ISSN: 2525-8761
Figura 3 - Imagem Pleiades de Pato Branco - PR
Fonte: Imagem cedida pelo Departamento de Agrimensura da UTFPR-PB (DAAGR). Mapa de autoria
própria.
Quadro 1 - Metadados da imagem Pleiades da região amostrada de Pato Branco-PR

Data de Resolução Resolução Intervalo
Satélite
aquisição radiométrica espacial Bandas espectral
0.5m PAN 0.47 - 0.83 μm
B 0.43 - 0.55 μm
Pleiades 27/09/2016;
12 bits G 0.50 - 0.62 μm
HR-1B 14:34:04 2m
R 0.59 - 0.71 μm
NIR 0.74 - 0.94 μm
Fonte: autoria própria, com dados do Pléiades Imagery User Guide (2012)
É importante ressaltar que a após o pré-processamento, a imagem ficou com 4

bandas (R, G, B, NIR) e com resolução espacial de aproximadamente 0,63m.
2.2 METODOLOGIA
A metodologia utilizada consiste, resumidamente, em quatro etapas (Figura 4). A
partir da imagem georreferenciada, foi feito o pré-processamento e a seleção de amostras,
ou seja, a delimitação de feições de interesse. Em seguida, após testes de diferentes
parâmetros, foi feita a classificação da imagem utilizando os algoritmos floresta
randômica e redes neurais convolucionais. Por fim, analisou-se a performance das
classificações realizadas pelos algoritmos de aprendizado de máquina FR e RNC.

ISSN: 2525-8761
Figura 4 - Diagrama das etapas do trabalho
Fonte: autoria própria.
Utilizou-se o índice kappa para quantificar a acurácia dos classificadores. Os

valores de kappa encontram-se entre 0 e 1. Um valor próximo ou igual a 0 indica acurácia
péssima, enquanto um valor próximo de 1 indica que o classificador apresentou
excelentes resultados. Valores entre 0,4 e 0,8 indicam acurácia mediana (BORRA;
THANKI; DEY, 2019).
2.2.1 Caracterização do objeto-alvo

Os telhados analisados nesse estudo apresentam distintos padrões de texturas e
cores. Os telhados de barro (Figura 5a) são caracterizados pela coloração alaranjada. Os
telhados de fibrocimento (Figura 5b) são reconhecidos pela sua opacidade e pelas cores
acizentadas. Já os telhados de zinco (Figura 5c) são identficados pelo seu brilho e alta
reflectância, o que confere ao objeto uma cor prateada. Os telhados apresentam bastante
variação na extensão da área de estudo, mas em geral mantém um formato retangular.
Figura 5 - Caracterização dos diferentes tipos de telhados amostrados na região de Pato Branco-PR. a)
Telhado de barro, b) telhado de fibrocimento e c) telhado de zinco
É extensamente relatado na literatura que a detecção de telhados em imagens de

sensoriamento remoto não é uma tarefa trivial (GAVANKAR; GHOSH, 2018; JOSHI et
al., 2014; NIEMEYER; ROTTENSTEINER; SOERGEL, 2014). A detecção manual é
um trabalho repetitivo, demorado e sujeito a erros, já que até mesmo um intérprete
humano pode ter dificuldades em delinear adequadamente todos os telhados individuais
presentes em uma imagem. Assim, o desenvolvimento de algoritmos que consigam

ISSN: 2525-8761
extrair as caracterísitcas de objetos-alvo em imagens de SR de maneira automática é um

problema em aberto que requer atenção multidisciplinar.
2.2.2 Pré-processamento e seleção de amostras

A partir da imagem Pleiades, foi feita a fusão das bandas RGB e PAN através do
pansharpening, para melhorar a resolução espacial da imagem. Em seguida, o raster foi
ortorretificado e os valores de radiância foram convertidos para valores de reflectância
utilizando o software ENVI 5.3. Na sequência, foi realizada a delineação das amostras de
treinamento no ambiente QGIS 3.12.2.
2.2.3 Classificação com algoritmo FR

Para criar o conjunto de treinamento, utilizou-se 50 recortes de cada tipo de
telhado e 50 recortes adicionais representando a classe “não-telhados”, englobando tudo
que o algoritmo deve detectar como não sendo um telhado (ruas, vegetação, corpos
d’água, solo cultivado e exposto, dentre outros). Nos polígonos desenhados, foram
gerados 100 pontos aleatórios, que serviram como amostras para treino ou para validação
dos modelos classificatórios. Assim, foram utilizados 5.000 pontos amostrais para cada
classe, ou seja, 20.000 pontos no total. Setenta por cento desses pontos foram utilizados
para o treinamento, enquanto os 30% restantes foram utilizados como conjunto de
validação. Para o conjunto de teste, utilizado para avaliar a classificação no raster após o
modelo ser aplicado a toda a área de estudo, foram desenhados 15 polígonos para cada
classe. Seguindo o mesmo procedimento dos pontos aleatórios, o conjunto de teste contou
com 6.000 amostras no total, ou seja, 1.500 amostras de cada classe.
Por fim, foi feita a separação das bandas e a reprojeção do raster para WGS-84
usando o QGIS. Implementou-se o algoritmo utilizando a linguagem de programação R
(R CORE TEAM, 2021) pela interface do RStudio. Foi utilizado o modelo FR padrão da
biblioteca randomForest (LIAW; WIENER, 2002).
2.2.4 Classificação com rede neural convolucional (RNC)

O aplicativo Picterra foi utilizado para implementar o modelo RNC na tarefa de
detecção de telhados. A RNC utilizada pelo Picterra é baseada na U-Net (GARCIA‐
MOLSOSA et al., 2021), uma arquitetura de rede convolucional que têm tido muito
sucesso na segmentação semântica de objetos. A plataforma automaticamente realiza
algumas etapas de pré-processamento, incluindo conversão do raster de entrada para o

ISSN: 2525-8761
espaço de cores 8-bit RGBA, a normalização do raster e a conversão deste para o sistema
de coordenadas WGS-84 (EPSG: 4326). Outra etapa que o algoritmo realiza é o aumento
artificial dos dados (data augmentation), processo que busca incrementar e balancear os
dados de treinamento, aumentando a capacidade efetiva do modelo. Além disso, os
detectores-base são pré-treinados com milhares de amostras genéricas, o que faz com que
o usuário não precise delinear manuelmente grandes volumes de amostras. Outra
vantagem é a possibilidade de treinar detectores sem conhecimento de programação e
sem hardware específico. O processamento é feito em nuvem, então não é necessário que
o usuário tenha uma GPU potente em mãos. O pós processamento também é integrado,
de forma que a saída do classificador é um conjunto de objetos vetoriais compatíveis com
sistemas de informação geográfica (SIG).
As maiores desvantagens são i) a limitação de utilizar apenas 3 bandas em um
raster; ii) a baixa possibilidade customização dos detectores; e iii) a limitação de distinguir
apenas entre objetos-alvo e outros objetos que não se deseja detectar. Por esse motivo,
um detector para cada tipo de telhado foi criado: um para TB, um para TFC e outro para
TZn.
3 RESULTADOS E DISCUSSÃO
3.1 CLASSIFICAÇÃO POR FLORESTA RANDÔMICA (FR)
A matriz de confusão da fase de treinamento e as métricas de performance
calculadas a partir dessa matriz (Quadro 2) mostram o desempenho do modelo.
Quadro 2 - Matriz de confusão para o treinamento FR

Acurácia do produtor % Acurácia do usuário %
TB TFC TZn Não-telhado F1-score
(Precisão) (Recall)
TB 3248 12 15 178 92,8 94,06 0,93
TFC 35 3276 160 200 93,6 89,24 0,91
TZn 21 44 3249 76 92,83 95,84 0,94
Não-telhado 196 168 76 3046 87,03 87,38 0,87
A partir da análise dos dados, percebe-se que o modelo apresentou resultados

satisfatórios na etapa de treinamento. Calculou-se o kappa do conjunto de dados de
validação utilizando a função kappa2 da biblioteca irr (GAMER; LEMON; SINGH,
2019), obtendo-se o valor 0,884. No entanto, ao aplicar o modelo no raster da área de
estudo, os resultados ficaram aquém do esperado. Utilizando a ferramenta
ComputeConfusionMatrix do OTB, foi feita a comparação entre os recortes do conjunto

ISSN: 2525-8761
de teste, feitos manualmente, e as detecções do modelo FR dentro do QGIS. O resultado

dessa comparação apresentou um baixo valor para o índice kappa (0,155), além de F-
score e precisão baixos para as classes de TB, TFC e TZn. Na comparação visual também
foi possível observar os problemas de classificação dos telhados pelo algoritmo. Portanto,
o algoritmo de FR dentro do RStudio apresentou resultados insatisfatórios quando
aplicado ao raster das áreas amostradas.
Também foi feita a plotagem da importância das bandas, dada pela métrica do
índice de Gini (Figura 6).
Figura 6 - Importância das bandas determinadas pelo modelo FR
É importante ressaltar que todas as classificações foram realizadas utilizando os

canais RGB e a banda NIR das imagens (Figura 6). Porém, observa-se que existem bandas
com maior importância que outras para classificação de imagens. Nesse caso, observou-
se que a banda de menor importância na classificação utilizando FR corresponde à região
do verde visível (banda G), enquanto as outra bandas tem níveis de importância similares
entre si de acordo com o índice Gini e são melhores para classificar nossos objetos-alvo
de estudo, os telhados. As razões pelas quais isso pode ter ocorrido nesse estudo podem
ser elencadas a seguir: (1) o tom alaranjado dos telhados de barro encontra-se no espectro
do vermelho; (2) materiais acinzentados, como os telhados de fibrocimento, geralmente
têm seu pico de reflectância na faixa de 0,6-0,8μm, faixa compreendida pelas bandas R e
NIR; (3) materiais que apresentam brilho intenso (como nuvens e telhados de zinco),
geralmente apresentam alta reflectância nas faixas da banda azul (B) e (4) a banda verde
(G) tem aplicações voltadas ao mapeamento de áreas de vegetação e análise de qualidade

ISSN: 2525-8761
de água, o que explica a baixa importância dessa faixa do espectro visível em um

ambiente predominantemente urbano.
3.2 CLASSIFICAÇÃO POR REDE NEURAL CONVOLUCIONAL (RNC)

O software Picterra recomenda a utilização de áreas de treinamento (para ensinar
ao algoritmo o que é um objeto de interesse e o que não é um objeto de interesse), áreas
de teste, e áreas de avaliação, onde o intérprete humano deve demarcar amostras para que
o algoritmo possa calcular as métricas de performance do detector (Quadro 3).
Quadro 3 - Treinamento do detector Picterra: número de amostras, áreas amostradas, e métricas de

performance
Amostras de Áreas de Acurácia na Épocas de
Classe área/formato Precisão Recall
treinamento Treinamento Teste Avaliação treinamento
TB 101 114 18 10 80,76% 100,00% 100,00% 500
TFC 246 68 9 9 59,66% 77,27% 94,44% 700
TZn 211 77 10 10 73,20% 94,12% 100,00% 500
As métricas de performance utilizadas pelo software foram:

• Acurácia na área/formato: quão bem os objetos detectados correspondem às amostras
delineadas manualmente.
• Precisão: porcentagem de detecções que interseccionam com uma amostra manual.
• Recall: porcentagem de amostras que interseccionam com uma detecção (PICTERRA,
2020).
Aplicando os detectores treinados ao raster completo, os resultados foram
adequados. Os polígonos resultantes foram rasterizados utilizando a ferramenta
Rasterization do plugin Orfeo Toolbox (OTB), para que fosse possível comparar amostras
que não foram utilizadas na fase de treinamento/validação do modelo com as detecções
provenientes do algoritmo. Novamente, foi utilizado o ComputeConfusionMatrix do
OTB para calcular as métricas de acurácia. Destaca-se o alto valor do índice kappa geral
de 0,94, além de F-score e precisão acima de 0,9 para as três classes de telhados
amostrados.
A análise visual confirmou os bons resultados apresentados pelo algoritmo RNC.
As maiores dificuldades do algoritmo ocorreram em áreas de difícil interpretação,
principalmente entre telhados de fibrocimento e telhados de zinco. É possível que isso
tenha ocorrido devido à normalização do raster, que reduz o forte brilho característico dos
pixels associados aos telhados de zinco. Também houveram casos em que o algoritmo

ISSN: 2525-8761
não detectou adequadamente o telhado-alvo. Esse problema pode estar relacionado pela
variedade de telhados existentes em uma cidade extensa como Pato Branco. Porém, uma
quantidade maior de amostras de treinamento poderia ser utilizada para contornar esse
tipo de problema.
Análises pós-classificação foram também realizadas quando utilizou-se esse
algoritimo. Foi realizada a contagem de telhados por bairro a partir da extração dos
centroides dos polígonos e da associação de atributos por local. Usou-se o vetor do limite
dos bairros, disponibilizado pelo Departamento de Agrimensura da UTFPR-PB
(DAAGR). Dessa forma, o polígono cujo centroide encontra-se dentro de um bairro foi
considerado pertencente a tal bairro. No total, o algoritmo detectou 18.880 telhados em
Pato Branco. Calculou-se o percentual total dos telhados de cada classe por bairros
(Figura 7) e o percentual do total de telhados detectados por bairro (Figura 8). Por fim,
produziu-se um mapa de calor (Figura 9).
Figura 7 - Gráfico da porcentagem total de telhados de cada classe por bairro.

ISSN: 2525-8761
De acordo com as classificações (Figura 7A), observa-se que mais de 12% dos
telhados de barro (TB) encontram-se fora do limite da cidade (FLC). Isso pode ser
explicado pela expansão da cidade de Pato Branco. Conjuntos habitacionais, como o que
pode ser visto a oeste da cidade (Figura 9, na parte central esquerda do mapa TB), foram
instalados fora do que era considerado a zona urbana na data de aquisição da imagem.
Também observa-se que os bairros Centro, La Salle e Santa Terezinha têm grandes
concentrações de TB. Isto pode ocorrer devido à alta população desses bairros. Outro
fator que pode ter influenciado a alta densidade TB nesses bairros é a renda média alta
nestes bairros. Segundo dados do Censo Demográfico de 2010 (IBGE, 2010), os três
bairros apresentaram renda média domiciliar maior que cinco salários mínimos. Os
bairros Dall Ross e Bela Vista apresentaram as menores porcentagens de telhados de
barro.
Os bairros Planalto e Alvorada foram os que mais concentraram telhados de
fribrocimento (Figura 7B). Isso poderia ser explicado pela grande densidade populacional
e pela característica residencial desses bairros. Os bairros Alto da Glória, Pinheiros e Dall
Ross apresentaram as menores concentrações desse tipo de telhado.
Aponta-se que 14,24% dos telhados de zinco encontram-se fora da zona urbana
(Figura 7C). Um motivo possível para essa distribuição espacial é que telhados de zinco
são utilizados principalmente em barracões que encontram-se na zona industrial. Outros
pontos de destaque foram os bairros Alvorada, Planalto e o Centro da cidade, que
poderiam ser explicados pela grande população desses bairros.
Figura 8 - Porcentagem total de telhados detectados por bairro na área amostrada de Pato Branco – PR.

ISSN: 2525-8761
Figura 9 - Mapa de calor dos diferentes tipos de telhados detectados nas áreas amostradas
As figuras 8 e 9 podem ser interpretadas como síntese dos gráficos apresentados

na figura 7. Como o gráfico da figura 8 mostra, em geral, os locais com maiores
concentrações de telhados no geral são onde ocorreram as maiores porcentagens de
telhados de fibrocimento, já que essa classe representa cerca de 66% de todos os telhados
detectados na área amostrada. Tomando a figura 9, temos a utilização da linguagem
cartográfica para a vizualização espacial dos dados apresentados. Diante disso, vale
destacar que a zona sul-sodoeste do município concentra algumas áreas industriais e os
bairros Alvorada e Planalto, com presença densa de TFC e TZn.
Os resultados desse trabalho seguem a tendência do estado-da-arte para detecção
de objetos: modelos tradicionais (como ANN, SVM, FR) têm sido deixados de lado,
dando preferência a modelos baseados em aprendizado profundo, como as redes neurais
convolucionais (ZHAO; KAMRAN; SOHN, 2020; LIU et al., 2019a, 2019b; ZHU et al.,
2020; FENG; YANG; SESTER, 2020; QIN et al., 2019; LI; WEGNER; LUCCHI, 2019;
WAGNER et al., 2020; WU; GUO, 2018; LIN et al., 2019). Notavelmente, o estado-da-
arte evoluiu muito nessa última década, com a popularização do deep learning e melhores
recursos computacionais. Basta comparar os trabalhos citados anteriormente com artigos
mais antigos (AYTEKIN et al., 2009; IZADI; SAEEDI, 2010).

ISSN: 2525-8761
A disponibilidade de dados públicos e abertos promoveu o uso de redes

convolucionais para detecção de objetos (LIU et al., 2019a), já que uma grande
quantidade de dados é necessária para que os modelos possam ser treinados. No entanto,
esses dados ainda são escassos no Brasil. Em escala global, temos conjuntos de dados tais
como o ImageNet1, ADE20K2, CityScapes3, OpenStreetMap4, o WHU Building Dataset5
e o Inria Aerial Image Dataset6; além desses, há datasets de desafios promovidos ao
público, como o CrowdAI Mapping Challenge7 e o SpaceNet8. Também vale mencionar
o projeto da Microsoft que foi treinado em um conjunto de dados massivo e manualmente
delineado e se propôs a detectar todos os edifícios dos EUA. O modelo encontrou
125.192.184 objetos9. Outro ponto que dificulta o avanço generalizado desses estudos no
mundo todo é a dificuldade de obter GPUs de alta capacidade por um custo acessível. As
técnicas de deep learning são muito eficazes, mas ainda são computacionalmente caras.
Um ponto que merece destaque é a baixa integração de práticas de SIG no estado-
da-arte da detecção de telhados. Dentre os artigos citados, apenas dois (FENG; YANG;
SESTER, 2020; LI; WEGNER; LUCCHI, 2019) apresentavam o produto final em
formato vetorial, ideal para a delineação de polígonos no âmbito da ciência geoespacial.
Assim, sugere-se que os avanços na área de Inteligência Artificial também
reflitam em benefícios para profissionais nas áreas da geoinformação. Faz-se necessário
a maior disponibilidade de dados open-source, além da criação de algoritmos de AM que
possam lidar com dados espaciais georreferenciados, bem como o desenvolvimento de
ferramentas acessíveis a usuários sem grande experiência em programação. Também
sugere-se o uso de computação em nuvem, caso o usuário não possua hardware de alto
custo em mãos.
4 CONCLUSÃO
Em resumo, os pontos-chave desse trabalho são:
1) A banda R teve maior importância no algoritmo FR na tarefa de classificação de
telhados, enquanto a banda G teve a menor importância, segundo o índice de Gini;
1
http://image-net.org/
2
https://groups.csail.mit.edu/vision/datasets/ADE20K/
3
https://www.cityscapes-dataset.com/
4
https://www.openstreetmap.org/
5
http://gpcv.whu.edu.cn/data/
6
https://project.inria.fr/aerialimagelabeling/
7
https://www.crowdai.org/challenges/mapping-challenge
8
https://spacenet.ai/
9
Microsoft - US Building Footprints; NY Times - A Map of Every Building in America

ISSN: 2525-8761
2) O algoritmo FR apresentou bons resultados nos conjuntos de treino e validação, mas

falhou ao ser aplicado a uma situação do mundo real;
3) O algoritmo RCN apresentou melhores resultados quando comparado a FR na tarefa
de detecção e classificação de telhados.
Na última década, classificadores tradicionais tem sido deixados de lado, dando
lugar a algoritmos baseados em redes neurais. Assim, os resultados desse trabalho de
detecção de objetos em ambientes urbanos encontram-se em consonância com outros
estudos da literatura recente, que são numerosos ao redor do mundo, mas escassos nas
municipalidades brasileiras.
A detecção e classificação de telhados pôde ser realizada de forma rápida e eficaz
utilizando o algoritmo RNC. Desse modo, recomenda-se que municípios brasileiros
adotem algoritmos baseados em RNC para o mapeamento de seus telhados a partir de
imagens de satélite georreferenciadas. A abordagem utilizada nesse trabalho permite
combinar a capacidade de algoritmos classificadores do estado-da-arte com o ambiente
SIG para conhecer a distribuição espacial dos telhados e auxiliar no planejamento e
cadastro urbano sem a necessidade de grandes volumes de detecções manuais da área de
interesse, o que poupa tempo e recursos.
Trabalhos subsequentes podem propiciar o desenvolvimento de algoritmos
abertos compatíveis diretamente com SIG e expandir a base de dados abertos no Brasil.
Com isso, a criação de redes roubustas através do compartilhamento de pesos pré-
treinados é estimulada e, consequentemente, aumenta-se o leque de possibilidades de
análise urbana através do aprendizado de máquina no país. Além disso, elimina-se a
dependência de software privado.

ISSN: 2525-8761
REFERÊNCIAS
AIRBUS DEFENSE AND SPACE. Pléiades Imagery – User Guide. Airbus Defence and
Space Intelligence, France: CNES, Airbus Defence and Space Intelligence, 18 out. 2012.
Disponível em: <http://www.engesat.com.br/wp-content/uploads/PleiadesUserGuide-
17062019.pdf>. Acesso em: 8 mar. 2021.
AYTEKIN, O. et al. Automatic and unsupervised building extraction in complex urban

environments from multi spectral satellite imagery. 2009 4th International Conference on
Recent Advances in Space Technologies. Anais... In: 2009 4TH INTERNATIONAL
CONFERENCE ON RECENT ADVANCES IN SPACE TECHNOLOGIES (RAST).
Istanbul, Turkey: IEEE, jun. 2009. Disponível em:
<http://ieeexplore.ieee.org/document/5158214/>. Acesso em: 19 nov. 2020
BELGIU, M.; DRĂGUŢ, L. Random forest in remote sensing: A review of applications

and future directions. ISPRS Journal of Photogrammetry and Remote Sensing, v. 114, p.
24–31, abr. 2016.
BORRA, S.; THANKI, R.; DEY, N. Satellite Image Classification. In: BORRA, S.;
THANKI, R.; DEY, N. (Eds.). Satellite Image Analysis: Clustering and Classification.
SpringerBriefs in Applied Sciences and Technology. Singapore: Springer, 2019. p. 53–
81.
BREIMAN, L. Random Forests. Machine Learning, v. 45, n. 1, p. 5–32, 1 out. 2001.
FENG, Y.; YANG, C.; SESTER, M. MULTI-SCALE BUILDING MAPS FROM

AERIAL IMAGERY. The International Archives of the Photogrammetry, Remote
Sensing and Spatial Information Sciences, XXIV ISPRS Congress. v. XLIII-B3-2020, n.
2020, p. 8, 2020.
FEPESE. ESTUDO DE IMPACTO DE VIZINHANÇA (EIV) DO TERMINAL

URBANO DE PATO BRANCO/PR. Pato Branco - PR: FUNDAÇÃO DE ESTUDOS E
PESQUISAS SOCIOECONÔMICOS - FEPESE, fev. 2020. Disponível em:
<http://patobranco.pr.gov.br/wp-content/uploads/2020/02/00.-EIV_TU_Pato
Branco_Levantamento-e-diagn%C3%B3stico_Volume-I_vers%C3%A3o-digital.pdf>.
Acesso em: 13 mar. 2021.
GAMER, M.; LEMON, J.; SINGH, I. F. P. irr: Various Coefficients of Interrater

Reliability and Agreement. R package version 0.84.1 ed. [s.l: s.n.].
GARCIA‐MOLSOSA, A. et al. Potential of deep learning segmentation for the extraction

of archaeological features from historical map series. Archaeological Prospection, 7 jan.
2021.
GAVANKAR, N. L.; GHOSH, S. K. Automatic building footprint extraction from high-

resolution satellite image using mathematical morphology. European Journal of Remote
Sensing, v. 51, n. 1, p. 182–193, 1 jan. 2018.
IBGE. Censo Demográfico 2010. Rio de Janeiro: Instituto Brasileiro de Geografia e

Estatística, 2010. Disponível em: <https://sidra.ibge.gov.br/Tabela/3345#notas-tabela>.

ISSN: 2525-8761
IZADI, M.; SAEEDI, P. Automatic Building Detection in Aerial Images Using a

Hierarchical Feature Based Image Segmentation. 2010 20th International Conference on
Pattern Recognition. Anais... In: 2010 20TH INTERNATIONAL CONFERENCE ON
PATTERN RECOGNITION (ICPR). Istanbul, Turkey: IEEE, ago. 2010. Disponível em:
<http://ieeexplore.ieee.org/document/5597414/>. Acesso em: 23 set. 2020
JOSHI, B. et al. Automatic Rooftop Detection Using a Two-Stage Classification. . In:

2014 UKSIM-AMSS 16TH INTERNATIONAL CONFERENCE ON MODELLING
AND SIMULATION (UKSIM). Cambridge, United Kingdom: IEEE, mar. 2014.
Disponível em: <http://ieeexplore.ieee.org/document/7046079/>. Acesso em: 23 set.
2020
LI, Z.; WEGNER, J. D.; LUCCHI, A. Topological Map Extraction from Overhead
Images. arXiv:1812.01497 [cs], 29 nov. 2019.
LIAW, A.; WIENER, M. Classification and Regression by randomForest. R News, v. 2,

n. 3, p. 18–22, 2002.
LIN, J. et al. ESFNet: Efficient Network for Building Extraction from High-Resolution
Aerial Images. arXiv:1903.12337 [cs], 19 abr. 2019.
LIU, H. et al. DE-Net: Deep Encoding Network for Building Extraction from High-
Resolution Remote Sensing Imagery. Remote Sensing, High Spatial Resolution Remote
Sensing: Data, Analysis, and Applications. v. 11, n. 2380, p. 20, 2019a.
LIU, P. et al. Building Footprint Extraction from High-Resolution Images via Spatial
Residual Inception Convolutional Neural Network. Remote Sensing, v. 11, n. 7, p. 830,
7 abr. 2019b.
MARETTO, R. V. Automating Land Cover Change Detection: A Deep Learning based

approach to map deforested areas. Tese de Doutorado—São José dos Campos, SP:
Instituto Nacional de Pesquisas Espaciais, 20 mar. 2020.
NIEMEYER, J.; ROTTENSTEINER, F.; SOERGEL, U. Contextual classification of

lidar data and building object detection in urban areas. ISPRS Journal of Photogrammetry
and Remote Sensing, v. 87, p. 152–165, jan. 2014.
O’SHEA, K.; NASH, R. An Introduction to Convolutional Neural Networks.

arXiv:1511.08458 [cs], 2 dez. 2015.
PICTERRA. Frequently asked questions - Picterra knowledge base. Picterra, 2020.

Disponível em: <https://picterra.ch/faq/>. Acesso em: 22 out. 2020
POLIDORIO, A. M. DETECÇÃO DE ELEMENTOS DA PAISAGEM URBANA EM

IMAGENS AÉREAS MULTIESPECTRAIS. Tese de Doutorado—Presidente Prudente:
Universidade Estadual Paulista - Faculdade de Ciências e Tecnologia, 2007.
QIN, Y. et al. Semantic Segmentation of Building Roof in Dense Urban Environment

with Deep Convolutional Neural Network: A Case Study Using GF2 VHR Imagery in
China. Sensors, v. 19, n. 5, p. 1164, 7 mar. 2019.

ISSN: 2525-8761
R CORE TEAM. R: A Language and Environment for Statistical Computing. Vienna,

Austria: R Foundation for Statistical Computing, 2021.
RODRIGUES, M. T. et al. COMPARAÇÃO DE DESEMPENHO DOS SISTEMAS DE

INFORMAÇÃO GEOGRÁFICA TERRSET E TERRAVIEW POR MEIO DE
PROCESSAMENTO DIGITAL DE IMAGEM / PERFORMANCE COMPARISON OF
GEOGRAPHIC INFORMATION SYSTEMS TERRSET AND TERRAVIEW
THROUGH DIGITAL IMAGE PROCESSING. Brazilian Journal of Development, v. 6,
n. 9, p. 70804–70816, 2020.
RODRIGUEZ-GALIANO, V. F. et al. An assessment of the effectiveness of a random

forest classifier for land-cover classification. ISPRS Journal of Photogrammetry and
Remote Sensing, v. 67, p. 93–104, jan. 2012.
ROSA, R. CAPÍTULO 5 – SENSORIAMENTO REMOTO. In: INTRODUÇÃO AO

GEOPROCESSAMENTO. Uberlândia, MG: UFU/Instituto de Geografia, Laboratório de
Geoprocessamento, 2013.
WAGNER, F. H. et al. U-Net-Id, an Instance Segmentation Model for Building

Extraction from Satellite Images—Case Study in the Joanópolis City, Brazil. Remote
Sensing, v. 12, n. 10, p. 1544, 12 maio 2020.
WU, G.; GUO, Z. Geoseg: A Computer Vision Package for Automatic Building
Segmentation and Outline Extraction. arXiv:1809.03175 [cs], 10 set. 2018.
ZHANG, L.; ZHANG, L.; DU, B. Deep Learning for Remote Sensing Data: A Technical
Tutorial on the State of the Art. IEEE Geoscience and Remote Sensing Magazine, v. 4, n.
2, p. 22–40, jun. 2016.
ZHAO, K.; KAMRAN, M.; SOHN, G. BOUNDARY REGULARIZED BUILDING

FOOTPRINT EXTRACTION FROM SATELLITE IMAGES USING DEEP NEURAL
NETWORKS. ISPRS Annals of Photogrammetry, Remote Sensing and Spatial
Information Sciences, v. V-2–2020, p. 617–624, 3 ago. 2020.
ZHU, Q. et al. MAP-Net: Multi Attending Path Neural Network for Building Footprint
Extraction from Remote Sensed Imagery. IEEE Transactions on Geoscience and Remote
Sensing, p. 1–13, 2020.
View publication stats

Chammaetal Crisigiovanni 2021

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Chammaetal Crisigiovanni 2021

Enviado por

Direitos autorais:

Formatos disponíveis

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

Aprendizado de máquina aplicado em imagens de satélite para classiﬁcação de

Article in Brazilian Journal of Development · July 2021

Willian Chamma Enzo Luigi Crisigiovanni

SEE PROFILE SEE PROFILE

Heloísa Victorino Vanderlei A Lima

SEE PROFILE SEE PROFILE

Synchronism and complexity of the Fiddler Crab's wave View project

The user has requested enhancement of the downloaded file.

Aprendizado de máquina aplicado em imagens de satélite para

Machine learning applied to satellite imagery for rooftop

Recebimento dos originais: 20/06/2021

Willian Douglas Sbitkowski Chamma

Enzo Luigi Crisigiovanni

Heloísa da Silva Victorino

Vanderlei Aparecido de Lima

Brazilian Journal of Development, Curitiba, v.7, n.7, p.72558-72576 jul. 2021

classificar telhados na região amostrada, floresta randômica (FR) e redes neurais

Palavras-Chave: Processamento Digital de Imagens, Geoprocessamento, Imageamento,

Keywords: Digital Image Processing, Geoprocessing, Imaging, Remote Sensing, Spatial

Brazilian Journal of Development, Curitiba, v.7, n.7, p.72558-72576 jul. 2021

(QIN et al., 2019), permite a atualização periódica de dados cadastrais, a criação de

Brazilian Journal of Development, Curitiba, v.7, n.7, p.72558-72576 jul. 2021

Figura 1 - Representação esquemática de uma floresta randômica

Fonte: Adaptado de Sharma (2020).

Brazilian Journal of Development, Curitiba, v.7, n.7, p.72558-72576 jul. 2021

ativação e de amostragem máxima de recursos (max-pooling), campos receptivos locais

Figura 2 - Exemplo da estrutura de uma RNC

Fonte: Adaptado de Saha (2018).

Dessa forma, a rede aproveita-se das características intrínsecas de uma imagem

Brazilian Journal of Development, Curitiba, v.7, n.7, p.72558-72576 jul. 2021

Figura 3 - Imagem Pleiades de Pato Branco - PR

Quadro 1 - Metadados da imagem Pleiades da região amostrada de Pato Branco-PR

É importante ressaltar que a após o pré-processamento, a imagem ficou com 4

Brazilian Journal of Development, Curitiba, v.7, n.7, p.72558-72576 jul. 2021

Figura 4 - Diagrama das etapas do trabalho

Fonte: autoria própria.

Utilizou-se o índice kappa para quantificar a acurácia dos classificadores. Os

2.2.1 Caracterização do objeto-alvo

Fonte: autoria própria.

É extensamente relatado na literatura que a detecção de telhados em imagens de

Brazilian Journal of Development, Curitiba, v.7, n.7, p.72558-72576 jul. 2021

extrair as caracterísitcas de objetos-alvo em imagens de SR de maneira automática é um

2.2.2 Pré-processamento e seleção de amostras

2.2.3 Classificação com algoritmo FR

2.2.4 Classificação com rede neural convolucional (RNC)

Brazilian Journal of Development, Curitiba, v.7, n.7, p.72558-72576 jul. 2021

Quadro 2 - Matriz de confusão para o treinamento FR

A partir da análise dos dados, percebe-se que o modelo apresentou resultados

Brazilian Journal of Development, Curitiba, v.7, n.7, p.72558-72576 jul. 2021

de teste, feitos manualmente, e as detecções do modelo FR dentro do QGIS. O resultado

Figura 6 - Importância das bandas determinadas pelo modelo FR

Fonte: autoria própria.

É importante ressaltar que todas as classificações foram realizadas utilizando os

Brazilian Journal of Development, Curitiba, v.7, n.7, p.72558-72576 jul. 2021

de água, o que explica a baixa importância dessa faixa do espectro visível em um

3.2 CLASSIFICAÇÃO POR REDE NEURAL CONVOLUCIONAL (RNC)

Quadro 3 - Treinamento do detector Picterra: número de amostras, áreas amostradas, e métricas de

As métricas de performance utilizadas pelo software foram:

Brazilian Journal of Development, Curitiba, v.7, n.7, p.72558-72576 jul. 2021

Figura 7 - Gráfico da porcentagem total de telhados de cada classe por bairro.

Fonte: autoria própria.

Brazilian Journal of Development, Curitiba, v.7, n.7, p.72558-72576 jul. 2021