Você está na página 1de 141

ESCOLA POLITÉCNICA DA UNIVERSIDADE DE SÃO PAULO

CAIO DA SILVA AZEVEDO

Uso de redes neurais artificiais na elaboração de mapas de suscetibilidade


para escorregamentos planares rasos

São Paulo
2022
CAIO DA SILVA AZEVEDO

Uso de redes neurais artificiais na elaboração de mapas de suscetibilidade


para escorregamentos planares rasos

Versão Corrigida

Dissertação apresentada à Escola Politécnica da


Universidade de São Paulo para obtenção do título
de Mestre em Ciências.

Área de Concentração Engenharia de Produção

Orientador: Prof. Dr. Mauro de Mesquita Spínola.

São Paulo
2022
Autorizo a reprodução e divulgação total ou parcial deste trabalho, por qualquer meio
convencional ou eletrônico, para fins de estudo e pesquisa, desde que citada a fonte.

Esse exemplar foi revisado e corrigido em relação à versão original,


sob responsabilidade única do autor e com a anuência de seu orientador.
São Paulo, 21 de abril de 2022

Assinatura do autor:

Assinatura do orientador:

Azevedo, Caio da Silva


Uso de redes neurais artificiais na elaboração de mapas de
suscetibilidade para escorregamentos planares rasos / C. S. Azevedo --
versão corr. -- São Paulo, 2022.
141 p.

Dissertação (Mestrado) - Escola Politécnica da Universidade de São


Paulo. Departamento de Engenharia de Produção.

1.Escorregamentos dos solos 2. Aprendizado de máquina 3. Cidades


inteligentes 4. Desastres naturais I. Universidade de São Paulo. Escola
Politécnica. Departamento de Engenharia de Produção II.t.

Assinatura do autor: ____________________________________


Assinatura do orientador: ________________________________
AZEVEDO, Caio da Silva. Uso de redes neurais artificiais na elaboração de
mapas de suscetibilidade para escorregamentos planares rasos. 2022.
Dissertação (Mestrado em Engenharia de Produção) – Departamento de Engenharia
de Produção, Escola Politécnica da Universidade de São Paulo, São Paulo, 2022.

Aprovado em: 24/03/2022

Banca Examinadora

Prof. Dr. Mauro de Mesquita Spinola


Instituição: Escola Politécnica - Universidade de São Paulo
Julgamento: Aprovado

Prof. Dr. Vagner Luiz Gava


Instituição: Instituto de Pesquisas Tecnológicas
Julgamento: Aprovado

Prof. Dra. Alessandra Cristina Corsi


Instituição: Instituto de Pesquisas Tecnológicas
Julgamento: Aprovado
Porque todas das minhas realizações acadêmicas devo à tia Ivonete!
AGRADECIMENTOS

Aos meus pais, Sr. Azevedo e Dona Ivoneide (in memoriam), assim como
aquele que me adotou, Sr. Álvaro Santana Lima (in memoriam), pela educação que
nenhum livro ensina.
À minha parceira na vida, Profa. Dra. Gisleise Nogueira, por tantos dias, noites,
feriados e finais de semana debruçados em livros, artigos, teses e dissertações.
Ao meu orientador Prof. Dr. Mauro de Mesquita Spínola, que me fez uma
pessoa melhor em apenas três anos de convivência. Aos membros da banca e
companheiros de publicações, Prof. Dr. Vagner Luiz Gava pela paciência e inquietude
com aspectos metodológicos que tanto me atormentam, e não menos importante, à
Profa. Dra. Alessandra Cristina Corsi, cujas simpatia, educação e paixão pelo saber
extraiu o máximo de mim. Ganhei três bons amigos.
Aos colegas do grupo de pesquisa do GTI em especial aos professores Marcelo
Pessoa e Rodrigo Franco que me acolheram, incentivaram e foram companheiros em
trabalhos e publicações.
Aos colegas Carlos Prado e Glauber Rocha, parceiros do grupo Big Data HAL,
onde passamos momentos agradáveis discutindo equações, algoritmos e as belezas
da matemática e suas aplicações, e que além de tudo, foram os primeiros
incentivadores dessa jornada.
A todos os colegas da Escola Politécnica da USP e do IPT que de alguma forma
me apoiaram durante todo esse processo. Assim como à colega Lucimara
Bragagnolo, da Universidade de Passo Fundo – RS, pelo suporte ao desbravar esse
mundo das ciências geológicas em sinergia com as redes neurais artificiais.
Ao Instituto de Pesquisas Tecnológicas do Estado de São Paulo – IPT, onde
essa pesquisa foi conduzida com todas as condições possíveis, em especial ao Prof.
Dr. Alessandro Santiago, à Maria Cristina Domingues e à Sra. Edna Gubitoso, pela
confiança e cordialidade.

À
FAPESP – Fundação de Amparo à Pesquisa do Estado de São Paulo (Processo nº
2019/14011-0) pelo apoio financeiro essencial para realização dessa pesquisa.
RESUMO

Os escorregamentos de terra podem provocar sérias consequências ambientais,


econômicas e sociais. Um dos primeiros passos na gestão de risco e prevenção
desses eventos é o mapeamento das suscetibilidades naturais e antrópicas do
território, que fornece subsídios para o planejamento territorial e indicações para
expansão urbana. Nesse sentido, o mapeamento de áreas suscetíveis atua como uma
importante ferramenta para os gestores locais, a fim de localizar as áreas mais
sensíveis a esses desastres naturais e pensar estratégias para o uso do solo. Entre
as técnicas atualmente utilizadas para esse mapeamento, destaca-se a de redes
neurais artificiais (RNA), considerada uma das mais precisas por conta da sua elevada
acurácia, capacidade de aprendizagem e generalização dos resultados. Assim, este
estudo teve como objetivo a proposição de uma metodologia para o mapeamento de
áreas suscetíveis a escorregamentos planares rasos, por meio de redes neurais
artificiais, contribuindo para o contexto das cidades inteligentes. Como dados de
entrada para treinamento das redes, foram utilizados sete atributos, a maioria
extraídos dos modelos digitais de terreno (MDT): declividade, aspecto, elevação, uso
do solo, litologia, topographic wetness index (twi) e curvatura, a partir de um inventário
de cicatrizes de escorregamentos do tipo planar raso, ocorridos no município litorâneo
do Guarujá-SP no ano de 2020, período atípico, com condições climáticas extremas,
caracterizado por índices pluviométricos acima de 200 mm. O número equivalente de
amostras foi criado para os pontos de não ocorrência em diferentes cenários. Em
seguida, foram avaliadas a importância dos atributos, concluindo-se que sua
relevância varia conforme o conjunto de dados utilizado para treinamento da RNA. Por
fim, dentre as melhores configurações das redes neurais, treinadas com algoritmo de
retropropagação, obteve-se a acurácia de 98,50% e 95,43%, métrica superior à média
de 86,74% identificado nos trabalhos da literatura e, para uma amostra não utilizada
no treinamento das redes, os mapas gerados com RNA também tiveram desempenho
superior ao mapa do IPT, instituto responsável pela mitigação de escorregamentos no
estado de São Paulo, cuja acurácia foi de 68,3%, demonstrando que o modelo
proposto atende ao objetivo de identificar áreas suscetíveis a movimentos de massa.

PALAVRAS-CHAVE: Escorregamentos dos solos, Aprendizado de Máquina, Cidades


Inteligentes e Desastres Naturais.
ABSTRACT

Landslides can cause serious environmental, economic and social consequences.


One of the first steps in risk management and prevention of these events is the
mapping of the territory's natural and anthropic susceptibilities, which provides
subsidies for territorial planning and indications for urban expansion. In this sense, the
mapping of susceptible areas acts as an important tool for local managers, in order to
locate the areas most sensitive to these natural disasters and to think of strategies for
land use. Among the techniques currently used for this mapping, artificial neural
networks (ANN) stands out, considered one of the most accurate because of its high
accuracy, ability to learn and generalization of results. Thus, this study aimed to
propose a methodology for mapping areas susceptible to shallow planar landslides,
through artificial neural networks, contributing to the context of smart cities. As input
data for training the networks, seven attributes were used, most extracted from digital
terrain models (DTM): slope, aspect, elevation, land use, lithology, topographic
wetness index (twi) and curvature, from an inventory of shallow planar landslide scars,
which occurred in the coastal municipality of Guarujá-SP in 2020, an atypical period,
with extreme weather conditions, characterized by rainfall above 200 mm. The
equivalent number of samples was created for the points of non-occurrence in different
scenarios. Then, the importance of the attributes was evaluated, concluding that their
relevance varies according to the data set used for ANN training. Finally, among the
best configurations of the neural networks, trained with the backpropagation algorithm,
the accuracy of 98.50% and 95.43% was obtained, a metric superior to the average of
86.74% identified in the works in the literature and, for a sample not used in the training
of networks, the maps generated with RNA also performed better than the map of the
IPT, the institute responsible for mitigating landslides in the state of São Paulo, whose
accuracy was 68.3%, demonstrating that the proposed model meets with the objective
of identifying areas susceptible to mass movements.

KEYWORDS: Landslide, Machine Learning, Smart City and Natural Disaster.


LISTA DE QUADROS

Quadro 1 - Tipos de escorregamento/processo ........................................................ 23


Quadro 2 - Critérios de inclusão e exclusão .............................................................. 45
Quadro 3 - Constructos ............................................................................................. 46
Quadro 4 - Artigos base para a revisão ..................................................................... 48
Quadro 5 - Strings para busca no Web of Science™ e Scopus™. ........................... 50
Quadro 6 - Critérios de inclusão e exclusão .............................................................. 51
Quadro 7 - Trabalhos selecionados na síntese da revisão sistemática ..................... 52
Quadro 8 - Etapas do processo de coleta e análise dos dados ................................ 69
Quadro 9 – Resumo das avaliações da base Web of Science ................................ 125
Quadro 10 – Resumo das avaliações da base Scopus of Science ......................... 138
LISTA DE TABELAS

Tabela 1 – Desempenho da RNA comparado com outras técnicas de AM............... 58


Tabela 2 – Condições iniciais dos hiperparametros para treinamento das RNAs ..... 74
Tabela 3 – Métricas das redes neurais de melhor desempenho ............................... 86
Tabela 4 – Desempenho dos mapas de suscetibilidade ........................................... 93
LISTA DE FIGURAS

Figura 1 – Contextualização da pesquisa ................................................................. 20


Figura 2 – Perfil esquemático de escorregamentos planares.................................... 25
Figura 3 – Escorregamentos planares induzidos pela ocupação .............................. 25
Figura 4 – Exemplo de cicatrizes mapeadas em uma das áreas piloto. .................... 28
Figura 5 – Relação entre área de cicatrizes e área total, na área piloto. ................. 30
Figura 6 – Classificação em aprendizado supervisionado. ....................................... 31
Figura 7 – Regressão em aprendizado supervisionado. ........................................... 32
Figura 8 – Agrupamento em aprendizado não supervisionado. ............................... 33
Figura 9 – Iteração para agrupamento em aprendizado não supervisionado. .......... 33
Figura 10 – Modelo artificial de um neurônio biológico ............................................. 35
Figura 11 – Arquitetura de rede unidirecional com camada única............................. 37
Figura 12 – Arquitetura de rede unidirecional com multicamada............................... 38
Figura 13 – Arquitetura de rede recorrente com neurônios ocultos........................... 39
Figura 14 – Mapa de suscetibilidade de Porto Alegre ............................................... 55
Figura 15 – Mapa de suscetibilidade do Rio de Janeiro ............................................ 55
Figura 16 – Resumo da revisão sistemática.............................................................. 61
Figura 17 – Localização da área de estudo, Guarujá - SP ........................................ 66
Figura 18 – Pilares da pesquisa ................................................................................ 67
Figura 19 – Modelo teórico conceitual para elaboração de mapas com RNA ........... 68
Figura 20 – Localização das cicatrizes de movimento de massa, Guarujá – SP ...... 77
Figura 21 – Cicatrizes (a) e pontos de não ocorrência aleatórias (b) ........................ 78
Figura 22 – Pontos de não ocorrência em raios de 50, 100, 150 e 200m ................. 78
Figura 23 – Pontos de não ocorrência em buffers de 1 (a), 2 (b), 3 (c) e 4 (d) km .... 79
Figura 24 – Aspecto (a), curvatura (b), declividade (c) e elevação (d) ...................... 81
Figura 25 – Twi (a), uso do solo (b) e geologia (c) .................................................... 81
Figura 26 – Correlação dos fatores de influência e ocorrência da amostra aleatória 82
Figura 27 – Correlação dos fatores de influência e ocorrencia da amostra de 200m 82
Figura 28 – Relevância das variáveis para amostra aleatória ................................... 83
Figura 29 – Relevância das variáveis para amostra 200m ........................................ 84
Figura 30 – Número de pontos de ocorrência e não ocorrência preditas .................. 85
Figura 31 – AUC ROC das amostras de melhor desempenho .................................. 87
Figura 32 – Visão bidimensional dos pontos de ocorrência para amostra aleatória.. 88
Figura 33 – Visão bidimensional dos pontos de ocorrência para amostra 200m ...... 88
Figura 34 – Mapas de suscetibilidade elaborado pela RNA – amostra aleatória. ..... 90
Figura 35 – Mapas de suscetibilidade elaborado pela RNA – amostra 200m ........... 91
Figura 36 – Mapas de suscetibilidade elaborado pelo IPT e por meio de RNA ........ 92
Figura 37 – Classificação da amostra não treinada pelas RNAs............................... 93
LISTA DE ABREVIATURAS E SIGLAS

AM Aprendizado de Máquina
AUC Area Under the Curve – Área Sob a Curva
AUROC Area Under the Receiver Operating Characteristics – Área sob a
Característica de Operação do Receptor
BCS Buffer Controlled Sampling – Amostragem Controlada por Buffer
BPA Backpropagation – Retropropagação
CPLA Coordenadoria de Planejamento Ambiental
CTGeo Centro de Tecnologias Geoambientais
DLNN Deep Learning Neural Network
FP Falso Positivo
FN Falso Negativo
IPT Instituto de Pesquisas Tecnológicas
IGR Information Gain Ratio – Taxa de Ganho de Informação
MDE Modelo Digital de Elevação
MDT Modelo Digital de Terreno
MLP-NN Multi-Layer Perceptron Neural Network – Rede Neural Perceptron
Multicamada
MLP Multi-Layer Perceptron – Perceptron Multicamada
RF Random Forest – Florestas aleatórias
RNA Redes Neurais Artificiais
ROC Receiver Operating Characteristics - Característica de Operação do
Receptor
RSL Revisão Sistemática da Literatura
Shalstab Shallow Landslide Stability Analysis - Análise de Estabilidade de
Escorregamentos Rasos
SIG Sistema de Informações Geográficas
Sirden Seção de Investigações, Riscos e Desastres Naturais
SVM Support Vector Machine – Máquinas de vetores de suporte
UFFS Universidade Federal Fronteira do Sul
VP Verdadeiro Positivo
VPN Valor Preditivo Negativo
VPP Valor Preditivo Positivo
VN Verdadeiro Negativo
SUMÁRIO

1 INTRODUÇÃO ........................................................................................................... 16
1.1 Apresentação e contextualização do problema ............................................. 16
1.2 Questões, objetivos e proposições da pesquisa ........................................... 18
1.3 Metodologia do trabalho .................................................................................. 19
1.4 Organização do trabalho.................................................................................. 20
2 REVISÃO DA LITERATURA ..................................................................................... 22
2.1 Movimentos de massa e suscetibilidade........................................................ 22
2.2 Cartas de suscetibilidade ................................................................................ 27
2.3 Aprendizado de máquina ................................................................................. 30
2.4 Mapeamento de suscetibilidade e aprendizado de máquina ........................ 42
2.5 Revisão sistemática da literatura .................................................................... 43
2.5.1 Planejamento da Revisão Sistemática ......................................................... 47
2.5.2 Síntese da revisão sistemática ..................................................................... 52
2.5.3 Análise dos resultados ................................................................................. 60
2.6 Considerações finais do capítulo.................................................................... 61
3 MÉTODO DA PESQUISA .......................................................................................... 63
3.1 Escolha do método de pesquisa ..................................................................... 63
3.2 Definição da pesquisa e construção do referencial teórico ......................... 65
3.3 Delimitação do escopo..................................................................................... 65
3.4 Roteiro do mapeamento de suscetibilidade ................................................... 67
3.4.1 Modelo teórico .............................................................................................. 68
3.4.2 Modelo de análise ........................................................................................ 68
4 RESULTADOS E DISCUSSÕES ............................................................................... 76
4.1 Etapa 1 – Preparo dos dados amostrais......................................................... 77
4.2 Etapa 2 – Seleção e formatação dos fatores de influência ........................... 79
4.3 Etapa 3 - Treinamento e validação da rede ................................................... 84
4.4 Etapa 4 - Elaboração do mapa de suscetibilidade ........................................ 90
4.5 Etapa 5 – Comparação de desempenho ......................................................... 91
5 CONSIDERAÇÕES FINAIS ....................................................................................... 95
5.1 Conclusões ....................................................................................................... 95
5.2 Contribuições ................................................................................................... 97
5.3 Limitações ......................................................................................................... 98
5.4 Estudos futuros ................................................................................................ 98
REFERÊNCIAS ............................................................................................................. 99
APÊNDICE A – ARTIGO APRESENTADO NO XII SIMPÓSIO INTERNACIONAL DE
ESCORREGAMENTOS .............................................................................................. 107
APÊNDICE B – EXECUÇÃO DA REVISÃO SISTEMÁTICA ...................................... 119
16

1 INTRODUÇÃO
Neste capítulo são descritos o problema e sua contextualização, os objetivos a
serem alcançados, a questão de pesquisa, a metodologia adotada e a organização
dos demais capítulos deste trabalho.

1.1 Apresentação e contextualização do problema


Considerados fenômenos naturais, os escorregamentos de terra, por vezes
chamados apenas escorregamentos ou mesmo deslizamentos, são popularmente
entendidos como “deslocamentos em massa de terra, detritos e rochas”, podendo ser
desencadeados por razões hidrológicas, topográficas e geofísicas. Além disso,
atividades antrópicas como mineração e a urbanização acelerada, também
contribuem para a ocorrência desses eventos (PHAM et al., 2019).
De acordo com o Banco Mundial quase 3,7 milhões de quilômetros quadrados
de área terrestre ao redor do mundo são altamente propensos a escorregamentos de
terra podendo colocar em risco cerca de 300 milhões de vidas humanas e incontáveis
prejuízos (DILLEY, M.; CHEN, R.S.; DEICHMANN, U.; LERNER-LAM, A.L.; ARNOLD,
2005).
Um aspecto relevante é que os escorregamentos podem ser preditos desde
que seus agentes potenciais e mecanismos relacionados sejam monitorados. Em
outras palavras, é possível identificar as áreas mais suscetíveis, aquelas que possuem
maior pré-disposição ao fenômeno, sendo esse um dos assuntos mais pesquisados
sobre os escorregamentos nas duas últimas décadas (BUI et al., 2020).
Suscetibilidade é a probabilidade de ocorrência de escorregamentos dado um
conjunto de condições ambientais da região (GUZZETTI et al., 2005). Sendo assim,
vários métodos e abordagens foram propostos e testados para determinar a
susceptibilidade a escorregamentos, incluindo (entre outros) mapeamento
geomorfológico, análise de inventários de escorregamentos, modelo heurístico e
zoneamento de suscetibilidade, modelagem numérica com base física e métodos de
classificação com base estatística (NOLA, 2015). Dentre os métodos que analisam e
descrevem os escorregamentos por meio de valores numéricos, caracterizando
matematicamente a avaliação dos eventos perigosos em termos probabilísticos, os
chamados métodos quantitativos (GUZZETTI et al., 1999), destaca-se aqui a análise
estatística e as redes neurais.
17

Nos estudos que utilizam métodos quantitativos, os mapeamentos de


suscetibilidade têm sido realizados considerando dados geomorfológicos de cicatrizes
de escorregamentos, fazendo com que modelos estatísticos bivariados e
multivariados sejam os mais utilizados (CARRARA; GUZZETTI, 1995; GUZZETTI et
al., 1999; VARNES et al., 1984). Para Cruden et al. (1993), uma cicatriz de
escorregamento é a superfície que se forma na encosta entre o topo da ruptura e o
material deslocado abaixo da superfície do solo original.
Segundo Reichenbach et al. (2018), importantes grupos de pesquisa estão
desenvolvendo técnicas de aprendizado de máquina (BUI et al., 2019; HONG et al.,
2019; PHAM; TIEN BUI; PRAKASH, 2018; PRADHAN; LEE; KIM, 2019;
REICHENBACH et al., 2018; WANG; FANG; HONG, 2019), dentre eles, redes neurais
artificiais (RNA) para o mapeamento de suscetibilidade em regiões monitoradas com
sucesso.
No Brasil, a elaboração de mapas de suscetibilidade começou por volta de 1965
no Rio de Janeiro, em estudos das favelas em escarpas elevadas, que desde o final
do século XIX sofrem com escorregamentos (LISTO, 2011). Esse problema é
potencializado com o processo de urbanização acelerado, resultado da expansão das
cidades de forma desordenada, com moradias em áreas impróprias para ocupação,
sem infraestrutura adequada (TOMINAGA; SANTORO; AMARAL, 2009).
Desde então, diversas metodologias para elaboração de mapas de
suscetibilidade foram desenvolvidas por institutos de pesquisa e universidades
brasileiras em outras áreas objetivando a utilização de mapas de suscetibilidade para
planejamento urbano, implementação de obras civis corretivas e mitigadoras, criação
de sistemas de emergência, aprimoramento das legislações ligadas ao uso do solo e
na difusão de informações e treinamentos (LISTO, 2011).
Atualmente no Brasil, o uso de técnicas de aprendizado de máquina (AM) para
mapeamento de áreas de risco de escorregamentos ainda está em desenvolvimento.
Trabalhos publicados em periódicos internacionais de alto impacto, como o de
Bragagnolo, Silva e Grzybowski (2020) sobre a aplicação de técnicas de aprendizado
de máquinas para elaboração de mapas de suscetibilidade em território nacional são
raros.
Em decorrência dos cenários econômicos e políticos, o Brasil continua com um
crescente aumento de população vivendo em áreas de risco. Apesar de diversas
18

linhas de pesquisas em andamento no tema, ainda existe espaço para a diversificação


das abordagens para elaboração de mapas de suscetibilidade.

1.2 Questões, objetivos e proposições da pesquisa


Diante do que foi exposto na contextualização, e visto que há uma oportunidade
para estudos que propõem a criação de mapas de suscetibilidade com o uso de RNA,
tem-se a seguinte questão central:

QC: Como elaborar mapas de suscetibilidade a escorregamentos utilizando


redes neurais artificiais com maior eficiência em relação àqueles elaborados com
métodos tradicionais?

O desdobramento da questão central leva à questão a seguir:


Q1 – Mapas de suscetibilidade elaborados por meio de redes neurais artificias
possuem bom desempenho?

Nesse sentido, este trabalho tem como objetivo geral propor uma
metodologia para elaboração de mapas de suscetibilidade por meio de redes
neurais artificiais.

Para que o objetivo geral fosse alcançado, os seguintes objetivos específicos


foram definidos:
 OB1: Implementar uma rede neural para classificação de pontos
geolocalizados, quanto a sua suscetibilidade a escorregamentos;

 OB2: Gerar o mapa de suscetibilidade a partir da arquitetura de rede


neural que apresentou melhor desempenho na etapa de treinamento;

 OB3: Comparar o desempenho do mapa gerado com auxílio da rede


neural com aquele implementado de forma tradicional na área
monitorada, bem como com o desempenho médio dos trabalhos
disponíveis na literatura.

A principal proposição desta pesquisa é evidenciar que a adoção de redes


neurais artificiais, assim como outras técnicas de aprendizado de máquina, é uma
ferramenta eficaz para elaboração de mapas de suscetibilidade de escorregamentos.
19

Esta pesquisa assume como premissa a existência de um conjunto de dados


com histórico de escorregamentos, contendo um inventário de cicatrizes e um
conjunto de fatores predisponentes em cada ponto de incidência e não incidência dos
escorregamentos.

1.3 Metodologia do trabalho


Considerando o exposto nas seções 1.1 e 1.2, propõe-se a seguinte
abordagem de trabalho:
 Realização de uma pesquisa exploratória para identificar na literatura
métodos, processos ou técnicas utilizadas para elaboração de mapas de
suscetibilidade;

 Revisão sistemática da literatura (seção 4.1), para aprofundar a pesquisa


conforme contexto apresentado na seção 1.1;

 Elaboração dos modelos teórico e de análise e sua aplicação em um


estudo de caso;

 Análise e avaliação dos resultados.

Portanto, a solução do problema de pesquisa desta dissertação foi realizada


pela adaptação de métodos, processos ou técnicas identificadas na literatura, pela
revisão sistemática, e a aplicação prática de seus conceitos por meio do estudo de
caso.
Após os capítulos de introdução e revisão da literatura, iniciam-se as atividades
específicas que foram conduzidas no decorrer desta pesquisa. A aplicação da
pesquisa foi realizada conforme a contextualização de sua condução, mostrada na 20.
20

Figura 1 – Contextualização da pesquisa

Fonte: Elaborado pelo autor (2021)

1.4 Organização do trabalho


Além desta seção introdutória, este trabalho está organizado em cinco
capítulos.
O segundo capítulo trata a revisão da literatura de tópicos relacionados ao tema
desse estudo. A análise visa explorar a utilização de técnicas de aprendizado de
máquina para elaboração de mapas de suscetibilidade, os fatores predisponentes de
escorregamentos utilizados na análise, e por fim, como medir o desempenho dessas
técnicas.
Na sequência, é apresentada uma breve revisão teórica sobre, segundo Skansi
(2018), o subcampo do aprendizado de máquina, que são as redes neurais artificiais.
O capítulo três, método de pesquisa, apresenta a metodologia proposta que
objetiva elaborar um mapa de suscetibilidade para o município do Guarujá-SP por
meio da aplicação de redes neurais artificiais. Cada uma das etapas é detalhada assim
como as atividades e procedimentos.
O capítulo quatro discorre sobre o estudo de caso, descreve os materiais e
métodos utilizados no contexto do roteiro da pesquisa proposto na seção 3.5.
21

No capítulo cinco, tem-se os resultados do estudo de caso. Descreve a


aplicação da abordagem descrita anteriormente, identificando os dados resultantes, a
discussão dos resultados, comparações com o mapa equivalente gerado pelo IPT
bem como, com a eficácia média documentada na literatura.
Capítulo seis, discussão final, são apresentadas as conclusões finais, as
contribuições, bem como as limitações da pesquisa e recomendações para trabalhos
futuros.
22

2 REVISÃO DA LITERATURA
Nesse capítulo é desenvolvida a revisão da literatura sobre tópicos específicos
de utilidade para a pesquisa. São apresentados e discutidos os principais
fundamentos teóricos do trabalho, com o intuito de estabelecer uma base para o seu
desenvolvimento. Inicialmente os conceitos, definições e mecanismos de
suscetibilidade de escorregamentos ou movimentos de massa são abordados com
base na literatura das geociências. Em seguida, são apresentadas as cartas de
suscetibilidade, primeiramente no âmbito das geociências, para enfim delimitá-las ao
escopo de prevenção de escorregamentos.
Na seção revisão sistemática da literatura, é apresentado o protocolo do
planejamento da revisão e a síntese final com os resultados obtidos na análise da
literatura. A execução da revisão é apresentada no Apêndice B.

2.1 Movimentos de massa e suscetibilidade


Neste tópico são descritos os principais movimentos de massa que ocorrem na
área de estudo, bem como a metodologia de elaboração do mapa de suscetibilidade
proposta por Bitar (2014).
O termo genérico movimentos de massa engloba uma variedade de tipos de
movimentos de instabilização de massas de solos, rochas ou detritos, gerados pela
ação da gravidade em terrenos inclinados tendo como fator deflagrador principal a
infiltração de água, principalmente de chuva (IPT, 2016).
Esses processos podem ser induzidos, ou seja, gerados pelas atividades do
homem que modificam as condições naturais do relevo por meio de cortes para
construção de moradias, aterros, lançamento concentrado de águas sobre as
encostas, estradas e outras obras. Por isso, a ocorrência desses movimentos de
massa resulta da ocupação inadequada, sendo mais comum em zonas com
ocupações precárias de baixa renda (IPT, 2016).
Os movimentos de massa têm possibilidade de previsão, ou seja, pode-se
conhecer previamente onde e em que condições vão ocorrer, e qual será a sua
magnitude, desde que se conheçam, em detalhes, o meio físico e antrópico, e os
condicionantes do processo. Para cada tipo existem medidas não estruturais e
estruturais (alternativas de intervenção) específicas (VEDOVELLO R.; MACEDO,
2007).
23

Existem diversas classificações nacionais e internacionais relacionadas a


movimentos de massa. Aqui é adotada a classificação proposta por Augusto Filho
(1992), onde os movimentos de massa relacionados a encostas são agrupados em
quatro grandes classes de processos: rastejos, escorregamentos, quedas e corridas
(Quadro 1).
Quadro 1 - Tipos de escorregamento/processo
Contingências características do movimento/ material/
Processos
geometria
Rastejos (CREEP)  Vários planos de deslocamento (internos)
 Velocidades muito baixas a baixas (cm/ano) e decrescentes com a
profundidade
 Movimentos constantes, sazonais ou intermitentes
 Solo, depósitos, rocha alterada/fraturada
 Geometria indefinida
Escorregamentos/  Poucos planos de deslocamento (externos)
Deslizamentos  Velocidades médias (m/h) a altas (m/s)
(SLIDES)  Pequenos a grandes volumes de material
 Geometria e materiais variáveis
 Planares / Translacionais: solos poucos espessos, solos e rochas
com um plano de fraqueza
 Circulares / Rotacionais: solos espessos homogêneos e rochas muito
fraturadas
 Em Cunha: solos e rochas com dois planos de fraqueza
Quedas (FALLS)  Com ou sem planos de deslocamento
 Movimento tipo queda livre ou em plano inclinado
 Velocidades muito altas (vários m/s)
 Material rochoso
 Pequenos e médios volumes
 Geometria variável: lascas, placas, blocos, etc.
 Desplacamento
 Rolamento de matacão
 Tombamento
Corridas (FLOWS)  Muitas superfícies de deslocamento (internas e externas à massa em
movimentação)
 Movimento semelhante ao de um líquido viscoso
 Desenvolvimento ao longo das drenagens
 Velocidades médias a altas
 Mobilização de solo, rocha, detritos e água
 Grandes volumes de material
 Extenso raio de alcance, mesmo em áreas planas
Fonte: Baseado em Augusto Filho (1992)

Dentro dos tipos de movimentos de massa acima descritos, esta pesquisa


tratará o tipo escorregamento planar raso.
24

Os escorregamentos são processos marcantes na evolução das encostas,


caracterizando-se por movimentos rápidos (m/h a m/s), com limites laterais e
profundidade bem definidos (superfície de ruptura). Os volumes instabilizados podem
ser facilmente identificados, ou pelo menos inferidos. Podem envolver solo, saprólito,
rocha e depósitos. São subdivididos em função do mecanismo de ruptura, geometria
e material que mobilizam (FORNASARI FILHO, N.; FARIA, 2018).
O principal agente deflagrador deste processo é a água das chuvas. Os índices
pluviométricos críticos variam de acordo com a região, sendo menores para os
escorregamentos induzidos e maiores para os generalizados (FORNASARI FILHO,
N.; FARIA, 2018).
Existem vários tipos de escorregamentos propriamente ditos: planares ou
translacionais, circulares ou rotacionais, em cunha e os induzidos. A geometria destes
movimentos varia em função da existência ou não de estruturas ou planos de fraqueza
nos materiais movimentados que condicionem a formação das superfícies de ruptura
(FORNASARI FILHO, N.; FARIA, 2018).
Os escorregamentos planares ou translacionais em solo são processos muito
frequentes na dinâmica das encostas serranas brasileiras, ocorrendo
predominantemente em solos pouco desenvolvidos das vertentes com altas
declividades (25) e (25). Sua geometria caracteriza-se por uma pequena espessura e
forma retangular estreita (comprimentos bem superiores às larguras). Este tipo de
escorregamento também pode ocorrer associado a solos saprolíticos, saprolitos e
rocha, condicionados por um plano de fraqueza desfavorável à estabilidade,
relacionado a estruturas geológicas diversas (foliação, xistosidade, fraturas, falhas
etc.) (FORNASARI FILHO, N.; FARIA, 2018).
25

Figura 2 – Perfil esquemático de escorregamentos planares

Fonte: Ministério das Cidades, Instituto de Pesquisas Tecnológicas do Estado de São Paulo (2007)

Figura 3 – Escorregamentos planares induzidos pela ocupação

Fonte: SIRGA-CIMA – IPT


Os escorregamentos ocorrem sob a influência de condicionantes naturais,
antrópicos ou ambos. As causas destes processos devem ser entendidas, a fim de se
evitar e controlar escorregamentos similares.
26

Os condicionantes naturais podem ser separados em dois grupos, o dos


agentes predisponentes e o dos agentes efetivos.
Os agentes predisponentes são o conjunto das características intrínsecas do
meio físico natural, podendo ser diferenciados em complexo geológico-
geomorfológico (comportamento das rochas, perfil e espessura do solo em função da
maior ou menor resistência da rocha ao intemperismo) e complexo hidrológico-
climático (relacionado ao intemperismo físico-químico e químico). A gravidade e a
vegetação natural também podem estar inclusas nesta categoria (FORNASARI
FILHO, N.; FARIA, 2018).
Os agentes efetivos são elementos diretamente responsáveis pelo
desencadeamento de escorregamentos, sendo estes diferenciados em preparatórios
(pluviosidade, erosão pela água e vento, congelamento e degelo, variação de
temperatura e umidade, dissolução química, ação de fontes e mananciais, oscilação
do nível de lagos e marés e do lençol freático, ação de animais e humana, inclusive
desflorestamento) e imediatos (chuva intensa, vibrações, fusão do gelo e neves,
erosão, terremotos, ondas, vento, ação do homem, etc.) (FORNASARI FILHO, N.;
FARIA, 2018).
Outros condicionantes naturais de grande importância são as características
intrínsecas dos maciços naturais (rochosos e terrosos), a cobertura vegetal, a ação
das águas pluviais (saturação e/ou elevação do lençol freático, geração de pressões
neutras e forças de percolação, distribuição da chuva no tempo), além dos processos
de alteração da rocha e de erosão do material alterado (FORNASARI FILHO, N.;
FARIA, 2018).
Os escorregamentos induzidos, ou causados pela ação antrópica são aqueles
cuja deflagração é causada pela execução de cortes e aterros inadequados, pela
concentração de águas pluviais e servidas, pela retirada da vegetação etc. Muitas
vezes, estes escorregamentos induzidos mobilizam materiais produzidos pela própria
ocupação, envolvendo massas de solo de dimensões variadas, lixo e entulho
(FORNASARI FILHO, N.; FARIA, 2018).
27

2.2 Cartas de suscetibilidade


No âmbito das geociências, o termo suscetibilidade pode ser definido como a
predisposição ou propensão dos terrenos ao desenvolvimento de um fenômeno ou
processo do meio físico (FELL et al., 2008).
Os procedimentos para elaboração do mapeamento da suscetibilidade a
movimentos gravitacionais de massa estão fundamentados no paradigma de que os
registros do passado constituem um guia para a análise do futuro, assumindo-se que
as áreas com características geomorfológicas e geológicas semelhantes às de locais
afetados por escorregamentos são propensas a novas ocorrências (FELL et al., 2008).
São ditos métodos tradicionais, os principais métodos utilizados para
elaboração dos mapas de suscetibilidade, são eles: mapas de inventários (ou análise
de distribuição), análise qualitativa, métodos heurísticos e modelos determinísticos
(LISTO, 2011). Esses métodos têm como característica por exemplo, alta
dependência de especialistas e subjetividade, como no caso dos métodos heurístico
e na análise qualitativa. Outra característica é sua limitação geográfica em relação aos
locais de ocorrência dos escorregamentos, são os casos dos métodos de análise de
distribuição ou mapa de inventários. Métodos como análise determinística e análise
estatística são pouco flexíveis no sentido que a previsão de perigo é obtida por meio
de um conjunto restrito de parâmetros ou características da região (LISTO, 2011;
NERY, 2011).
As abordagens estatísticas (ou probabilísticas) se fundamentam nas relações
observadas entre cada fator condicionante e a distribuição dos escorregamentos em
áreas monitoradas (GUZZETTI et al., 1999), visando a uma menor subjetividade e a
uma maior repetitividade no mapeamento de áreas suscetíveis (FERNANDES et al.,
2001).
Método do Instituto de Pesquisas Tecnológicas/CPRM
Entre a variedade de condicionantes do meio físico possíveis de obtenção,
distinguem-se três fatores predisponentes de escorregamento, frequentemente
associados à distribuição das cicatrizes: declividade, curvatura de encosta e
densidade de lineamentos estruturais (correlatos a fraturas, juntas, zonas de falhas e
outras descontinuidades), que refletem, respectivamente, a influência combinada de
aspectos geomorfológicos, hidrológico-pedológicos e geológicos (STABILE et al.,
2013).
28

O processo de preparo dos mapas de suscetibilidade pode ser exemplificado


conforme descrito a seguir: a declividade e a curvatura de encosta são mapeadas por
meio de software de geoprocessamento, a partir de um MDE (Modelo Digital de
Elevação). Os lineamentos estruturais são obtidos em ortofotos e posteriormente
tratados em software de geoprocessamento com um módulo de densidade Kernel,
que propicia calcular a densidade de feições lineares a partir de um raio de busca
(SILVERMAN, 1988). Para fins de análises posteriores, cada um dos parâmetros é
categorizado no maior número de classes possível, com representatividade espacial
e significado geológico-geomorfológico no município mapeado.
Para determinar a relação entre os fatores predisponentes e os
escorregamentos, seleciona-se, para cada região mapeada, ao menos uma área
piloto como matriz de modelagem, em que, além do mapeamento dos fatores,
mapeiam-se também as cicatrizes de escorregamentos. Os critérios para a seleção
das áreas piloto compreendem a presença de um grande número de cicatrizes de
escorregamentos mapeáveis e a semelhança com as unidades morfoesculturais
(ROSS, 2011) das regiões selecionados, para a consequente extrapolação dos
resultados àqueles situados no mesmo contexto (Figura 4).

Figura 4 – Exemplo de cicatrizes mapeadas em uma das áreas piloto.

Fonte: Bitar (2014)

De modo a avaliar a relação entre os escorregamentos e cada parâmetro


analisado, calculou-se a densidade de cicatrizes em cada uma das classes dos fatores
predisponentes, conforme a Equação 1 (BITAR, 2014):
29

𝐴𝑑
𝐷= 𝐴𝑡

Equação (1)
Onde: D = densidade de cicatrizes em cada classe do fator predisponente; A d
= área afetada por escorregamentos na classe; e At = área total da classe (BITAR,
2014).
Na sequência, para que a intensidade do evento mapeado não tenha influência
nos resultados, cada valor é dividido pela densidade média de escorregamentos na
área de estudo. Esse índice é denominado Dn (densidade normalizada), representado
na Equação 2 (BITAR, 2014):

𝐷
𝐷𝑛 = 𝐷𝑡

Equação (2)
Onde: Dn = densidade normalizada; D = densidade de cicatrizes em cada classe
do fator predisponente; e Dt = densidade média de escorregamento na área de estudo.
A Densidade normalizada (Dn) determina a contribuição dos parâmetros na
distribuição dos escorregamentos ocorridos. Em seguida, o Índice de Suscetibilidade
a Escorregamentos (ISE) de cada parâmetro é calculado utilizando-se o método do
Valor Informativo (ZÊZERE, 2002), que consiste no cálculo do logaritmo natural de Dn,
conforme Equação 3 (BITAR, 2014):

𝐼𝑆𝐸 = 𝑙𝑛 𝐷𝑛

Equação (3)
Onde: ISE = Índice de Suscetibilidade a Escorregamentos; e Dn = densidade
normalizada.
Para o mapeamento da suscetibilidade em cada região, os mapas dos fatores
predisponentes considerados (declividade, curvatura de encosta, densidade de
lineamentos estruturais) são reclassificados segundo os respectivos valores de ISE, e
posteriormente somados (BITAR, 2014).
Para definição das classes de suscetibilidade (alta, média e baixa) a representar
na carta, visando a elaborar o zoneamento, busca-se incluir o maior número de
escorregamentos nas classes mais altas, em uma área mínima (FELL et al., 2008).
Para tanto, são elaboradas curvas que relacionam a área de ocorrência de
escorregamentos com cada área piloto, segundo sua suscetibilidade (Figura 5 )
(BITAR, 2014).
30

Figura 5 – Relação entre área de cicatrizes e área total, na área piloto.

Fonte: Bitar (2014)

São definidas três classes de suscetibilidade: alta, média e baixa. A alta


suscetibilidade é definida no limite superior da curva (em geral contemplando 90% dos
escorregamentos), onde há uma ruptura a partir da qual a inclusão de novas cicatrizes
demandaria a inserção de muitas áreas, enquanto a média é a partir da abrangência
dos demais escorregamentos ocorridos na área piloto, totalizando cerca de 100% da
área das cicatrizes mapeadas. Por sua vez, a baixa suscetibilidade representa as
demais áreas cuja ocorrência de escorregamentos na área piloto tende a ser
desprezível (BITAR, 2014).

2.3 Aprendizado de máquina


Para Mitchell (1997) e Flach (2012) aprendizado de máquina é o estudo
sistemático de algoritmos e sistemas que melhoram o conhecimento ou desempenho
com a experiência. Mitchell (1997) complementa definindo aprendizado de máquina
como um campo da inteligência computacional que estuda métodos capazes de
transformar amostras de dados em conhecimento. Dentre esses métodos existem
aqueles classificados como supervisionados, cujo objetivo é construir modelos
computacionais que podem adaptar-se e aprender a partir de dados previamente
classificados.
De maneira geral, os algoritmos de aprendizado de máquina são utilizados para
classificação de padrões, modelagens, simulações e previsões numéricas para um
conjunto de amostras (RUSSELL; NORVIG, 2009).
31

São três os principais paradigmas possíveis utilizados pelos processos de


aprendizado de máquina: supervisionado, não-supervisionado e por reforço (SKANSI,
2018). A seleção de um paradigma de aprendizado está relacionada ao tipo de
problema e determina o modo com que a técnica de aprendizado de máquina aprende
por meio de um conjunto de dados.
No aprendizado supervisionado, a amostra dos dados analisados é
previamente classificada. Esse conjunto de dados de exemplo com as classes
rotuladas são descritos como atributos, variáveis explanatórias ou independentes
(FLACH, 2012). No aprendizado supervisionado, é sabido que existe uma relação
entre as classes rotuladas e as variáveis independentes. Há dois métodos de
aprendizado supervisionado: classificação e regressão (BISHOP, 2006). Nos
problemas de classificação, as variáveis explanatórias ou dados de entrada são
conhecidas e o algoritmo tem como objetivo distribuir esses dados entre uma das
classes de saída como demonstrado na Figura 6. Por outro lado, nos problemas de
regressão, as variáveis independentes e as classes rotuladas de saída se relacionam
por intermédio de uma função contínua (Figura 7). A saída desse modelo é um número
(BISHOP, 2006).
Figura 6 – Classificação em aprendizado supervisionado.

Fonte: Elaborado pelo autor (2021)


32

Figura 7 – Regressão em aprendizado supervisionado.

Fonte: Elaborado pelo autor (2021)

Por outro lado, no aprendizado não supervisionado não há classificação prévia


dos dados amostrais. Sendo assim, o algoritmo precisa aprender e representar as
variáveis independentes submetidas segundo um critério de qualidade. Nesse
cenário, em que somente dados de entrada são conhecidos, o principal objetivo desse
método é encontrar padrões ou regularidades. Ao contrário do paradigma de
aprendizado supervisionado, nesse método é gerado um agrupamento (clusterização)
dos dados de entrada (Figura 8). Esse processo consiste no agrupamento dos dados
de entrada que possuem informações em comum ou que sejam semelhantes entre si,
formando diferentes grupos ou clusters (JAIN, 2010). A clusterização realiza esse
agrupamento por meio de critérios de similaridade e dissimilaridade entre os diversos
clusters gerados em um processo iterativo (Figura 9).
33

Figura 8 – Agrupamento em aprendizado não supervisionado.

Fonte: Adaptado de Jain (2010)

Figura 9 – Iteração para agrupamento em aprendizado não supervisionado.

Fonte: Baseado em Jain (2010)

Nos modelos por reforço, o aprendizado se dá por meio de recompensas ao


indutor. Como no aprendizado não-supervisionado, não há necessidade de um
conjunto de dados de saída e entradas previamente estabelecidas (RUSSELL;
NORVIG, 2009). Nesse modelo, o aprendizado é estabelecido explorando-se um
34

ambiente desconhecido e concentrando-se em receber recompensas após a


execução de determinadas ações. O que determina as recompensas e os próximos
estágios do ambiente são as ações tomadas pelo agente (RUSSELL; NORVIG, 2009).

Redes Neurais Artificiais


Os sistemas biológicos, em particular o sistema nervoso humano, serviram de
referência para o desenvolvimento de técnicas de aprendizado de máquinas. Dentre
essas técnicas as redes neurais artificiais (RNA) estão entre as mais populares
(AGGARWAL, 2018). Seu processo de aprendizagem é inspirado nos mecanismos
cerebrais e o procedimento utilizado para realizar esse processo é chamado de
algoritmo de aprendizagem (HAYKIN, 2008). Esses sistemas computacionais
estruturados são treinados com informações previamente coletadas. Sendo assim, as
RNA são modelos simplificados da atividade cerebral, onde suas entidades básicas,
os neurônios, estão interconectados em redes permitido a troca de informações
processadas. No caso dessas RNAs, os neurônios são substituídos por unidades de
processamento simples, os neurônios artificiais, que são interligados por sinapses
artificiais, cujo sistema de interconexão é representado por vetores e matrizes de
pesos sinápticos. A configuração mais simples de uma rede neural artificial é o
Perceptron, inicialmente implementado por Frank Rosenblatt em 1956 (SKANSI,
2018).
Um modelo de neurônio artificial simples (35) tem a função de coleta entre os
sinais de entrada, a fim de agregá-los e produzir uma resposta de acordo com sua
função de ativação. Assim, os sinais de entrada (𝑥1 , 𝑥2 , … 𝑥𝑚 ) são ponderados por
seus pesos sinápticos (𝑤𝑘1 , 𝑤𝑘2 , … 𝑤𝑘𝑚 ) dando a eles uma relevância por meio de
multiplicações. A soma ponderada das entradas (∑) se transforma na saída do corpo
celular artificial (𝑢𝑘 ). A função de ativação (ⱷ(.)) possui o objetivo de limitar a saída
dentro de um intervalo de valores a serem assumidos.
35

Figura 10 – Modelo artificial de um neurônio biológico

Fonte: Adaptado de (HAYKIN, 2008)

Os componentes básicos de uma rede neural são:


1) Sinais de entradas (𝑥𝑚 ): são as variáveis de uma aplicação específica. Cada
valor de entrada é um tipo de dado da amostra. Ex: (𝑥1 ) como valor de
declividade.
2) Pesos sinápticos (𝑤𝑘𝑚 ): valores associados a cada variável de entrada com o
intuito de ponderá-las, de modo a quantificar sua relevância. Em geral eles são
inicializados aleatoriamente com valores entre 0 e 1, e são ajustados durante o
processo de treinamento da rede.
3) Junção aditiva (∑): tem como função agrupar os produtos das variáveis de
entradas e pesos sinápticos.
4) Bias ou viés (𝑏𝑘 ): considerado um parâmetro externo do neurônio k, tem como
efeito ampliar ou reduzir a entrada da função de ativação conforme seu valor
seja positivo ou negativo respectivamente.
5) Função de ativação (ⱷ): utilizada para limitar a amplitude da saída de um
neurônio de modo que os valores resultantes possam ser interpretados.
6) Sinal de saída (𝑦𝑘 ): resultado do processamento da rede. Pode ser o produto
da análise ou entrada para outros neurônios da rede.

O processo de aprendizagem começa com a inicialização dos pesos sinápticos


e bias de maneira aleatória. Em seguida os pesos e bias sofrem ajustes de acordo
com as regras previamente estabelecidas visando ao aprimoramento da rede na
36

execução da sua tarefa. Matematicamente a representação do neurônio k descrito na


35 é dado pela equação 4.

yk = ⱷ (∑𝑚
𝑗=1 𝑤𝑘𝑗 𝑥𝑗 + bk)
Equação (4)
Dentre as propriedades e benefícios das redes neurais apontados por Haykin
(2008) destaca-se:
 Não linearidade (os neurônios artificiais são distribuídos de forma não linear e
o processo se dá dessa relação entre as diversas sinapses);
 Tolerância a falhas (devido a distribuição das informações entre os neurônios
e o elevado número de interconexões, uma parcial inoperabilidade da rede não
prejudica seu desempenho);
 Adaptabilidade (decorrente das mudanças dos pesos sinápticos em
decorrência do ambiente de análise e eventuais mudança do estado desse
ambiente);
 Generalização (uma rede generaliza bem quando o mapeamento de entrada e
saída calculado pela rede está correto para dados de teste nunca usados na
criação ou treinamento da rede);
 Capacidade de aprendizado (realizado por intermédio do mapeamento das
entradas e saídas, onde o cálculo dos pesos sinápticos é realizado e repetido
de modo a minimizar a diferença entre os resultados esperados e os obtidos)

Entende-se como arquitetura de uma rede neural, a maneira pela qual seus
neurônios são estruturados. Por sua vez, esta estrutura está relacionada ao algoritmo
de aprendizagem utilizado para o treinamento da rede. Em geral, pode-se classificar
três classes de arquiteturas de rede essencialmente diferentes.

1) Single-Layer Feedforward Networks ou redes unidirecionais de camada


única (37). Nessa arquitetura todos os neurônios estão conectados entre si e a
informação flui da camada de entrada para única camada de saída (neurônios).
A camada de entrada não é considerada pois nenhum processamento é
realizado em seus nós. O Perceptron é um exemplo dessa arquitetura.
37

Figura 11 – Arquitetura de rede unidirecional com camada única.

Fonte: Adaptado de (HAYKIN, 2008)

2) Multilayer Feedforward Networks, ou redes com múltiplas camadas (38).


Essa arquitetura é uma evolução das redes single-layers, por conta da
existência de uma ou mais camadas “ocultas” onde o processamento dos
dados de entrada ocorre. Os sinais de entrada são inseridos nos neurônios da
segunda camada (primeira oculta) e os sinais de saída dessa camada são
utilizados como dados de entrada para camada seguinte até que se atinja a
camada de saída. São empregadas em problemas de aproximação de funções,
classificação de padrões, identificação de sistemas, otimização, robótica e
controle de processos. Tipos: Perceptron Multicamadas, Redes de Base Radial
(AGGARWAL, 2018; HAYKIN, 2008).
38

Figura 12 – Arquitetura de rede unidirecional com multicamada.

Fonte: Adaptado de (HAYKIN, 2008)

3) Por fim, têm-se as redes do tipo recorrente, onde existe pelo menos uma
retroalimentação de dados durante seu processo de execução. A existência da
retroalimentação impacta significativamente a capacidade de aprendizagem e
o desempenho da rede (AGGARWAL, 2018; HAYKIN, 2008). Nas redes com
arquitetura recorrente têm-se pelo menos uma camada de neurônios onde a
informação de saída de cada neurônio alimenta a entrada de dados dos demais
neurônios. As redes recorrentes podem ter neurônios em camadas ocultas, isto
é, camadas que não são dos sinais de entrada ou de saída. A 39 ilustra essa
arquitetura de rede com uma camada oculta onde as informações transitam e
são transformadas entre as camadas ocultas e de saída. Esses ciclos também
39

possuem uma memória de atraso, os operadores de atraso unitário (z-1), que


operam sobre todas as entradas xn.

Figura 13 – Arquitetura de rede recorrente com neurônios ocultos.

Fonte: Adaptado de (HAYKIN, 2008)

Popularizado por Rumelhart et al. (1986) a retropropagação (back-propagation)


está entre um dos algoritmos mais utilizados nas redes neurais artificiais. O objetivo
desse algoritmo é obter o erro mínimo durante o treinamento da rede, ajustando os
pesos de maneira iterativa (AGGARWAL, 2018). Assim, o algoritmo de
retropropagação atualiza os pesos de um neurônio fazendo uso dos erros, das
entradas e da derivada da função de erro do neurônio em relação aos pesos (SKANSI,
2018). A correção de erro inversa começa na camada de saída, o erro é realimentado
por meio da camada intermediária em direção à camada de entrada, a fim de ajustar
os pesos e, assim, reduzir o erro. A interação é mantida até que o erro seja reduzido
a um nível aceitável em termos de um número predeterminado de vezes, ou um valor
limite especificado (RUMELHART; HINTON; WILLIAMS, 1986).
40

São diversos os casos bem-sucedidos da aplicação de técnicas de aprendizado


de máquina em diversas áreas. Por exemplo, Wu et al. (2018), na predição de diabetes
tipo 2 utilizando o algoritmo de classificação regressão logística. Em bioinformática, o
trabalho de Yu et al. (2021), também faz uso de técnicas de aprendizado de máquina
para análise de imagens de tecidos, com o objetivo de suportar os profissionais de
saúde no diagnóstico de patologias. Quanto aos mapeamentos de suscetibilidade a
escorregamentos, pode-se citar os trabalhos de Bragagnolo et al. (2020), Hong et al.
(2019), bem como os trabalhos de Krkac et al. (2017) e Pham et al. (2019).
Um aspecto relevante na utilização de RNA, assim como de outras técnicas de
AM é a seleção das variáveis de entrada, especialmente quando da existência de
muitas variáveis independentes, tornando o processo de treinamento complexo, e
eventualmente resultando em previsões pouco precisas (BUI et al., 2020).
Para May, Dandy e Maier (2011), esse cenário é potencializado nas RNA,
devido a sua não linearidade, complexidade inerente e natureza não paramétrica, e
assim, a dificuldade de selecionar variáveis de entrada surge devido:
(i) ao número de variáveis disponíveis, que pode ser grande;
(ii) correlações entre variáveis de entrada potenciais, o que cria redundância;
(iii) variáveis que têm pouco ou nenhum poder preditivo.
Em decorrência desses fatores, a avaliação e seleção de entradas ou redução
de dimensionalidade é necessária, visto que entradas redundantes, isto é, de alta
correlação, e sem contribuição para predição podem ser removidas.
Outro fator favorável a aplicação de técnicas para seleção de variáveis é que
elas possibilitam uma melhor compreensão do fenômeno de escorregamentos por
meio da análise de suas variáveis.
As técnicas de seleção de variáveis são classificadas em: supervisionadas e
não supervisionadas, onde os métodos supervisionados podem ser divididos em
wrapper, filtro e intrínseco. Os do tipo wrapper utilizam modelos de classificação com
diferentes subconjuntos das variáveis disponíveis e seleciona aquelas que maximizam
o desempenho modelo. Métodos baseados em filtros, não dependem de modelos de
classificação, eles utilizam métricas estatísticas para pontuar a correlação ou
dependência entre as variáveis de entrada e a variável de classificação, e essas
métricas são utilizadas para filtrar as variáveis de entrada de maior relevância. Por
fim, existem algoritmos de AM que realizam a seleção de variáveis automaticamente
como parte do aprendizado do modelo, por isso esses métodos são tipificados como
41

intrínsecos ou embedded. Quando a variável de classificação é ignorada durante o


processo de seleção de variáveis de entrada, esse processo é dito não
supervisionado, como por exemplo os métodos que removem variáveis redundantes
usando correlação de linear (KUHN; JOHNSON, 2013).
Dentre as técnicas de análise e seleção de variáveis de entrada, para o escopo
desse trabalho foi utilizado o algoritmo Recursive Feature Elimination (RFE), que é do
tipo wrapper-supervisionado. Como técnica do tipo filtro-supervisionado para seleção
de variáveis com base em teste estatístico univariado optou-se pela implementação
da análise de variância (ANOVA) / F-teste. E por fim, como técnica não
supervisionada, foi utilizada a correlação de Pearson.
O algoritmo RFE opera construindo modelos de classificação que são treinados
com recursivos subconjuntos de variáveis de entrada do conjunto de dados de
treinamento, e seleciona aquelas variáveis cujo desempenho do modelo é maximizado
e medido por meio de uma métrica previamente estabelecida.
A técnica ANOVA é usada para determinar o poder preditivo quantitativo dos
fatores de influência. Ela consiste em uma análise estatística, F-teste, realizada em
um conjunto de dados de referência para conhecer as características das variáveis. A
ideia por trás da ANOVA / F-teste é selecionar as variáveis levando em consideração
a distribuição do conjunto de dados e selecionar aquelas mais relacionadas à variável
de classificação.
O valor do F-teste é usado como parâmetro estatístico para determina se um
grupo de variáveis é conjuntamente significativo. Esse valor é usado em combinação
com o p-value, onde valores individuais de cada variável revelam o quanto elas são
estatisticamente significativas em relação à variável de classificação. Se o teste não
identificar significância estatística (p-value < 0.05) de alguma variável, então, essa
variável possui baixo poder preditivo, podendo ser excluída do conjunto de dados
(SHAKEELA et al., 2021).
Dessa forma, dado um conjunto de dados D contendo n linhas, submetido ao
processo de seleção de variáveis por meio de ANOVA / F-teste, e sendo k o número
de variáveis. Suponha que yij contenha a jesima linha da variável i e 𝑦̅𝑖 a média de i. A
média geral do conjunto de dados é representada por 𝑦̅. Seja ni o número de todos os
valores no grupo.
O F-teste consiste na relação algébrica entre as somas dos erros quadráticos,
identificados por Sa e Se, onde o primeiro é a soma dos erros quadrado considerando
42

a média total da amostra em relação à média da variável i, ponderada pelo tamanho


de cada grupo. Portanto Sa para o conjunto de dados D é dado por:
𝑘

𝑆𝑎 (𝐷) = ∑ 𝑛𝑖 (𝑦̅𝑖 − 𝑦̅)2


𝑖=1

Equação (5)
O segundo termo, Se, é a soma do erro quadrático de todos os valores em
comparação com a média geral. E algebricamente dado por:
k
𝑛𝑖
2
Se (D) = ∑ ∑(y𝑖𝑗 − y̅𝑖 )
𝑗=1
𝑖=1

Equação (6)
Assim, o F-teste é calculado por:
Se (D) ∕ (k − 1)
F(D) =
Sa (D) ∕ (n − k)
Equação (7)
Assim, uma vez obtido o valor do F-teste, determina-se a probabilidade p-value,
que é a métrica estatística utilizada como filtro para seleção das variáveis de entrada.
Por fim a correlação de Pearson (ρ), linear ou correlação cruzada, que mede o
grau da correlação entre duas variáveis, x e y, a partir de suas variâncias e
covariâncias, sendo definida por:
𝑐𝑜𝑣(𝑥. 𝑦)
ρ=
√𝑣𝑎𝑟(𝑥). 𝑣𝑎𝑟(𝑦)
Equação (8)

2.4 Mapeamento de suscetibilidade e aprendizado de máquina


Para compreender os processos de utilização das técnicas de aprendizado de
máquina que, em última instancia, são métodos estatísticos para modelagem de
suscetibilidade a escorregamentos, foi necessário incorporar o conceito proposto por
Guzzetti et al. (2005) que define suscetibilidade em linguagem matemática, como a
probabilidade de ocorrência espacial de falhas em taludes, dado um conjunto de
condições geoambientais.
De acordo com Bui et al. (2020) nos últimos anos há um crescimento no uso de
métodos de aprendizado de máquina para elaboração dos mapas de suscetibilidade
43

e, na maioria dos casos o uso desses métodos apresenta melhor desempenho que os
métodos que não os utilizam, sobretudo por sua capacidade de lidar com dados não
lineares em diferentes escalas e provenientes de diferentes fontes. Os fatores
predisponentes usualmente utilizados são mapas geológicos, geomorfológicos, bem
como atributos da região, obtidos de um Modelo Digital de Elevação (MDE), como por
exemplo elevação, declividade, curvaturas vertical e longitudinal, entre outros
(GUZZETTI et al., 1999; PRADHAN; LEE, 2010; REICHENBACH et al., 2018).
O trabalho de Reichenbach et al. (2018) confirma que essa teoria é sustentada
por diversos métodos e abordagens, sendo todos, apesar das diferenças, baseados
nas mesmas suposições. Em primeiro lugar, a suscetibilidade deixa sinais discerníveis
que podem ser reconhecidos, classificados e mapeados em campo ou por meio de
análise de imagens de sensoriamento remoto. Além disso, os escorregamentos de
terra e sua ocorrência são controlados por leis físicas que podem ser analisadas
empiricamente, estatisticamente ou deterministicamente e as condições que os
causam (ou seja, seus fatores de instabilidade) direta ou indiretamente, podem ser
coletadas e usadas para construir modelos preditivos de ocorrência de
escorregamentos.
Neste trabalho os autores levantaram que as primeiras tentativas de avaliar por
meio de métodos estatísticos a suscetibilidade a escorregamentos ocorreram em
meados dos anos 1970. Desde então, foram centenas de publicações, de pesquisas
realizadas em mais de sessenta países e nos sete continentes abordando os mais
diversos cenários e métodos para diferentes condições climáticas e geológicas.
Assim, é incontestável que a contribuição dos métodos estatísticos para confecção
dos mapas de suscetibilidade e a aplicação de técnicas de aprendizado de máquina
tem crescido nas últimas décadas, despontando como uma alternativa eficaz e
eficiente.
Diversos são os estudos na literatura sobre o uso de aprendizado de máquina
e mapas de suscetibilidade com o intuito de aprimorá-los. Alguns desses trabalhos
são apresentados como resultado da revisão sistemática que embasou esta pesquisa,
em especial aqueles que utilizam o método de aprendizado de máquina aqui utilizado.

2.5 Revisão sistemática da literatura


Com objetivo de construir uma visão ampla para esta pesquisa, incluindo
resultados relevantes e com um caráter imparcial em relação as referências
44

encontradas, optou-se por utilizar a revisão sistemática da literatura para identificar os


avanços do uso de técnicas de aprendizado de máquina no tratamento de
escorregamentos em especial o uso de redes neurais para mapeamento de
suscetibilidade no Brasil e no mundo. Além disso buscou-se identificar as principais
técnicas, fatores de entrada utilizados na análise e a acurácia média obtida por esses
modelos, para uso no estudo de caso realizado por este estudo.
A condução da revisão sistemática foi feita em dois momentos. Inicialmente
para elaboração de um artigo, cujo objetivo foi mapear a evolução do uso de técnicas
de aprendizado de máquina como ferramenta para lidar com escorregamentos no
Brasil e no mundo. Esse artigo foi feito em parceria de outros colaboradores, foi
publicado no XII Simpósio Internacional de Escorregamentos em Cartagena-
Colômbia, e está disponível no Apêndice A.
Posteriormente, após a definição do problema, foi realizada uma revisão
sistemática, onde as principais motivações são: identificar qualquer lacuna de
conhecimento no atual estágio da pesquisa de modo a sugerir áreas para futuros
estudos e fornecer um panorama global sobre determinado conteúdo de modo a
posicionar adequadamente novas atividades de pesquisas (KITCHENHAM, 2004).
Sendo assim, segue o protocolo da pesquisa, cujas diretrizes da revisão foram
baseadas em Kitchenham et al. (2009) e Milan, Spinola e Carvalho (2019).

PROTOCOLO DE PESQUISA
1) Objetivo

O objetivo dessa revisão sistemática foi: Identificar os avanços do uso de


técnicas de aprendizado de máquina no tratamento de escorregamentos em especial
o mapeamento de suscetibilidade no Brasil e no mundo. Além disso buscou-se
identificar as principais técnicas, fatores de entrada utilizados na análise e a acurácia
média obtida por esses modelos.
2) Questões de Pesquisa

A questão de pesquisa teve como objetivo principal direcionar a seleção dos


estudos e os dados extraídos de cada um deles. Ao final da execução do protocolo, a
questão deve ser respondida utilizando os estudos encontrados. Neste trabalho, a
questão central é: Como o uso de técnicas de aprendizado de máquina vem sendo
aplicadas em deslizamento nos últimos anos?
45

E o desmembramento dessa pergunta levou às seguintes questões:


- Quais as técnicas de aprendizado de máquina utilizadas;
- Quais os fatores predisponentes mais utilizados na análise, e por fim, qual a
acurácia média obtida por essas técnicas.
3) Critérios de Seleção

O primeiro critério é que somente foram aceitos trabalhos escritos em inglês e


publicados em eventos científicos e journals (45). Para cada um dos estudos
encontrados, foram aplicados critérios de inclusão e exclusão. Esses critérios ajudam
a selecionar apenas estudos que, a critério do pesquisador, podem contribuir para o
seu estudo, dessa forma eles devem estar alinhados com as questões de pesquisa.

Quadro 2 - Critérios de inclusão e exclusão

Núm. Critério Descrição


I1 Inclusão Claramente mencionam o uso de técnicas de
aprendizado de máquina para elaboração de
mapas de suscetibilidade
I2 Inclusão Discutam conceitualmente as técnicas de
aprendizado de máquina, explicitando os fatores de
entrada dos algoritmos e técnicas utilizadas
I3 Inclusão Foram incluídos estudos publicados a partir de
janeiro de 2015
E1 Exclusão Texto completo do artigo não disponível em
meio eletrônico
E2 Exclusão Não relacionados ao tema da revisão
E3 Exclusão Abordem o tema superficialmente
E4 Exclusão Foram excluídos estudos duplicados
Fonte: Elaborado pelo Autor (2021)

4) Procedimento de Pesquisa

EXECUÇÃO DO PROTOCOLO DE PESQUISA


1) Identificação dos artigos - Confecção das Strings de Consulta
2) Seleção dos Estudos Primários

Observadas as premissas acima, bem como a condução da revisão da


literatura sobre a aplicação de redes neurais para elaboração de mapas de
suscetibilidade, foram identificados os trabalhos mais recentes e relevantes da área
como, por exemplo, o estudo de Bragagnolo; Silva; Grzyboswki (2020) que, utilizando
um modelo de RNA, elaboraram mapas de suscetibilidade para as cidades do Rio de
46

Janeiro e Porto Alegre. Em ambos os municípios, as redes obtiveram desempenho


próximos à média estimada na RSL (seção 4.1), quando da identificação de áreas de
suscetibilidade, sendo capazes de identificar todos os registros com os dados de teste,
sem falsos positivo ou negativo, sendo assim capazes de aprender e generalizar sua
aplicabilidade. Esse desempenho foi confirmado com a rede treinada e submetida a
um conjunto de dados que não o de treinamento, onde 85.5% e 92.1% das
manifestações foram identificadas respectivamente para os municípios de Porto
Alegre e Rio de Janeiro. Resultados superiores aqueles produzidos pelos mapas
divulgados pelos órgãos estaduais.
Como resultado do exame minucioso da literatura sobre RNA aplicados aos
mapas de suscetibilidade, os seguintes constructos (46) foram considerados para a
elaboração do modelo teórico (Seção 3.4.1) que fundamenta as questões da pesquisa
e as suas proposições:

Quadro 3 - Constructos

Constructos
1. Relacionados a movimento O que são movimentos de massa
de massa e suscetibilidade Quais as causas dos movimentos de massa
2. Relacionados ao Definições e tipos de aprendizado de máquina
aprendizado de máquina Redes neurais artificiais
3. Relacionados ao Mapas de suscetibilidade com redes neurais.
mapeamento de Mapas de suscetibilidade com outras técnicas de AM.
suscetibilidade e técnicas de Métricas de avaliação de desempenho das técnicas de
aprendizado de máquina: AM.
Principais fatores predisponentes envolvidos no
fenômeno.
Fonte: Elaborado pelo autor (2020)
Os constructos são utilizados na elaboração do modelo teórico (Seção 3.4.1),
que por sua vez é a base do modelo de análise (Seção 3.4.2Erro! Fonte de
referência não encontrada.).
A revisão sistemática tem o objetivo identificar e sintetizar a literatura sobre um
tema, através de procedimentos replicáveis e transparentes (LITTELL; CORCORAN;
PILLAI, 2008). Kitchenham (2004) reforça que a revisão sistemática tem também
como função melhorar cientificamente a validade de afirmações que podem ser feitas
no campo e, consequentemente, o grau de confiabilidade dos métodos. Este autor
divide o processo de revisão sistemática em 3 fases principais:
47

1) Planejamento: Fase composta pelas etapas de identificação da necessidade


da revisão, desenvolvimento de uma proposta de revisão e elaboração de um
protocolo de pesquisa;

2) Execução: Fase responsável pela identificação das fontes de pesquisa,


extração dos dados, seleção dos estudos primários, avaliação da qualidade e
relevância dos trabalhos selecionados no contexto de interessa;

3) Síntese: Fase responsável pela seleção final dos trabalhos, análise e síntese
dos resultados, elaboração de conclusão e recomendações, e apresentação
dos resultados.

As fases de planejamento com o protocolo da revisão e síntese com a análise


dos resultados e as considerações finais da revisão sistemática estão presentes nas
seções seguintes. A fase de execução se encontra no Apêndice B.

2.5.1 Planejamento da Revisão Sistemática


Inicialmente, esta etapa tem como objetivo encontrar os avanços do uso de
técnicas de aprendizado de máquina no tratamento de escorregamentos em especial
o mapeamento de suscetibilidade no Brasil e no mundo. Além disso buscou-se
identificar as principais técnicas, fatores de entrada utilizados na análise e a acurácia
obtida por esses modelos.
Em seguida, delimitou-se seu escopo à elaboração de mapas de
suscetibilidade por meio do algoritmo de backpropagation das redes neurais.
Sendo assim, a revisão sistemática procura identificar estudos que possam
auxiliar na resposta à questão principal da pesquisa (ver seção 1.2):
- Como elaborar mapas de suscetibilidade a escorregamentos utilizando redes
neurais artificiais?
E o desmembramento dessa pergunta levantou a seguinte questão:
- Como identificar os fatores predisponentes mais relevantes em um
mapeamento de suscetibilidade com redes neurais.
A questão de pesquisa foi decomposta e organizada utilizando a estratégia
PICO de Petticrew e Roberts (2006). PICO representa um acrônimo para Population,
Intervention, Comparison e Outcome.
População: trabalhos que utilizam aprendizado de máquina para a gestão de
escorregamentos.
48

Intervenção: abordagens, métodos ou técnicas de elaboração de mapas de


suscetibilidade em contextos de escorregamentos.
Controle: os estudos base de apoio à revisão sistemática têm origem na
pesquisa exploratória, realizada por meio de consulta bibliográfica de artigos
publicados em periódicos, obtidas por consultas em base de dados eletrônica Scopus
(http://scopus.com/) e Web of Science (www.webofknowledge.com). As referências
utilizadas para definição da abrangência do tema pesquisado e que serviram de base
para escolha das palavras chaves, fontes e períodos de busca foram:
 Reichenbach, P. et al. (2018);

 Bragagnolo, L. et al. (2020);

 Bui, D. et al. (2016);

 Guzzetti, F. et al. (1999).

Essas referências foram obtidas na análise exploratória inicial para esta


pesquisa, e são detalhadas no 48.

Quadro 4 - Artigos base para a revisão


# Ano Título Autores Base Eletrônica
1 2018 A review of statistically-based landslide REICHENBACH, Web of Science
susceptibility models. P. et al.
2 2020 Artificial neural network ensembles applied to BRAGAGNOLO, Scopus
the mapping of landslide susceptibility L. et al.
3 2016 Spatial prediction models for shallow landslide BUI, D. et al. Scopus
hazards: a comparative assessment of the
efficacy of support vector machines, artificial
neural networks, kernel logistic regression, and
logistic model tree.
4 1999 Landslide hazard evaluation: a review of current GUZZETTI, F. et Web of Science
techniques and their application in a multi-scale al.
study, Central Italy.
Fonte: Elaborado pelo autor (2021)

Resultados: visão abrangente dos estudos propostos na literatura que tratam


de forma sistemática a elaboração de mapas de suscetibilidade com técnicas de
aprendizado de máquina no contexto de escorregamentos.
 Critérios de seleção das bases de busca:

A escolha das fontes de busca foi feita utilizando os seguintes critérios:


49

a) Bibliografias da análise exploratória;

b) Revisões Sistemáticas anteriores;

c) Bases bibliográficas indexadas na internet;

d) Motores de busca que indexam diversas bases bibliográficas;

e) A base de busca deve conceder acesso ao texto completo e na íntegra


dos artigos.

f) Fontes híbridas que indexam artigos próprios e artigos de outras bases


bibliográficas;

 Lista das bases de busca:

As bibliotecas digitais Web of Science™ e Scopus™ foram as bases de dados


utilizadas, por serem reconhecidas mundialmente pela produção literária de alta
qualidade e por incluírem as principais revistas literárias e eventos científicos no
campo das engenharias. As buscas nas bases de dados ocorreram em 20 de
dezembro de 2019 e a seleção foi inicialmente conduzida em três etapas descritas na
seção de execução do protocolo de pesquisa. Também foram incluídos outros
trabalhos que elaboram mapas de suscetibilidade com o algoritmo de aprendizado
backpropagation para redes neurais, esses trabalhos resultam da revisão exploratória
realizada no período posterior à da RSL.
 Idioma dos trabalhos:

Com base nas fontes escolhidas, o idioma inglês foi o utilizado pois trata-se
daquele com maior aceitação internacional para os trabalhos científicos da área.
 Palavras-chave:

As palavras-chave utilizadas na pesquisa procuraram identificar os artigos com


base em três conjuntos de strings em todos os campos pertinentes nas bases de
dados. O primeiro conjunto de strings visava buscar artigos que tratasse de aplicações
de aprendizado de máquina nos escorregamentos. O segundo, buscava destacar a
relevância numérica das publicações sobre predição de escorregamentos. Por fim as
duas strings anteriores foram utilizadas para identificação das publicações referentes
ao uso de técnicas de aprendizado de máquina para predição de escorregamentos,
conforme apresentado no 50.
50

Recorreu-se aos operacores logicos “AND” e “OR” para combinação das


palavras-chave.

Quadro 5 - Strings para busca no Web of Science™ e Scopus™.

1. (“big data” OR "machine learn*") AND (“landslid*”)

2. ("landslid*") AND ("forecast*" OR "predict*")

3. (“big data” OR "machine learn*") AND (“landslid*”) AND ("forecast*" OR "predict*")

Fonte: Elaborado pelo autor (2021)

 Estratégia para identificação dos trabalhos:

Busca manual:

A busca manual é realizada por meio da aplicação da técnica de Pearl Growing


(SCANNAVINO et al., 2017), que utiliza a lista de citações e referências dos estudos
aceitos após a segunda ou terceira avaliação, com o objetivo de identificar novos
estudos.
Busca automática:

A busca automática é realizada por meio da aplicação da string de busca e


suas variações nas bases de busca selecionadas.
Inicialmente foram utilizadas as duas formas de busca para identificação dos
trabalhos onde, diante dos contínuos avanços das técnicas de aprendizado de
máquina, foram considerados artigos dos últimos cinco anos, entre os meses de
janeiro de 2015 e dezembro de 2019, escritas em inglês e publicados em eventos
científicos e revistas indexados nas bibliotecas digitais Web of Science™ e Scopus™.
Estabelecidas essas premissas as buscas automáticas ocorreram em 20 de dezembro
de 2019, e seleção final foi conduzida em três etapas. O resultado dessa revisão foi
um artigo apresentado virtualmente no XII Simpósio Internacional de Escorregamento
em Cartagena-Colômbia, apresentado no ANEXO A.
Em seguida, e fazendo uso da busca manual, uma quarta etapa foi realizada
somente para seleção dos trabalhos necessários para essa pesquisa visto que as três
primeiras tiveram um caráter mais amplo na aplicação de aprendizado de máquina em
escorregamentos e esta pesquisa restringe-se à elaboração de mapas de
suscetibilidade por meio do algoritmo de backpropagation das redes neurais.
51

 Critérios de inclusão e exclusão dos trabalhos:

Na revisão sistemática, os critérios de inclusão e exclusão, limitam a seleção


dos trabalhos conforme sua relevância para o objetivo da pesquisa.
Esses critérios ajudam a selecionar apenas estudos que, a critério do
pesquisador, podem contribuir para o seu estudo, dessa forma eles devem estar
alinhados com as questões de pesquisa. Portanto, com base em avaliações
qualitativas foram definidos os seguintes critérios apresentados no 51:

Quadro 6 - Critérios de inclusão e exclusão

Núm. Critério Descrição


I1 Inclusão Claramente mencionam redes neurais na
elaboração de mapas de suscetibilidade
I2 Inclusão Discutam conceitualmente as técnicas de
aprendizado de máquina, explicitando os
fatores de entrada dos algoritmos, bem como as
métricas de avaliação de desempenho
E1 Exclusão Não relacionados ao tema da revisão
E2 Exclusão Trabalhos que não abordem mapeamento de
suscetibilidade por meio de redes neurais por
backpropagation
Fonte: Elaborado pelo autor (2021)
Cabe ressaltar que alguns artigos foram considerados relevantes para o
trabalho e, portanto, fazem parte da sua fundamentação, mesmo não pertencendo à
lista de resultados da pesquisa sistemática. Esses trabalhos foram adicionados, por
exemplo, por meio da busca manual.

 Estratégia para seleção dos trabalhos:

Todos os trabalhos retornados pelas buscas são devidamente documentados


em tabelas específicas para cada fonte de busca. Após essa documentação, é
realizada a primeira avaliação destes trabalhos por meio da leitura de seus títulos,
resumos e palavras-chave, e considerando os critérios de inclusão e exclusão
definidos no protocolo.
Na sequência, e considerando os mesmos critérios, é realizada uma segunda
avaliação por meio da leitura da introdução e conclusão dos estudos que passaram
52

pela primeira avaliação. Na terceira etapa, considerando os mesmos critérios, é


realizada uma terceira avaliação por meio da leitura completa dos estudos que
passaram pela segunda avaliação. Até aqui tem-se os trabalhos selecionados para o
artigo do Apêndice A.
Por fim, é aplicado os critérios de exclusão E1 e E2 para restringir os trabalhos
de interesse dessa pesquisa, que são aqueles que tratam da elaboração de mapas
de suscetibilidade por meio do algoritmo de backpropagation das redes neurais.

 Resumo dos resultados:

Após a leitura minuciosa e completa dos trabalhos incluídos, é elaborado um


resumo comparativo entre eles, destacando os métodos ou técnicas utilizadas,
mostrando como eles se inter-relacionam, como respondem, ou ajudam a responder,
a pergunta de pesquisa e como podem contribuir para o estudo dessa dissertação.
Com os resultados obtidos, deverá ser redigida uma análise geral que descreve
sinteticamente as análises críticas elaboradas pelo pesquisador. Análises qualitativas
com relação aos trabalhos pesquisados e algumas considerações sobre os resultados
observados nos trabalhos selecionados.

2.5.2 Síntese da revisão sistemática


O 52 apresenta um resumo comparativo dos trabalhos considerados válidos na
revisão, findadas as avaliações, enfatizando as características das abordagens, além
dos principais pontos de divergência e convergência identificados na leitura detalhada
destes trabalhos.

Quadro 7 - Trabalhos selecionados na síntese da revisão sistemática


# Autores Base Origem
Ano Título
Eletrônica
1 2019 A novel performance assessment SEVGEN E. et Scopus RSL
approach using photogrammetric al. (dissertação)
techniques for landslide
susceptibility mapping with logistic
regression, ann and random forest
2 2019 A shallow slide prediction model PRADHAN A. et Scopus RSL
combining rainfall threshold al. (dissertação)
warnings and shallow slide
susceptibility in Busan, Korea
3 2019 Optimizing the predictive ability of WANG Y. et al. Scopus RSL
machine learning methods for (dissertação)
landslide susceptibility mapping
using smote for Lishui city in
Zhejiang province, China
53

# Autores Base Origem


Ano Título
Eletrônica
4 2019 Mine landslide susceptibility LUO X. et al. Web of RSL
assessment using IVM, ANN and Science (dissertação)
SVM models considering the
contribution of affecting factors
5 2019 Random forest and artificial neural DE OLIVEIRA Web of RSL
networks in landslide susceptibility G. et al. Science (dissertação)
modeling: a case study of the Fão
River Basin, Southern Brazil.
6 2018 A comparison of five methods in GE, Y. et al. Scopus RSL
landslide susceptibility (dissertação)
assessment: a case study from the
330-kV transmission line in Gansu
Region, China.
7 2018 Landslide susceptibility MERGHADI A. Scopus RSL
assessment at Mila basin et al. (dissertação)
(Algeria): A comparative
assessment of prediction
capability of advanced machine
learning methods
8 2018 Landslide susceptibility modeling ZHOU C. et al. Scopus RSL
applying machine learning (dissertação)
methods: A case study from
Longju in the Three Gorges
Reservoir area, China
9 2017 Landslide spatial modeling: CHEN W. et al. Scopus RSL
Introducing new ensembles of (dissertação)
ANN, MaxEnt, and SVM machine
learning techniques
10 2016 Spatial prediction models for BUI, D. et al. Scopus RSL
shallow landslide hazards: a (dissertação)
comparative assessment of the
efficacy of support vector
machines, artificial neural
networks, kernel logistic
regression, and logistic model
tree.
11 2015 Landslide Occurrence Prediction AL-BATAH M. et Scopus RSL
Using Trainable Cascade Forward al. (dissertação)
Network and Multilayer Perceptron
12 2020 Artificial neural network ensembles BRAGAGNOLO, Pearl Growing RSL
applied to the mapping of landslide L. et al. (Scopus) (dissertação)
susceptibility
13 2020 Comparing the prediction BUI, D. et al. Pearl Growing RSL
performance of a Deep Learning (Web of (dissertação)
Neural Network model with Science)
conventional machine learning
models in landslide susceptibility
assessment.
14 2010 Regional landslide susceptibility PRADHAN, B.; Pearl Growing RSL
analysis using back-propagation LEE, S. (Web of (dissertação)
neural network model at Cameron Science)
Highland, Malaysia.
15 2009 Landslide susceptibility mapping KAWABATA, D.; Pearl Growing RSL
using geological data, a DEM from BANDIBAS, J. (Web of (dissertação)
ASTER images and an Artificial Science)
Neural Network (ANN).
54

# Autores Base Origem


Ano Título
Eletrônica
16 2019 A comparative study of support ABEDINI, M. et Web of RSL
vector machine and logistic model al. Science (Apêndice A)
tree classifiers for shallow landslide
susceptibility modeling.
17 2018 Mapping landslide susceptibility TAALAB, K.; Scopus RSL
and types using Random Forest. CHENG, T.; (Apêndice A)
ZHANG, Y.

18 2017 A comparative study of logistic CHEN, W. et al. Scopus RSL


model tree, random forest, and (Apêndice A)
classification and regression tree
models for spatial prediction of
landslide susceptibility.
Fonte: Elaborado pelo autor (2021)
As RNA estão entre os métodos de aprendizado de máquina mais utilizados
para análise de suscetibilidade de forma eficiente e para os mais diversos tipos de
escorregamentos.
Bragagnolo, Silva, Grzyboswki (2020), utilizando métodos ensemble de uma
RNA elaboraram mapas de suscetibilidade para os municípios do Rio de Janeiro e
Porto Alegre. Um método ensemble é uma forma de combinar possíveis saídas de
diversos modelos de AM para alcançar uma maior desempenho (AGGARWAL, 2018).
Em ambos os municípios, as redes obtiveram desempenho superior a 85% na
identificação de áreas de suscetibilidade, sendo capazes de detectar todos os
registros com os dados de teste, sem falsos positivo ou negativo, sendo assim
capazes de aprender e generalizar sua aplicabilidade. Esse desempenho foi
confirmado com a rede treinada e submetida a um conjunto de dados que não o de
treinamento, onde 85,5% e 92,1% das manifestações foram identificadas
respectivamente para os municípios de Porto Alegre e Rio de Janeiro. São resultados
superiores àqueles produzidos pelos mapas divulgados pelos órgãos estaduais,
conforme demonstrado nas Figuras 55 e 55.
55

Figura 14 – Mapa de suscetibilidade (a) gerada pela rede neural e exibindo os locais de evento de
escorregamentos ocorridos em Porto Alegre e (b) mapa de suscetibilidade produzido pelo Serviço
Geológico do Brasil da Companhia de Pesquisa de Recursos Minerais (CPRM)

Fonte: (BRAGAGNOLO; SILVA; GRZYBOWSKI, 2020)

Figura 15 – Mapa de suscetibilidade (a) gerada pela rede neural e exibindo os locais de evento de
escorregamentos ocorridos no Rio de Janeiro e (b) mapa de suscetibilidade produzido pela Fundação
Instituto de Geotécnica – Geo-Rio

Fonte: (BRAGAGNOLO; SILVA; GRZYBOWSKI, 2020)

Por outro lado, Bui et al. (2020) compararam sua implementação de RNA, que
denominaram Deep Learning Neural Network (DLNN) com outras técnicas, Support
Vector Machine (SVM), Randon Forest (RF), C4.5 (um algoritmo de árvore de decisão)
e por fim, uma Multi-Layer Perceptron Neural Network (MLP-NN). Esse trabalho foi
realizado com dados da província de Kon Tum no Vietnam e foram utilizados nove
fatores predisponentes (elevação, ângulo de declive, aspecto, uso da terra, índice de
vegetação, tipo de solo, distância de falhas, distância de fronteiras geológicas e
56

cobertura litológica), bem como uma amostra de 1657 localizações. Para o escopo
desse trabalho, os fatores de maior relevância para predição foram elevação e
declividade. Outro resultado relevante é que os modelos de árvore de decisão (RF e
C4.5) obtiveram maior desempenho durante a fase de treinamento. No entanto, na
etapa de predição, as redes neurais foram mais acuradas, sendo a DLNN a mais
satisfatória.
As avaliações de desempenho pelas quais as técnicas de aprendizado de
máquina foram submetidas, são métricas estatísticas utilizadas para avaliar o
aprendizado e capacidade de predição das técnicas utilizadas pelos autores. Como
descrito no trabalho de Sokolova, Japkowicz e Szpakowicz (2006), em cenários de
classificação, as métricas são calculadas a partir da quantidade de predições
realizadas pela técnica em relação ao que de fato ocorreu, aqui dado pela incidência
de escorregamento ou não. Assim, os seguintes indicadores são definidos pelas
quantidades detectadas de falso positivo (FP) e falso negativo (FN), quantidades de
verdadeiro positivo (VP) e verdadeiro negativo (VN):
 Sensibilidade, é a capacidade da técnica de AM detectar casos positivos,
ou seja, a incidência de escorregamentos, dentre os eventos de fato
ocorridos. Algebricamente a sensibilidade é dada por:

𝑉𝑃
𝑆𝑒𝑛𝑠𝑖𝑏𝑖𝑙𝑖𝑑𝑎𝑑𝑒 = (𝑉𝑃+𝐹𝑁)

Equação (9)
 Especificidade, complementa a sensibilidade e corresponde as frações
das predições de não ocorrências do evento (escorregamentos) e as não
incidências reais do evento, cuja relação matemática é:

𝑉𝑁
𝐸𝑠𝑝𝑒𝑐𝑖𝑓𝑖𝑐𝑖𝑑𝑎𝑑𝑒 = (𝑉𝑁+𝐹𝑃)

Equação (10)
Vale destacar que esses indicadores de sensibilidade e especificidade, avaliam
a capacidade de predição das técnicas de AM, independentemente da amostra
analisada. Por outro lado, os próximos indicadores são influenciados pela ocorrência
do evento na amostra que está sendo avaliada. O primeiro deles é o valor preditivo
positivo (VPP) ou precisão, que é a probabilidade de um ponto específico avaliado
como positivo (ocorrer escorregamento) realmente acontecer. Sua contraparte é o
valor preditivo negativo (VPN) ou precisão inversa, sendo a probabilidade de um ponto
57

específico avaliado como negativo (não-ocorrência de escorregamentos) não haver


escorregamento realmente.
Esses indicadores são descritos matematicamente nas equações 11 e 12.

𝑉𝑃
𝑉𝑃𝑃 = (𝑉𝑃+𝐹𝑃)

Equação (11)
𝑉𝑁
𝑉𝑃𝑁 = (𝑉𝑁+𝐹𝑁)

Equação (12)
 Acurácia, é a proporção de casos (ocorrência e não ocorrência) de
escorregamentos corretamente previstos em relação a todas as
predições, equação 13.

𝑉𝑃+𝑉𝑁
𝐴𝑐𝑢𝑟á𝑐𝑖𝑎 = (𝑉𝑃+𝐹𝑃+𝑉𝑁+𝐹𝑁)

Equação (13)
Entende-se aqui como métrica, as medidas brutas, atômicas, de simples
composição e que servem de subsídio aos indicadores. Valores, pesos, volumes, e
quantidades ou outro formato quantitativo são exemplos de formatos das métricas. No
contexto dessa pesquisa as métricas são as quantidades de predições realizadas pela
rede neural. Por outro lado, os indicadores são medidas calculadas, decompostos a
partir das métricas e relacionados ao desempenho da RNA.
A 58 apresenta as métricas e indicadores estatísticos das técnicas de
aprendizado de máquina quando submetidos aos dados de validação.
A DNLL teve desempenho superior na sensibilidade, no balanço médio entre
erros e acertos, ou seja, o valor médio absoluto entre as taxas de erro e acerto (|PPV-
NPV|) e principalmente na acurácia que a destacou como a melhor das técnicas para
o cenário analisado. E, embora os resultados obtidos tenham sido satisfatórios para
todos as técnicas utilizadas, isto é, com acurácia acima de 80%, somente a DNLL
superou os 90%.
58

Tabela 1 – Desempenho da predição da RNA em comparação com outras técnicas de aprendizado


de máquina com uso do conjunto de dados de validação
Métrica/Indicador DLNN MLP-NN SVM C4.5 RF
VP 1392 1553 1570 1483 1612
VN 1554 1286 1259 1268 1093
FP 235 74 57 144 15
FN 73 341 368 359 534
VPP (%) 85.56 95.45 96.50 91.15 99.08
NPV (%) 95.51 79.04 77.38 77.93 67.18
Sensibilidade (%) 95.02 82.00 81.01 80.51 75.12
Especificidade (%) 86.86 94.56 95.67 89.80 98.65
Acurácia (%) 90.53 87.25 86.94 84.54 83.13
Fonte: Baseado em Bui et al. (2020)

Na região de Cameron Highlands, na Malásia, em uma área de 293 Km²


Pradhan e Lee (2010), a partir de um inventário de 324 cicatrizes e com um modelo
de rede neural, utilizando o algoritmo de backpropagation, o mesmo utilizado nesse
trabalho, obtiveram uma acurácia de 83%, sendo a declividade, identificada como o
fator de maior relevância.
Kawabata e Bandibas (2009) também utilizaram o algoritmo backpropagation
para modelar áreas suscetíveis em Chuetsu, município de Niigata no Japão, a partir
das ANNs. Dois MDEs foram considerados, com seis fatores de entrada, e uma
arquitetura de rede formada por 40 neurônios na camada oculta e dois dados de saída.
A acurácia de ambos os mapas foi superior a 90%.
Todos esses casos exemplificam a capacidade e a potencialidade das RNAs
para mapeamentos da suscetibilidade a escorregamentos, independente da estrutura
da rede, dos parâmetros utilizados ou dos processos de amostragem em si.
Assim como as redes neurais, os modelos de random forest são amplamente
utilizadas por diversos autores como Chen et al. (2017), Riffel (2017) e Taalab, Cheng
e Zhang (2018).
Riffel (2017) elaborou o MDE utilizando dados do Serviço Geológico dos
Estados Unidos, e com informações da bacia hidrográfica do rio Forromeco, região
nordeste do estado do Rio Grande do Sul, utilizou os modelos de RF e Shallow
Landslide Stability Analysis (Shalstab). Nesse caso, o RF apresentou acurácia,
medida por meio do índice Kappa, de 98%, valor superior ao modelo Shalstab que
obteve 82% de acurácia. Em um estudo comparativo Chen et al. (2017), na província
59

de Shaanxi, China, com doze fatores de entrada e 171 localidades para mapeamento
de suscetibilidade, fez uso de três métodos de aprendizado de máquina e obtiveram
84% de acurácia com o modelo de RF, desempenho superior aos demais, Logistic
model tree e Classification and regression trees.
Finalmente, Taalab, Cheng e Zhang (2018) mapearam áreas suscetíveis em
larga escala, na região de Piemonte, na Itália, uma região heterogênea e com diversos
tipos de escorregamentos, também utilizando RF como método de aprendizado de
máquinas, e a acurácia obtida foi de 85%. Todos esses trabalhos demonstram RF
também como um método adequado para este tipo de estudo.
Por fim, há o modelo SVM, que segundo Merghadi et al. (2020), está entre os
modelos de aprendizado de máquina mais utilizados desde 2010, sobretudo por conta
do seu bom desempenho e simplicidade.
Na cidade de Kamyaran, província do Curdistão, Irã Abedini et al. (2019)
analisando 60 localidades e 21 fatores, utilizando o método SVM obtiveram uma
acurácia de 85%, desempenho superior aquele obtido com o método de árvore de
modelo logístico, cuja acurácia foi de 82%. Acurácia acima de 90% foi obtida por Ge
et al. (2018) com o mesmo modelo quando o confrontaram com outras quatro técnicas,
dentre elas redes neurais artificiais com backpropagation, na região de Longnan
cidade localizada na província de Gansu – China, com 10 fatores de entrada.
Conforme demonstrando na revisão sistemática para esse trabalho, ANEXO A,
e reforçado por Reichenback et al. (2018), nos mapeamentos de suscetibilidade a
escorregamento, existem dezenas de fatores possíveis que podem ser utilizados
como entrada para os modelos de aprendizado de máquina, sendo que em média são
utilizados nove.
Os autores propõem um agrupamento por similaridade desses atributos em
fatores geológicos, hidrológicos, cobertura do solo, morfológicos e outros, com maior
preponderância dos morfológicos. Dentre os fatores mais utilizados destaca-se:
declividade, geolitologia, aspecto, elevação, curvatura de encosta, bem como uso e
cobertura do solo.
Em sua maioria, as técnicas de aprendizado de máquina utilizadas para
mapeamentos de suscetibilidade a escorregamentos demonstram resultados
satisfatórios, com taxas de acerto variando entre 75% e 95%, dependendo da precisão
e resolução das bases de dados utilizadas, dos parâmetros, da estrutura do modelo e
60

do processo de amostragem, sendo este último um grande influenciador no


desempenho do modelo.

2.5.3 Análise dos resultados


A revisão sistemática foi inicialmente conduzida durante o mês de dezembro de
2019 e a seleção dos trabalhos foi conduzida em três etapas inicialmente. A primeira
etapa restringiu as publicações àquelas escritas em inglês e no período de janeiro de
2015 e dezembro de 2019, resultando em 387 trabalhos das fontes Web of Science™
e Scopus™.
Após a remoção dos trabalhos duplicados, restaram 226 artigos que
submetidos a primeira avaliação, por meio da leitura de seus títulos e resumos, e então
foram aplicados os critérios de inclusão e exclusão, resultaram nos 155 trabalhos
aceitos para análise inicial. Essa primeira revisão, teve como objetivo mapear os
avanços do uso de técnicas de aprendizado de máquina no tratamento de
escorregamentos no Brasil e no mundo. Esse trabalho resultou no artigo publicado no
XII Simpósio Internacional de Escorregamentos em Cartagena-Colômbia (ANEXO A).
Posteriormente, para elaboração dessa dissertação, uma quarta avaliação foi
realizada, com o intuito de restringir os trabalhos ao escopo dessa pesquisa. Assim,
os 155 artigos previamente selecionados, tiveram título, resumo, palavras-chave e
introdução avaliados para garantir que eles abordavam o aprendizado de máquina no
cenário de elaboração de mapas de suscetibilidade por meio da aplicação de redes
neurais artificiais do tipo backpropagation. Sendo assim, os critérios de exclusão E1 e
E2 foram aplicados, resultando nos 22 artigos escolhidos. Estes tiveram a leitura
completa e analisada, tendo sido selecionados 11 artigos para que assim pudessem
compor a síntese da pesquisa.
Além destes onze trabalhos escolhidos, foram acrescentados quatro trabalhos
encontrados e selecionados por meio da técnica manual Pearl Growing, dois por meio
das referências de uma das citações; um como resultado de consulta posterior ao
período da RSL de um autor com outros trabalhos relevantes e por fim um trabalho
que havia sido citado em uma publicação no período da RSL, mas cuja publicação
ocorreu somente no ano seguinte.
Segundo Felizardo et. al (2017), a técnica denominada Pearl Growing consiste
em investigar as referências utilizadas pelos artigos mais relevantes e dos principais
autores da área. Desta forma, alguns estudos que faziam parte da lista de referências
61

de trabalhos selecionados como relevantes das fontes anteriores foram incluídos


nesta etapa da revisão sistemática.
A 61 representa o resumo da revisão sistemática descrita anteriormente. São
apontadas as bases de busca com a amplitude da busca, período e quantidade de
artigos encontrados. Na sequência são descritas as fases intermediárias de seleção
dos estudos finalizando com a seleção final com a quantidade de estudos que vão
compor a síntese da revisão.
Figura 16 – Resumo da revisão sistemática

Fonte: Elaborado pelo autor (2021)

A partir da revisão sistemática realizada, pode-se afirmar que há um crescente


interesse no uso técnicas de aprendizado de máquina para elaboração de mapas de
suscetibilidade nos últimos anos e que a aplicação de redes neurais artificiais está
entre as principais técnicas utilizadas. No entanto, o Brasil é carente de estudos, o
que é corroborado com os poucos trabalhos encontrados.

2.6 Considerações finais do capítulo


No início deste capítulo, foram apresentados conceitos e teorias relativos aos
principais temas que permeiam a questão de pesquisa e que foram utilizados como
base para a estruturação do método proposto.
Em seguida, foram apresentados os principais conceitos, objetivos e
importância da revisão sistemática da literatura em um projeto de pesquisa. Após
conceituada a revisão sistemática, foram apresentadas a etapa de planejamento com
o protocolo da pesquisa, a síntese final com os artigos encontrados e selecionados
62

bem como uma análise geral dos resultados obtidos na execução. A etapa de
execução da revisão sistemática, foi descrita no Apêndice A.
Resumidamente, a revisão sistemática evidenciou o esforço da comunidade
científica nos últimos anos em propor soluções e alternativas para lidar com o
fenômeno dos escorregamentos, por meio de técnicas de aprendizado de máquina,
especialmente na elaboração dos mapas de suscetibilidade e na predição do evento.
Entretanto, especialmente no Brasil, o uso de técnicas de aprendizado de máquina
para mapeamento de áreas de risco de escorregamentos, ainda estão em
desenvolvimento.
Por fim, o artigo “A Systematic Review: Big Data Analytics and Landslides” que
contém os principais pontos descritos nessa revisão sistemática foi aceito no XIII
Simpósio Internacional de Deslizamentos, organizado pela International Society for
Soil Mechanics and Geotechnical Engineering (ISSMGE), Cartagena, Colômbia, e que
deveria ter ocorrido em fevereiro de 2020, mas por conta da pandemia do COVID-19,
somente ocorreu entre os dias 22 e 26 de fevereiro de 2021. Esse trabalho foi
importante para nortear o estudo de caso desta pesquisa uma vez que com ele foi
possível identificar as principais técnicas de aprendizado de máquina aplicadas ao
fenômeno de escorregamentos, bem como, para seleção dos fatores predisponentes.
O próximo capítulo trata do método de pesquisa elaborado a partir dos
elementos obtidos neste capítulo. Esse método objetiva a construção do roteiro que
conduzirá a execução da desta pesquisa.
63

3 MÉTODO DA PESQUISA
A relevância do método de uma pesquisa é fundamentada por uma sustentação
cientifica pertinente, qualificada pela busca da melhor abordagem para tratar as
questões da pesquisa, tais como métodos e técnicas inerentes para o seu
planejamento e desenvolvimento (MIGUEL, 2007). Neste capítulo são apontadas as
estratégias metodológicas utilizadas, explicando as principais atividades e recursos
para desenvolver a pesquisa e atender os objetivos propostos. No início, é
apresentada a escolha do método de pesquisa. A seguir estão a definição da pesquisa
e a construção do referencial teórico, estruturas e etapas do estudo de casos,
delimitação do escopo, roteiro do mapeamento de suscetibilidade, critérios utilizados
na seleção do local do estudo de caso, coleta dos dados e, encerrando o capítulo as
oportunidades para análises.

3.1 Escolha do método de pesquisa


De acordo com Dubois e Gadde (2002) “o principal objetivo de qualquer
pesquisa é confrontar a teoria com o mundo empírico”. Tendo esta afirmação como
norteadora deste trabalho, foi feita a escolha do método, por meio do qual este autor
procurará responder às questões desta dissertação.
No contexto da engenharia de software, para Wohlin et al. (2012), o método de
estudo de caso, é uma investigação empírica sobre um determinado fenômeno dentro
de seu contexto da vida real, especialmente quando a fronteira entre fenômeno e
contexto não pode ser claramente especificado. Essa investigação é baseada em uma
ou mais fontes de evidências (casos) e cujo objetivo é aprofundar o conhecimento de
um problema não suficientemente definido, visando a estimular sua compreensão,
sugerir hipóteses e questões ou desenvolver uma teoria.
A partir da análise dos métodos de pesquisa para o presente trabalho, decidiu-
se pelo aprofundamento do processo de escolha na abordagem por estudo de caso,
por tratar-se de uma metodologia de pesquisa válida quando se deseja realizar um
exame em profundidade de um fenômeno atual, onde o contexto em que está inserido
é importante, e no qual o pesquisador possui pouco ou nenhum controle sobre os
eventos (VOSS; TSIKRIKTSIS; FROHLICH, 2002; WOHLIN et al., 2012).
Levando-se em conta o que foi anteriormente exposto, baseado na bibliografia
e em revisão sistemática da literatura para o estabelecimento do problema, da questão
de pesquisa e do próprio modelo teórico, esse estudo utiliza a metodologia de estudos
64

de casos, de natureza quantitativa, ou seja, buscar entender o fenômeno do


mapeamento de suscetibilidade de escorregamentos recorrendo ao uso de redes
neurais artificiais, utilizando a análise do caso de uma região monitorada.
Baseado em seus objetivos gerais, pesquisas científicas são classificadas em
três grupos: descritiva, exploratória e explicativa (VIANNA, 2001).
A pesquisa exploratória estabelece critérios, métodos e técnicas para sua
elaboração e visa a oferecer informações sobre o objeto desta pesquisa e orientar a
formulação de hipóteses (CERVO; BERVIAN; DA SILVA, 2006). A pesquisa
exploratória objetiva a descoberta, o achado, a elucidação de fenômenos ou a
explicação daqueles que não eram aceitos apesar de evidentes (GONÇALVES, 2005).
Na pesquisa descritiva realiza-se o estudo, a análise, o registro e a
interpretação dos fatos do mundo físico sem a interferência do pesquisador. Aqui, não
pode haver interferência do pesquisador, que deverá apenas descobrir a frequência
com que o fenômeno acontece ou como se estrutura e funciona um sistema, método,
processo ou realidade operacional (BARROS; LEHFELD, 2007). Para Perovano
(2016), o processo descritivo visa à identificação, registro e análise das características
ou fatores que se relacionam com o fenômeno ou processo. Essa pesquisa pode ser
entendida como um estudo de caso em que após a coleta de dados, é realizada uma
análise das relações entre os fatores para uma posterior determinação dos seus
efeitos resultantes.
Por fim a pesquisa explicativa, que registra fatos, analisa-os, interpreta-os e
identifica suas causas. Essa prática visa ampliar generalizações, definir leis mais
amplas, estruturar e definir modelos teóricos, relacionar hipóteses em uma visão mais
unitária e gerar hipóteses ou ideias por força de dedução lógica (MARCONI;
LAKATOS, 2004). Visa identificar os fatores que contribuem para a ocorrência dos
fenômenos que afetam o processo. Explica o porquê das coisas por intermédio de
métodos experimentais de modelagem e simulação.
Dessa forma, o desenvolvimento do modelo teórico (Seção 3.4.1) para lidar
com a elaboração de mapas de suscetibilidade por intermédio de técnicas de AM tem
a natureza de uma pesquisa descritiva.
Além disto, a partir da viabilidade da aplicação do modelo de análise (Seção
3.4.2) como pode ser observado no estudo de caso, esta pesquisa tem como resultado
potencial recomendar a sua aplicação para um sistema de monitoramento de
escorregamentos eficaz e eficiente com o intuito de minimizar os riscos de vida da
65

população e prejuízos financeiros, bem como maximizar a capacidade de atendimento


das autoridades, em especial a defesa civil, como uma importante ferramenta para
seus mecanismos de tomada de decisão.

3.2 Definição da pesquisa e construção do referencial teórico


Croom (2005) afirma que, em primeiro lugar é preciso definir um referencial
conceitual teórico para uma pesquisa, resultando em um mapeamento da literatura
sobre o assunto. Além disso, a partir da busca bibliográfica e de revisões sistemáticas
da literatura é possível identificar lacunas onde a pesquisa possa ser justificada (em
termos de relevância), bem como permitir a extração dos elementos teóricos
(constructos) que foram utilizados para a construção do modelo teórico que servirá
como pano de fundo para as análises dos casos. As proposições podem ser então
estabelecidas a partir desses constructos (uma ou mais proposições correspondem
ao que realmente será verificado, ou seja, é a representação do constructo para fins
de medição) (MIGUEL, 2007).
Assim, primeiramente foi realizada uma pesquisa exploratória, baseada na
análise bibliográfica sobre a concepção de mapas de suscetibilidade e técnicas de
aprendizado de máquina com o objetivo de descrever o contexto do trabalho e
fornecer subsídios para planejar a próxima etapa. Essa investigação fez uso de uma
coleção de estudos sobre o assunto, obtidos em artigos sugeridos nos grupos de
pesquisa do IPT, revisões sistemáticas conduzidas anteriormente e demais materiais
que auxiliassem no levantamento de dados e identificação de resultados.

3.3 Delimitação do escopo


O estudo de caso consiste na elaboração de um mapa de suscetibilidade a
escorregamentos planares rasos no município do Guarujá, região metropolitana da
baixada santista no estado de São Paulo (66).
66

Figura 17 – Localização da área de estudo, Guarujá - SP

Fonte: Elaborado pelo autor (2021)

Os dados de entrada do modelo foram selecionados em concordância com a


literatura e extraídos do modelo digital do terreno, tais como: declividade, curvatura
de encosta, índice de umidade topográfico e aspecto. Os dados de geologia foram
obtidos do Mapa Geológico do Estado de São Paulo e os dados de uso de solo da
Coordenadoria de Planejamento Ambiental (CPLA).
Como métodos de aprendizado de máquina em destaque atualmente para
elaboração dos mapas de suscetibilidade, pode-se citar as redes neurais artificiais
(BRAGAGNOLO; DA SILVA; GRZYBOWSKI, 2020; BUI et al., 2020; PRADHAN; LEE,
2010), Support Vector Machine (SVM) (ABEDINI et al., 2019; BUI et al., 2019) e
Random Forest (RF) (BUI et al., 2020; DANG et al., 2019; SAHIN; COLKESEN;
KAVZOGLU, 2020).
Verifica-se que os métodos de RNA, SVM, RF dentre outros, são utilizados por
diversos autores e que ambos apresentam resultados satisfatórios, resultando em
mapas com elevada acurácia (superior a 80%). Entretanto, observa-se que a
67

qualidade dos resultados está diretamente relacionada à qualidade dos dados de


entrada.
Dessa forma, a técnica de redes neurais foi selecionada para este trabalho,
pois, além da sua elevada acurácia, ele se destaca por conta da sua flexibilidade,
capacidade de generalização, adaptabilidade, o processamento inerente de
informações contextuais e tolerância a falhas, devido ao elevado número de
interconexões (HAYKIN, 2008).
Foi utilizado uma rede do tipo perceptron de múltiplas camadas (MLP), com
algoritimo de treinamento de backpropagation ou retro-propagação, e sua
configuração, em especial a quantidade de camadas e de neuronios por camada, bem
como demais parametros são determinados empiricamente. Cada configuração de
rede tem seu desempenho avaliado por meio de métricas estatísticas.

3.4 Roteiro do mapeamento de suscetibilidade


O roteiro proposto para mapeamento de suscetibilidade, por meio de redes
neurais, no escopo dessa pesquisa é constituído pelos seguintes elementos: Modelo
teórico e Modelo de análise (67). O Modelo teórico (3.4.1) é sustentado pelos
elementos da literatura relacionados com a teoria sobre aprendizado de máquina e
mapas de suscetibilidade, resultantes da construção do referencial teórico (3.2). O
Modelo de análise (3.4.2) é uma instrumentalização do Modelo teórico, e está
estruturado a partir do próprio Modelo teórico, acrescido dos elementos da teoria do
estudo de casos. O Modelo de análise prescreve as etapas da coleta, seleção e
preparo dos dados das condições ambientais da região delimitada, treinamento e
validação da rede neural, e elaboração do mapa de suscetibilidade.
Figura 18 – Pilares da pesquisa

Fonte: Elaborado pelo autor (2021)


68

3.4.1 Modelo teórico


O modelo teórico que sustenta essa pesquisa foi construído a partir da literatura
referente à elaboração de mapas de suscetibilidade recorrendo ao uso de técnicas de
aprendizado de máquina. A 68 mostra as etapas necessárias para elaboração de um
mapa de suscetibilidade. Em um primeiro momento, etapas 1 e 2, os dados são
coletados e preparados. Posteriormente, esses dados são submetidos à rede neural
para treinamento e validação (etapa 3). Por fim o mapa de suscetibilidade é elaborado
(etapa 4) com os dados resultantes da RNA e este é confrontado com o mapa
elaborado pelo IPT (etapa 5) com os dados da mesma região do escopo desta
pesquisa.
Figura 19 – Modelo teórico conceitual para elaboração de mapas de suscetibilidade com RNA

Fonte: Elaborado pelo autor (2021)

Este modelo teórico é utilizado no processo de pesquisa conforme prescrito no


modelo de análise, que está descrito a seguir em 3.4.2.

3.4.2 Modelo de análise


O modelo de análise está apoiado no modelo teórico (3.4.1) e na literatura.
Adaptando os trabalhos de Bragagnolo, Silva e Grzybowski (2020), Bui et al. (2020) e
Lucchese, De Oliveira e Predrollo (2020) a metodologia proposta nesta pesquisa,
sugere as cinco etapas, descritas no 69, são elas:
 Preparo dos dados amostrais;
 Seleção e formatação dos fatores de influência;
 Treinamento e validação da rede;
 Elaboração do mapa de suscetibilidade;
 Comparação com o mapa utilizado pelo IPT e com os resultados da
literatura.
69

Estas práticas possibilitam uma análise e entendimento dos dados, bem como
a criação dos mapas de suscetibilidade com uso de técnicas de aprendizado de
máquina.

Quadro 8 - Etapas do processo de coleta e análise dos dados

Etapas Descrição
1. Preparo dos Corresponde aos dados das condições ambientais e intervenções
dados amostrais antropogênicas da região delimitada no escopo desta pesquisa.
Esses dados foram disponibilizados pelo IPT em formato digital e
seu processo de extração e formatação foge do escopo desse
trabalho.
2. Seleção e Por meio de técnicas estatísticas podem ser eliminados os fatores
formatação dos de menor influência, de modo a minimizar a complexidade da RNA,
fatores de influência além disso, os dados também são normalizados para maximizar
seu desempenho.
3. Treinamento e Configuração empírica dos hiperparâmetros da rede neural, para
validação da rede obtenção do melhor desempenho possível, medido com os dados
obtidos e preparados nas etapas 1 e 2.
4. Elaboração do Criação do mapa com os dados amostrais submetidos à rede
mapa de neural treinada.
suscetibilidade
5.1 Comparação Confrontar as classes de suscetibilidade identificados pelo mapa
com mapa do IPT gerado pelo IPT com aquelas identificadas pelo modelo proposto
neste estudo, por meio de uma amostra de escorregamentos não
utilizada no treinamento das redes neurais.
5.2 Comparação dos Comparar o desempenho da rede neural com aqueles disponíveis
resultados da na literatura, recorrendo a métricas estatísticas semelhantes.
literatura
Fonte: Elaborado pelo autor (2021)
Maiores detalhes sobre as etapas do modelo de análise, são apresentados a seguir:

Etapa 1 – Preparo dos dados amostrais


As condições ambientais, aliadas às informações de histórico de ocorrência dos
escorregamentos são cruciais para elaboração dos mapas de suscetibilidade,
baseado na suposição que escorregamentos futuros acontecerão sob as mesmas
condições de eventos anteriores (WANG; FANG; HONG, 2019).
70

Conforme apontado por Reichenbach et al. (2018) existem dezenas de fatores


que influenciam os escorregamentos. A seleção eficiente desses fatores é uma etapa
fundamental na elaboração dos mapas de suscetibilidade para confiabilidade e
desempenho dos modelos. Os fatores mais significativos apontados pelos autores
são, declividade e aspecto do terreno, bem como, sua geologia e litologia, embora
esse grau de importância possa mudar dependendo do tipo do escorregamento e do
seu fator de inicialização. Tão importante quanto os atributos do terreno, os fatores
ambientais - naturais e antropogênicos estão entre as causas de escorregamentos
(TOMINAGA; SANTORO; AMARAL, 2009) e portanto são inclusos no modelo desse
estudo. Uso do solo e distância de estradas estão entre alguns dos fatores
antropogênicos e exercem importante impacto na suscetibilidade.
O uso do solo é importante para estabilidade das encostas em termos da
vegetação de cobertura do terreno (PHAM et al., 2016a), enquanto que a distância
das estradas tem impacto relevante no tamanho e propagação dos escorregamentos
(PHAM et al., 2016b). Ademais, tem-se o inventário de cicatrizes como a principal
informação de entrada na modelagem de movimentos de massa. Esses registros de
eventos passados, têm sido obtidos por análise de imagens aéreas ou orbitais, além
do auxílio de coleta de campo (ADITIAN; KUBOTA; SHINOHARA, 2018; GARCIA-
URQUIA; YAMAGISHI, 2017).
O processo de preparo do conjunto de dados foge do escopo desta pesquisa
ficando sob responsabilidade dos especialistas de domínio do IPT, embora sob
supervisão do pesquisador a fim de garantir a integridade desses dados. Os conjuntos
de dados com os pontos de ocorrência e não ocorrência, foram fornecidos em formato
digital exportados para arquivos Excel, contendo um identificador de cada ponto, suas
respectivas coordenadas, latitude (X) e longitude (Y), bem como os atributos
selecionados para o desenvolvimento do mapa.

Etapa 2 – Seleção e formatação dos fatores de influência


A seleção dos fatores predisponentes ou entradas é um processo importante
para o uso das técnicas de aprendizado de máquina de um modo geral, e para o
mapeamento de suscetibilidade a escorregamentos não seria diferente.
Conjuntos de dados para treinamento e validação dos modelos de aprendizado
de máquina com alta dimensionalidade, isto é, com muitas variáveis independentes
podem fazer o processo de predição muito complexo, podendo resultar em previsões
71

pouco precisas (BUI et al., 2020). Em decorrência desses fatores, a avaliação e


seleção de entradas ou redução de dimensionalidade é necessária, visto que entradas
redundantes podem ser removidas.
Para seleção das variáveis de entrada, este trabalho adotou dois métodos.
Análise de variância, com teste estatístico univariado (ANOVA / F-Test), que é uma
técnica do tipo filtro-supervisionado, utilizado em conjunto com RNA em trabalhos
como os de Shaharum et al. (2015) e Shakeela et al. (2021). Também foi utilizado
análise de correlação, com o método de correlação de Pearson tal qual Bui et al.
(2016a) e Luchese et al. (2020). Ambos foram utilizados para analisar o quanto os
fatores predisponentes estão correlacionados individualmente com as amostras de
ocorrência e não ocorrência de escorregamentos, e poderão ser excluídos aqueles de
alta correlação, assim como aqueles que pouco contribuem para predição.
Partindo para etapa de formatação dos atributos, o passo seguinte é amenizar
as discrepâncias dos seus valores. Por exemplo, atributos como o fator de elevação,
que no cenário deste trabalho, oscilam entre 0.501 e 226.055, e em contrapartida,
para curvatura medida em graus, os valores mínimo e máximo são -0.586 e 0.026
respectivamente. A normalização objetiva equalizar a magnitude dos atributos ou
dimensões, bem como, a variabilidade desses atributos (PROVOST & FAWCETT,
2013). Assim, o processo de normalização de atributos geralmente garante melhor
desempenho das redes neurais pois é comum que os valores discrepantes
prejudiquem o seu aprendizado ocasionando uma tendência inerente a alguns
parâmetros em detrimento de outros (AGGARWAL, 2018). Nesse sentido, uma
segunda versão dos dados foi criada contendo os dados normalizados.
Por fim, as localizações de ocorrência e não ocorrência de escorregamentos
são aleatoriamente divididos em conjuntos de dados de treinamento/testes e
validação da rede neural. De forma empírica, o experimento adotou a proporção de
70% dos dados para treinamento da rede neural e os demais para sua validação, tal
qual os trabalhos de Bui et al. (2020), Chen et al. (2017a) e Wang et al. (2019).

Etapa 3 – Treinamento das redes neurais


Para Kumar et al. (2017), as redes neurais artificias estão entre os métodos
mais utilizados para modelagem de escorregamentos, imitando o desempenho do
cérebro humano e podem encontrar soluções para problemas não lineares complexos,
descobrindo seus padrões (SKANSI, 2018). A forma mais simples de uma rede neural
72

é um único perceptron. Seus elementos essenciais são os valores de entrada, os


pesos associados, as funções de ativação e uma saída desejada. As funções de
ativação comumente usadas incluem a sigmoide, tangente hiperbólica (Tanh) e
unidades lineares retificadas (ReLU). Uma rede neural pode conter mais de uma
camada entre a entrada e a saída para lidar com problemas complexos. No presente
estudo, a rede neural utiliza a arquitetura MLP que foi treinada por meio do algoritmo
de retropropagação ou Backpropagation (BPA), que é o algoritmo comumente
utilizado para treinamento de redes neurais em problemas dessa natureza.
Considerando que se está diante de um problema de classificação, essa fase consiste
em buscar empiricamente a melhor configuração dos hiperparâmetros da rede neural,
de modo a obter o melhor desempenho possível. Dentre os hiperparâmetros
ajustáveis temos:
 Quantidade de camadas ocultas;
 Funções de ativação das camadas ocultas;
 Quantidade de neurônios nas camadas ocultas;
 Quantidade de neurônio na primeira camada, função da etapa “Análise de
influência dos fatores”;
 Método de atualização dos pesos – Gradiente descendente do tipo Batch, Mini
batch ou estocástico;
 Técnicas de regularização L1, L2 e/ou Dropout.

Han, Kamber e Pei (2012) apresentam uma séria de métricas para avaliar o
desempenho de modelos de classificação. Assim, as diferentes configurações das
redes neurais são avaliadas por intermédio da confecção de uma matriz de confusão,
de onde são extraídas as seguintes métricas de classificação:
 Acurácia: taxa de acerto global do modelo, isto é, a proporção de predições
corretas em relação ao total do conjunto de dados.
 Sensibilidade (recall): proporção de padrões da classe positiva (ocorrência de
escorregamento) identificada corretamente em relação a todas as classes
positivas, o que inclui as falsamente negativadas. Indica o quão bom o
classificador é para identificar a classe positiva, isto é, os pontos de
escorregamento;
 AUC (Area Under the Curve) extraída da curva ROC (Receiver Operating
Characteristics), também chamada AUROC (Area Under the Receiver
73

Operating Characteristics), é um índice desempenho geral de classificadores


que indica o quanto o modelo é capaz de distinguir entre as classes do
problema. Modelos com altos valores de AUC apresentam boa probabilidade
de prever as classes por conta do seu baixo índice de predições erradas.

A curva ROC relaciona a taxa de falsos positivos no eixo X e a taxa de


verdadeiros positivos no eixo Y. Seu gráfico mostra a compensação entre as duas
taxas e sua área (AUC). Assim, a curva ROC é uma análise baseada na distribuição
final de um método de classificação que diferencia previsões corretas e falhas
(CANTARINO et al., 2019), considerada como a representação bidimensional de
desempenho de um modelo.
Embora acurácia seja uma métrica específica, esse termo também é usado
com significado genérico, para designar o desempenho de uma técnica de
classificação.
Esse trabalho adotou como métrica de desempenho a acurácia assim como os
trabalhos de Bragagnolo et al. (2020) e Bui et al. (2020), embora outros estudos
utilizem os termos acurácia ou desempenho geral do modelo de classificação para
designar a área sob a curva ROC, como em Gameiro (2020), Al-Batah et al. (2015) e
Quevedo (2019).
A rede neural utilizada nesse trabalho foi desenvolvida em linguagem de
programação Python, bem como os scripts para análise de influência dos fatores e
identificação da melhor arquitetura da rede.
Adotou-se o método de força bruta para configuração de arquiteturas das redes
neurais, combinando valores previamente estabelecidos de forma empírica para cada
um dos hiperparâmetros, totalizando 162 possibilidades. As redes foram treinadas e
seus desempenhos medidos para cada uma das amostras.
Foram considerados os seguintes parâmetros: learning rate, número de
camadas ocultas, números de neurônios por camada oculta, tamanho de lote e
dropout como técnica de regularização. Os valores das condições iniciais de cada
parâmetro estão descritos na 74.
74

Tabela 2 – Condições iniciais dos hiperparametros para treinamento das redes neurais
Learning rate Camadas Neurônios Tamanho de Dropout
Hiperparâmentros
ocultas por camada lote
oculta

[0.001,0.005,0.01] [1,2,3] [7,8,12] [0,4,8] [0,0.1]

Fonte: Elaborado pelo autor (2021)

Etapa 4 – Elaboração Mapa de Suscetibilidade


Uma vez obtidas as melhores configurações da rede, um mapa de
suscetibilidade é gerado na plataforma ArcGIS com os dados de saída da RNA para
as amostras de melhor resultado, onde, cada registro representa um ponto de
ocorrência ou não ocorrência. Esses dados de saída são as geolocalizações dos
pontos analisados pela rede neural, seus respectivos atributos e graduações de
suscetibilidade em uma escala de 0 a 1.
Esse mapa é elaborado no mesmo ambiente SIG, por meio do software ArcGIS,
utilizado para extrair os fatores predisponentes na etapa 1, com a classificação das
localidades em intervalos de suscetibilidade. Essa etapa foi uma atividade coletiva e
o manuseio do ArcGIS fica por conta dos especialistas do IPT.
A classificação das localidades de saída da rede é possível devido a utilização
da sigmoide como função de ativação, cujo resultado varia entre zero e um, sendo
interpretado heuristicamente como a probabilidade da variável dependente ser igual a
1 (AGGARWAL, 2018).

Etapa 5 – Comparação com o mapa utilizado pelo IPT e com os resultados da


literatura
Os mapas gerados a partir dos dados da RNA são comparados com o mapa de
suscetibilidade a movimento gravitacionais do IPT com o objetivo de medir a precisão
com que pontos geolocalizados não utilizados no treinamento da rede neural são
classificados e identificados nos respectivos mapas. Também são ressaltados os
aspectos operacionais das duas abordagens.
Vale ressaltar que o mapa do IPT foi elaborado em um cenário distinto daquele
utilizado nesta pesquisa cujas condições climáticas foram extremas, enquanto que o
75

mapa do IPT foi gerado com base em cicatrizes oriundas de condições climáticas
normais e de encosta natural e sem intervenção humana.
Para medição de equivalência entre os mapas IPT e RNA foi gerada uma
amostra de pontos aleatórios não utilizados no treinamento e testes das redes neurais.
Após submetidos às redes neurais, esses pontos são classificados e sobrepostos
tanto aos mapas das RNAs gerados anteriormente, quanto ao mapa do IPT na
plataforma ArcGIS onde foram identificados os erros e acertos da classificação dos
mapas em relação aos dados reais da amostra. Por meio dessa conferencia são
identificados os resultados positivos (verdadeiro e falso) e negativos (verdadeiro e
falso), com isso, é elaborado uma matriz de confusão para cada mapa e computadas
as métricas de acuracidade e sensibilidade.
Para confrontar o desempenho com os resultados apresentados na literatura foi
utilizado a acurácia, embora sensibilidade e AUROC, também tenham sido calculadas
para as redes treinadas com as nove amostras utilizadas nesta pesquisa, ver 84.
76

4 RESULTADOS E DISCUSSÕES
Neste capítulo é apresentado o resultado do objetivo central proposto quando
da abordagem deste trabalho na seção 3, subseção 3.4 - Roteiro do mapeamento de
suscetibilidade. São discutidas as conclusões e associações com o restante da
pesquisa.
O objetivo central desta pesquisa é propor uma metodologia para elaboração
de mapas de suscetibilidade por meio de redes neurais artificiais. Desse objetivo
derivam:
• implementar uma rede neural para classificação de pontos geolocalizados,
quanto a sua suscetibilidade a escorregamentos;
• gerar o mapa de suscetibilidade a partir da arquitetura de rede neural que
apresentou melhor desempenho na etapa de treinamento;
• comparar o desempenho do mapa gerado com auxílio da rede neural com
aquele implementado de forma tradicional na área monitorada, bem como com o
desempenho médio dos trabalhos disponíveis na literatura.
Esses objetivos são apresentados e atingidos por meio dos resultados da
exploração do caso prático, são apresentados abaixo.

Resultados sobre a aplicação do modelo de análise


O Modelo de Análise é avaliado em relação à sua utilidade e viabilidade de
aplicação frente às oportunidades de análise apresentadas pelo caso estudado. Esses
resultados são obtidos na execução das etapas do modelo de análise proposto no
roteiro de pesquisa.
A execução das etapas do modelo de análise proposto em 3.4.2 foi realizada
em uma máquina pessoal com processador Intel i7-8550U 1.80Ghz com 4 núcleos. A
máquina possui 8 GB de memória RAM e um disco SSD. A descrição da máquina é
relevante para aqueles que queiram avaliar a performance das etapas da análise dos
dados e treinamento das redes neurais.
A linguagem Python foi selecionada como linguagem de programação para
codificação dos scripts que implementam as etapas do modelo, incluindo a rede neural
para classificação de pontos geolocalizados. O ambiente de desenvolvimento foi
criado a partir do instalador Miniconda do gerenciador de pacotes e ambientes de
código-livre Conda para Python. A IDE utilizada foi o Microsoft Visual Code.
77

Vale ressaltar que das nove amostras utilizadas, duas apresentaram


desempenho satisfatório, segundo os critérios de avaliação estabelecidos no modelo
de análise e por isso, daqui em diante essas amostras são destaque na apresentação
dos resultados das etapas 2, 3, 4 e 5 do modelo proposto.

4.1 Etapa 1 – Preparo dos dados amostrais


Conforme descrito em 3.4.2, os dados da análise foram disponibilizados pelo
time de especialistas do IPT.
O inventário de cicatrizes utilizado (77) foi obtido das ocorrências de
escorregamentos registrados pela Coordenadoria de Proteção e Defesa Civil do
município de Guarujá para o ano de 2020. Esse inventário foi produzido em formato
tabular e espacializado em ambiente SIG. Posteriormente foram gerados os dados de
não ocorrência, respeitando uma proporção de 1:1 entre os pontos de ocorrência e
não ocorrência, utilizando três abordagens distintas.

Figura 20 – Localização das cicatrizes de movimento de massa, Guarujá – SP

Fonte: Elaborado pelo autor (2021)

Na primeira abordagem, os pontos de não ocorrência foram distribuídos de


forma aleatória, conforme ilustrado na 78.
78

A 78 mostra a segunda abordagem, onde foram geradas amostras, sendo que,


para cada ponto de ocorrência foi selecionado um ponto de não ocorrência distando
em um raio de 50 (a), 100 (b), 150 (c) e 200 (d) m. Por fim, foram gerados buffers de
distância das cicatrizes de 1, 2, 3 e 4 Km a fim de gerar as amostras de não ocorrência
(79). Buffers são áreas delimitadas, onde seu perímetro é estabelecido a partir dos
pontos de ocorrência.
Desta forma, esse estudo utilizou nove amostras para análise em busca
daquela de melhor desempenho. Os nove conjuntos amostrais da análise, todos com
os mesmos pontos de ocorrência, possuem um total de cento e noventa e oito
registros.
Figura 21 – Cicatrizes (a) e pontos de não ocorrência aleatórias (b)

Fonte: Elaborado pelo autor (2021)

Figura 22 – Pontos de não ocorrência em raios de 50 (a), 100 (b), 150 (c) e 200 (d) m

Fonte: Elaborado pelo autor (2021)


79

Figura 23 – Pontos de não ocorrência em buffers de 1 (a), 2 (b), 3 (c) e 4 (d) km

Fonte: Elaborado pelo autor (2021)

De posse das primeiras amostras geradas, foi realizada uma análise


exploratória com o objetivo de garantir sua validade e integridade.
Durante essa análise, identificou-se inconsistências no conjunto de dados,
como por exemplo o TWI com valores numéricos inteiros, o que não faziam sentido,
visto que essa variável é resultado de uma relação logarítmica de base neperiana o
que implica que seus valores são números irracionais.
Outra inconsistência foi identificada nos registros de declividade que também
eram todos numéricos do tipo inteiro, o que é incompatível com as características
dessa variável que representa o ângulo de inclinação da encosta.
Essas inconsistências foram notificadas para os especialistas do IPT que
confirmaram os erros de coleta e processamento, e uma nova versão dos dados foi
gerada.

4.2 Etapa 2 – Seleção e formatação dos fatores de influência


Uma vez validados os conjuntos amostrais que compõem o inventário de
cicatrizes utilizado neste estudo de caso, a segunda etapa do modelo de análise
corresponde à seleção dos fatores de influência ou variáveis do modelo de análise,
identificação de suas respectivas relevâncias e eventual eliminação quando do
80

treinamento da rede neural. Outra proposição dessa etapa é formatar o conjunto de


dados de modo a deixá-los prontos para as etapas seguintes.
De acordo com Reichenbach et al. (2018), não há uma regra ou uma estrutura
específica para seleção e definição da importância dos fatores predisponentes. Sendo
assim, para o escopo desse estudo, foram utilizados, por conta da sua disponibilidade
e características da região, sete atributos, sendo a maioria morfométricos, extraídos
por meio do software ArcGIS, são eles:
 Elevação (elevation), representa as altitudes da região, e amplamente
utilizado em processo de modelagem dessa natureza, e sua variação
tem efeito considerável em modelos de suscetibilidade dependendo da
região.
 Declividade (slope) é o ângulo de inclinação da encosta, e tal qual a
elevação, é comumente utilizado para modelagem de mapas de
suscetibilidade, sendo em alguns casos considerado um dos fatores de
maior influência do fenômeno. (BUI et al., 2016a; PRADHAN; LEE,
2010).
 Aspecto (aspect) é a orientação ou direção da inclinação, cuja métrica é
graus, variando de 0 a 360.
 Índice de umidade topográfico (TWI - topographic wetness index), é um
atributo de influência direta na instabilidade das encostas devido a
pressão da água nos poros e consequente redução de resistência dos
solos, pois ele indica a quantidade de umidade no solo. Seu valor pode
ser estimado em função da relação dos efeitos topográficos e
hidrológicos de uma área. Seu valor foi obtido automaticamente em
ambiente SIG.
 Curvatura (curv), refere-se à curvatura do solo em relação a uma
inclinação. Considerado um parâmetro influente nas modelagens de
escorregamentos, pois ele indica o fluxo de água nas encostas. Pham et
al. (2016b) classifica a curvatura em côncavo (<-0.05); plano (-0.05-
0.05) e convexo (> 0.05).
 Litologia (lito), segundo Pradhan & Lee (2010); Reichenbach et al.
(2018), os escorregamentos são influenciados pelas propriedades
litológicas da superfície. Neste caso, a região analisada nesse trabalho,
caracteriza-se por dois tipos predominantes de rochas/litologias:
sedimentos marinhos e migmatitos.
 Uso do solo: trata da forma de ocupação do solo no município e foi
dividido em 10 categorias: campo antrópico, área urbana, mangues,
aeroportos, campos úmidos, cultura perene, mata, mata ciliar, restingas
e zonas portuárias.
81

As Figuras 81 e 81 apresentam os fatores predisponentes mapeados no


município do Guarujá.
Figura 24 – aspecto (a), curvatura (b), declividade (c) e elevação (d)

Fonte: Elaborado pelo Autor (2021)

Figura 25 – twi (a), uso do solo (b) e geologia (c)

Fonte: Elaborado pelo autor (2021)


O primeiro critério para uma eventual eliminação de alguma(s) dessas variáveis
foi identificar alta correlação linear de Pearson entre elas (AL-NAJJAR et al., 2019;
82

LUCCHESE; DE OLIVEIRA; PEDROLLO, 2020). Coeficientes com valor absoluto


superior a 0.80 indicam alta correlação. Para a amostra de melhor desempenho,
conforme ilustrado na 82, nenhum par de variáveis atingiu esse valor, logo, por esse
critério, todas são mantidas na análise.
Em seguida, é feita a análise de correlação linear entre as variáveis e a
ocorrência do escorregamento, identificada com a variável ‘class’ (LUCCHESE; DE
OLIVEIRA; PEDROLLO, 2020). Embora essa análise tenha sido realizada para todos
os conjuntos de dados analisados, são apresentadas aqui somente os fatores com
maior conexão linear com o fenômeno das amostras de maior desempenho. Sendo
assim, tem-se twi, elevação e uso do solo para a amostra aleatória (82) e, declividade,
twi e aspecto para amostra com pontos de não ocorrência à 200 m dos pontos de
ocorrência (82).
Figura 26 – Correlação dos fatores de influência e ocorrência do evento para amostra aleatória

Fonte: Elaborado pelo autor (2021)


Figura 27 – Correlação dos fatores de influência e ocorrencia do evento para amostra de 200 m

Fonte: Elaborado pelo autor (2021)


83

O passo seguinte foi aplicar a análise de variância com teste estatístico


univariado (ANOVA/ F-Test). Esse teste computa um score de correlação entre cada
variável de entrada e a ocorrência do escorregamento. De acordo com essa técnica,
os fatores com maior conexão com fenômeno em ordem decrescente, também para
as amostras de maior desempenho, são twi, elevação e uso do solo para amostra
aleatória, assim como declividade, twi e aspecto são as variáveis mais relevantes para
amostra cujos pontos de não ocorrência distam 200m dos pontos de ocorrência
(Figuras 83 e 84).
Figura 28 – Relevância das variáveis em relação à ocorrência do evento para amostra aleatória

Fonte: Elaborado pelo autor (2021)


84

Figura 29 – Relevância das variáveis em relação à ocorrência do evento para amostra 200m

Fonte: Elaborado pelo autor (2021)


Observa-se que as duas técnicas são condizentes quanto as três principais
variáveis de entrada do modelo. Os conjuntos de fatores, litologia, curvatura, aspecto
e declividade (amostra aleatória), bem como uso solo, litologia, elevação e curvatura
(amostra 200m) são os de menor relevância para o escopo dessa pesquisa, e são
candidatas à exclusão nos respectivos conjuntos de dados para treinamento da rede
neural. Essa diferença nos principais fatores de relevância para cada amostra de
dados demostra que não é possível generalizar sua conclusão.
Por fim os dados são preparados para o treinamento e validação da rede neural.
Inicialmente todas as amostras individualmente foram subdivididas aleatoriamente em
conjuntos distintos de treinamento (~50%, 96 registros), validação (20%, 42 registros)
e teste (30%, 60 registros). Em seguida, os dados foram normalizados para variar
entre -1 e 1 para cada um dos fatores individualmente de modo a deixá-los na mesma
escala de valor, padronizando assim os estímulos fornecidos à rede (HAYKIN, 2008).
Vale ressaltar que o processo de normalização é inicialmente ajustado para os dados
de treinamento, e posteriormente aplicado para os dados de teste e validação com o
objetivo de evitar viés nos conjuntos de dados distorcendo o desempenho da rede.

4.3 Etapa 3 - Treinamento e validação da rede


Todas as amostras foram submetidas ao processo de treinamento e validação
das redes neurais, e aquelas cujos pontos de não ocorrência foram selecionados
85

aleatoriamente, bem como aqueles que distam 200 m dos pontos de ocorrência são
as de melhor desempenho, contribuindo assim para acurácia do modelo proposto e
principalmente para capacidade de extrapolação do domínio numérico do espaço
amostral que a rede neural foi treinada.
De posse dos subconjuntos provenientes dos conjuntos amostrais,
treinamento, validação e teste, buscaram-se os parâmetros que compunham a
arquitetura da rede neural que maximizasse seu desempenho. Sendo assim, o
desempenho das redes neurais para os nove cenários foi medido por meio da
acurácia, tendo sido adotado 0,5 com limiar de corte para classificação. Essa métrica
mede a quantidade de observações, ocorrência e não ocorrência que foram
corretamente classificadas, sendo esta considerada uma boa métrica para o estudo,
visto que lidou-se com um cenário com amostras balanceadas e as classes de
ocorrência e não ocorrência igualmente importantes. A 85 exibe as quantidades de
pontos de ocorrência e não ocorrência, suas respectivas classificações preditas e
falsos positivo e negativo, para as redes de melhor desempenho obtidas com as
amostras aleatórias (a) e cujos pontos de não ocorrências distam em 200m dos pontos
de ocorrência (b), os melhores cenários obtidos no escopo desse estudo de caso.
Figura 30 – Número de pontos de ocorrência e não ocorrência preditas

Fonte: Elaborado pelo Autor (2021)


Além da acurácia, é registrada a sensibilidade das melhores configurações de
rede para cada amostra, 86. Essa métrica ajuda a discernir a capacidade de
identificação de ocorrência de escorregamentos do modelo.
Por fim, o desempenho também é medido por meio da curva ROC, que de
acordo com Al-Batah et al. (2015) é um dos procedimentos científicos mais populares
para validar a eficiência de modelos de predição de desastres naturais. Sua área
(AUC) explica a precisão do modelo na previsão de escorregamentos. Em geral, o
86

valor mais baixo de AUC é 0,5, o que significa que o modelo não prevê nada melhor
do que uma abordagem aleatória.
Dessa forma, por meio de força-bruta, são feitas as configurações das redes
neurais para cada amostra de dados e a 86 exibe os indicadores das configurações
de melhor desempenho para cada amostra.
Tabela 3 – Métricas das redes neurais de melhor desempenho
Amostra Acurácia Sensibilidade (Recall) ROC AUC
Aleatória 0.985000 0.969697 0.995400
50m 0.813131 0.868687 0.834813
100m 0.873737 0.919192 0.905571
150m 0.898990 0.919192 0.933782
200m 0.954315 0.969697 0.973511
Buffer 1km 0.863636 0.898990 0.903887
Buffer 2km 0.888889 0.989899 0.950617
Buffer 3km 0.878788 0.868687 0.912356
Buffer 4km 0.898990 0.898990 0.911642
Fonte: Elaborado pelo autor (2021)

As amostras de baixo desempenho, inferior a 90% de acurácia, são aquelas


com os pontos de não ocorrência mais próximos dos pontos de ocorrência, isto é, 50,
100 e 150 m, cujas características geomorfológicas são tão semelhantes que
inviabilizam a identificação de padrões. O mesmo baixo desempenho acontece com
as amostras com buffers de 3 e 4km. Nessas, por conta das características litorâneas
do município do Guarujá, é necessário concentrar conjuntos de pontos de não
ocorrência nos limites do território, o que sem uma distribuição uniforme, obrigou-se a
geração de pontos com características semelhantes novamente, como ilustrado nas
figuras Figura 22 – Pontos de não ocorrência em raios de 50 (a), 100 (b), 150 (c) e
200 (d) m e Figura 23.
As amostras dos buffers de 1 e 2 km também não obtiveram bom desempenho,
tal qual no trabalho de Samuel Gameiro (2020), onde os melhores desempenhos
foram obtidos com as amostras que aplicaram buffers maiores, com 30 e 40 km, visto
que nesse estudo as condições geográficas permitiam maior espaçamento geográfico,
o que não é o cenário deste trabalho.
Das redes de melhor performance de cada amostra, adotou-se como critério,
baseado nas referencias literárias do que é considerado bom desempenho para esse
87

tipo de análise, selecionar aquelas que obtiveram desempenho superior à 90% de


acurácia e dessas, destaque para as redes neurais obtidas com a amostra cujos
pontos de não ocorrência são selecionados aleatóriamente e aqueles que distam em
200m dos pontos cicatrizes, com acurácia de 98.5% e 95.43%, sensibilidades de
96.97% e ROC AUC de 99.54 e 97.35 respectivamente, essa última ilustrada na 87
(a) e (b).
Figura 31 – AUC ROC das amostras de melhor desempenho

Fonte: Elaborado pelo autor (2021)

Por fim, para ilustrar o resultado das redes de melhor desempenho para as
amostras aleatórias e a de 200m entre os pontos de ocorrência e não ocorrência, as
Figuras 88 e 88, apresentam uma visualização bidimensional, declividade por
elevação, do mapa elaborado pela rede em comparação com os dados reais, onde
os circulos vermelhos simbolizam os pontos de ocorrência, enquanto que os roxos são
pontos de não ocorrência.
88

Figura 32 – Visão bidimensional dos pontos de ocorrência para amostra aleatória

Fonte: Elaborado pelo autor (2021)


Figura 33 – Visão bidimensional dos pontos de ocorrência para amostra 200m

Fonte: Elaborado pelo autor (2021)


89

Ainda durante o processo de treinamento das redes, além das sete variáveis
inicialmente disponíveis, são utilizadas somente as três mais relevantes levantadas
na seção 4.2, no entanto o desempenho foi, na média inferior, o que é esperado visto
que todas as variáveis contribuíam para análise, conforme demonstrado na etapa 2.
Tendo a acurácia como métrica, é identificado que a arquitetura ideal da rede
neural de melhor desempenho, para os conjuntos de dados de melhor resultado dessa
pesquisa, apresenta os seguintes hiperparametros por conjunto de dados:
Pontos de não ocorrência selecionados aleatoriamente:
 3 camadas ocultas, além das camadas de entrada e saída;
 12 neurônios nas camadas ocultas;
 7 neurônios na primeira camada;
 Dropout como técnica de regularização, com taxa de 0.1;
 A taxa de aprendizado é de 0.01;
 Para atualização dos pesos, gradiente descendente do tipo mini batch com 8
registros, é a configuração ideal;

Pontos de não ocorrência 200m distante dos pontos de ocorrência:


 3 camadas ocultas, além das camadas de entrada e saída;
 8 de neurônios nas camadas ocultas;
 7 neurônios na primeira camada;
 Nenhuma técnica de regularização, Dropout ou L1/L2, se mostrou necessária;
 A taxa de aprendizado é de 0.005;
 Para atualização dos pesos, gradiente descendente do tipo mini batch com 8
registros, é a configuração ideal;

A seguir as configurações comuns as redes de melhor desempenho:


 ReLU, como função de ativação, na primeira e nas camadas ocultas. Sendo
que a camada de saída deve ser a sigmoide por conta da natureza
classificatória do problema;
 Para inicialização dos pesos nas camadas inicial e final, bem como que nas
camadas ocultas é utilizada a técnica Glorot normal, sendo que nas camadas
intermediárias a técnica Glorot também é utilizada para inicialização das bias.
90

 São 7 os neurônios na primeira camada pois existem 7 fatores de influência do


fenômeno
 E por fim, 40.000 é o número de épocas necessárias para completar o
aprendizado da rede.

4.4 Etapa 4 - Elaboração do mapa de suscetibilidade


As Figuras 90 e 91 apresentam os mapas de suscetibilidade do município do
Guarujá – SP gerados pelas redes neurais otimizadas para as amostras aleatórias e
de 200m. Os mapas resultantes gerados pelas RNAs são classificados em três
classes de suscetibilidade a movimentos de massa: alto, médio e baixo, considerando
o intervalo de 0 a 1 resultante da camada de saída da rede neural. Adotou-se como
critério o intervalo de [0;0,5] como de baixa suscetibilidade. Quando esse valor está
no intervalo (0,5;0,9] o ponto é considerado de média suscetibilidade e saídas acima
de 0,9 são considerados de alta suscetibilidade. Embora não haja um padrão para
delimitação desses intervalos, eles foram inspirados nos trabalhos de Bragagnolo et
al. (2020), Samuel Gameiro (2020), Quevedo (2019), Pradhan & Lee (2010) e Chen
et al. (2017b).
Figura 34 – Mapas de suscetibilidade elaborado pela RNA – amostra aleatória.

Fonte: Elaborado pelo autor (2021)


91

Figura 35 – Mapas de suscetibilidade elaborado pela RNA – amostra 200m

Fonte: Elaborado pelo autor (2021)

Por meio da plataforma ArcGIS também são medidas as proporções das áreas
de alta suscetibilidade (destacadas em marrom na 90) e que correspondem a 8,27%,
enquanto que as áreas laranja são consideradas de suscetibilidade média com
18,35%, e por fim, as áreas de baixa suscetibilidade representadas em amarelo,
correspondendo a 73,38% do município. Para a amostra cujos pontos de não
ocorrência distam 200 m dos pontos de ocorrência essas proporções são de 64,84%
para área de baixa suscetibilidade, 23,18% e 11,98% para as áreas de média e alta
suscetibilidade. Esses resultados deixam claras indicações das regiões que devem ter
um planejamento adequado para a ocupação ou construção de obras de infraestrutura
como estradas, redes elétricas ou de esgotos por exemplo.

4.5 Etapa 5 – Comparação de desempenho


Conforme proposto na etapa 5 do modelo de análise, os mapas de
suscetibilidade para as amostras aleatórias e de 200 m das cicatrizes, as consideradas
válidas, atingiram 98,50% e 95,43% de acurácia (86), superando a média de 86,74%
de acurácia observada nos trabalhos identificados na literatura.
92

Destaca-se que o mapa do IPT e aqueles resultantes deste trabalho foram


gerados em condições distintas. As amostras utilizadas para treinamento das redes
neurais são resultado de condições climáticas de evento extremo ocorrido no ano de
2020, com índices pluviométricos acima de 200 mm, e com cicatrizes provenientes de
encostas naturais e taludes de corte e aterro para construção de moradias e vias. Em
contrapartida, o mapa do IPT foi gerado com base em cicatrizes resultantes de
condições climáticas normais e de encosta natural, sem qualquer intervenção
humana. Consequentemente, as áreas com as classificações de suscetibilidade entre
os mapas são distintas, o que é comprovado por meio de inspeção visual na 92 que
apresenta o mapa elaborado pelo IPT e aquele gerado pelo método proposto neste
trabalho, com a amostra de pontos de não ocorrência gerados aleatoriamente.

Figura 36 – Mapas de suscetibilidade elaborado pelo IPT e por meio de RNA

Fonte: Elaborado pelo autor (2021)

Com o intuito de medir quantitativamente o desempenho dos três mapas, uma


amostra de pontos não utilizados no treinamento e testes das redes neurais foi gerada
e confrontada com os respectivos mapas. Essa amostra contém 60 registros, sendo
29 pontos de ocorrência e 31 pontos de não ocorrência gerados aleatoriamente.
Quando submetidos às duas redes neurais, os pontos dessa amostra foram
classificados com a mesma métrica descrita na etapa 4, seção 4.2. Em seguida esses
pontos foram sobrepostos aos mapas gerados com pontos aleatórios, com 200m de
distância dos pontos de ocorrência e o mapa gerado pelo IPT na plataforma ArcGIS,
onde foi feita a conferência das classificações, cujos resultados estão na 93.
93

Figura 37 – Classificação da amostra não treinada pelas RNAs

Fonte: Elaborado pelo autor (2021)

Considerando que os pontos aqui identificados como de média suscetibilidade


são considerados pontos de escorregamentos, chegamos ao seguinte resumo (93):
Tabela 4 – Desempenho dos mapas de suscetibilidade – amostra não treinada pelas RNAs

IPT 200m aleatório


Acurácia: 0.683 Acurácia: 0.883 Acurácia: 0.983
[[10 0] [[36 4] [[31 0]
[ 19 31]] [ 3 17]] [ 1 28]]
Classificação mapa Classificação mapa Classificação mapa
n-suscetibilidade:10 n-suscetibilidade:40 n-suscetibilidade:31
suscetibilidade: 50 suscetibilidade: 20 suscetibilidade: 29
Fonte: Elaborado pelo autor (2021)

Percebe-se que os mapas gerados pelas redes neurais tiveram desempenho


bom e excelente com 88,3% e 98,3% de acurácia respectivamente para as redes
geradas com pontos de 200m e aleatórios. Destaque para sensibilidade (de todas as
situações de classe positivo como valor esperado, quantas estão corretas), que da
rede de 200m é de 85%, mas a rede de pontos aleatórios obteve 96,55%. Por fim, foi
identificado um desempenho inferior do mapa do IPT para essa amostra, com acurácia
de 68,3% e sensibilidade 62% classificando 50 pontos como suscetíveis a
escorregamentos quando de fato existem apenas 29, demonstrando que esse mapa
superestima as áreas de alta suscetibilidade sendo ele pouco preciso e acurado, com
muitos falsos positivos.
Assim, em termos comparativos sobre a localização dos pontos de incidência
de escorregamentos para os mapas gerados pelo método proposto e a referência do
IPT percebe-se que a aplicação de redes neurais mostrou-se mais precisa uma vez
94

que a maioria dos pontos não utilizados no treinamento da rede estão localizados nas
áreas classificadas como de alta suscetibilidade. Por outro lado, tal precisão não foi
observada no mapa do IPT como pode ser visto na 93.
De qualquer forma, o modelo desenvolvido pelo IPT é resultado do apoio de
especialistas que colaboraram na atribuição da importância relativa dos fatores
condicionantes e na classificação das áreas delimitadas. Sendo assim, foi mostrado
que o uso de redes neurais no contexto do método apresentado neste trabalho pode
fornecer um nível equivalente ou superior de qualidade de classificação com
capacidade de generalização e reprodutibilidade adicionais, visto que esse método
não depende de conhecimento especializado. Esta vantagem é importante quando da
avaliação da influência dos fatores condicionantes, parte importante do processo de
aprendizagem totalmente orientado a dados. Dessa forma, o conhecimento
especializado deve ser levado em consideração na avaliação dos resultados
propostos pelo método.
De modo mais amplo, os resultados indicam que a aplicação de RNAs para o
mapeamento de suscetibilidade, apresenta também como vantagens, a capacidade
de detectar relações não lineares complexas entre variáveis, a capacidade de detectar
interações entre variáveis e a capacidade de processar dados em diferentes escalas
e unidades de medida, e essas habilidades são limitadas nos seres humanos
(AGGARWAL, 2018; HAYKIN, 2008).
95

5 CONSIDERAÇÕES FINAIS
Esse estudo propôs um método para elaboração de mapas de suscetibilidade
a escorregamentos por meio de redes neurais artificiais, submetido a um estudo de
caso com eventos ocorridos no município do Guarujá-SP.
Neste capítulo são apresentadas as conclusões deste trabalho, examinando os
resultados alcançados. Também são relatadas as contribuições obtidas, as limitações
encontradas e as recomendações para trabalhos futuros.

5.1 Conclusões
As Redes Neurais Artificiais são ferramentas computacionais extensamente
utilizadas na solução de problemas complexos do mundo real. Sua atratividade vem
de suas características de processamento das informações pertinentes a esses
problemas, bem como propriedades e benefícios em relação a outras técnicas de
aprendizado de máquina, tais como, não-linearidade, alto paralelismo, tolerância a
falhas e ruídos, além das suas capacidades de aprendizagem e generalização
(HAYKIN, 2008; SAMUEL GAMEIRO, 2020).
Neste trabalho, o estudo de caso abordado propôs uma metodologia para
elaboração de mapas de suscetibilidade a escorregamentos utilizando como
referência dados históricos de incidentes ocorridos no município do Guarujá-SP,
relacionando-os à fatores geológicos, geomorfológicos, bem como outros atributos da
região, obtidos de um modelo digital de terreno. Sendo assim, as entradas para os
modelos foram declividade, aspecto, elevação, uso do solo, litologia, topographic
wetness index (twi) e curvatura.
Dentre esses fatores, a declividade e twi foram aquelas de maior capacidade
preditiva, tal qual no trabalho de Goeltz et al. (2015), Bui et al. (2020) e Pradhan & Lee
(2010), bem como no trabalho de Bragagnolo et al. (2020) com declividade e twi,
embora esse não seja um padrão e varie conforme as características de cada região,
por exemplo no trabalho de Kawabata & Bandibas (2009) a declividade é um dos
fatores mais irrelevantes. Além da declividade e twi, o aspecto compõe os fatores de
maior relevância. Curvatura, elevação, uso do solo e litologia apresentaram menor
importância. De qualquer forma todos esses fatores foram utilizados no treinamento
da rede de melhor desempenho.
Neste estudo, as RNAs mostraram-se capazes de modelar as áreas
suscetíveis, com acurácia no mapeamento superiores a 0,9, demonstrando a validade
96

do método proposto para duas das nove amostras de dados utilizadas nesse estudo
de caso.
A análise da revisão bibliográfica possibilitou o levantamento de informações
sobre o uso de redes neurais para a questão da suscetibilidade que foram cruciais
para o desenvolvimento deste trabalho, com o objetivo de contribuir com a proposição
do modelo aqui apresentado.
Diante dos resultados apresentados no capítulo anterior, revisita-se os
objetivos e proposições apresentadas para embasar as conclusões do trabalho por
meio da sua questão central.
Assim, o objetivo geral desta pesquisa em propor uma metodologia para
elaboração de mapas de suscetibilidade por meio de redes neurais artificiais, bem
como seus objetivos específicos foram alcançados.
Nesse sentido, no caso deste estudo, onde utilizou-se nove amostras com
propriedades distintas quanto à seleção dos pontos de não ocorrência, as redes
neurais foram implementadas com a linguagem de programação python e optou-se
por retropropagação como algoritmo de treinamento. As redes neurais foram treinadas
para cada uma das amostras, e aquelas que obtiveram acurácia superior a 90% foram
consideradas válidas sendo elas, as amostras cujos pontos de não ocorrência foram
selecionados aleatoriamente e aqueles 200m distantes dos pontos de ocorrência, com
respectivos 98,50% e 95,43%.
Para essas amostras foram gerados os mapas de suscetibilidade com auxílio
da ferramenta ArcGIS (Figuras 34 e 35). Por fim, constatou-se que o desempenho dos
mapas gerados com o modelo proposto superou a média dos trabalhos identificados
na literatura que é de 86,74% e, fazendo uso de uma amostra não utilizada no
treinamento das redes, os mapas gerados com RNA tiveram desempenho superior ao
mapa do IPT, que utiliza método tradicional, cuja acurácia foi de 68,3%. Sendo assim,
o sucesso dos objetivos específicos valida o objetivo geral.
Investigou-se também a proposição apresentada, que levantou a adoção de
RNAs, assim como outras técnicas de aprendizado de máquina, como uma ferramenta
eficaz para elaboração de mapas de suscetibilidade de escorregamentos. Se por um
lado os resultados obtidos no estudo de caso deste trabalho concluíram que as redes
neurais são ferramentas eficazes para elaboração de mapas de suscetibilidade, a
revisão de literatura abordou outras técnicas, em especial SVM e Randon Forest,
também como ferramentas eficazes, validando assim a proposição.
97

Retomada a questão central de pesquisa: “Como elaborar mapas de


suscetibilidade a escorregamentos utilizando redes neurais artificiais com maior
eficiência em relação àqueles elaborados com métodos tradicionais? ”, conclui-se, até
por conta da veracidade da proposição apresentada e do sucesso dos objetivos da
pesquisa, que a elaboração de mapas de suscetibilidade utilizando redes neurais
artificiais é possível por meio do modelo de análise proposto e validado no estudo de
caso apresentado.
O conhecimento gerado neste trabalho possibilitou confrontar o método
proposto com os ditos tradicionais. Ambos são modelos complexos de predição e
podem ser considerados opções de ferramentas para solução de problemas como o
de predição de escorregamentos.

5.2 Contribuições
Este trabalho buscou contribuir de forma prática utilizando um conjunto de
dados, disponibilizados pelo IPT e Defesa Civil, possibilitando assim comparações
futuras com novas pesquisas por parte de outros pesquisadores, da mesma forma
como este trabalho foi realizado, partindo do estudo proposto por outros autores
(BRAGAGNOLO; DA SILVA; GRZYBOWSKI, 2020; BUI et al., 2020; PRADHAN; LEE,
2010; QUEVEDO, 2019; SAMUEL GAMEIRO, 2020) e propondo assim a aplicação
prática.
No que diz respeito à produção de conhecimento sobre os mecanismos dos
escorregamentos, tendo como princípio uma análise baseada em dados, o método
proposto pode, além de elaborar mapas de suscetibilidade, auxiliar na identificação
dos diferentes fatores condicionantes a escorregamentos. Isso permite identificar os
parâmetros que mais influenciam a ocorrência de escorregamentos em uma
determinada área, permitindo também que medidas preventivas sejam tomadas de
forma mais eficaz. Da mesma forma, a estrutura flexível da RNA permite que os
parâmetros de entrada sejam modificados ou atualizados a qualquer momento,
conforme novos dados e informações adicionais se tornem disponíveis.
Do ponto de vista de aplicação, o método proposto é capaz de delimitar regiões
que devem ser evitadas, seja para ocupação humana, seja para construção estradas,
ferrovias, redes elétricas, esgotos, telefonia ou qualquer outra obra de infraestrutura.
98

5.3 Limitações
Embora eficiente, conforme demonstrado ao logo deste trabalho, alguns
problemas podem ser considerados fatores limitantes para o modelo proposto.
Um desses fatores é a dependência da existência de bancos de dados locais
de escorregamentos, o que pode restringir sua aplicabilidade em algumas regiões cujo
processo de criação, manutenção e atualização de bancos de dados de
escorregamentos não é uma prática consolidada. Por esse motivo, sugere-se aos
órgãos públicos responsáveis pela gestão de desastres naturais a criação,
manutenção e atualização de bancos de dados com informações sobre
escorregamentos, bem como sua disponibilização ao público. O mesmo vale para
base cartográfica, que quando não atualizada, gera inconsistência na realidade da
ocupação. Isso facilitaria a aplicação de metodologias baseadas em inteligência
artificial para a identificação de áreas suscetíveis a escorregamentos, além de
aumentar a confiabilidade dos resultados.

5.4 Estudos futuros


Como perspectiva futura, propõe-se a utilização de outros algoritmos de
classificação tais como Support Vector Machine (SVM), árvores de decisão e
regressão logística com o mesmo conjunto de dados.
Estudos de previsão de escorregamentos com aplicação de técnicas de
aprendizado de máquina, tendo como referência, mapas de suscetibilidade e dados
em tempo real proveniente de sensores.
Outra proposição seria a utilização dos mesmos dados e condições para
confecção do mapa de suscetibilidade pelos especialistas e pelas redes neurais.
Do ponto de vista de aplicação seria interessante a implementação de
integração com plataformas GIS, tais como o ArcGIS utilizado nesse trabalho, para
importação e tratamento dos dados.
99

REFERÊNCIAS
ABEDINI, M. et al. A comparative study of support vector machine and logistic model
tree classifiers for shallow landslide susceptibility modeling. Environmental Earth
Sciences, v. 78, n. 18, p. 1–15, 2019.
ADITIAN, A.; KUBOTA, T.; SHINOHARA, Y. Comparison of GIS-based landslide
susceptibility models using frequency ratio, logistic regression, and artificial neural
network in a tertiary region of Ambon, Indonesia. Geomorphology, v. 318, p. 101–
111, 2018.
AGGARWAL, C. C. Neural Networks and Deep Learning. [s.l: s.n.].
AL-BATAH, M. S. et al. Landslide Occurrence Prediction Using Trainable Cascade
Forward Network and Multilayer Perceptron. Mathematical Problems in
Engineering, v. 2015, 2015.
AL-NAJJAR, H. A. H. et al. Conditioning factor determination for mapping and
prediction of landslide susceptibility using machine learning algorithms. n. October, p.
19, 2019.
AUGUSTO FILHO, O. Caracterização geológico-geotécnica voltada à
estabilização de encostas: uma proposta metodológica. Conferência Brasileira
sobre Estabilidade de Encostas-COBRAE. Anais. Anais...1992
BARROS, A. J. DA S.; LEHFELD, N. A. DE S. Fundamentos de metodologia: um
guia para a iniciação científica. [s.l.] MAKRON, 2007.
BISHOP, C. M. Pattern Recognition and Machine Learning (Information Science
and Statistics). Berlin, Heidelberg: Springer-Verlag, 2006.
BITAR, O. Y. Cartas de Suscetibilidade a Movimentos Gravitacionais de Massa e
Inundações - 1:25.000. [s.l.] CPRM - Serviço Geológico do Brasil IPT - Instituto de
Pesquisas Tecnológicas, 2014.
BRAGAGNOLO, L.; DA SILVA, R. V.; GRZYBOWSKI, J. M. V. Landslide susceptibility
mapping with r.landslide: A free open-source GIS-integrated tool based on Artificial
Neural Networks. Environmental Modelling and Software, v. 123, n. August 2019,
p. 104565, 2020.
BRAGAGNOLO, L.; SILVA, R. V. D.; GRZYBOWSKI, J. M. V. Artificial neural network
ensembles applied to the mapping of landslide susceptibility. Catena, v. 184, n.
September 2019, p. 104240, 2020.
BUI, D. et al. Spatial prediction models for shallow landslide hazards: a comparative
100

assessment of the efficacy of support vector machines, artificial neural networks,


kernel logistic regression, and logistic model tree. Landslides, v. 13, n. 2, p. 361–378,
2016a.
BUI, D. T. et al. Spatial prediction models for shallow landslide hazards: a comparative
assessment of the efficacy of support vector machines, artificial neural networks,
kernel logistic regression, and logistic model tree. LANDSLIDES, v. 13, n. 2, p. 361–
378, abr. 2016b.
BUI, D. T. et al. New ensemble models for shallow landslide susceptibility modeling in
a semi-aridwatershed. Forests, v. 10, n. 9, 2019.
BUI, D. T. et al. Comparing the prediction performance of a Deep Learning Neural
Network model with conventional machine learning models in landslide susceptibility
assessment. Catena, v. 188, n. December 2019, p. 104426, 2020.
CANTARINO, I. et al. A ROC analysis-based classification method for landslide
susceptibility maps. Landslides, v. 16, n. 2, p. 265–282, 2019.
CARRARA, A.; GUZZETTI, F. Geographical information systems in assessing
natural hazards. [s.l.] Springer, Dordrecht, 1995.
CERVO, A. L.; BERVIAN, P. A.; DA SILVA, R. Metodologia cientifica. [s.l.] Pearson
Prentice Hall, 2006.
CHEN, W. et al. A comparative study of logistic model tree, random forest, and
classification and regression tree models for spatial prediction of landslide
susceptibility. Catena, v. 151, p. 147–160, 2017a.
CHEN, W. et al. Landslide spatial modeling: Introducing new ensembles of ANN,
MaxEnt, and SVM machine learning techniques. Geoderma, v. 305, n. June, p. 314–
327, 2017b.
CROOM, S. Topic issues and methodological concerns for operations management
research. EDEN Doctoral Seminar on Research Methodology in Operations
Management., 2005.
CRUDEN, D. et al. Multilingual Landslide Glossary. [s.l: s.n.].
DANG, V. H. et al. Enhancing the accuracy of rainfall-induced landslide prediction
along mountain roads with a GIS-based random forest classifier. Bulletin of
Engineering Geology and the Environment, v. 78, n. 4, p. 2835–2849, 2019.
DILLEY, M.; CHEN, R.S.; DEICHMANN, U.; LERNER-LAM, A.L.; ARNOLD, M.
Natural Disaster Hotspots: A Global Risk Analysis. [s.l: s.n.]. v. 19
DUBOIS, A.; GADDE, L. E. Systematic combining: An abductive approach to case
101

research. Journal of Business Research, v. 55, n. 7, p. 553–560, 2002.


FELL, R. et al. Guidelines for landslide susceptibility, hazard and risk zoning for land
use planning. Engineering Geology, v. 102, 2008.
FERNANDES, N. et al. Condicionantes Geomorfológicos dos Deslizamentos nas
Encostas: Avaliação de Metodologias e Aplicação de Modelo de Previsão de Áreas
Susceptíveis. Revista Brasileira de Geomorfologia, v. 2, 2001.
FLACH, P. Machine Learning: The Art and Science of Algorithms That Make
Sense of Data. USA: Cambridge University Press, 2012.
FORNASARI FILHO, N.; FARIA, M. S. C. Relevo e Dinâmica Superficial. In:
OLIVEIRA, A. M. S.; MONTICELI, J. J. (ORG. ). (Ed.). . Geologia de Engenharia e
Ambiental. Vol. 2 ed. São Paulo: Associação Brasileira de Geologia de Engenharia e
Ambiental, 2018. p. 204–228.
GARCIA-URQUIA, E.; YAMAGISHI, H. Landslide Susceptibility Mapping Based on
Aerial Photograph Interpretation Inventory for Tegucigalpa, Honduras: An Application
of the Matrix Method. In: GIS Landslide. [s.l: s.n.].
GE, Y. et al. A comparison of five methods in landslide susceptibility assessment: a
case study from the 330-kV transmission line in Gansu Region, China. Environmental
Earth Sciences, v. 77, n. 19, p. 1–15, 2018.
GOETZ, J. N. et al. Evaluating machine learning and statistical prediction techniques
for landslide susceptibility modeling. Computers and Geosciences, v. 81, p. 1–11,
2015.
GONÇALVES, H. DE A. Manual de metodologia da pesquisa científica. [s.l.]
Avercamp, 2005.
GUZZETTI, F. et al. Landslide hazard evaluation: a review of current techniques and
their application in a multi-scale study, Central Italy. Geomorphology, v. 13, n. 6, p.
1995, 1999.
GUZZETTI, F. et al. Probabilistic landslide hazard assessment at the basin scale.
Geomorphology, v. 72, n. 1–4, p. 272–299, 2005.
HAN, J.; KAMBER, M.; PEI, J. 8 - Classification: Basic Concepts. In: HAN, J.;
KAMBER, M.; PEI, J. (Eds.). . Data Mining (Third Edition). The Morgan Kaufmann
Series in Data Management Systems. Third Edit ed. Boston: Morgan Kaufmann, 2012.
p. 327–391.
HAYKIN, S. Neural Networks and Learning Machines. [s.l: s.n.]. v. 3
HONG, H. et al. Landslide susceptibility assessment at the Wuning area, China:
102

a comparison between multi-criteria decision making, bivariate statistical and


machine learning methods. [s.l.] Springer Netherlands, 2019. v. 96
IPT. Atualização do Plano Municipal de Redução de Riscos de Deslizamentos para o
Município de Guarujá. Science of Surverying and Mapping, v. 41, 2016.
JAIN, A. K. Data clustering: 50 years beyond K-means. Pattern Recognition Letters,
v. 31, n. 8, p. 651–666, 2010.
KAWABATA, D.; BANDIBAS, J. Landslide susceptibility mapping using geological
data, a DEM from ASTER images and an Artificial Neural Network (ANN).
Geomorphology, v. 113, n. 1–2, p. 97–109, 2009.
KITCHENHAM, B. Procedures for Performing Systematic Reviews. 2004
KITCHENHAM, B. et al. Systematic literature reviews in software engineering - A
systematic literature review. Information and Software Technology, v. 51, n. 1, p. 7–
15, 2009.
KRKAČ, M. et al. Method for prediction of landslide movements based on random
forests. Landslides, v. 14, n. 3, p. 947–960, 2017.
KUHN, M.; JOHNSON, K. Applied Predictive Modeling with Applications in R. [s.l:
s.n.]. v. 26
KUMAR, D. et al. Landslide susceptibility mapping & prediction using Support Vector
Machine for Mandakini River Basin, Garhwal Himalaya, India. Geomorphology, v.
295, n. June, p. 115–125, 2017.
LISTO, F. DE L. R. Análise Da Suscetibilidade E Do Grau De Risco a
Escorregamentos Rasos Na Bacia Do Alto Aricanduva, RMSP ( Sp ). UNIVERSIDADE
DE SÃO PAULO Faculdade de Filosofia, Letras e Ciências Humanas, p. 151, 2011.
LITTELL, J. H.; CORCORAN, J.; PILLAI, V. Systematic Reviews and Meta-Analysis.
[s.l.] Oxford University Press, 2008. v. 26
LUCCHESE, L. V.; DE OLIVEIRA, G. G.; PEDROLLO, O. C. Attribute selection using
correlations and principal components for artificial neural networks employment for
landslide susceptibility assessment. Environmental Monitoring and Assessment, v.
192, n. 2, 2020.
MARCONI, M. DE A.; LAKATOS, E. M. Metodologia científica. [s.l.] Atlas, 2004.
MAY, R.; DANDY, G.; MAIER, H. Review of Input Variable Selection Methods for
Artificial Neural Networks. Artificial Neural Networks - Methodological Advances
and Biomedical Applications, n. April, 2011.
MERGHADI, A. et al. Machine learning methods for landslide susceptibility studies: A
103

comparative overview of algorithm performance. Earth-Science Reviews, v. 207, n.


June, p. 103225, 2020.
MIGUEL, P. A. C. Estudo de caso na engenharia de produção: estruturação e
recomendações para sua condução. Production, v. 17, n. 1, p. 216–229, abr. 2007.
MILIAN, E. Z.; SPINOLA, M. DE M.; CARVALHO, M. M. D. Fintechs: A literature review
and research agenda. Electronic Commerce Research and Applications, v. 34, n.
February, 2019.
MINISTÉRIO DAS CIDADES, I. DE P. T. DO E. DE S. P. Mapeamento de riscos em
encostas e margens de rios. [s.l: s.n.].
MITCHELL, T. M. Machine Learning. [s.l.] McGraw-Hill, 1997.
NERY, T. D. Avaliação da suscetibilidade a escorregamentos translacionais rasos na
Badia da Ultrafértil, Serra do Mar (SP). p. 170, 2011.
NOLA, I. T. DE S. Avaliação de dados geológico -geotécnicos prévios para elaboração
de carta de eventos perigosos de movimentos de massa gravitacionais por meio de
redes neurais artificiais e probabilidade Avaliação de dados geológico -geotécnicos
prévios para elaboração d. 2015.
PEROVANO, D. G. Manual De Metodologia Da Pesquisa Científica. [s.l.]
INTERSABERES, 2016.
PETTICREW, M.; ROBERTS, H. Systematic Reviews in the Social Sciences: A
Practical Guide. [s.l: s.n.]. v. 11
PHAM, B. T. et al. Rotation forest fuzzy rule-based classifier ensemble for spatial
prediction of landslides using GIS. Natural Hazards, v. 83, n. 1, p. 97–127, 2016a.
PHAM, B. T. et al. Evaluation of predictive ability of support vector machines and naive
Bayes trees methods for spatial prediction of landslides in Uttarakhand state (India)
using GIS. Journal of Geomatics, v. 10, n. 1, p. 71–79, 2016b.
PHAM, B. T. et al. Landslide susceptibility assessment by novel hybrid machine
learning algorithms. Sustainability (Switzerland), v. 11, n. 16, p. 1–25, 2019.
PHAM, B. T.; TIEN BUI, D.; PRAKASH, I. Bagging based Support Vector Machines for
spatial prediction of landslides. Environmental Earth Sciences, v. 77, n. 4, p. 1–17,
2018.
PRADHAN, A. M. S.; LEE, S. R.; KIM, Y. T. A shallow slide prediction model combining
rainfall threshold warnings and shallow slide susceptibility in Busan, Korea.
Landslides, v. 16, n. 3, p. 647–659, 2019.
PRADHAN, B.; LEE, S. Regional landslide susceptibility analysis using back-
104

propagation neural network model at Cameron Highland, Malaysia. Landslides, v. 7,


n. 1, p. 13–30, 2010.
PROVOST & FAWCETT. Data science-what you need to know about analytic-thinking
and decision-making. Journal of Chemical Information and Modeling, v. 53, n. 9, p.
1689–1699, 2013.
QUEVEDO, R. P. MAPEAMENTO DE SUSCETIBILIDADE A MOVIMENTOS DE
MASSA A PARTIR DE APRENDIZADO DE MÁQUINA. Journal of Chemical
Information and Modeling, v. 53, n. 9, p. 1689–1699, 2019.
REICHENBACH, P. et al. A review of statistically-based landslide susceptibility
models. Earth-Science Reviews, v. 180, n. March, p. 60–91, 2018.
RIFFEL, E. S. Metodologias para mapeamento de suscetibilidade a movimentos de
massa. Programa de Pós-graduação em Geografia, p. 120, 2017.
ROSS, J. L. S. O REGISTRO CARTOGRÁFICO DOS FATOS GEOMORFOLÓGICOS
E A QUESTÃO DA TAXONOMIA DO RELEVO. Revista do Departamento de
Geografia, v. 6, p. 17–29, 2011.
RUMELHART, D.; HINTON, G. E.; WILLIAMS, R. J. Learning representations by back-
propagating errors. Nature, v. 323, p. 533–536, 1986.
RUSSELL, S.; NORVIG, P. Artificial Intelligence: A Modern Approach. 3rd. ed.
USA: Prentice Hall Press, 2009.
SAHIN, E. K.; COLKESEN, I.; KAVZOGLU, T. A comparative assessment of canonical
correlation forest, random forest, rotation forest and logistic regression methods for
landslide susceptibility mapping. Geocarto International, v. 35, n. 4, p. 341–363,
2020.
SAMUEL GAMEIRO. Capacidade de Generalização e Extrapolação de Redes Neurais
Artificiais no Mapeamento a Suscetibilidade de Deslizamentos. 2020.
SCANNAVINO, K. R. F. et al. Revisão Sistemática da Literatura em Engenharia de
Software: teoria e prática. [s.l.] Elsevier, 2017.
SHAHARUM, S. M.; SUNDARAJ, K.; HELMY, K. Performance analysis of feature
selection method using anova for automatic wheeze detection. Jurnal Teknologi, v.
77, n. 7, p. 43–47, 2015.
SHAKEELA, S. et al. Optimal ensemble learning based on distinctive feature selection
by univariate ANOVA-F statistics for IDS. International Journal of Electronics and
Telecommunications, v. 67, n. 2, p. 267–275, 2021.
SILVERMAN, B. W. Density Estimation for Statistics and Data Analysis. Chapman &
105

Hall, London – New York 1986, 175 pp. Biometrical Journal, v. 30, n. 7, p. 876–877,
1988.
SKANSI, S. Introduction to deep learning: From Logical Calculus to Artificial
Intelligence. [s.l: s.n.]. v. 114
SOKOLOVA, M.; JAPKOWICZ, N.; SZPAKOWICZ, S. Beyond accuracy, F-score and
ROC: A family of discriminant measures for performance evaluation. AAAI Workshop
- Technical Report, v. WS-06-06, n. January, p. 24–29, 2006.
STABILE, R. et al. Análise de fatores condicionantes de instabilizações em
encostas como subsídio para a modelagem estatística da suscetibilidade a
deslizamentos. 2013
TAALAB, K.; CHENG, T.; ZHANG, Y. Mapping landslide susceptibility and types using
Random Forest. Big Earth Data, v. 2, n. 2, p. 159–178, 2018.
TOMINAGA, L. K.; SANTORO, J.; AMARAL, R. Desastres Naturais : conhecer para
prevenir. [s.l: s.n.].
VARNES, D. J. et al. Landslide Hazard Zonation: A Review of Principles and
Practice. [s.l.] Unesco, 1984.
VEDOVELLO R.; MACEDO, E. S. Deslizamentos de Encostas. In: DOS SANTOS, R.
F. (Ed.). . Vulnerabilidade Ambiental: Desastres naturais ou fenômenos
induzidos? Brasília: Ministério do Meio Ambiente – MMA, 2007. p. 75–93.
VIANNA, I. O. DE A. Metodologia do trabalho científico: um enfoque didático da
produção científica. [s.l.] E.P.U., 2001.
VOSS, C.; TSIKRIKTSIS, N.; FROHLICH, M. Case research in operations
management. International Journal of Operations and Production Management,
v. 22, n. 2, p. 195–219, 2002.
WANG, Y. et al. Optimizing the predictive ability of machine learning methods for
landslide susceptibility mapping using smote for Lishui city in Zhejiang province, China.
International Journal of Environmental Research and Public Health, v. 16, n. 3,
2019.
WANG, Y.; FANG, Z.; HONG, H. Comparison of convolutional neural networks for
landslide susceptibility mapping in Yanshan County, China. Science of the Total
Environment, v. 666, p. 975–993, 2019.
WOHLIN, C. et al. Experimentation in software engineering. [s.l: s.n.]. v.
9783642290
WU, H. et al. Type 2 diabetes mellitus prediction model based on data mining.
106

Informatics in Medicine Unlocked, v. 10, p. 100–107, 2018.


YU, Y. et al. Implementation of Machine Learning-Aided Imaging Analytics for
Histopathological Image Diagnosis. In: WOLKENHAUER, O. (Ed.). . Systems
Medicine. Oxford: Academic Press, 2021. p. 208–221.
ZÊZERE, J. Landslide susceptibility assessment considering landslide typology. A
case study in the area north of Lisbon (Portugal). Natural Hazards and Earth System
Sciences, v. 2, 2002.
107

APÊNDICE A – ARTIGO APRESENTADO NO XII SIMPÓSIO


INTERNACIONAL DE ESCORREGAMENTOS

A Systematic Review: Big Data Analytics and Landslides


Caio da Silva Azevedo¹, Thaís Passos Correia², Alessandra Cristina
Corsi³, Mauro de Mesquita Spinola4 and José Alberto Quintanilha5
1 Postgraduate Program in Production Engineering at the Polytechnic School of the
University of São Paulo – PRO - EPUSP
2 Postgraduate Program in Transportation Engineering at the Polytechnic School of
the University of São Paulo – PTR - EPUSP
3 Institute for Technological Research - IPT
4 Production Engineering Department at the Polytechnic School of the University of
São Paulo – PRO – EPUSP
5 Institute of Energy and Environment of the University of São Paulo – IEEUSP
caio.aze@usp.br

Abstract
Landslides are among the natural disasters that most affect the population in Brazil and in the
world, as they are responsible for numerous humans, economic, social and environmental
losses. High-resolution aerial and satellite imagery, that contribute to identify this type of event
are valuable sources of information, even if they are not the only ones. Machine learning (ML)
techniques are often adopted to identify relevant patterns, as high-performance computing and
data visualization are widely and successfully applied to natural disaster-related data,
particularly for landslides. The greater the volume of data processed during machine learning,
the better the accuracy of the results obtained. Among other reasons, Big Data (BD) has stood
out for its ability to integrate and generate a large volume of data from different sources and in
different formats. The use of BD concepts and techniques has become common in several
areas of knowledge, in particular for the storage and analysis of data related to natural
accidents and, thus, helping to improve decision making as well as prevention of disasters.
With the emergence of the BD, it came the challenge of aligning decision-making processes,
so that there is no shortage of information or useless data for decision makers. In the case of
Brazil and considering, especially, applications to landslide data, there is a lack of articles
dealing with the subject. The aim of this study is to investigate the main features used on
machine learning techniques, to map the literature, thus pointing out new routes and
opportunities in the field. In the systematic review, the eligibility criteria adopted are studies
published in the last 4 years (from January 2015 to December 2019), in English, at national
108

and international levels, including publications in scientific events and relevant journals,
through databases such as Scopus and Web of Science. The search was performed in a
structured form with the terms "Big Data*", "machine learn*","landslid*", "forecast*" and
"predict*" and the like through the boolean operator “AND” or “OR” in order to restrict the theme
to the aspects to be discussed. The researches were included when they contained a
description of the BD and ML techniques, and could be applied to landslide studies.
109

1 INTRODUCTION
Landslides are one of the most catastrophic events that have a huge impact on
humans and have received attention for centuries in several countries around the
world. On one hand, the driving factors of landslides are complex.
Landslides can be predicted as it is possible to monitor their conditioning or
potentiating agents and the mechanisms related to the movement of materials in the
different types of landslide. In other words, it is possible to identify the areas that are
most susceptible to landslide, in addition to their typology and magnitude. In this way,
it is possible to define and implement distinct mechanisms and actions to avoid and/or
minimize the negative consequences caused by this phenomenon in a certain area.
To this end, land management should consider three factors: avoiding the emergence
of risk areas and situations, identifying and characterizing these already existing
regions, and resolving or reducing the risks that exist (Vedovello and De Macedo,
2007).
Big Data is no longer a buzzword nowadays. Big Data carries with it the
opportunity to change business models design and everyday decision making that
requires emerging data analysis. Its most diffused definition is: “Big Data is high-
volume, high-velocity and high-variety information assets that demand cost-effective,
innovative forms of information processing for enhanced insight, decision making and
process automation” (Gartner Glossary, 2020).
Big Data and predictive analytics have the potential to revolutionize natural
disasters such as landslides prevention, presenting a doozy of an opportunity and a
challenge to our field (Wang and Sun, 2013).
Landslides prediction methods can be grouped into two types, qualitative and
quantitative. The qualitative techniques (landslide inventory and weighted methods)
rely on judgment of experts. On the other hand, quantitative techniques (statistical,
probabilistic and deterministic methods) are based on mathematical approach.
Recently, machine learning algorithms have been used for developing quantitative
models (Shirzadi et al., 2018).
Existing literature reviews of Big Data, machine learning and landslide can be
divided into two categories: traditional literature reviews and systematic literature
reviews (SLR).
In order to understand trends in Big Data, machine learning and landslide could
provide a potential guide for future research. In addition, governments could integrate
the current knowledge of landslides into their sustainable development policy, planning
and programming.
Despite the increasing interest in the use of machine learning techniques to
forecast landslides, there is still a lack of research examining the landscape and the
spatial data in the Big Data environment in relation to natural disasters such as floods
and landslides, particularly in Brazil (Correia et al., 2020). The aim of this study is to
investigate the main features used on machine learning techniques, to map the
literature and point out new routes and opportunities in the field.

2 METHODS
The basic objective of a Systematic Literature Review (SLR) is to gather and
assess the available research related to the subject of interest (the research question),
thus achieving impartial results that can be audited and repeated. An SLR is a rigorous
methodological review of research results, whose objective is not just to group existing
110

works on this subject; it is also meant to help developing evidence-based guidance for
professionals involved in the area of study (Kitchenham, 2004).
Moreover, to demonstrate that the work is new to the existing body of
knowledge, the results of an SLR should identify the state of the art regardless to the
research question (Levy and Ellis, 2006). The authors of this study planned and
conducted the systematic review.
A review protocol at the planning phase was proposed. This review protocol
includes: questions definition, search strings, study selection, data extraction, and data
analysis. This study used the Parsifal (2018). Parsifal is an online tool designed to
support researchers to perform systematic literature reviews within the context of
Software Engineering. Geographically distributed researchers can work together within
a shared workspace, designing the protocol and conducting the research.
In the first stage, we raised a set of research questions based on the objective
of this paper. Then, in the second stage, aiming at the research questions, we designed
search strings to find out the studies relevant to answer our questions. In this moment,
the stage involves the determination of search terms. After this, the next step is the
selection of literature resources. In the third stage, we defined study selection criteria
to identify the relevant studies that can really contribute to our study. As part of this
stage, pilot study selection was employed to accepted or rejected the literature select
in the past step of our process. The remaining two stages involve data extraction and
data synthesis, respectively. In the data extraction stage, we initially devised data
extraction form and subsequently refined it through pilot data extraction. Finally, in the
data synthesis stage, we determined the proper methodologies for synthesizing the
extracted data.

2.1 Research Questions


This section describes the process followed to accomplish this systematic
literature review, which is based on a known and validated methodology (Kitchenham
et al., 2008). The Parsifal – through Systematic Review was used. This is an online
tool designed to support researchers to perform systematic literature which lends
support for planning, executing, and summarizing an SLR, as proposed by Kitchenham
(2004). Moreover, to identify the scenario for scientific literature on landslides,
bibliometric analysis techniques (Ikpaahindi, 1985) and content analysis (Duriau et al.,
2007) were used.

For the study to achieve its objectives, some research questions are proposed:

(1) RQ1. How has the literature on the use of Big Data analytics on landslides evolved
over time?

Seeking answers of a more quantitative nature, this question has been broken
down into the following:

RQ1.1. How has the number of publications about this subject evolved over time?

RQ1.2. What are the main periodicals for this subject and how has the number of
publications evolved over the last four years?

(2) RQ2. Which and where are the main references about the use of Big Data
techniques for landslides prediction?
111

RQ2.1. Which countries contributed most in terms of publications over the last four
years (considering the number of publications)?

RQ2.2. Which have been the most influential studies over the last four years
(considering the number of citations)?

RQ2.3. Who are the main authors (considering the number of publications)?

(3) RQ3. Which machine learning techniques have been used for landslides prediction
(by the number of keywords)?

RQ3 aims at identifying the ML techniques that have been used to predict
landslides. Practitioners can take the identified ML techniques as candidate solutions
in their practice. For ML techniques that have not yet been employed in landslides
prediction, researchers can explore the possibility of using them as potential feasible
solutions.

(4) RQ4. What is the overall estimation accuracy of ML models?

RQ4 is concerned with the estimation accuracy of ML models. Estimation


accuracy is the primary performance metric for ML models. This question focuses on
the following four aspects of estimation accuracy: accuracy metric, accuracy value,
data set for model construction, and model validation method.

(5) RQ5: Are there any ML models that distinctly outperform other ML models?

The evidence of comparisons between different ML models can be synthesized


to determine which ML models consistently outperform other ML models. Thus, RQ5
aims to identify the ML models with relatively excellent performance.

(6) RQ6 What are the main features used by ML techniques?

The ML feasibility use is related with data acquisition. In case of landslides


areas, the conditioning factors may be different according to the region. In addition,
data gathering rely on devices such as satellites and accelerometers.

2.2 RESEARCH QUESTIONS THE SAMPLING PROCESSES

The initial sample was taken from the indexed databases Web of Science
Core™ Collection through the ISI Web of Knowledge™ portal (Thomson Reuters) and
Scopus® by Elsevier B.V. These databases were selected since they provide
interfaces that make it possible to perform simultaneous searches on different sources
using the common set of search strings. In a broad way, i.e., without restriction on
periodicals, periods or areas of knowledge, studies from January 2015 until December
2019 were identified.
112

Works that did not meet the requirements above were rejected under the quality
criterion (Kitchenham and Charters, 2007; Kitchenham et al., 2008).
Figure 1 represents the initial schematic presentation of the process for
identifying and selecting the sample for the study. The following steps were used to
construct the search terms:
(a) Derive major terms from the research questions.
(b) Identify alternative spellings and synonyms for major terms.
(c) Check the keywords in relevant papers or books.
(d) Use the Boolean OR to incorporate alternative spellings and synonyms.
(e) Use the Boolean AND to link the major terms
With the use of previous definitions for the search strings, the searches were
carried out on the databases indexed in Web of Science and Scopus. Based on the
results obtained, the strings were refined eliminating publications in which the
expressions contained in the search string were not connected with Big Data
technologies and landslides prediction.
Previous Search 1 and Search 2 are introduced individually to highlight the
relevance of these subjects. Afterward they were combined by AND operator which
resulted in 387 candidate papers.

Figure 1. Search and selection process – search phase. Source: the authors, 2020.

Figure 2 represents selection phase divided in three steps. Where a step


restricted the publications written in English and from 2015 to 2019, resulting in 337
relevant papers. The result of the search and first selection were inserted into the
database of the Parsifal tool where additional steps were performed.
Parsifal tool automatically removed duplicated articles, i.e. step b, resulting in
226 relevant papers.
Finally, inclusion and exclusion criteria (defined below) were applied to the
candidate papers to identify the relevant papers, which provide potential data for
answering the research questions. Thus 155 publications were accepted.
Inclusion criteria:
• Clearly mention machine learning to predict landslides
Exclusion criteria:
• Deal with the topic superficially
• Not related to Big Data, ML or AI
• Not related to landslides prediction
113

Figure 2. Search and selection process – selection phase.


Source: the authors, 2020.

2.3 Data Analysis


By data extraction, we exploited the selected studies to aggregate evidence for
answering the research questions. A single piece of evidence might have small
evidence force, but the aggregation of many of them can make a point stronger. The
quantitative data in this review were achieved by using varying experimental designs.
We employed different strategies to synthesize the extracted data pertaining to
different kinds of research questions. The synthesis strategies are explained in detail
as follows.
For the data pertaining to RQ1, RQ1.1, RQ1.2, RQ2, RQ2.1, RQ2.2 and RQ2.3,
we used narrative synthesis method. That is, the data were tabulated in a manner
consistent with the questions. Some visualization tools, including bar chart, and pie
chart. The citations and publications were analyzed to identify the most influential
studies. This analysis is based on the premise that authors cite publications they
consider important to the development of their studies; therefore, the documents cited
with greatest frequency probably exercise a greater influence that the least often cited
(Ramos-Rodríguez and Ruíz-Navarro, 2004).
For the data pertaining to RQ3, that concerns the main ML techniques, we used
counting method. That is the same method used to RQ6 but here we count how often
a landslide factor was used as input to ML techniques.
On the other hand, data pertaining to RQ4 and RQ5, which focus on the
comparison of estimation accuracy between different estimation models, we used vote
counting method. We just need to count the number of experiments in which model A
is reported to outperform model B and the number of experiments in which model B is
reported to outperform model A. The two numbers are then used as the basis to
analyse the overall comparison between model A and model B. By this way, we can
obtain a general idea about whether an estimation technique outperforms another
technique or not.
The use of content analysis techniques is intended to respond to questions RQ3
and RQ6. This technique was adopted because it offers flexibility in defining a coding
scheme for the techniques of the landslides and machine learning and for the research
question in the landslide’s features contained in the sample. This is then used in the
frequency statistics for these codes and their relationships.
114

3 RESULTS
This section contains the results of the process of surveying quantitative data
related to the periods, publications, authors, citations and other information involving
the periodicals that are part of the sample.
First, we present an overview of the selected studies. Second, we report and
discuss the review findings according to the research questions, one by one in the
separate subsections. During the discussion, we interpret the review results not only
within the context of the research questions, but also in a broader context closely
related to the research questions.

3.1 Bibliometric Analysis


This subsection contains the results of the process of surveying quantitative
data related to the periods, publications, authors, citations and other information
involving the periodicals that are part of the sample.

3.1.1 Publications/year/period

It was identified 155 studies in the field of landslides prediction using machine
learning techniques. They were published during time period 2015-2019 and we focus
on papers written in English. 7 papers (4%) were found up to 2015, 12 (8%) are from
2016, 23 (15%) from 2017, 33 are from 2018 (21%), 80 from 2019 (52%), totalling the
155 publications selected. It is emphasized that 52% of the publications are from 2019,
clearly showing the intensity, currency, and increased interest by researchers in the
subject (Figure 3).

Figure 3. Number of publications in recent years.


80 80
70
60
Publications

50
40 33
30 23
20 12
7
10
0
2015 2016 2017 2018 2019
Years

Source: the authors, 2020.

3.1.2. Frequency of the citations in the periods


Table 1 presents the frequency of citations in the period starting in 2015,
showing the most influential studies over the last five years. The precursor work of Bui
Dieu Tien et al. (2015) fulfils the criteria of the sample and uses a case study to deal
with the landslides’ prediction by the use of five machine learning models, having MLP
Neural Nets model the highest prediction capability (90.2 %).

Table 1. The 10 most influential articles about this study's theme.


115

Sources: (1) “Scopus®” (Elsevier B.V.) and (2) ISI Web of Knowledge™ (Thomson Reuters).

3.1.3. Publications /periodicals/periods


The 155 works in the sample were published in 78 different periodicals. Table 2
shows only the top 10 journals that present the most of publications about this study
topic between 2015 and December 2019. In first place is the Environmental Earth
Sciences journal, with 11 publications.
Table 2. The selected journals with the most publications.

Source: the authors, 2020.

3.1.4 Countries/publications
It was also verified where the main references about the use of Big Data
techniques for the landslides’ prediction were located (Figure 4). Of the 155 articles
considered, China has more publications (51) followed by Vietnam (22); Iran (15); India
(13); South Korea (7); Turkey (6); Japan and Austria (4); Malaysia and Croatina (3),
Taiwan, Norway, Italy, Indonesia, Australia and Algeria (2 each one), Tunisia, Sri
Lanka, Slovakia, Serbia, New Zealand, Netherlands, Korea, Jordan, Greece, Germany
and Brazil (1).
Figure 4. Countries that have more publications about BD and landslides prediction.

Source: the authors, 2020.

3.1.5 Types of ML techniques


From the selected studies, it was identified the most used types of ML
techniques that had been applied to predict landslides (Figure 5). The identified
116

machine learning techniques were support vector machine (77, the most used), neural
network (52), random forest (51), logistic regression (39), decision tree (27), bagging
(16), rotation forest (15) and others (adaboost - 10, naive bayes - 9, multiboost - 8, rbf
- 8, deep learning - 8, linear regression - 2, xgboost - 2, knn - 1, radial base - 0).

Figure 5. ML techniques identified.

Source: the authors, 2020.

3.1.6 Overall estimation accuracy and the most outperformed ML models

In order to provide a panoramic overview regarding most used ML techniques


performance, we considered accuracy metric. In classification problems, accuracy is
the number of correct predictions, positive or negative, divided by the total number of
predictions made (Sokolova et al. 2006).
From selected sample of 46 papers, those about the use of ML techniques that
informed overall accuracy metric for testing, we estimated average accuracy in
86.74%, having a peak of 96% as reported by Emrehan Kutlug Sahin, Ismail Colkesen
& Taskin Kavzoglu in the article “A comparative assessment of canonical correlation
forest, random forest, rotation forest and logistic regression methods for landslide
susceptibility mapping” (2018), when they combined ensemble learning methods and
the conventional statistical method decision tree method to landslide displacement
prediction for Yenice district of Karabuk in Turkey.
Furthermore, we can find that random forest and support vector machine overall
outperform the other ML models. Nonetheless, we should avoid drawing such a
misleading conclusion that RF and SVM are always preferable without any restriction.

3.1.7. Most usual features


The 62 works in the sample that mentioned factor used to predict landslides
through ML technique we highlight: slope, lithology, elevation, plan curvature, land use,
aspect, distance to roads, distance to river, profile curvature, topographic wetness
index, distance to faults and rainfall as the most used.

4 CONCLUSIONS
This article shows that of the 155 selected studies, 2019 was the year with the
largest number of studies about BD, ML techniques and landslides prediction, and
there is an increasing trend of publications about this subject. Regarding the
periodicals that published the most about this theme, Catena and Environmental Earth
Sciences journals stand out.
The country with the most publications is China, few publications from Brazil
about this topic were noted; in the case of Brazil and considering, especially,
117

applications to landslide data, there is a lack of articles dealing with the subject. The
most used machine learning technique, identified in the selected studies, was the
support vector machine.
It was estimated an average accuracy in 86.74% and it could find that random
forest and support vector machine overall outperform the other ML models. According
to the systematic review, there is still a shortage of studies about Big Data, machine
learning techniques and landslide’s prediction, mainly in Brazil; however, it was noted
there has been a growing interest about the topic in recent years.

5 REFERENCES

Bui, D. T., Ho, T. C., Pradhan, B., Pham, B. T. (2016). GIS-Based Modeling of Rainfall-Induced
Landslides Using Data Mining Based Functional Trees Classifier with AdaBoost, Bagging, and
MultiBoost Ensemble Frameworks. Environmental Earth Sciences 75: 1-22. DOI: 10.1007/s12665-
016-5919-4

Bui, D. T., Tuan, T. A., Klempe, H., Pradhan, B., Revhaug, I. (2015). Spatial prediction models for
shallow landslide hazards: a comparative assessment of the efficacy of support vector machines,
artificial neural networks, kernel logistic regression, and logistic model tree. Landslides 13: 361-378.
DOI:10.1007/s10346-015-0557-6

Chen, W., Hong, H., Peng, J., Shahabi, H. (2018). Landslide susceptibility modelling using GIS-based
machine learning techniques for Chongren County, Jiangxi Province, China. Science of The Total
Environment 626: 1121-1135. DOI: 10.1016/j.scitotenv.2018.01.124

Chen, W., Kornejady, A., Pourghasemi, H. R. (2017). Landslide spatial modeling: Introducing new
ensembles of ANN, MaxEnt, and SVM machine learning techniques. Geoderma 305: 314-327. DOI:
10.1016/j.geoderma.2017.06.020

Correia, T. P.; Corsi, A. C.; Quintanilha, J. A., (2020). “Big Data for Natural Disasters in an Urban
Railroad Neighborhood: A Systematic Review”. Smart Cities 3 (2): 202-211.
https://doi.org/10.3390/smartcities3020012.

Duriau, V.J., Reger, R.K., Pfarrer, M.D., (2007). “A content analysis of the content analysis literature in
organization studies: Research themes, data sources, and methodological refinements”.
Organizational Research Methods 10: 5–34. https://doi.org/10.1177/1094428106289252.

Gartner Glossary, (2020). “Big Data”. Available in: https://www.gartner.com/en/information-


technology/glossary/big-data. Accessed on: February 20, 2020.

Goetz, J., Brenning, A., Petschko, H., Philip, L., (2015). Evaluating machine learning and statistical
prediction techniques for landslide susceptibility modeling. Computers & Geosciences 81: 1 – 11.
DOI: 10.1016/j.cageo.2015.04.007

Ikpaahindi, L., (1985). “An overview of bibliometrics: its measurements, laws and their applications”.
Libraries 35: 163.

Kitchenham, B., (2004). “Procedures for performing systematic reviews”. Keele Univ., Keele, UK: 1-33.
https://doi.org/10.1.1.122.3308

Kitchenham, B., Brereton, O. P., Budgen, D., Turner, M., Bailey, J., Linkman, S., (2008). “Systematic
literature reviews in software engineering – A systematic literature review”. Information and Software
Technology 51: 7–15. https://doi.org/10.1016/j.infsof.2008.09.009.

Levy, Y., Ellis, T. J., (2006). “A systems approach to conduct an effective literature review in support of
information systems research”. Informing Science 9: 181–211. https://doi.org/10.1049/cp.2009.0961.
118

Milian, E.Z., Spínola, M.D., & Carvalho, M.M. (2019). Fintechs: A literature review and research agenda.
Electron. Commer. Res. Appl., 34. https://doi.org/10.1016/j.elerap.2019.100833.

Parsifal Software (2018). Available in: https://parsif.al/about/. Accessed on: February 20, 2020.

Pham, B. T., Pradhan, B., Bui, D. T., Prakash, I., Dholakia, M. B.¹ (2016). A comparative study of
different machine learning methods for landslide susceptibility assessment: A case study of
Uttarakhand area (India). Environmental Modelling & Software 84: 240-250.
https://doi.org/10.1016/j.envsoft.2016.07.005

Pham, B. T., Bui, D. T., Dholakia, M. B., Prakash, I.² (2016). A Comparative Study of Least Square
Support Vector Machines and Multiclass Alternating Decision Trees for Spatial Prediction of Rainfall-
Induced Landslides in a Tropical Cyclones Area. Geotechnical and Geological Engineering 34: 1807-
1824. DOI: 10.1007/s10706-016-9990-0

Pham, B. T., Bui, D. T., Prakash, I., Dholakia, M. B. (2017). Hybrid integration of Multilayer Perceptron
Neural Networks and machine learning ensembles for landslide susceptibility assessment at
Himalayan area (India) using GIS. Catena 149: 52-63. https://doi.org/10.1016/j.catena.2016.09.007

Pourghasemi, H. R., Kerle, N. (2016). Random forests and evidential belief function-based landslide
susceptibility assessment in Western Mazandaran Province, Iran. Environmental Earth Sciences 75:
1-17. https://doi.org/10.1007/s12665-015-4950-1

Ramos-Rodríguez, A.-R., Ruíz-Navarro, J., (2004). “Changes in the intellectual structure of strategic
management research: a bibliometric study of the Strategic Management Journal, 1980–2000”.
Strategic Management Journal 25: 981–1004.https://doi.org/10.1002/smj.397.

Shirzadi, A., Bui, D. T., Pham, B. T., Chapi, K. S. K., Kavian, A., Shahabi, H., Revhaug, I. (2017). Shallow
landslide susceptibility assessment using a novel hybrid intelligence approach. Environmental Earth
Sciences 76: 1-18. DOI 10.1007/s12665-016-6374-y

Shirzadi, A., Soliamani, K., Habibnejhad, M., Kavian, A., Chapi, K., Shahabi, H., Chen, W., Khosravi,
K., Pham, B.T., Pradhan, B., Ahmad, A., Ahmad, B.B., & Bui, D.T., (2018). “Novel GIS Based Machine
Learning Algorithms for Shallow Landslide Susceptibility Mapping”. Sensors 18(11): 1-28.

Sokolova, M., Japkowicz, N., Szpakowicz, S., (2006). “Beyond Accuracy, F-score and ROC: a Family
of Discriminant Measures for Performance Evaluation”. Adv. Artif. Intell. 4304: 1015–1021.

Vedovello R., De Macedo, E. S. Deslizamentos de Encostas, (2007). In: Dos Santos, R. F. (Org.).
“Vulnerabilidade Ambiental: Desastres naturais ou fenômenos induzidos?” Brasília: Ministério do
Meio Ambiente – MMA, 75-93.

Wang, X., Sun, Z., (2013). ”The design of water resources and hydropower cloud GIS platform based
on big data”. In Geo-Informatics in Resource Management and Sustainable Ecosystem, Springer
Berlin Heidelberg: 313-322.

This research was funded by the Sao Paulo Research Foundation (FAPESP),
grant numbers: 2017/50343-2, 2018/21279-7 and 2019/14011-0, and it was developed
in partnership with the Institute for Technological Research (IPT) and the Polytechnic
(engineering) School of University of Sao Paulo (EPUSP).
The Authors declare that they do not have Conflict of Interest with the contents
and authorize the Editorial Committee of XIII ISL to publish the paper during the next
two years, according of Authors Instructions.
119

APÊNDICE B – EXECUÇÃO DA REVISÃO SISTEMÁTICA


A condução da revisão sistemática foi feita em dois momentos. Inicialmente
para elaboração de um artigo, cujo objetivo foi mapear a evolução do uso de técnicas
de aprendizado de máquina como ferramenta para lidar com escorregamentos no
Brasil e no mundo. Esse foi feito em parceria de outros colaboradores, foi publicado
no XII Simpósio Internacional de Escorregamentos em Cartagena-Colômbia, e está
disponível no Apêndice A.
Posteriormente a revisão inicial foi refinada pelo autor desta dissertação, visto
que o escopo desta pesquisa é mais restrito. Sendo assim, todos os 155 trabalhos
selecionados para primeira revisão foram devidamente documentados em uma
ferramenta de apoio, identificando-se as fontes de busca. Após essa documentação,
foi realizada a primeira avaliação desses trabalhos por meio da leitura de seus títulos,
palavras-chave e introdução, e considerando os critérios de inclusão e exclusão
definidos no protocolo e descritos na seção 2.5.1
Na sequência, e também considerando os mesmos critérios, foi realizada uma
segunda avaliação por meio da leitura completa dos estudos que passaram pela
primeira avaliação.
A ferramenta utilizada para documentar as informações, também fornece a
visão de quais critérios de inclusão e/ou exclusão, descritos a seguir, foram indicados
para cada um dos trabalhos avaliados, sejam eles incluídos ou não na síntese final.
Critérios de inclusão:
a) Estudos quantitativos que discutam conceitualmente as técnicas de aprendizado
de máquina, explicitando os fatores de entrada dos algoritmos e técnicas
utilizadas;
b) Estudos que apresentam alguma proposta, experimento ou aplicação de redes
neurais no contexto da elaboração de mapas de suscetibilidade.

Critérios de exclusão:
a) Estudos que não estejam relacionados a redes neurais com backpropagation;
b) Estudos que não abordam redes neurais para elaboração de mapas de
suscetibilidade;

Nas próximas subseções são apresentados os trabalhos selecionados na


primeira revisão e publicados no simpósio internacional de escorregamentos, assim
como o resultado de cada etapa das duas avaliações, pode meio de um quadro, com
as seguintes informações:
• Coluna A: contém o número sequencial do estudo, independente da base
120

consultada;
• Coluna B: contém o ano do estudo;
• Colunas C e D: contém o atendimento aos critérios de inclusão;
• Colunas E e F: contém o atendimento aos critérios de exclusão;
• Colunas G: contém o resultado da primeira avaliação. Caso o trabalho tenha
atendido pelo menos um critério de inclusão ele foi aceito nesta etapa;
• Colunas H: contém o resultado da segunda avaliação. Após a leitura completa
dos trabalhos, foram considerados aceitos aqueles cuja trabalho foi considerado
relevante em responder à pergunta de pesquisa.

A.1 Fonte 1 – Web of Science


Relação de trabalhos:
1. Reichenbach, Paola and Rossi, Mauro and Malamud, Bruce D. and Mihir, Monika
and Guzzetti, Fausto. A review of statistically-based landslide susceptibility models, EARTH-
SCIENCE REVIEWS (2018) https://doi.org//10.1016/j.earscirev.2018.03.001
2. Yu, Lanbing and Cao, Ying and Zhou, Chao and Wang, Yang and Huo, Zhitao.
Landslide Susceptibility Mapping Combining Information Gain Ratio and Support Vector
Machines: A Case Study from Wushan Segment in the Three Gorges Reservoir Area, China,
APPLIED SCIENCES-BASEL (2019) https://doi.org//10.3390/app9224756
3. Shirzadi, Ataollah and Shahabi, Himan and Chapi, Kamran and Dieu TienBui and
Binh Thai Pham and Shahedi, Kaka and Bin Ahmad, Baharin. A comparative study between
popular statistical and machine learning methods for simulating volume of landslides, CATENA
(2017) https://doi.org//10.1016/j.catena.2017.05.016
4. Choi, Changhyun and Kim, Jeonghwan and Kim, Jungwook and Kim, Hung Soo.
Development of Combined Heavy Rain Damage Prediction Models with Machine Learning,
WATER (2019) https://doi.org//10.3390/w11122516
5. Chen, Wei and Zhang, Shuai and Li, Renwei and Shahabi, Himan. Performance
evaluation of the GIS-based data mining techniques of best-first decision tree, random forest,
and naive Bayes tree for landslide susceptibility modeling, SCIENCE OF THE TOTAL
ENVIRONMENT (2018) https://doi.org//10.1016/j.scitotenv.2018.06.389
6. Nikolopoulos, Efthymios I. and Destro, Elisa and Bhuiyan, Md Abul Ehsanand Borga,
Marco and Anagnostou, Emmanouil N.. Evaluation of predictive models for post-fire debris
flow occurrence inthe western United States, NATURAL HAZARDS AND EARTH SYSTEM
SCIENCES (2018) https://doi.org//10.5194/nhess-18-2331-2018
7. Huang, Yu and Zhao, Lu. Review on landslide susceptibility mapping using support
vector machines, CATENA (2018) https://doi.org//10.1016/j.catena.2018.03.003
121

8. Ada, Metehan and San, B. Taner. Comparison of machine-learning techniques for


landslide susceptibility mapping using two-level random sampling (2LRS) in Alakir catchment
area, Antalya, Turkey, NATURAL HAZARDS (2018) https://doi.org//10.1007/s11069-017-
3043-8
9. Luo, Xiangang and Lin, Feikai and Zhu, Shuang and Yu, Mengliang and Zhang, Zhuo
and Meng, Lingsheng and Peng, Jing. Mine landslide susceptibility assessment using IVM,
ANN and SVM models considering the contribution of affecting factors, PLOS ONE (2019)
https://doi.org//10.1371/journal.pone.0215134
10. Aktas, Hakan and San, Bekir Taner. Landslide susceptibility mapping using an
automatic sampling algorithm based on two level random sampling, COMPUTERS &
GEOSCIENCES (2019) https://doi.org//10.1016/j.cageo.2019.104329
11. Tavakkoli Piralilou, Sepideh and Shahabi, Hejar and Jarihani, Ben and
Ghorbanzadeh, Omid and Blaschke, Thomas and Gholamnia, Khalil and Meena, Sansar Raj
and Aryal, Jagannath. Landslide Detection Using Multi-Scale Image Segmentation and
Different Machine Learning Models in the Higher Himalayas, REMOTE SENSING (2019)
https://doi.org//10.3390/rs11212575
12. Dieu Tien Bui and Shirzadi, Ataollah and Shahabi, Himan and Geertsema, Marten
and Omidvar, Ebrahim and Clague, John J. and Binh Thai Pham and Dou, Jie and Asl, Dawood
Talebpour and Bin Ahmad, Baharin and Lee, Saro. New Ensemble Models for Shallow
Landslide Susceptibility Modeling in a Semi-Arid Watershed, FORESTS (2019)
https://doi.org//10.3390/f10090743
13. Kuan-Tsung Chang and Merghadi, Abdelaziz and Yunus, Ali P. and Binh ThaiPham
and Dou, Jie. Evaluating scale effects of topographic variables in landslide susceptibility
models using GIS-based machine learning techniques, SCIENTIFIC REPORTS (2019)
https://doi.org//10.1038/s41598-019-48773-2
14. de Oliveira, Guilherme Garcia and Chimelo Ruiz, Luis Fernando and Guasselli,
Laurindo Antonio and Haetinger, Claus. Random forest and artificial neural networks in
landslide susceptibility modeling: a case study of the Fao River Basin, Southern Brazil,
NATURAL HAZARDS (2019) https://doi.org//10.1007/s11069-019-03795-x
15. Rahmati, Omid and Ghorbanzadeh, Omid and Teimurian, Teimur and Mohammadi,
Farnoush and Tiefenbacher, John P. and Falah, Fatemeh and Pirasteh, Saied and Phuong-
Thao Thi Ngo and Dieu Tien Bui. Spatial Modeling of Snow Avalanche Using Machine Learning
Models and Geo-Environmental Factors: Comparison of Effectiveness in Two Mountain
Regions, REMOTE SENSING (2019) https://doi.org//10.3390/rs11242995
16. Abedini, Mousa and Ghasemian, Bahareh and Shirzadi, Ataollah and Shahabi,
Himan and Chapi, Kamran and Binh Thai Pham and Bin Ahmad, Baharin and Dieu Tien Bui.
A novel hybrid approach of Bayesian Logistic Regression and its ensembles for landslide
122

susceptibility assessment, GEOCARTO INTERNATIONAL (2019)


https://doi.org//10.1080/10106049.2018.1499820
17. Binh Thai Pham and Pradhan, Biswajeet and Bui, Dieu Tien and Prakash, Indra
and Dholakia, M. B.. A comparative study of different machine learning methods for landslide
susceptibility assessment: A case study of Uttarak hand area (India), ENVIRONMENTAL
MODELLING \& SOFTWARE (2016) https://doi.org//10.1016/j.envsoft.2016.07.005
18. Lee, Sunmin and Lee, Moung-Jin and Jung, Hyung-Sup and Lee, Saro. Landslide
susceptibility mapping using Naive Bayes and Bayesian network models in Umyeonsan,
Korea, GEOCARTO INTERNATIONAL (2019)
https://doi.org//10.1080/10106049.2019.1585482
19. Cheng, Min-Yuan and Nhat-Duc Hoang. Typhoon-induced slope collapse
assessment using a novel bee colony optimized support vector classifier, NATURAL
HAZARDS (2015) https://doi.org//10.1007/s11069-015-1813-8
20. Kumar, Deepak and Thakur, Manoj and Dubey, Chandra S. and Shukla, Dericks
P.. Landslide susceptibility mapping \& prediction using Support Vector Machine for Mandakini
River Basin, Garhwal Himalaya, India, GEOMORPHOLOGY (2017)
https://doi.org//10.1016/j.geomorph.2017.06.013
21. Chen, Wei and Xie, Xiaoshen and Peng, Jianbing and Wang, Jiale and Duan, Zhao
and Hong, Haoyuan. GIS-based landslide susceptibility modelling: a comparative assessment
of kernel logistic regression, Naive-Bayes tree, and alternating decision tree models,
GEOMATICS NATURAL HAZARDS \& RISK (2017)
https://doi.org//10.1080/19475705.2017.1289250
22. Pradhan, Ananta Man Singh and Kang, Hyo-Sub and Kim, Yun-Tae. Hybrid
Landslide Warning Model for Rainfall Triggered Shallow Landslides in Korean Mountain, nan
(2017) https://doi.org//10.1007/978-3-319-53487-9_22
23. Krkac, Martin and Arbanas, Snjezana Mihalic and Arbanas, Zeljko and Gazibara,
Sanja Bernat and Secanj, Marin. Prediction of the Kostanjek Landslide Movements Based on
Monitoring Results Using Random Forests Technique, nan (2017)
https://doi.org//10.1007/978-3-319-53487-9_30
24. Tehrany, Mahyat Shafapour and Jones, Simon and Shabani, Farzin and Martinez-
Alvarez, Francisco and Dieu Tien Bui. A novel ensemble modeling approach for the spatial
prediction of tropical forest fire susceptibility using Logit Boost machine learning classifier and
multi-source geospatial data, THEORETICAL AND APPLIED CLIMATOLOGY (2019)
https://doi.org//10.1007/s00704-018-2628-9
25. He, Qingfeng and Shahabi, Himan and Shirzadi, Ataollah and Li, Shaojunand Chen,
Wei and Wang, Nianqin and Chai, Huichan and Bian, Huiyuan and Ma, Jianquan and Chen,
Yingtao and Wang, Xiaojing and Chapi, Kamran and Bin Ahmad, Baharin. Landslide spatial
123

modelling using novel bivariate statistical based Naive Bayes, RBF Classifier, and RBF
Network machine learning algorithms, SCIENCE OF THE TOTAL ENVIRONMENT (2019)
https://doi.org//10.1016/j.scitotenv.2019.01.329
26. Binh Thai Pham and Prakash, Indra. Evaluation and comparison of Logit Boost
Ensemble, Fisher's Linear Discriminant Analysis, logistic regression and support vector
machines methods for landslide susceptibility mapping, GEOCARTO INTERNATIONAL
(2019) https://doi.org//10.1080/10106049.2017.1404141
27. Al-Najjar, Husam A. H. and Kalantar, Bahareh and Pradhan, Biswjaeet and Saeidi,
Vahideh. Conditioning factors determination for mapping and prediction of landslide
susceptibility using machine learning algorithms, nan (2019)
https://doi.org//10.1117/12.2532687
28. Chen, Wei and Sun, Zenghui and Han, Jichang. Landslide Susceptibility Modeling
Using Integrated Ensemble Weights of Evidence with Logistic Regression and Random Forest
Models, APPLIED SCIENCES-BASEL (2019) https://doi.org//10.3390/app9010171
29. Zhao, Jiubin and Liu, Yuanxue and Hu, Ming. Optimisation algorithm for decision
trees and the prediction of horizon displacement of landslides monitoring, JOURNAL OF
ENGINEERING-JOE (2018) https://doi.org//10.1049/joe.2018.8305
30. Krkac, Martin and Spoljaric, Drago and Bernat, Sanja and Arbanas, Snjezana
Mihalic. Method for prediction of landslide movements based on random forests, LANDSLIDES
(2017) https://doi.org//10.1007/s10346-016-0761-z
31. Dieu Tien Bui and Shahabi, Himan and Shirzadi, Ataollah and Chapi, Kamran and
Pradhan, Biswajeet and Chen, Wei and Khosravi, Khabat and Panahi, Mahdi and Bin Ahmad,
Baharin and Saro, Lee. Land Subsidence Susceptibility Mapping in South Korea Using
Machine Learning Algorithms, SENSORS (2018) https://doi.org//10.3390/s18082464
32. Dou, Jie and Yunus, Ali P. and Dieu Tien Bui and Merghadi, Abdelaziz and Sahana,
Mehebub and Zhu, Zhongfan and Chen, Chi-Wen and Han, Zheng and Binh Thai Pham.
Improved landslide assessment using support vector machine with bagging, boosting, and
stacking ensemble machine learning framework in a mountainous watershed, Japan,
LANDSLIDES (2020) https://doi.org//10.1007/s10346-019-01286-5
33. Lee, Saro. Current and Future Status of GIS-based Landslide Susceptibility
Mapping: A Literature Review, KOREAN JOURNAL OF REMOTE SENSING (2019)
https://doi.org//10.7780/kjrs.2019.35.1.12
34. Oommen, Thomas and Cobin, Patrice F. and Gierke, John S. and Sajinkumar, K.
S.. Significance of variable selection and scaling issues for probabilistic modeling of rainfall-
induced landslide susceptibility, SPATIAL INFORMATION RESEARCH (2018)
https://doi.org//10.1007/s41324-017-0154-y
35. Janizadeh, Saeid and Avand, Mohammadtaghi and Jaafari, Abolfazl and TranVan
124

Phong and Bayat, Mahmoud and Ahmadisharaf, Ebrahim and Prakash, Indra and Binh Thai
Pham and Lee, Saro. Prediction Success of Machine Learning Methods for Flash Flood
Susceptibility Mapping in the Tafresh Watershed, Iran, SUSTAINABILITY (2019)
https://doi.org//10.3390/su11195426
36. Li, Huajin and Xu, Qiang and He, Yusen and Fan, Xuanmei and Li, Songlin.
Modeling and predicting reservoir landslide displacement with deep belief network and EWMA
control charts: a case study in Three Gorges Reservoir, LANDSLIDES (2020)
https://doi.org//10.1007/s10346-019-01312-6
37. Sachdeva, Shruti and Bhatia, Tarunpreet and Verma, Anil K.. A novel voting
ensemble model for spatial prediction of landslides using GIS, INTERNATIONAL JOURNAL
OF REMOTE SENSING (2020) https://doi.org//10.1080/01431161.2019.1654141
38. Tang, Yandong and Zang, Cuiping and Wei, Yong and Jiang, Minghui. Data-Driven
Modeling of Groundwater Level with Least-Square Support Vector Machine and Spatial-
Temporal Analysis, GEOTECHNICAL AND GEOLOGICAL ENGINEERING (2019)
https://doi.org//10.1007/s10706-018-0713-6
39. Oh, Hyun-Joo and Syifa, Mutiara and Lee, Chang-Wook and Lee, Saro. Land
Subsidence Susceptibility Mapping Using Bayesian, Functional, and Meta-Ensemble Machine
Learning Models, APPLIED SCIENCES-BASEL (2019) https://doi.org//10.3390/app9061248
40. Binh Thai Pham and Manh Duc Nguyen and Kien-Trinh Thi Bui and Prakash, Indra
and Chapi, Kamran and Dieu Tien Bui. A novel artificial intelligence approach based on Multi-
layer Perceptron Neural Network and Biogeography-based Optimization for predicting
coefficient of consolidation of soil, CATENA (2019)
https://doi.org//10.1016/j.catena.2018.10.004
41. Hosseinalizadeh, Mohsen and Kariminejad, Narges and Rahmati, Omid and
Keesstra, Saskia and Alinejad, Mohammad and Behbahani, Ali Mohammadian. How can
statistical and artificial intelligence approaches predict piping erosion susceptibility? SCIENCE
OF THE TOTAL ENVIRONMENT (2019) https://doi.org//10.1016/j.scitotenv.2018.07.396
42. Mohammady, Majid and Pourghasemi, Hamid Reza and Amiri, Mojtaba. Land
subsidence susceptibility assessment using random forest machine learning algorithm,
ENVIRONMENTAL EARTH SCIENCES (2019) https://doi.org//10.1007/s12665-019-8518-3
43. Shafizadeh-Moghadam, Hossein and Minaei, Masoud and Shahabi, Himan and
Hagenauer, Julian. Big data in Geo hazard; pattern mining and large scale analysis of
landslides in Iran, EARTH SCIENCE INFORMATICS (2019) https://doi.org//10.1007/s12145-
018-0354-6
125

Quadro 9 – Resumo das avaliações da base Web of Science

Fonte: Elaborado pelo Autor (2021)


126

A.2 Fonte 2 – Scopus


Relação de trabalhos:

44. Pourghasemi, H.R. and Rahmati, O.. Prediction of the landslide susceptibility:
Which algorithm, which precision? Catena (2018)
https://doi.org//10.1016/j.catena.2017.11.022
45. Wei, Z.-L. and Lü, Q. and Sun, H.-Y. and Shang, Y.Q.. Estimating the rainfall
threshold of a deep-seated landslide by integrating models for predicting the groundwater level
and stability analysis of the slope, Engineering Geology (2019)
https://doi.org//10.1016/j.enggeo.2019.02.026
46. Pham, B.T. and Tien Bui, D. and Prakash, I. and Dholakia, M.B.. Hybrid integration
of Multilayer Perceptron Neural Networks and machine learning ensembles for landslide
susceptibility assessment at Himalayan area (India) using GIS, Catena (2017)
https://doi.org//10.1016/j.catena.2016.09.007
47. Xiao, L. and Zhang, Y. and Peng, G.. Landslide susceptibility assessment using
integrated deep learning algorithm along the China-Nepal highway, Sensors (Switzerland)
(2018) https://doi.org//10.3390/s18124436
48. Zhou, C. and Yin, K. and Cao, Y. and Intrieri, E. and Ahmed, B. and Catani, F..
Displacement prediction of step-like landslide by applying a novel kernel extreme learning
machine method, Landslides (2018) https://doi.org//10.1007/s10346-018-1022-0
49. Mutlu, B. and Nefeslioglu, H.A. and Sezer, E.A. and Ali Akcayol, M. and Gokceoglu,
C.. An experimental research on the use of recurrent neural networks in landslide susceptibility
mapping, ISPRS International Journal of Geo-Information (2019)
https://doi.org//10.3390/ijgi8120578
50. Goetz, J.N. and Brenning, A. and Petschko, H. and Leopold, P.. Evaluating machine
learning and statistical prediction techniques for landslide susceptibility modeling, Computers
and Geosciences (2015) https://doi.org//10.1016/j.cageo.2015.04.007
51. Cao, Y. and Yin, K. and Alexander, D.E. and Zhou, C.. Using an extreme learning
machine to predict the displacement of step-like landslides in relation to controlling factors,
Landslides (2016) https://doi.org//10.1007/s10346-015-0596-z
52. Shihabudheen, K.V. and Peethambaran, B.. Landslide displacement prediction
technique using improved neuro-fuzzy system, Arabian Journal of Geosciences (2017)
https://doi.org//10.1007/s12517-017-3278-4
53. Thai Pham, B. and Tien Bui, D. and Prakash, I.. Landslide susceptibility modelling
using different advanced decision trees methods, Civil Engineering and Environmental
Systems (2018) https://doi.org//10.1080/10286608.2019.1568418
127

54. Sevgen, E. and Kocaman, S. and Nefeslioglu, H.A. and Gokceoglu, C.. A novel
performance assessment approach using photogrammetric techniques for landslide
susceptibility mapping with logistic regression, ann and random forest, Sensors (Switzerland)
(2019) https://doi.org//10.3390/s19183940
55. Shen, C. and Xue, S.. Displacement Prediction of Rainfall-induced Landslide Based
on Machine Learning, Journal of Coastal Research (2018) https://doi.org//10.2112/SI83-044.1
56. Kadavi, P.R. and Lee, C.-W. and Lee, S.. Application of ensemble-based machine
learning models to landslide susceptibility mapping, Remote Sensing (2018)
https://doi.org//10.3390/rs10081252
57. Bordoni, M. and Bittelli, M. and Valentino, R. and Chersich, S. and Persichillo, M.G.
and Meisina, C.. Soil Water Content Estimated by Support Vector Machine for the Assessment
of Shallow Landslides Triggering: the Role of Antecedent Meteorological Conditions,
Environmental Modeling and Assessment (2018) https://doi.org//10.1007/s10666-017-9586-y
58. Pradhan, A.M.S. and Lee, S.-R. and Kim, Y.-T.. A shallow slide prediction model
combining rainfall threshold warnings and shallow slide susceptibility in Busan, Korea,
Landslides (2019) https://doi.org//10.1007/s10346-018-1112-z
59. Truong, X.L. and Mitamura, M. and Kono, Y. and Raghavan, V. and Yonezawa, G.
and Truong, X.Q. and Do, T.H. and Bui, D.T. and Lee, S.. Enhancing prediction performance
of landslide susceptibility model using hybrid machine learning approach of bagging ensemble
and logistic model tree, Applied Sciences (Switzerland) (2018)
https://doi.org//10.3390/app8071046
60. Chen, W. and Peng, J. and Hong, H. and Shahabi, H. and Pradhan, B. and Liu, J.
and Zhu, A.-X. and Pei, X. and Duan, Z.. Landslide susceptibility modelling using GIS-based
machine learning techniques for Chongren County, Jiangxi Province, China, Science of the
Total Environment (2018) https://doi.org//10.1016/j.scitotenv.2018.01.124
61. Pham, B.T. and Shirzadi, A. and Tien Bui, D. and Prakash, I. and Dholakia, M.B..
A hybrid machine learning ensemble approach based on a Radial Basis Function neural
network and Rotation Forest for landslide susceptibility modeling: A case study in the
Himalayan area, India, International Journal of Sediment Research (2018)
https://doi.org//10.1016/j.ijsrc.2017.09.008
62. Wang, Y. and Wu, X. and Chen, Z. and Ren, F. and Feng, L. and Du, Q.. Optimizing
the predictive ability of machine learning methods for landslide susceptibility mapping using
smote for Lishui city in Zhejiang province, China, International Journal of Environmental
Research and Public Health (2019) https://doi.org//10.3390/ijerph16030368
63. Ma, J. and Tang, H. and Liu, X. and Wen, T. and Zhang, J. and Tan, Q. and Fan,
Z.. Probabilistic forecasting of landslide displacement accounting for epistemic uncertainty: a
case study in the Three Gorges Reservoir area, China, Landslides (2018)
128

https://doi.org//10.1007/s10346-017-0941-5
64. Agrawal, K. and Baweja, Y. and Dwivedi, D. and Saha, R. and Prasad, P. and
Agrawal, S. and Kapoor, S. and Chaturvedi, P. and Mali, N. and Kala, V.U. and Dutt, V.. A
Comparison of Class Imbalance Techniques for Real-World Landslide Predictions,
Proceedings - 2017 International Conference on Machine Learning and Data Science, MLDS
2017 (2018) https://doi.org//10.1109/MLDS.2017.21
65. Krkac, M. and Spoljaric, S. and Bernat, S. and Arbanas, S.M.. TXt-tool 4.385-1.1
method for prediction of landslide movements based on random forests, Landslide Dynamics:
ISDR-ICL Landslide Interactive Teaching Tools (2018) https://doi.org//10.1007/978-3-319-
57777-7_35
66. Ge, Y. and Chen, H. and Zhao, B. and Tang, H. and Lin, Z. and Xie, Z. and Lv, L.
and Zhong, P.. A comparison of five methods in landslide susceptibility assessment: a case
study from the 330-kV transmission line in Gansu Region, China, Environmental Earth
Sciences (2018) https://doi.org//10.1007/s12665-018-7814-7
67. Pham, B.T. and Prakash, I. and Tien Bui, D.. Spatial prediction of landslides using
a hybrid machine learning approach based on Random Subspace and Classification and
Regression Trees, Geomorphology (2018) https://doi.org//10.1016/j.geomorph.2017.12.008
68. Pham, B.T. and Tien Bui, D. and Prakash, I.. Bagging based Support Vector
Machines for spatial prediction of landslides, Environmental Earth Sciences (2018)
https://doi.org//10.1007/s12665-018-7268-y
69. Volf, G. and Zic, E. and Ozanic, N.. Prediction of groundwater level fluctuations on
Grohovo landslide using rule based regression, Engineering Review (2018)
70. Merghadi, A. and Abderrahmane, B. and Tien Bui, D.. Landslide susceptibility
assessment at Mila basin (Algeria): A comparative assessment of prediction capability of
advanced machine learning methods, ISPRS International Journal of Geo-Information (2018)
https://doi.org//10.3390/ijgi7070268
71. Xiao, T. and Yin, K. and Yao, T. and Liu, S.. Spatial prediction of landslide
susceptibility using GIS-based statistical and machine learning models in Wanzhou County,
Three Gorges Reservoir, China, Acta Geochimica (2019) https://doi.org//10.1007/s11631-019-
00341-1
72. Deng, H. and Guan, S. and Ji, Y. and Zhou, L. and Luo, X.. A hybrid predicting
model for displacement of multifactor-Triggered landslides, 11th International Conference on
Advanced Computational Intelligence, ICACI 2019 (2019)
https://doi.org//10.1109/ICACI.2019.8778500
73. Tehrani, F.S. and Costa, A.L. and Peters, T.. Enabling technologies for monitoring
and forecasting: Applications in slope stability and dam safety, 53rd U.S. Rock
Mechanics/Geomechanics Symposium (2019)
129

74. Palamakumbure, D. and Stirling, D. and Flentje, P. and Chowdhury, R.. ArcGIS
v.10 landslide susceptibility data mining add-in tool integrating data mining and GIS techniques
to model landslide susceptibility, Engineering Geology for Society and Territory - Volume 2:
Landslide Processes (2015) https://doi.org//10.1007/978-3-319-09057-3_208
75. Zhou, C. and Yin, K. and Cao, Y. and Ahmed, B. and Li, Y. and Catani, F. and
Pourghasemi, H.R.. Landslide susceptibility modeling applying machine learning methods: A
case study from Longju in the Three Gorges Reservoir area, China, Computers and
Geosciences (2018) https://doi.org//10.1016/j.cageo.2017.11.019
76. Pham, B.T. and Tien Bui, D. and Dholakia, M.B. and Prakash, I. and Pham, H.V..
A Comparative Study of Least Square Support Vector Machines and Multiclass Alternating
Decision Trees for Spatial Prediction of Rainfall-Induced Landslides in a Tropical Cyclones
Area, Geotechnical and Geological Engineering (2016) https://doi.org//10.1007/s10706-016-
9990-0
77. Chen, W. and Wang, J. and Xie, X. and Hong, H. and Van Trung, N. and Bui, D.T.
and Wang, G. and Li, X.. Spatial prediction of landslide susceptibility using integrated
frequency ratio with entropy and support vector machines by different kernel functions,
Environmental Earth Sciences (2016) https://doi.org//10.1007/s12665-016-6162-8
78. Hoang, N.-D. and Tien Bui, D.. A novel relevance vector machine classifier with
Cuckoo search optimization for spatial prediction of landslides, Journal of Computing in Civil
Engineering (2016) https://doi.org//10.1061/(ASCE)CP.1943-5487.0000557
79. Tien Bui, D. and Ho, T.-C. and Pradhan, B. and Pham, B.-T. and Nhu, V.-H. and
Revhaug, I.. GIS-based modeling of rainfall-induced landslides using data mining-based
functional trees classifier with AdaBoost, Bagging, and MultiBoost ensemble frameworks,
Environmental Earth Sciences (2016) https://doi.org//10.1007/s12665-016-5919-4
80. Chen, W. and Pourghasemi, H.R. and Kornejady, A. and Zhang, N.. Landslide
spatial modeling: Introducing new ensembles of ANN, MaxEnt, and SVM machine learning
techniques, Geoderma (2017) https://doi.org//10.1016/j.geoderma.2017.06.020
81. Pham, B.T. and Bui, D. and Prakash, I. and Dholakia, M.B.. Evaluation of predictive
ability of support vector machines and naive Bayes trees methods for spatial prediction of
landslides in Uttarakhand state (India) using GIS, Journal of Geomatics (2016)
82. Pourghasemi, H.R. and Kerle, N.. Random forests and evidential belief function-
based landslide susceptibility assessment in Western Mazandaran Province, Iran,
Environmental Earth Sciences (2016) https://doi.org//10.1007/s12665-015-4950-1
83. Kainthura, P. and Singh, V. and Gupta, S.. Gis based model for monitoring and
prediction of landslide susceptibility, Proceedings on 2015 1st International Conference on
Next Generation Computing Technologies, NGCT 2015 (2016)
https://doi.org//10.1109/NGCT.2015.7375188
130

84. Tien Bui, D. and Tuan, T.A. and Klempe, H. and Pradhan, B. and Revhaug, I..
Spatial prediction models for shallow landslide hazards: a comparative assessment of the
efficacy of support vector machines, artificial neural networks, kernel logistic regression, and
logistic model tree, Landslides (2016) https://doi.org//10.1007/s10346-015-0557-6
85. Pham, B.T. and Tien Bui, D. and Prakash, I.. Landslide Susceptibility Assessment
Using Bagging Ensemble Based Alternating Decision Trees, Logistic Regression and J48
Decision Trees Methods: A Comparative Study, Geotechnical and Geological Engineering
(2017) https://doi.org//10.1007/s10706-017-0264-2
86. Arabameri, A. and Pourghasemi, H.R. and Yamani, M.. Applying different scenarios
for landslide spatial modeling using computational intelligence methods, Environmental Earth
Sciences (2017) https://doi.org//10.1007/s12665-017-7177-5
87. Lun, N.K. and Liew, M.S. and Matori, A.N. and Zawawi, N.A.W.A.. Recent developments
in machine learning applications in landslide susceptibility mapping, AIP Conference
Proceedings (2017) https://doi.org//10.1063/1.5012210
88. Al-Batah, M.S. and Alkhasawneh, M.S. and Tay, L.T. and Ngah, U.K. and Hj Lateh, H. and
Mat Isa, N.A.. Landslide Occurrence Prediction Using Trainable Cascade Forward Network
and Multilayer Perceptron, Mathematical Problems in Engineering (2015)
https://doi.org//10.1155/2015/512158
89. Pham, B.T. and Khosravi, K. and Prakash, I.. Application and Comparison of Decision
Tree-Based Machine Learning Methods in Landside Susceptibility Assessment at Pauri
Garhwal Area, Uttarakhand, India, Environmental Processes (2017)
https://doi.org//10.1007/s40710-017-0248-5
90. Rahardianto, T. and Saputra, A. and Gomez, C.. Assessment of landslide distribution map
reliability in Niigata Prefecture - Japan using frequency ratio approach, AIP Conference
Proceedings (2017) https://doi.org//10.1063/1.4987086
91. Huang, F. and Yin, K. and Huang, J. and Gui, L. and Wang, P.. Landslide susceptibility
mapping based on self-organizing-map network and extreme learning machine, Engineering
Geology (2017) https://doi.org//10.1016/j.enggeo.2017.04.013
92. Zhang, K. and Wu, X. and Niu, R. and Yang, K. and Zhao, L.. The assessment of landslide
susceptibility mapping using random forest and decision tree methods in the Three Gorges
Reservoir area, China, Environmental Earth Sciences (2017) https://doi.org//10.1007/s12665-
017-6731-5
93. Nguyen, Q.-K. and Bui, D.T. and Hoang, N.-D. and Trinh, P.T. and Nguyen, V.-H. and
Yilmaz, I.. A novel hybrid approach based on instance based learning classifier and rotation
Forest ensemble for spatial prediction of rainfall-induced shallow landslides using GIS,
Sustainability (Switzerland) (2017) https://doi.org//10.3390/su9050813
94. Bui, D.T. and Shahabi, H. and Omidvar, E. and Shirzadi, A. and Geertsema, M. and
131

Clague, J.J. and Khosravi, K. and Pradhan, B. and Pham, B.T. and Chapi, K. and Barati, Z.
and Bin Ahmad, B. and Rahmani, H. and Gróf, G. and Lee, S.. Shallow landslide prediction
using a novel hybrid functional machine learning algorithm, Remote Sensing (2019)
https://doi.org//10.3390/rs11080952
95. Hu, J. and Zhu, H. and Mao, Y. and Zhang, C. and Liang, T. and Mao, D.. Using uncertain
DM-chameleon clustering algorithm based on machine learning to predict landslide hazards,
Journal of Robotics and Mechatronics (2019) https://doi.org//10.20965/jrm.2019.p0329
96. Pham, B.T. and Prakash, I. and Singh, S.K. and Shirzadi, A. and Shahabi, H. and Tran, T.-
T.-T. and Bui, D.T.. Landslide susceptibility modeling using Reduced Error Pruning Trees and
different ensemble techniques: Hybrid machine learning approaches, Catena (2019)
https://doi.org//10.1016/j.catena.2018.12.018
97. Dou, J. and Yunus, A.P. and Tien Bui, D. and Merghadi, A. and Sahana, M. and Zhu, Z.
and Chen, C.-W. and Khosravi, K. and Yang, Y. and Pham, B.T.. Assessment of advanced
random forest and decision tree algorithms for modeling rainfall-induced landslide
susceptibility in the Izu-Oshima Volcanic Island, Japan, Science of the Total Environment
(2019) https://doi.org//10.1016/j.scitotenv.2019.01.221
98. Wang, Y. and Fang, Z. and Hong, H.. Comparison of convolutional neural networks for
landslide susceptibility mapping in Yanshan County, China, Science of the Total Environment
(2019) https://doi.org//10.1016/j.scitotenv.2019.02.263
99. Kalantar, B. and Ueda, N. and Al-Najjar, H.A.H. and Gibril, M.B.A. and Lay, U.S. and
Motevalli, A.. AN EVALUATION of LANDSLIDE SUSCEPTIBILITY MAPPING USING
REMOTE SENSING DATA and MACHINE LEARNING ALGORITHMS in Iran, ISPRS Annals
of the Photogrammetry, Remote Sensing and Spatial Information Sciences (2019)
https://doi.org//10.5194/isprs-annals-IV-2-W5-503-2019
100. Pham, B.T. and Jaafari, A. and Prakash, I. and Bui, D.T.. A novel hybrid intelligent model
of support vector machines and the MultiBoost ensemble for landslide susceptibility modeling,
Bulletin of Engineering Geology and the Environment (2019) https://doi.org//10.1007/s10064-
018-1281-y
101. Dang, V.-H. and Dieu, T.B. and Tran, X.-L. and Hoang, N.-D.. Enhancing the accuracy of
rainfall-induced landslide prediction along mountain roads with a GIS-based random forest
classifier, Bulletin of Engineering Geology and the Environment (2019)
https://doi.org//10.1007/s10064-018-1273-y
102. Ullo, S.L. and Langenkamp, M.S. and Oikarinen, T.P. and Delrosso, M.P. and
Sebastianelli, A. and Iccirillo, F.P. and Sica, S.. Landslide Geohazard Assessment with
Convolutional Neural Networks Using Sentinel-2 Imagery Data, International Geoscience and
Remote Sensing Symposium (IGARSS) (2019)
https://doi.org//10.1109/IGARSS.2019.8898632
132

103. Kalantar, B. and Ueda, N. and Lay, U.S. and Al-Najjar, H.A.H. and Halin, A.A..
Conditioning Factors Determination for Landslide Susceptibility Mapping Using Support Vector
Machine Learning, International Geoscience and Remote Sensing Symposium (IGARSS)
(2019) https://doi.org//10.1109/IGARSS.2019.8898340
104. Yi, Y. and Zhang, Z. and Zhang, W. and Xu, C.. Comparison of Different Machine Learning
Models for Landslide Susceptibility Mapping, International Geoscience and Remote Sensing
Symposium (IGARSS) (2019) https://doi.org//10.1109/IGARSS.2019.8898208
105. Pham, B.T. and Shirzadi, A. and Shahabi, H. and Omidvar, E. and Singh, S.K. and
Sahana, M. and Asl, D.T. and Ahmad, B.B. and Quoc, N.K. and Lee, S.. Landslide
susceptibility assessment by novel hybrid machine learning algorithms, Sustainability
(Switzerland) (2019) https://doi.org//10.3390/su11164386
106. Chen, W. and Hong, H. and Panahi, M. and Shahabi, H. and Wang, Y. and Shirzadi, A.
and Pirasteh, S. and Alesheikh, A.A. and Khosravi, K. and Panahi, S. and Rezaie, F. and Li,
S. and Jaafari, A. and Bui, D.T. and Bin Ahmad, B.. Spatial prediction of landslide susceptibility
using GIS-based data mining techniques of ANFIS with whale optimization algorithm (WOA)
and grey wolf optimizer (GWO), Applied Sciences (Switzerland) (2019)
https://doi.org//10.3390/app9183755
107. Abedini, M. and Ghasemian, B. and Shirzadi, A. and Bui, D.T.. A comparative study of
support vector machine and logistic model tree classifiers for shallow landslide susceptibility
modeling, Environmental Earth Sciences (2019) https://doi.org//10.1007/s12665-019-8562-z
108. Bui, D.T. and Shirzadi, A. and Shahabi, H. and Geertsema, M. and Omidvar, E. and
Clague, J.J. and Pham, B.T. and Dou, J. and Asl, D.T. and Ahmad, B.B. and Lee, S.. New
ensemble models for shallow landslide susceptibility modeling in a semi-aridwatershed,
Forests (2019) https://doi.org//10.3390/f10090743
109. Chen, W. and Shahabi, H. and Shirzadi, A. and Hong, H. and Akgun, A. and Tian, Y. and
Liu, J. and Zhu, A.-X. and Li, S.. Novel hybrid artificial intelligence approach of bivariate
statistical-methods-based kernel logistic regression classifier for landslide susceptibility
modeling, Bulletin of Engineering Geology and the Environment (2019)
https://doi.org//10.1007/s10064-018-1401-8
110. Lai, J.-S. and Tsai, F.. Improving GIS-based landslide susceptibility assessments with
multi-temporal remote sensing and machine learning, Sensors (Switzerland) (2019)
https://doi.org//10.3390/s19173717
111. Tien Bui, D. and Hoang, N.-D. and Nguyen, H. and Tran, X.-L.. Spatial prediction of
shallow landslide using Bat algorithm optimized machine learning approach: A case study in
Lang Son Province, Vietnam, Advanced Engineering Informatics (2019)
https://doi.org//10.1016/j.aei.2019.100978
112. Liyanage, L.C. and Weerakoon, O.S. and Palliyaguru, S.T. and Wimalaratne, G.D.S.P..
133

Towards prediction of landslide susceptibility using random forest for kalutara district, Sri
Lanka, IEEE Region 10 Humanitarian Technology Conference, R10-HTC (2019)
https://doi.org//10.1109/R10-HTC47129.2019.9042450
113. Singh, V.K. and Vishal, V. and Angara, K.P. and Singh, T.N.. Shallow Landslides
Monitoring Using the Internet of Things and Machine Learning Technique, Proceedings of the
2nd International Conference on Smart Systems and Inventive Technology, ICSSIT 2019
(2019) https://doi.org//10.1109/ICSSIT46314.2019.8987809
114. Zhu, A.-X. and Miao, Y. and Liu, J. and Bai, S. and Zeng, C. and Ma, T. and Hong, H.. A
similarity-based approach to sampling absence data for landslide susceptibility mapping using
data-driven methods, Catena (2019) https://doi.org//10.1016/j.catena.2019.104188
115. Luo, X. and Lin, F. and Chen, Y. and Zhu, S. and Xu, Z. and Huo, Z. and Yu, M. and
Peng, J.. Coupling logistic model tree and random subspace to predict the landslide
susceptibility areas with considering the uncertainty of environmental features, Scientific
Reports (2019) https://doi.org//10.1038/s41598-019-51941-z
116. Pham, B.T. and Tien Bui, D. and Prakash, I. and Nguyen, L.H. and Dholakia, M.B.. A
comparative study of sequential minimal optimization-based support vector machines, vote
feature intervals, and logistic regression in landslide susceptibility assessment using GIS,
Environmental Earth Sciences (2017) https://doi.org//10.1007/s12665-017-6689-3
117. Kornejady, A. and Ownegh, M. and Bahremand, A.. Landslide susceptibility assessment
using maximum entropy model with two different data sampling methods, Catena (2017)
https://doi.org//10.1016/j.catena.2017.01.010
118. Shirzadi, A. and Bui, D.T. and Pham, B.T. and Solaimani, K. and Chapi, K. and Kavian,
A. and Shahabi, H. and Revhaug, I.. Shallow landslide susceptibility assessment using a novel
hybrid intelligence approach, Environmental Earth Sciences (2017)
https://doi.org//10.1007/s12665-016-6374-y
119. Tsangaratos, P. and Ilia, I.. Applying Machine Learning Algorithms in Landslide
Susceptibility Assessments, Handbook of Neural Computation (2017)
https://doi.org//10.1016/B978-0-12-811318-9.00024-7
120. Karell, L. and Munko, M. and Duraciová, R.. Applicability of support vector machines in
landslide susceptibility mapping, Lecture Notes in Geoinformation and Cartography (2017)
https://doi.org//10.1007/978-3-319-45123-7_27
121. Shirzadi, A. and Soliamani, K. and Habibnejhad, M. and Kavian, A. and Chapi, K. and
Shahabi, H. and Chen, W. and Khosravi, K. and Pham, B.T. and Pradhan, B. and Ahmad, A.
and Bin Ahmad, B. and Bui, D.T.. Novel GIS based machine learning algorithms for shallow
landslide susceptibility mapping, Sensors (Switzerland) (2018)
https://doi.org//10.3390/s18113777
122. Zhang, T. and Han, L. and Chen, W. and Shahabi, H.. Hybrid integration approach of
134

entropy with logistic regression and support vector machine for landslide susceptibility
modeling, Entropy (2018) https://doi.org//10.3390/e20110884
123. Shao, X. and Ma, S. and Xu, C. and Zhang, P. and Wen, B. and Tian, Y. and Zhou, Q.
and Cui, Y.. Planet image-based inventorying and machine learning-based susceptibility
mapping for the landslides triggered by the 2018 Mw6.6 Tomakomai, Japan Earthquake,
Remote Sensing (2019) https://doi.org//10.3390/rs11080905
124. Jaafari, A. and Panahi, M. and Pham, B.T. and Shahabi, H. and Bui, D.T. and Rezaie, F.
and Lee, S.. Meta optimization of an adaptive neuro-fuzzy inference system with grey wolf
optimizer and biogeography-based optimization algorithms for spatial prediction of landslide
susceptibility, Catena (2019) https://doi.org//10.1016/j.catena.2018.12.033
125. Hong, H. and Shahabi, H. and Shirzadi, A. and Chen, W. and Chapi, K. and Ahmad, B.B.
and Roodposhti, M.S. and Yari Hesar, A. and Tian, Y. and Tien Bui, D.. Landslide susceptibility
assessment at the Wuning area, China: a comparison between multi-criteria decision making,
bivariate statistical and machine learning methods, Natural Hazards (2019)
https://doi.org//10.1007/s11069-018-3536-0
126. Madawala, C.N. and Kumara, B.T.G.S. and Indrathilaka, L.. Novel machine learning
ensemble approach for landslide prediction, Proceedings - IEEE International Research
Conference on Smart Computing and Systems Engineering, SCSE 2019 (2019)
https://doi.org//10.23919/SCSE.2019.8842762
127. Arabameri, A. and Pradhan, B. and Rezaei, K. and Sohrabi, M. and Kalantari, Z.. GIS-
based landslide susceptibility mapping using numerical risk factor bivariate model and its
ensemble with linear multivariate regression and boosted regression tree algorithms, Journal
of Mountain Science (2019) https://doi.org//10.1007/s11629-018-5168-y
128. Peethambaran, B. and Anbalagan, R. and Shihabudheen, K.V. and Goswami, A..
Robustness evaluation of fuzzy expert system and extreme learning machine for geographic
information system-based landslide susceptibility zonation: A case study from Indian
Himalaya, Environmental Earth Sciences (2019) https://doi.org//10.1007/s12665-019-8225-0
129. Nguyen, V.V. and Pham, B.T. and Vu, B.T. and Prakash, I. and Jha, S. and Shahabi, H.
and Shirzadi, A. and Ba, D.N. and Kumar, R. and Chatterjee, J.M. and Bui, D.T.. Hybrid
machine learning approaches for landslide susceptibility modeling, Forests (2019)
https://doi.org//10.3390/f10020157
130. Chen, W. and Yan, X. and Zhao, Z. and Hong, H. and Bui, D.T. and Pradhan, B.. Spatial
prediction of landslide susceptibility using data mining-based kernel logistic regression, naive
Bayes and RBF Network models for the Long County area (China), Bulletin of Engineering
Geology and the Environment (2019) https://doi.org//10.1007/s10064-018-1256-z
131. Pradhan, A.M.S. and Kang, H.-S. and Lee, J.-S. and Kim, Y.-T.. An ensemble landslide
hazard model incorporating rainfall threshold for Mt. Umyeon, South Korea, Bulletin of
135

Engineering Geology and the Environment (2019) https://doi.org//10.1007/s10064-017-1055-


y
132. He, Q. and Xu, Z. and Li, S. and Li, R. and Zhang, S. and Wang, N. and Pham, B.T. and
Chen, W.. Novel entropy and rotation forest-based creedal decision tree classifier for landslide
susceptibility modeling, Entropy (2019) https://doi.org//10.3390/e21020106
133. Gao, H. and Fam, P.S. and Low, H.C. and Tay, L.T. and Lateh, H.. An overview and
comparison on recent landslide susceptibility mapping methods, Disaster Advances (2019)
134. Yuan, C. and Moayedi, H.. Evaluation and comparison of the advanced metaheuristic and
conventional machine learning methods for the prediction of landslide occurrence, Engineering
with Computers (2019) https://doi.org//10.1007/s00366-019-00798-x
135. Kavzoglu, T. and Colkesen, I. and Sahin, E.K.. Machine learning techniques in landslide
susceptibility mapping: A survey and a case study, Advances in Natural and Technological
Hazards Research (2019) https://doi.org//10.1007/978-3-319-77377-3_13
136. Park, S. and Son, S. and Han, J. and Lee, S. and Kim, S. and Kim, J.. Effects of variable
selection on the landslide susceptibility assessment using machine learning techniques,
Proceedings of SPIE - The International Society for Optical Engineering (2019)
https://doi.org//10.1117/12.2533063
137. Al-Najjar, H.A.H. and Kalantar, B. and Pradhan, B. and Saeidi, V.. Conditioning factor
determination for mapping and prediction of landslide susceptibility using machine learning
algorithms, Proceedings of SPIE - The International Society for Optical Engineering (2019)
https://doi.org//10.1117/12.2532687
138. Pham, B.T. and Prakash, I. and Dou, J. and Singh, S.K. and Trinh, P.T. and Tran, H.T.
and Le, T.M. and Van Phong, T. and Khoi, D.K. and Shirzadi, A. and Bui, D.T.. A novel hybrid
approach of landslide susceptibility modelling using rotation forest ensemble and different base
classifiers, Geocarto International (2019) https://doi.org//10.1080/10106049.2018.1559885
139. Nguyen, P.T. and Tuyen, T.T. and Shirzadi, A. and Pham, B.T. and Shahabi, H. and
Omidvar, E. and Amini, A. and Entezami, H. and Prakash, I. and Phong, T.V. and Vu, T.B. and
Thanh, T. and Saro, L. and Bui, D.T.. Development of a novel hybrid intelligence approach for
landslide spatial prediction, Applied Sciences (Switzerland) (2019)
https://doi.org//10.3390/app9142824
140. Kutlug Sahin, E. and Colkesen, I.. Performance analysis of advanced decision tree-based
ensemble learning algorithms for landslide susceptibility mapping, Geocarto International
(2019) https://doi.org//10.1080/10106049.2019.1641560
141. Yusri, S. and Retnowati, E. and Prastowo, M. and Idris and Fakhrurrozi. Combining
Participatory Mapping, Cloud Computing and Machine Learning for Mapping Climate Induced
Landslide Susceptibility in Lembeh Island, North Sulawesi, IOP Conference Series: Earth and
Environmental Science (2019) https://doi.org//10.1088/1755-1315/363/1/012020
136

142. Li, Y. and Sun, R. and Yin, K. and Xu, Y. and Chai, B. and Xiao, L.. Forecasting of
landslide displacements using a chaos theory based wavelet analysis-Volterra filter model,
Scientific Reports (2019) https://doi.org//10.1038/s41598-019-56405-y
143. Chen, J. and Zeng, Z. and Jiang, P. and Tang, H.. Deformation prediction of landslide
based on functional network, Neurocomputing (2015)
https://doi.org//10.1016/j.neucom.2013.10.044
144. Zhang, N. and Li, Q. and Li, C. and He, Y.. Landslide Early Warning Model Based on the
Coupling of Limit Learning Machine and Entropy Method, Journal of Physics: Conference
Series (2019) https://doi.org//10.1088/1742-6596/1325/1/012076
145. Hemalatha, T. and Ramesh, M.V. and Rangan, V.P.. Effective and accelerated
forewarning of landslides using wireless sensor networks and machine learning, IEEE Sensors
Journal (2019) https://doi.org//10.1109/JSEN.2019.2928358
146. Zhu, X. and Xu, Q. and Tang, M. and Li, H. and Liu, F.. A hybrid machine learning and
computing model for forecasting displacement of multifactor-induced landslides, Neural
Computing and Applications (2018) https://doi.org//10.1007/s00521-017-2968-x
147. Li, H. and Xu, Q. and He, Y. and Deng, J.. Prediction of landslide displacement with an
ensemble-based extreme learning machine and copula models, Landslides (2018)
https://doi.org//10.1007/s10346-018-1020-2
148. Zhu, X. and Xu, Q. and Tang, M. and Nie, W. and Ma, S. and Xu, Z.. Comparison of two
optimized machine learning models for predicting displacement of rainfall-induced landslide: A
case study in Sichuan Province, China, Engineering Geology (2017)
https://doi.org//10.1016/j.enggeo.2017.01.022
149. Wang, Y. and Tang, H. and Wen, T. and Ma, J.. A hybrid intelligent approach for
constructing landslide displacement prediction intervals, Applied Soft Computing Journal
(2019) https://doi.org//10.1016/j.asoc.2019.105506
150. Lee, E.-J. and Liao, W.-Y. and Lin, G.-W. and Chen, P. and Mu, D. and Lin, C.-W..
Towards automated real-time detection and location of large-scale landslides through seismic
waveform back projection, Geofluids (2019) https://doi.org//10.1155/2019/1426019
151. Huang, L. and Li, J. and Hao, H. and Li, X.. Micro-seismic event detection and location in
underground mines by using Convolutional Neural Networks (CNN) and deep learning,
Tunnelling and Underground Space Technology (2018)
https://doi.org//10.1016/j.tust.2018.07.006
152. Zhou, S. and Fang, L.. Support vector machine modeling of earthquake-induced
landslides susceptibility in central part of Sichuan province, China, Geoenvironmental
Disasters (2015) https://doi.org//10.1186/s40677-014-0006-1
153. Xie, J.-C. and Liu, R. and Li, H.-W. and Lai, Z.-L.. Analysis of landslide hazard area in
Ludian earthquake based on Random Forests, International Archives of the Photogrammetry,
137

Remote Sensing and Spatial Information Sciences - ISPRS Archives (2015)


https://doi.org//10.5194/isprsarchives-XL-7-W3-865-2015
154. Duric, U. and Marjanovic, M. and Radic, Z. and Abolmasov, B.. Machine learning based
landslide assessment of the Belgrade metropolitan area: Pixel resolution effects and a cross-
scaling concept, Engineering Geology (2019) https://doi.org//10.1016/j.enggeo.2019.05.007
155. Huang, L. and Xiang, L.-Y.. Method for Meteorological Early Warning of Precipitation-
Induced Landslides Based on Deep Neural Network, Neural Processing Letters (2018)
https://doi.org//10.1007/s11063-017-9778-0
138

Quadro 10 – Resumo das avaliações da base Scopus of Science


INCLUSÃO EXCLUSÃO
ID ANO 1° AVALIAÇÃO 2° AVALIAÇÃO
I1 I2 E1 E2
44 2018 SIM NÃO NÃO NÃO ACEITO REJEITADO
45 2019 SIM NÃO NÃO NÃO ACEITO REJEITADO
46 2017 SIM NÃO NÃO NÃO ACEITO REJEITADO
47 2018 SIM NÃO NÃO NÃO ACEITO REJEITADO
48 2018 SIM NÃO NÃO NÃO ACEITO REJEITADO
49 2019 SIM NÃO NÃO NÃO ACEITO REJEITADO
50 2015 NÃO SIM NÃO NÃO ACEITO REJEITADO
51 2016 NÃO SIM NÃO NÃO ACEITO REJEITADO
52 2017 NÃO SIM NÃO NÃO ACEITO REJEITADO
53 2018 NÃO NÃO SIM NÃO REJEITADO REJEITADO
54 2019 SIM NÃO NÃO NÃO ACEITO ACEITO
55 2018 NÃO NÃO SIM NÃO REJEITADO REJEITADO
56 2018 NÃO NÃO SIM NÃO REJEITADO REJEITADO
57 2018 NÃO NÃO SIM NÃO REJEITADO REJEITADO
58 2019 SIM NÃO NÃO NÃO ACEITO ACEITO
59 2018 NÃO NÃO SIM NÃO REJEITADO REJEITADO
60 2018 NÃO NÃO SIM NÃO REJEITADO REJEITADO
61 2018 NÃO NÃO SIM NÃO REJEITADO REJEITADO
62 2019 SIM NÃO NÃO NÃO ACEITO ACEITO
63 2018 NÃO NÃO SIM NÃO REJEITADO REJEITADO
64 2018 NÃO NÃO SIM NÃO REJEITADO REJEITADO
65 2018 NÃO NÃO SIM NÃO REJEITADO REJEITADO
66 2018 SIM NÃO NÃO NÃO ACEITO ACEITO
67 2018 NÃO NÃO SIM NÃO REJEITADO REJEITADO
68 2018 NÃO NÃO SIM NÃO REJEITADO REJEITADO
69 2018 NÃO NÃO SIM NÃO REJEITADO REJEITADO
70 2018 SIM NÃO NÃO NÃO ACEITO ACEITO
71 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
72 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
73 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
74 2015 NÃO NÃO SIM NÃO REJEITADO REJEITADO
75 2018 SIM NÃO NÃO NÃO ACEITO ACEITO
76 2016 NÃO NÃO SIM NÃO REJEITADO REJEITADO
77 2016 NÃO NÃO SIM NÃO REJEITADO REJEITADO
78 2016 NÃO NÃO SIM NÃO REJEITADO REJEITADO
79 2016 NÃO NÃO SIM NÃO REJEITADO REJEITADO
80 2017 SIM NÃO NÃO NÃO ACEITO ACEITO
81 2016 NÃO NÃO SIM NÃO REJEITADO REJEITADO
82 2016 NÃO NÃO SIM NÃO REJEITADO REJEITADO
83 2016 NÃO NÃO SIM NÃO REJEITADO REJEITADO
84 2016 SIM NÃO NÃO NÃO ACEITO ACEITO
85 2017 NÃO NÃO SIM NÃO REJEITADO REJEITADO
86 2017 NÃO NÃO SIM NÃO REJEITADO REJEITADO
87 2017 NÃO NÃO SIM NÃO REJEITADO REJEITADO
88 2015 SIM NÃO NÃO NÃO ACEITO ACEITO
139

INCLUSÃO EXCLUSÃO
ID ANO 1° AVALIAÇÃO 2° AVALIAÇÃO
I1 I2 E1 E2
89 2017 NÃO NÃO SIM NÃO REJEITADO REJEITADO
90 2017 NÃO NÃO SIM NÃO REJEITADO REJEITADO
91 2017 NÃO NÃO SIM NÃO REJEITADO REJEITADO
92 2017 NÃO NÃO SIM NÃO REJEITADO REJEITADO
93 2017 NÃO NÃO SIM NÃO REJEITADO REJEITADO
94 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
95 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
96 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
97 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
98 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
99 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
100 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
101 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
102 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
103 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
104 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
105 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
106 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
107 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
108 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
109 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
110 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
111 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
112 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
113 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
114 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
115 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
116 2017 NÃO NÃO SIM NÃO REJEITADO REJEITADO
117 2017 NÃO NÃO SIM NÃO REJEITADO REJEITADO
118 2017 NÃO NÃO SIM NÃO REJEITADO REJEITADO
119 2017 NÃO NÃO SIM NÃO REJEITADO REJEITADO
120 2017 NÃO NÃO SIM NÃO REJEITADO REJEITADO
121 2018 NÃO NÃO SIM NÃO REJEITADO REJEITADO
122 2018 NÃO NÃO SIM NÃO REJEITADO REJEITADO
123 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
124 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
125 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
126 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
127 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
128 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
129 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
130 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
131 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
132 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
140

INCLUSÃO EXCLUSÃO
ID ANO 1° AVALIAÇÃO 2° AVALIAÇÃO
I1 I2 E1 E2
133 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
134 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
135 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
136 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
137 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
138 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
139 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
140 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
141 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
142 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
143 2015 NÃO NÃO SIM NÃO REJEITADO REJEITADO
144 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
145 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
146 2018 NÃO NÃO SIM NÃO REJEITADO REJEITADO
147 2018 NÃO NÃO SIM NÃO REJEITADO REJEITADO
148 2017 NÃO NÃO SIM NÃO REJEITADO REJEITADO
149 2019 NÃO NÃO SIM NÃO REJEITADO REJEITADO
150 2019 NÃO NÃO NÃO SIM REJEITADO REJEITADO
151 2018 NÃO NÃO NÃO SIM REJEITADO REJEITADO
152 2015 NÃO NÃO NÃO SIM REJEITADO REJEITADO
153 2015 NÃO NÃO NÃO SIM REJEITADO REJEITADO
154 2019 NÃO NÃO NÃO SIM REJEITADO REJEITADO
155 2018 NÃO NÃO NÃO SIM REJEITADO REJEITADO

Fonte: Elaborado pelo Autor (2021)

A.3 Fonte 3 – Outras Fontes (Pearl Growing)


O método utilizado para busca destes estudos é denominado Pearl Growing.
Segundo Felizardo et. al (2017), esta técnica consiste em investigar as referências
utilizadas pelos artigos mais relevantes e dos principais autores da área.
Desta forma, alguns estudos que faziam parte da lista de referências de
trabalhos selecionados como relevantes das fontes anteriores, foram incluídos nesta
etapa da revisão sistemática, bem como trabalhos mais recentes de autores
previamente identificados como relevantes.
Relação de trabalhos:

156. Bragagnolo, L. et al. Artificial neural network ensembles applied to the mapping
of landslide susceptibility (2020) https://doi.org//10.1016/j.catena.2019.104240
157. BUI, D. et al. Comparing the prediction performance of a Deep Learning Neural
Network model with conventional machine learning models in landslide susceptibility
assessment (2020) https://doi.org//10.1016/j.catena.2019.104426
141

158. Pradhan, B.; Lee, S. Regional landslide susceptibility analysis using back-
propagation neural network model at Cameron Highland, Malaysia (2010)
https://doi.org//10.1007/s10346-009-0183-2
159. Kawabata, D.; Bandibas, J. Landslide susceptibility mapping using geological data, a
DEM from ASTER images and an Artificial Neural Network (ANN) (2009)
https://doi.org//10.1016/j.geomorph.2009.06.006

Você também pode gostar