Você está na página 1de 6

1

Mineração de dados aplicado à engenharia geotécnica (Determinação da estabilidade de


taludes da cidade de Salvador-BA)

Laedson Silva Pedreira


Programa de Pós-Graduação em Ciência da Computação, PGGC-UEFS
E-mail: laedsonsilva@hotmail.com

I. I NTRODUC ÃO
A estabilidade das encostas naturais tem um impacto significativo nas infra-estruturas de engenharia
civil (por exemplo, barragens de terra, estradas e edificações) que ficam perto delas. Esse problema pode
ser considerado para diferentes tipos de taludes, como taludes artificiais e naturais [1].
Os escorregamentos de taludes são fenômenos de grande complexidade e constituem sérios riscos em
áreas de encostas. Muitas variáveis estão envolvidas na avaliação da estabilidade de taludes e o cálculo
do fator de segurança requer dados geométricos, dados fı́sicos do solo e seus parâmetros de resistência,
informações sobre pressões da água e da chuva. Atualmente, a avaliação para determinar a suscetibilidade
de falhas de engenharia da estabilidade dos taludes, de forma geral, é realizada usando diferentes
técnicas computacionais, como equilı́brio limite, análise de limite, método de elementos finitos, método
de diferenças finitas e método de elementos de contorno. Devido à variabilidade do material, informações
insuficientes sobre o local e a incompleta compreensão do mecanismo de falha, é quase impossı́vel
modelar o problema de maneira exata. Pressupostos e simplificações são realizados na modelagem para
que as soluções sejam tratáveis. Contudo, a precisão dos modelos na previsão do comportamento dos
problemas depende muito das suposições e simplificações. Alternativamente, a mineração de dados tem
sido uma opção para desenvolver relações de entrada e saı́da para análise de estabilidade de taludes,
desde que se tenha uma quantidade suficientemente grande de dados [2] [3] [4].
Neste contexto, este trabalho busca realizar um levantamento bibliográfico sobre a utilização das
técnicas de mineração de dados como ferramentas alternativas no estudo e previsão da estabilidade
de taludes. Além disso, busca-se verificar quais são as técnicas mais eficientes e utilizadas na resolução
destes problemas de considevável grau de complexidade.

II. F UNDAMENTAÇ ÃO


A. Mineração de dados
Com o crescimento exponencial do volume de dados armazenados pelas organizações nas últimas
décadas, novas e mais complexas estruturas de armazenamento foram desenvolvidas, tais como: banco
de dados, Data Warehouses, Bibliotecas virtuais, entre outras. Desta forma, o que fazer com os dados
armazenados? O modelo tradicional para transformação dos dados em informação (conhecimento), con-
siste em um processamento manual de todas essas informações por es- pecialistas que, então, produzem
relatórios que deverão ser analisados. Na grande maioria das situações, devido ao grande volume de
dados, esse processo manual torna-se impraticável. Com a finalidade de responder a esta questão, foi
proposta, no final da década de 80, a Mineração de Dados, do inglês Data Mining [5].
O conceito de Mineração de Dados torna-se cada vez mais popular como uma ferramenta de utilizada
para obter informações, que podem revelar estruturas de conhecimento, que possam guiar as tomadas
de decisões em situações de incerteza. Há pouco tempo, tem-se observado um interesse crescente em
desenvolver novas técnicas para analisar dados, especialmente projetadas para tratar questões relativas
a mineração de dados. No entanto, a mineração de dados ainda está baseada em princı́pios conceituais
de Análise de Dados Exploratórios (Exploratory Data Analysis - EDA) e de modelagem [6].
São inúmeras as definições de Mineração de Dados que podem ser encontradas na literatura. Dentras
as inúmeras definições destacamos as seguintes:

• Mineração de dados é o nome dado ao conjunto de técnicas que permite a extração de conhecimentos
a partir de grandes volumes de dados [7].
2

• Mineração de dados é a busca de informações valiosas em grandes bancos de dados. É um esforço de


cooperação entre homens e computadores. Os homens projetam bancos de dados, descrevem problemas
e definem seus objetivos. Os computadores verificam dados e procuram padrões que casem com as metas
estabelecidas pelos homens [8]

• Mineração de dados é o processo de proposição de várias consultas e extração de informações


úteis, padrões e tendências, freqüentemente desconhecidos, a partir de grande quantidade de dados
armazenada em bancos de dados [9].

• Mineração de dados, de forma simples, é o processo de extração ou mineração de conhecimento em


grandes quantidades de dados [10].

Na verdade, a Mineração de Dados é parte de um processo maior de pesquisa denominado Busca de


Conhecimento em Banco de Dados (Knowledge Discovery in Database - KDD), o qual possui uma meto-
dologia própria para preparação e exploração dos dados, interpretação de seus resultados e assimilação
dos conhecimentos minerados. No entanto, se tornou mais conhecida do que o próprio processo de KDD
em função de ser a etapa onde são aplicadas as técnicas de busca de conhecimentos. [6].
Existe uma grande diversidade de métodos ou técnicas para minerar dados,
mas aqui, apenas concentrar-se-á no subconjunto de técnicas mais utilizadas para resolução de proble-
mas de engenharia geotécnica.

B. Redes Neurais Artificiais (RNAs)


Redes neurais artificiais (RNAs) consiste em uma técnica matemática que tem origem na psicologia e
na neurobiologia. Seu funcionamento consiste basicamente em simular o comportamento dos neurônios.
Desta forma, uma rede neural pode ser entendida como um conjunto de unidades de entrada e saı́da,
conectados por camadas intermediárias e cada ligação possui um peso associado. Durante o processo
de aprendizado, a rede ajusta estes pesos para conseguir classificar corretamente um objeto. É uma
técnica que necessita de um longo perı́odo de treinamento, ajustes finos dos parâmetros e é de difı́cil
interpretação, não sendo possı́vel identificar de forma clara a relação entre a entrada e a saı́da. Em
contrapartida, as redes neurais conseguem trabalhar de forma que não sofram com valores errados e
também podem identificar padrões para os quais nunca foram treinados. [11] [5]
Desde o inı́cio, as pesquisas na área de redes neurais artificiais (RNAs) e suas aplicações continuam a
fascinar cientistas e engenheiros de várias áreas de conhecimento. O crescente interesse entre os pesquisa-
dores que estudam a instabilidade de taludes, decorre do fato de que essas máquinas de aprendizado têm
um excelente desempenho nas questões de reconhecimento de padrões e na modelagem de problemas
multivariados não-lineares. [12]
Algumas publicações recentes sobre a utilização de redes neurais na engenharia geotécnica são forne-
cidas abaixo:

• Previsão de estabilidade de taludes usando abordagens metaheurı́sticas e de aprendizado de máquina


integradas: um estudo comparativo [11].

• Previsão da estabilidade de taludes usando regressão linear múltipla (MLR) e rede neural artificial
(RNA) [13].

• Estudo da previsão de estabilidade de taludes usando redes neurais [12].

• Previsão da estabilidade de taludes usando rede neural artificial (Estudo de caso: Noabad, mazan-
daran, iran) [14].
3

• A previsão do fator crı́tico de segurança de declives finitos homogêneos usando redes neurais e
regressões múltiplas [15]

• Aplicação de redes neurais artificiais para análise de estabilidade de taludes na prática geotécnica
[16]

• Estudo dos modelos de previsão de estabilidade de taludes com mineração de dados [2]

[16] desenvolveu um modelo de previsão para o fator de segurança dos taludes. Para isso, supôs
sete fatores que predertemina a estabilidade da inclinação: altura, ângulo de inclinação do talude, massa,
coesão, ângulo de atrito do solo, coeficiente de pressão, profundidade da rocha. Para este modelo realizou-
se a análise de 57 taludes. Após os experimentos tanto [16] quanto [14] concluiram que as redes neurais
artificiais são capazez de fornecer resultados confiáveis para a análise de estabilidade de talude, sem
a perda da confiabilidade estatı́stica e alto nı́vel de precisão da estimativa. Porém, [16] enfatiza que o
modelo proposto, representa um modelo simplificado para estimativa do fator de segurança de taludes.

C. Árvores de Decisão (Decision Trees)


Esse técnica de classificação por Árvore de Decisão, utiliza um gráfico em configuração de árvore para
auxiliar a tomada de decisão. É um modelo não paramétrico, sem relações presumidas entre variáveis
de saı́da e variáveis de entrada, que atua efetivamente nos problemas de previsão [11].
Neste método cada nó (não-folha) indica um teste feito sobre um valor (por exemplo, idade ¿ 20). As
ligações entre os nós representam valores possı́veis do teste do nó superior, e as folhas indicam a classe
(categoria) a qual o registro pertence. Com a árvore de decição completa, para classificarmos um novo
registro, basta seguir o fluxo na árvore(mediante os testes nos nós não-folhas) começando no nó raiz até
chegar a uma folha. Pela estrutura que formam, as árvores de decisões podem ser convertidas em Regras
de Classificação. O sucesso das árvores de decisão, deve-se ao fato de ser uma técnica extremamente
simples, não necessita de parâmetros de configuração e geralmente tem um bom grau de assertividade.
Apesar de ser uma técnica extremamente poderosa, é necessário uma análise detalhada dos dados que
serão usados para garantir bons resultados. [5]
Nos últimos anos, muitos estudos apareceram na literatura utilizando a Árvore de decisão como uma
ferramenta para a engenharia. [11].
No que se refere a utilização das Árvores de Decisão para a determinação da estabilidade de taludes
ou resolução de problemas não-lineares, conforme experimento realizado por [11], as Árvores de decisão
apresentaram um desempenho relativamente baixo.

D. Algoritmos Genéticos
A ideia dos algoritmos genéticos segue a teoria da evolução. Geralmente, no estágio inicial uma
população é definida de forma aleatória. Seguindo a lei do mais forte (evolução), uma nova população é
gerada com base na atual, porém, os indivı́duos passam por processos de troca genética e mutação. Este
processo continua até que populações com indivı́duos mais fortes sejam geradas ou que atinga algum
critério de parada [5]. As técnicas de computação evolutiva fornecem alternativas robustas. Essa técnica
tenta obter a melhor solução realizando otimização global. Para isso, utilizam codificação adequada para
representar possı́veis soluções para um problema e orientam a pesquisa usando operadores genéticos e
o princı́pio da ”sobrevivência do teste de adaptação”. [3] A utilização de algoritmos genéticos têm sido
amplamente aplicadas em engenharia civil e na geotecnia. Várias pesquisadores utilizaram algoritmos
genéticos para procurar superfı́cies crı́ticas de escorregamento de taludes. Porém, algoritmos genéticos são
extremamente simples e eficientes, contudo, não podem ser usados para desenvolver modelos complexos,
como equações. Portanto, a programação genética foi desenvolvida para superar essa limitação. Uma das
vantagens é que suposições e conhecimento prévio sobre a estrutura e o tamanho da solução não sejam
necessários. Além disso, essa técnica pode selecionar automaticamente as entradas do sistema para gerar
4

uma estrutura de modelo que se ajuste com precisão à resposta de entrada e saı́da do sistema e forneça
uma solução descritiva [3].
[3] desenvolveu um algoritmo evolutivo em duas etapas, combinando programação genética e al-
goritmos genétivos Para problemas de engenharia altamente não-lineares e extremamente complexos,
um algoritmo evolutivo em duas etapas, combinando programação genética e algoritmos genéticos.
Utilizando este método, foi estabelecido uma equação empı́rica para estimar o fator de segurança dos
taludes a partir dos dados de entrada. Os resultados mostraram que há uma boa concordância entre os
os fatores de segurança obtidos pelo presente método e o método equilı́bri limite (Método comumente
utilizado para determinar fator de segurança de taludes).

E. SVM (Support Vector Machines)


A SVM é uma técnica de mineração de dados embasada na Teoria de Aprendizado Estatı́stico. É
uma técnica que tem chamado muita atenção pelos seus resultados, pois são capazes de obter altos
ı́ndices de assertividade, permite modelar situações não-lineares complexas gerando modelos de simples
interpretação, pode ser usada para relações lineares e não-lineares, entre outros. É utilizado tanto para
tarefas de classificação quanto de predição. [5].
Em [2] é apresentado os métodos de RNA e SVM, visto que são comumente utilizados na mineração de
dados, bem como as vantagens e desvantagens de ambos quando aplicados a problemas de engenharia.
Em uma situação que os dados são limitados, o modelo de previsão do SVM tem mais vantagens em
avaliar a estabilidade de taludes do que o modelo RNA. O dois métodos são baseados em teorias
matemáticas distintas, onde a RNA é um método de ajuste de dados, enquanto o SVM é baseado no
aprendizado estatı́stico.
Embora o SVM possua vantagens, o mesmo apresenta problemas de custo de tempo e memória para
treia as amostras em grande escala e a taxa de reação de classificação reduz quando a uma enorme
quantidade de vetores de suporte [2].
[11] prôpos e comparou seis métodos para a previsão da estabilidade de taludes. As técnicas utiliza-
das foram: regressão logı́stica, árvore de decisão, floresta aleatória, máquina de aumento de gradiente,
SVM, RNA. O resultado da comparação demonstrou que o SVM foi recomendado para a previsão da
estabilidade da taludes.

F. Regressão Logı́stica
A Regressão Logı́stica, também conhecida como regressão logit, é um tipo de modelo linear generali-
zado usado para estimar a probabilidade de uma resposta binária com base em uma ou mais variáveis
independentes. Ela permite estabelecer um modelo de regressão multivariado entre uma variável de saı́da
e múltiplas variáveis de entrada.
No estudo comparativo estabelecido por [11] ficou claro à incompetência da técnica de Regreção
Logistı́ca em lidar com a modelagem de relacionamento não-linear. Com isso, os resultados obtidos não
foram satisfatórios para a resolução de problemas de estabilidade de taludes, visto que são problemas
complexos e de natureza não-linear.

III. M ETODOLOGIA
Para o desenvolvimento deste trabalho realizou-se uma pesquisa bibliográfica de artigos cientı́ficos
sobre o tema supracitado. Para isso, realizou-se buscas nas seguintes bases bibliográficas: IEEE, Google
Acadêmico, Scopus e Science Direct. Durante a pesquisa foram fornecidas diversas palavras-chaves, no
qual podem-se destacar: “Slope”, “Data mining”, “Stability” e “Prediction”. Desta forma, ao encontrar
um artigo com tı́tulo dentro do tópico de pesquisa definido, realizou-se a leitura do seu resumo com
a finalidade de separar o artigo para leitura detalhada. Nesta etapa, realizou-se a leitura de resumos,
selecionando-se alguns para realizar uma leitura aprofundada. Por meio das referências de dois artigos
encontrou-se mais artigos, totalizando 11 artigos para leitura detalhada. Neste universo, foram selecio-
nados 5 artigos publicados nos últimos 5 anos e 6 publicados a mais de 5 anos. Os critérios de seleção
5

adotado para a escolha dos artigos foram os seguintes: número de citações, ano de publicação e ı́ndices
bibliométricos.
Além da leitura dos artigos, recorreu-se a livros conceituados com o objetivo de compreender conceitos
não abordados de forma clara nos artigos cientı́ficos.
Para auxiliar no processo de gerenciamento de bibliografia, obtenção de referências e documentação
de comentários utilizou-se a ferramenta Mendeley. O Mendeley ajuda o pesquisador a gerenciar, com-
partilhar e descobrir conteúdo para sua pesquisa.
Além disso, foi elaborada uma planilha em Excel com o objetivo de organizar de forma sistemática os
artigos, separando-os por técnica de mineração de dados, ano de publicação e número de citações.

IV. C ONSIDERAÇ ÕES F INAIS


Com este trabalho, percebe-se que a revisão bibliográfica tem um papel fundamental na construção de
uma boa pesquisa cientı́fica, visto que através dela adiquire-se as ferramentas necessárias para situar a
pesquisa dentro da fronteira do conhecimento. Para isso, é preciso conhecer e definir as bases teóricas da
pesquisa, conhecer os métodos de pesquisas utilizados em outros trabalhos, conhecer pesquisas iguais
e relacionados ao tema proposto, para então definir seu problema a partir de uma lacuna identificada.
Além disso, é de extrema relevância comparar sua pesquisa, seus resultados e suas contribuições com os
de outro autores. Desta forma, este trabalho possui grande importância, visto que teve-se um primeiro
contato com o tópico que pretende-se desenvolver a dissertação de mestrado.
Nesta pesquisa, também, verificou-se que as técnicas de mineração de dados podem ser grandes aliadas
para a engenharia geotécnica, visto que são capazes de resolver, de maneira eficiente, problemas de grande
relevância para essa área de conhecimento.
Por fim, outras pesquisas faz-se necessárias, com o objetivo e verificar o emprego de outras técnicas,
bem com a verificação de modelos menos simplificados.

R EFER ÊNCIAS
[1] D. T. Bui, H. Moayedi, M. Gör, A. Jaafari, and L. K. Foong, “Predicting slope stability failure through machine learning
paradigms,” ISPRS International Journal of Geo-Information, vol. 8, no. 9, 2019.
[2] J. Li and F. Wang, “Study on the forecasting models of slope stability under data mining,” Earth and Space 2010: Engineering,
Science, Construction, and Operations in Challenging Environments, pp. 765–776, 2010.
[3] C. X. Yang, L. G. Tham, X. T. Feng, Y. J. Wang, and P. K. Lee, “Two-stepped evolutionary algorithm and its application to
stability analysis of slopes,” Journal of Computing in Civil Engineering, vol. 18, no. 2, pp. 145–153, 2004.
[4] S. K. Das, R. K. Biswal, N. Sivakugan, and B. Das, “Classification of slopes and prediction of factor of safety using differential
evolution neural networks,” Environmental Earth Sciences, vol. 64, no. 1, pp. 201–210, 2011.
[5] C. Camilo and J. Silva, “Mineração de Dados: Conceitos, tarefas, métodos e ferramentas,” Universidade Federal de Goiás
(UFC), p. 29, 2009.
[6] S. D. C. Côrtes, R. M. Porcaro, and S. Lifschitz, “Mineração de Dados – Funcionalidades, Técnicas e Abordagens,”
PUC-Rio Informática, p. 35, 2002. [Online]. Available: ftp://ftp.inf.puc-rio.br/pub/docs/techreports/02{\ }10{\ }cortes.pdf
[7] U. Fayyad, G. Piatetsky-Shapiro, and P. Smyth, “From data mining to knowledge discovery in databases,” AI Magazine,
vol. 17, no. 3, p. 37, Mar. 1996. [Online]. Available: https://www.aaai.org/ojs/index.php/aimagazine/article/view/1230
[8] S. Weiss and N. Indurkhya, Predictive Data Mining: A Practical Guide, ser. The Morgan Kaufmann Series in Data Management
Systems. Elsevier Science, 1998. [Online]. Available: https://books.google.com.br/books?id=xzVD8C2YpnQC
[9] B. Thuraisingham, Data Mining: Technologies, Techniques, Tools, and Trends. CRC Press, 2014. [Online]. Available:
https://books.google.com.br/books?id=F0JZDwAAQBAJ
[10] J. Han and M. Kamber, Data mining : concepts and techniques. San Francisco [u.a.]: Kaufmann, 2005. [Online]. Available:
http://www.amazon.com/Data-Mining-Concepts-Techniques-Management/dp/1558604898
[11] C. Qi and X. Tang, “Slope stability prediction using integrated metaheuristic and machine learning approaches:
A comparative study,” Computers and Industrial Engineering, vol. 118, pp. 112–122, 2018. [Online]. Available:
https://doi.org/10.1016/j.cie.2018.02.028
[12] “A study of slope stability prediction using neural networks,” Geotechnical and Geological Engineering, vol. 23, no. 4, pp.
419–445, 2005.
[13] A. Chakraborty and D. Goswami, “Prediction of slope stability using multiple linear regression (MLR) and artificial neural
network (ANN),” Arabian Journal of Geosciences, vol. 10, no. 17, pp. 1–11, 2017.
[14] A. J. Choobbasti, F. Farrokhzad, and A. Barari, “Prediction of slope stability using artificial neural network (Case study:
Noabad, mazandaran, iran),” Arabian Journal of Geosciences, vol. 2, no. 4, pp. 311–319, 2009.
[15] Y. Erzin and T. Cetin, “The prediction of the critical factor of safety of homogeneous finite slopes using neural
networks and multiple regressions,” Computers and Geosciences, vol. 51, pp. 305–313, 2013. [Online]. Available:
http://dx.doi.org/10.1016/j.cageo.2012.09.003
6

[16] S. Kostic, N. Vasovic, K. Todorovic, and A. Samcovic, “Application of artificial neural networks for slope stability analysis
in geotechnical practice,” 2016 13th Symposium on Neural Networks and Applications, NEUREL 2016, 2016.

Você também pode gostar