Escolar Documentos
Profissional Documentos
Cultura Documentos
Engenharia Civil
Orientadores:
Júri
Junho 2021
ii
Declaração
Declaro que o presente documento é um trabalho original da minha autoria e que cumpre
todos os requisitos do Código de Conduta e Boas Práticas da Universidade de Lisboa.
iii
iv
À Ordem do Conhecimento
v
vi
Agradecimentos
Agradecimentos
Aos meus orientadores, Doutor Juan Mata pela dedicação e empenho que demonstrou na realização
desta dissertação bem como pelo imensurável apoio que prestou ao longo deste caminho e ao
Professor João Almeida pelas contribuições que forneceu.
Ao Laboratório Nacional de Engenharia Civil (LNEC), pela disponibilização de meios necessários para
a realização da minha Dissertação.
À EDP - Energias de Portugal S.A. que disponibilizou os dados para a análise do caso de estudo.
Aos meus Pais, ao meu Mano e Família, por todo o apoio que me prestaram ao longo da minha vida.
Finalmente, aos meus colegas, amigos e professores que de uma maneira ou outra contribuíram para
o meu percurso académico, conhecimento adquirido e desenvolvimento desta Dissertação.
vii
viii
Resumo
Resumo
Esta dissertação insere-se no âmbito do controlo estrutural de barragens de betão e estuda diferentes
formulações de aprendizagem automática para a análise e interpretação do comportamento observado
em barragens de betão. Nesta dissertação foram analisados e interpretados os deslocamentos
horizontais, observados ao longo de 30 anos, em dois pontos no bloco central da barragem do Alto
Lindoso.
Em cada ponto foram testadas três formulações designadas por Hydrostatic-Season-Time (HST),
Hydrostatic-Temperature-Time (HTT) e Hydrostatic-Temperature-Foundation-Time (HTFT), sendo a
última uma proposta inovadora no âmbito deste trabalho. Todas as formulações permitem a
consideração dos efeitos do nível da água da albufeira, da temperatura e do tempo. A diferença entre
eles reside no seguinte: i) HST considera o efeito da temperatura do ar através de uma função
sinusoidal de período anual; ii) HTT considera o efeito da temperatura do ar através da temperatura
medida no corpo da barragem; e iii) HTFT considera o efeito da temperatura do ar através da
temperatura medida no corpo da barragem e considera também o efeito da deformação na fundação.
Nas formulações foram utilizados os seguintes métodos de aprendizagem automática: regressão linear
múltipla, redes neuronais artificiais e random forest. Consideraram-se 286 campanhas de observação
na análise que foram divididas em período de aprendizagem e período de previsão. Todas as
formulações demonstraram boa capacidade de estimação, existindo algumas potenciais vantagens na
utilização da formulação HTFT. Os métodos de aprendizagem automática mostraram ser adequados
ao tipo de aplicação, tendo o método random forest apresentado resultados muito interessantes
comparativamente aos outros métodos.
Palavras-chave
Controlo de Segurança Estrutural de Barragens de Betão; Análise e Interpretação do Comportamento
Observado; Aprendizagem Automática; Redes Neuronais Artificiais; Random Forest; Interpretação
Quantitativa.
ix
x
Abstract
Abstract
The scope of this dissertation entails the structural health monitoring of concrete dams and different
machine learning formulations, to support the analysis and interpretation of the observed behavior in
concrete dams. In this dissertation, horizontal displacements, spanning 30 years, were analyzed, and
interpreted at two points in the central block of Alto Lindoso dam.
Keywords
Structural Health Monitoring of Dams; Analysis and Interpretation of Observed Behavior; Machine
Learning; Artificial Neural Networks; Random Forest; Quantitative Interpretation.
xi
xii
Índice
Índice
Agradecimentos .................................................................................................................................. vii
Resumo.................................................................................................................................................. ix
Abstract ................................................................................................................................................. xi
Índice ................................................................................................................................................... xiii
Índice de Figuras ............................................................................................................................... xvii
Índice de Tabelas ................................................................................................................................ xxi
Lista de Acrónimos .......................................................................................................................... xxiii
Lista de Símbolos .............................................................................................................................. xxv
Lista de Software .............................................................................................................................. xxix
1 Introdução ....................................................................................................................................... 1
1.1 Enquadramento geral ............................................................................................................... 2
1.2 Motivação e objetivos................................................................................................................ 3
1.3 Estrutura da dissertação ........................................................................................................... 3
2 Classificação de barragens ........................................................................................................... 4
2.1 Introdução ................................................................................................................................. 5
2.2 Classificação de barragens ....................................................................................................... 5
2.2.1 Barragens de aterro ........................................................................................................... 6
2.2.2 Barragens de betão ........................................................................................................... 7
2.2.3 Classificações de barragens segundo o Regulamento de Segurança de Barragens ....... 9
3 Controlo de segurança de barragens ........................................................................................ 11
3.1 Aspetos gerais ........................................................................................................................ 12
3.2 Controlo de segurança estrutural de barragens de betão ...................................................... 13
4 Métodos de aprendizagem automática ...................................................................................... 18
4.1 Introdução ............................................................................................................................... 19
4.2 Interpretação quantitativa tradicional ...................................................................................... 20
4.2.1 Introdução ........................................................................................................................ 20
4.2.2 Regressão linear múltipla ................................................................................................ 21
4.3 Redes neuronais artificiais ...................................................................................................... 22
4.3.1 Introdução ........................................................................................................................ 22
4.3.2 Conceitos básicos de redes neuronais artificiais ............................................................. 22
4.3.3 Aprendizagem e aplicação dos modelos de redes neuronais artificiais perceptrão
multicamada ................................................................................................................................... 24
4.4 Random forest......................................................................................................................... 26
4.4.1 Introdução ........................................................................................................................ 26
xiii
4.4.2 Conceitos básicos de árvores de decisão ....................................................................... 26
4.4.3 Funcionamento do método random forest ....................................................................... 28
5 Caso estudo .................................................................................................................................. 30
5.1 A barragem do Alto Lindoso ................................................................................................... 31
5.1.1 Monitorização do comportamento estrutural ................................................................... 32
5.2 Elementos de formulação do estudo ...................................................................................... 34
5.2.1 Introdução ........................................................................................................................ 34
5.2.2 Dados do sistema de observação da barragem .............................................................. 35
5.3 Metodologia proposta ............................................................................................................. 39
5.4 Modelos de regressão linear múltipla na interpretação do deslocamento radial no FP3 à cota
326,5 metros ...................................................................................................................................... 41
5.4.1 Modelo IQ1 ...................................................................................................................... 42
5.4.2 Modelo IQ2 ...................................................................................................................... 42
5.4.3 Modelo IQ3 ...................................................................................................................... 43
5.4.4 Modelo IQ4 ...................................................................................................................... 44
5.4.5 Modelo IQ5 ...................................................................................................................... 45
5.4.6 Modelo IQ6 ...................................................................................................................... 45
5.4.7 Modelo IQ7 ...................................................................................................................... 46
5.4.8 Resumo dos modelos IQ obtidos..................................................................................... 47
5.5 Modelos de rede neuronal artificial na interpretação do deslocamento radial no FP3 à cota
326,5m ............................................................................................................................................... 51
5.5.1 Modelo NN1 ..................................................................................................................... 52
5.5.2 Modelo NN2 ..................................................................................................................... 52
5.5.3 Modelo NN3 ..................................................................................................................... 52
5.5.4 Modelo NN4 ..................................................................................................................... 53
5.5.5 Modelo NN5 ..................................................................................................................... 53
5.5.6 Modelo NN6 ..................................................................................................................... 54
5.5.7 Modelo NN7 ..................................................................................................................... 54
5.5.8 Resumo dos modelos NN obtidos ................................................................................... 55
5.6 Modelos de random forest na interpretação do deslocamento radial no FP3 à cota 326,5m 57
5.6.1 Modelo RF1 ..................................................................................................................... 58
5.6.2 Modelo RF2 ..................................................................................................................... 58
5.6.3 Modelo RF3 ..................................................................................................................... 59
5.6.4 Modelo RF4 ..................................................................................................................... 59
5.6.5 Modelo RF5 ..................................................................................................................... 60
5.6.6 Modelo RF6 ..................................................................................................................... 60
5.6.7 Modelo RF7 ..................................................................................................................... 61
5.6.8 Resumo dos modelos RF obtidos.................................................................................... 61
5.7 Resumo dos modelos desenvolvidos para a interpretação dos deslocamentos radiais no FP3
à cota 232,7m .................................................................................................................................... 64
xiv
5.7.1 Modelos de interpretação quantitativa ............................................................................. 65
5.7.2 Modelos de redes neuronais artificiais ............................................................................ 69
5.7.3 Modelos de random forest ............................................................................................... 71
5.8 Discussão de resultados ......................................................................................................... 75
6 Considerações finais e desenvolvimentos futuros .................................................................. 78
Referências Bibliográficas ................................................................................................................. 81
Anexo A. Gráficos modelos à cota 232,7m .................................................................................. 87
A.1 Gráficos dos modelos de IQ dos deslocamentos radiais no FP3 à cota 232,7m ................... 88
A.2 Gráficos dos modelos de NN dos deslocamentos radiais no FP3 à cota 232,7m ................. 90
A.3 Gráficos dos modelos de RF dos deslocamentos radiais no FP3 à cota 232,7m .................. 92
xv
xvi
Índice de Figuras
Índice de Figuras
Figura 2.1. Materiais utilizados nas construções de barragens. ................................................... 6
Figura 2.2. Tipos de barragens de aterro (adaptado de [TL14]). .................................................. 6
Figura 2.3. Tipos de barragens de betão (adaptado de [TL14]). .................................................. 8
Figura 3.1. As principais causas de incidentes em barragens nos EUA de 2010 a 2019 [DS1]. 12
Figura 3.2. Fases de vida da obra (adaptado de [MJ07]). .......................................................... 14
Figura 3.3. Principais atividades de controlo de segurança de barragens (adaptado de [MJ13]).
........................................................................................................................... 15
Figura 3.4. Algumas das principais ações que afetam a segurança estrutural nas barragens
(adaptado de [MJ13]). ........................................................................................ 15
Figura 4.1. Abordagens dos métodos supervisionados (esquerda) e não supervisionados
(direita). .............................................................................................................. 19
Figura 4.2. Alguns métodos de aprendizagem automática utilizados. ........................................ 20
Figura 4.3. Diagrama esquemático de um neurónio genérico (adaptado de [GM19]). ............... 22
Figura 4.4. Esquema de rede neuronal recorrente (esquerda) e estritamente direta (direita)
[MJ07]. ............................................................................................................... 24
Figura 4.5. Esquema de rede neuronal do tipo perceptrão multicamada [MJ07]. ...................... 24
Figura 4.6. Diagrama esquemático de uma árvore binária de regressão. .................................. 27
Figura 4.7. Exemplo de regiões determinadas do espaço para a Figura 4.6. ............................ 27
Figura 4.8. Diagrama esquemático de uma random forest [GR20]. ........................................... 28
Figura 4.9. Diagrama esquemático de uma random forest de variáveis aleatórias [GR20]. ...... 29
Figura 5.1. Vista de jusante da barragem (esquerda) [PN1] e vista aérea da barragem e da
albufeira (direita) do Alto Lindoso [TD1]. ........................................................... 31
Figura 5.2. Localização dos termómetros e extensómetros. ...................................................... 32
Figura 5.3. Localização dos fios de prumo e dos extensómetros de fundação (alçado). ........... 33
Figura 5.4. Localização dos fios de prumo e extensómetros de fundação (planta).................... 33
Figura 5.5. Localização das bicas e outra instrumentação (alçado). .......................................... 34
Figura 5.6. Perfil e instrumentação da barragem entre a junta 11 e 12. ..................................... 36
Figura 5.7. Observações da altura média da água no reservatório. ........................................... 37
Figura 5.8. Temperaturas observadas nos instrumentos. ........................................................... 37
Figura 5.9. Representação da variação sazonal. ........................................................................ 38
Figura 5.10. Deformações da fundação em relação a ponto fixo a 45 metros de profundidade. 38
Figura 5.11. Observações dos deslocamentos radiais em FP3.................................................. 38
Figura 5.12. Esquema da metodologia adotada. ........................................................................ 41
Figura 5.13. Observações e resultados do modelo IQ1 para o deslocamento radial no FP3-
xvii
326,5m. .............................................................................................................. 42
Figura 5.14. Observações e resultados do modelo IQ2 para o deslocamento radial no FP3-
326,5m. .............................................................................................................. 43
Figura 5.15. Observações e resultados do modelo IQ3 para o deslocamento radial no FP3-
326,5m. .............................................................................................................. 44
Figura 5.16. Observações e resultados do modelo IQ4 para o deslocamento radial no FP3-
326,5m. .............................................................................................................. 44
Figura 5.17. Observações e resultados do modelo IQ5 para o deslocamento radial no FP3-
326,5m. .............................................................................................................. 45
Figura 5.18. Observações e resultados do modelo IQ6 para o deslocamento radial no FP3-
326,5m. .............................................................................................................. 46
Figura 5.19. Observações e resultados do modelo IQ 7 para o deslocamento radial no FP3-
326,5m. .............................................................................................................. 47
Figura 5.20. Diagrama de extremos e quartis dos resíduos dos diversos modelos IQ para o
período de aprendizagem. ................................................................................. 50
Figura 5.21. Diagrama de extremos e quartis dos resíduos dos modelos IQ para o período de
previsão. ............................................................................................................ 51
Figura 5.22. Observações e resultados do modelo NN1 para o deslocamento radial no FP3-
326,5m. .............................................................................................................. 52
Figura 5.23. Observações e resultados do modelo NN2 para o deslocamento radial no FP3-
326,5m. .............................................................................................................. 52
Figura 5.24. Observações e resultados do modelo NN3 para o deslocamento radial no FP3-
326,5m. .............................................................................................................. 53
Figura 5.25. Observações e resultados do modelo NN4 para o deslocamento radial no FP3-
326,5m. .............................................................................................................. 53
Figura 5.26. Observações e resultados do modelo NN5 para o deslocamento radial no FP3-
326,5m. .............................................................................................................. 54
Figura 5.27. Observações e resultados do modelo NN6 para o deslocamento radial no FP3-
326,5m. .............................................................................................................. 54
Figura 5.28. Observações e resultados do modelo NN7 para o deslocamento radial no FP3-
326,5m. .............................................................................................................. 55
Figura 5.29. Diagrama de extremos e quartis dos resíduos dos modelos NN para o período de
aprendizagem .................................................................................................... 56
Figura 5.30. Diagrama de extremos e quartis dos resíduos dos modelos NN para o período de
previsão. ............................................................................................................ 57
Figura 5.31. Observações e resultados do modelo RF1 para o deslocamento radial no FP3-
326,5m. .............................................................................................................. 58
Figura 5.32. Observações e resultados do modelo RF2 para o deslocamento radial no FP3-
326,5m. .............................................................................................................. 59
Figura 5.33. Observações e resultados do modelo RF3 para o deslocamento radial no FP3-
xviii
326,5m. .............................................................................................................. 59
Figura 5.34. Observações e resultados do modelo RF4 para o deslocamento radial no FP3-
326,5m. .............................................................................................................. 60
Figura 5.35. Observações e resultados do modelo RF5 para o deslocamento radial no FP3-
326,5m. .............................................................................................................. 60
Figura 5.36. Observações e resultados do modelo RF6 para o deslocamento radial no FP3-
326,5m. .............................................................................................................. 61
Figura 5.37. Observações e resultados do modelo RF7 para o deslocamento radial no FP3-
326,5m. .............................................................................................................. 61
Figura 5.38. Diagrama de extremos e quartis dos resíduos dos modelos RF para o período de
aprendizagem .................................................................................................... 63
Figura 5.39. Diagrama de extremos e quartis dos resíduos dos modelos RF para o período de
previsão. ............................................................................................................ 64
Figura 5.40. Diagrama de extremos e quartis dos resíduos dos modelos IQ para o período de
aprendizagem. ................................................................................................... 67
Figura 5.41. Diagrama de extremos e quartis dos resíduos dos modelos IQ para o período de
previsão. ............................................................................................................ 68
Figura 5.42. Diagrama de extremos e quartis dos resíduos dos modelos NN para o período de
aprendizagem. ................................................................................................... 70
Figura 5.43. Diagrama de extremos e quartis dos resíduos dos modelos NN para o período de
previsão. ............................................................................................................ 71
Figura 5.44. Diagrama de extremos e quartis dos resíduos dos modelos RF para o período de
aprendizagem. ................................................................................................... 74
Figura 5.45. Diagrama de extremos e quartis dos resíduos dos modelos RF para o período de
previsão. ............................................................................................................ 75
Figura A.1. Observações e resultados do modelo IQ1 para o deslocamento radial no FP3-232,7m.
........................................................................................................................... 88
Figura A.2. Observações e resultados do modelo IQ2 para o deslocamento radial no FP3-232,7m.
........................................................................................................................... 88
Figura A.3. Observações e resultados do modelo IQ3 para o deslocamento radial no FP3-232,7m.
........................................................................................................................... 88
Figura A.4. Observações e resultados do modelo IQ4 para o deslocamento radial no FP3-232,7m.
........................................................................................................................... 88
Figura A.5. Observações e resultados do modelo IQ5 para o deslocamento radial no FP3-232,7m.
........................................................................................................................... 89
Figura A.6. Observações e resultados do modelo IQ6 para o deslocamento radial no FP3-232,7m.
........................................................................................................................... 89
Figura A.7. Observações e resultados do modelo IQ7 para o deslocamento radial no FP3-232,7m.
........................................................................................................................... 89
Figura A.8. Observações e resultados do modelo NN1 para o deslocamento radial no FP3-
xix
232,7m. .............................................................................................................. 90
Figura A.9. Observações e resultados do modelo NN2 para o deslocamento radial no FP3-
232,7m. .............................................................................................................. 90
Figura A.10. Observações e resultados do modelo NN3 para o deslocamento radial no FP3-
232,7m. .............................................................................................................. 90
Figura A.11. Observações e resultados do modelo NN4 para o deslocamento radial no FP3-
232,7m. .............................................................................................................. 90
Figura A.12. Observações e resultados do modelo NN5 para o deslocamento radial no FP3-
232,7m. .............................................................................................................. 91
Figura A.13. Observações e resultados do modelo NN6 para o deslocamento radial no FP3-
232,7m. .............................................................................................................. 91
Figura A.14. Observações e resultados do modelo NN7 para o deslocamento radial no FP3-
232,7m. .............................................................................................................. 91
Figura A.15. Observações e resultados do modelo RF1 para o deslocamento radial no FP3-
232,7m. .............................................................................................................. 92
Figura A.16. Observações e resultados do modelo RF2 para o deslocamento radial no FP3-
232,7m. .............................................................................................................. 92
Figura A.17. Observações e resultados do modelo RF3 para o deslocamento radial no FP3-
232,7m. .............................................................................................................. 92
Figura A.18. Observações e resultados do modelo RF4 para o deslocamento radial no FP3-
232,7m. .............................................................................................................. 92
Figura A.19. Observações e resultados do modelo RF5 para o deslocamento radial no FP3-
232,7m. .............................................................................................................. 93
Figura A.20. Observações e resultados do modelo RF6 para o deslocamento radial no FP3-
232,7m. .............................................................................................................. 93
Figura A.21. Observações e resultados do modelo RF7 para o deslocamento radial no FP3-
232,7m. .............................................................................................................. 93
xx
Índice de Tabelas
Índice de Tabelas
Tabela 2.1. Classificação de barragens por risco (Decreto-Lei n.º 21/2018 de 28 de março -
Regulamento de Segurança de Barragens [RSB18]). ....................................... 10
Tabela 4.1. Exemplos de funções de ativação utilizadas em redes neuronais artificiais. .......... 23
Tabela 5.1. Variáveis independentes utilizadas para estimar o deslocamento radial no FP3-
326,5m em cada modelo. .................................................................................. 40
Tabela 5.2. Variáveis independentes utilizadas para estimar o deslocamento radial à cota 232,7m
em cada modelo. ............................................................................................... 40
Tabela 5.3. Coeficientes de regressão e significância das variáveis dos modelos IQ para o
deslocamento radial (em milímetros) no FP3-326,5m....................................... 48
Tabela 5.4. Parâmetros de desempenho para os modelos IQ no período de aprendizagem. ... 49
Tabela 5.5. Parâmetros de desempenho para os modelos IQ no período de previsão. ............ 50
Tabela 5.6. Parâmetros de desempenho para os modelos NN no período de aprendizagem... 56
Tabela 5.7. Parâmtros de desempenho para os modelos NN no período de previsão. ............. 57
Tabela 5.8. Importânica das variáveis dos modelos RF para a previsão do deslocamento radial
no FP3-326,5m. ................................................................................................. 62
Tabela 5.9. Parâmetros de desempenho para os modelos RF no período de aprendizagem. .. 63
Tabela 5.10. Parâmetros de desempenho para os modelos RF no período de previsão. ......... 64
Tabela 5.11. Coeficientes de regressão e e significância das variáveis dos modelos IQ para a
previsão do deslocamento radial (em milímetros) no FP3-232,7m. .................. 66
Tabela 5.12. Parâmetros de desempenho para os modelos IQ no período de aprendizagem. . 67
Tabela 5.13. Parâmetros de desempenho para os modelos IQ no período de previsão. .......... 68
Tabela 5.14. Parâmetros de desempenho para os modelos NN no período de aprendizagem. 69
Tabela 5.15. Parâmtros de desempenho para os modelos NN no período de previsão. ........... 70
Tabela 5.16. Importânica das variáveis dos modelos RF para a previsão do deslocamento radial
(em milímetros) no FP3-232,7m. ....................................................................... 72
Tabela 5.17. Parâmetros de desempenho para os modelos RF no período de aprendizagem. 73
Tabela 5.18. Parâmetros de desempenho para os modelos no período de previsão. ............... 74
xxi
xxii
Lista de Acrónimos
Lista de Acrónimos
RSB Regulamento de Segurança de Barragens
ICOLD International Commission on Large Dams
LNEC Laboratório Nacional de Engenharia Civil
EDP Energias de Portugal S.A.
NPA Nível de Pleno Armazenamento
GV Galeria de Visita
PCA Principal Component Analysis
FP Fio de Prumo
RLM Regressão Linear Múltipla
NN Artificial Neural Network
RF Random Forest
IQ Interpretação Quantitativa
HST Hydrostatic-Season-Time
HTT Hydrostatic-Temperature-Time
HTFT Hydrostatic-Temperature-Foundation-Time
%𝑨𝒖𝑴𝑺𝑬 Aumento do mean squared error em percentagem
xxiii
xxiv
Lista de Símbolos
Lista de Símbolos
𝑋 Perigosidade
𝐻 Altura da barragem em metros
𝑉 Capacidade do reservatório em hectómetros cúbicos.
𝑌 Danos potenciais
𝑈 Efeitos previstos/Resposta
Valor observado/Saída; Número total de saídas; Número de
𝑀
observações
𝜀 Resíduo
𝑡 Tempo; Nó
𝑎𝑚𝑏 Ações ambientais
𝑋𝑗 Variável independente jésima
𝛽𝑗 Coeficiente jésimo
𝛽0 Constante
ℎ Altura da água no reservatório
̅̅̅̅
ℎ20 Altura média da água dos últimos 20 dias
𝑡𝑑 ; 𝐷 Número de dias desde o início do ano
𝑡𝑚 Número de minutos desde o início do dia
𝜃1 ; 𝑑 Fase do ano
𝜃2 Fase do dia
𝑈𝑟 Efeitos reversíveis
𝑈𝑖𝑟 Efeitos irreversíveis
𝑈𝑖 Efeitos instantâneos
𝑈𝑑 Efeitos diferidos
𝑒 Número de Euler
ln Logaritmo de base 𝑒
log Logaritmo de base 10
𝑐𝑗 Constante jésima
𝑘 Ordenada na origem
𝑃 Número total de variáveis; Número total de padrões.
n Número total de observações
𝑼 Matriz de resposta
𝑿 Matriz de variáveis independentes
𝜷 Matriz de coeficientes
xxv
𝜺 Vetor de resíduos
∑ Somatório
𝑡𝑒 Nó esquerdo
𝑡𝑑 Nó direito
𝑦̅𝑡 Média das observações
𝑛𝑡𝑑 Número de observações nó direito
𝑛𝑡𝑒 Número de observações nó esquerdo
𝑉(𝑡) Variância do nó 𝑡
𝑡𝑘 Subárvore
𝛼 Coeficiente positivo
𝑛𝑡𝑘 Número de nós terminais
𝑐𝛼 (𝑡𝑘 ) Erro da subárvore
𝑞 Número de subdomínios
Subdomínio de variáveis aleatórias independentes e identicamente
Θ𝑗
distribuídas jésima
ℒ𝑛 Domínio
ℎ̂𝑅𝐹 Conjunto da random forest
ℎ̂𝑅𝐹 (𝑥) Previsão da random forest
Θ Subdomínio de número determinado de variáveis de entrada e
ℒ𝑛 𝑞 variáveis aleatórias independentes e identicamente distribuídas
𝑛 Número determinado de variáveis de entrada
𝐸𝐹𝑇 Empolamento/Assentamento do bloco
𝐸𝐹𝑅 Rotação do bloco
Altura média da água no reservatório no dia da observação elevada à
ℎ4
4ª potência
𝛿𝐻𝑆𝑇 Deslocamento previsto pelo modelo HST
𝛿𝐻𝑇𝑇 Deslocamento previsto pelo modelo HTT
𝛿𝐻𝑇𝐹𝑇 Deslocamento previsto pelo modelo HTFT
𝜀𝑚𝑖𝑛 Resíduo mínimo
xxvi
𝜀𝑚𝑎𝑥 Resíduo máximo
𝜎𝜀 Desvio-padrão dos resíduos
𝑅 2
Coeficiente de determinação
2
𝑅𝑎𝑑𝑗 Coeficiente de determinação ajustado
xxvii
xxviii
Lista de Software
Lista de Software
R Linguagem de programação
RStudio Programa de ambiente de desenvolvimento integrado em R
Autodesk
Programa de desenho assistido por computador
AutoCAD
Microsoft Office Conjunto de programas de escritório
Paint Editor de imagem
Notepad Editor de texto simples
xxix
xxx
Capítulo 1
Introdução
1 Introdução
1
1.1 Enquadramento geral
O controlo de segurança estrutural de infraestruturas críticas para a sociedade, como o são as grandes
barragens de betão, é uma atividade de elevada importância, uma vez que em Portugal algumas destas
infraestruturas foram construídas no século passado e estão em fase avançada da sua vida útil de
dimensionamento. Nesse sentido, as atividades de análise e interpretação do comportamento estrutural
observado são fundamentais para a avaliação da sua segurança estrutural e servem de suporte à
tomada de decisões (relativamente a qualquer tipo de intervenção de beneficiação, limitação da
exploração ou mesmo demolição da obra), as quais são essenciais para o prolongamento da vida útil
da barragem em segurança. Em geral, o comportamento estrutural das barragens e da sua envolvente
são observadas a partir do início do primeiro enchimento da albufeira, a que corresponde o primeiro
ensaio de carga, e são periodicamente avaliadas por comparação com os pressupostos de projeto ou
com o padrão de comportamento previamente observado caso existam dados da observação da
estrutura em quantidade suficiente.
As barragens são das infraestruturas mais importantes para o país, devido ao seu elevado custo de
construção, à gestão que proporciona dos recursos hídricos e a serem uma fonte de energia renovável.
Em caso de acidente os danos potenciais são usualmente elevados, por isso são infraestruturas que
carecem de controlo rigoroso.
O controlo de segurança das barragens, que se exerce desde a fase do projeto e por toda a vida das
obras, compete ao dono de obra, à Comissão de Segurança de Barragens e às seguintes entidades da
Administração Pública: i) a Agência Portuguesa do Ambiente, I. P. (APA, I. P.) na qualidade de
organismo com competência genérica de controlo de segurança das barragens, que se designa por
Autoridade Nacional de Segurança de Barragens, ii) o Laboratório Nacional de Engenharia Civil
(LNEC), na qualidade de consultor da Autoridade em matéria de controlo de segurança das barragens;
e iii) a Autoridade Nacional de Proteção Civil (ANPC), como entidade orientadora e coordenadora das
atividades de proteção civil ao nível nacional.
Para tornar operacional as atividades de controlo de segurança estrutural das grandes barragens, cada
barragem tem um plano de observação que integra um sistema de monitorização que fornece dados
sobre as principais solicitações e respetiva resposta estrutural que são alvo de análise e interpretação.
Tradicionalmente, após a construção, esta análise do padrão de comportamento observado recorre a
métodos estatísticos que pretendem estimar o comportamento observado através de modelos que
consideram de forma direta ou indireta o efeito das principais ações a que a barragem está sujeita.
Com o aparecimento de métodos de aprendizagem automática, novas metodologias têm sido testadas
em vários âmbitos do controlo de segurança estrutural de infraestruturas e, em particular, às barragens.
A aplicação destes métodos para a computação de modelos que descrevem o comportamento
estrutural encontra-se numa fase exploratória, mas tem havido alguns contributos importantes para o
2
desenvolvimento desta área nas últimas duas décadas.
Esta dissertação surge na sequência destes desenvolvimentos que estudos anteriores demonstraram
na aplicação desses métodos no controlo de segurança estrutural de barragens. Sendo esta uma área
em desenvolvimento não apenas na área da engenharia. O objetivo desta dissertação é expandir a
aplicação destes métodos de aprendizagem automática ao controlo de segurança de barragens através
de um caso de estudo real e a comparação dos modelos assim obtidos com o modelo tradicional. Esta
dissertação pretende igualmente explorar diferentes formulações para a caraterização da resposta
estrutural observada, com base no efeito das principais ações a que uma barragem está sujeita,
incluindo uma nova formulação que considera também o efeito da deformada da fundação.
A presente dissertação é composta por 6 capítulos, sendo o capítulo 1 a presente introdução onde se
apresenta o enquadramento geral e motivação que deram origem à realização deste trabalho, assim
como alguns dos objetivos e a estrutura da dissertação. O capítulo 2 descreve os métodos de
classificação de barragens tendo em conta diversos fatores, nomeadamente, o material estrutural, o
tamanho e a legislação baseada na avaliação de risco potencial. No capítulo 3 são identificados os
aspetos fundamentais no controlo de segurança estrutural em barragens, são descritas as fases de
vida de uma barragem e em quais deles a observação estrutural faz parte, as atividades englobantes
deste controlo, as ações e os dados recolhidos tradicionalmente pelos sistemas de monitorização e a
sua modelação tradicional. O capítulo 4 introduz os métodos de aprendizagem automática aplicados
no caso e estudo, em particular, os conceitos fundamentais e o seu modo de funcionamento. O capítulo
5 retrata a maior parte do trabalho desenvolvido, descrevendo a barragem em estudo, os elementos
relevantes para a sua formulação e a metodologia proposta, em seguida são apresentados os modelos
obtidos pelos diversos métodos de aprendizagem automática e pelas diferentes formulações, realçando
no final alguns aspetos relevantes identificados. O capítulo 6 apresenta as principais conclusões desta
dissertação e potenciais áreas a explorar.
3
Capítulo 2
Classificação de barragens
2 Classificação de barragens
4
2.1 Introdução
Em engenharia, a classificação prende-se essencialmente pelo material estrutural e com a forma como
resistem às cargas; elementos que influenciam o método de dimensionamento destas estruturas. Outra
metodologia, mais popular, é a classificação das barragens pelo seu uso e fim a que se destinam. Há
ainda outro modo ainda não referido que é o legislativo, que no caso de Portugal classifica as barragens
tendo em conta o risco que apresenta e que está relacionado com as consequências em caso de rotura,
o volume de água na albufeira e a altura desde a fundação ao coroamento. Neste documento, não será
abordada a classificação por uso.
Existem dois grandes grupos de barragens relativamente ao material estrutural, as barragens de aterro,
que englobam barragens totalmente ou maioritariamente constituídas por terra e/ou rocha natural, e as
barragens de betão e alvenaria, existindo alguns casos de barragens de alvenaria relativamente
recentes (Barragem de Covão do Ferro, 1956, Covilhã) ou conjunto dos materiais referidos (Figura 2.1).
A escolha do material e da forma a utilizar para o efeito desejado da barragem depende, em geral, da
geologia e da topografia do terreno que influenciam, em particular, a escolha da solução de fundação,
a disponibilidade dos materiais e a capacidade económica.
5
Material
As barragens de aterro são caracterizadas por terem uma forma trapezoidal que transmite as cargas
para a sua fundação através da ação de atrito da sua massa sobre a fundação, impermeabilizada, de
modo que a percolação não afete o seu desempenho e impedindo igualmente os deslocamentos
horizontais. As barragens de aterros são subdivididas em quatro classes principais, aterro homogéneo
(Figura 2.2 - a), aterro zonado (Figura 2.2 - b, c, d), parede de montante impermeabilizante (Figura 2.2
- e) e parede interna impermeabilizante (Figura 2.2 - f).
No caso do material disponível em maior quantidade não ser o indicado para garantir uma redução
efetiva da percolação no aterro, opta-se por um zonamento do aterro de modo a criar um núcleo de
baixa condutividade hidráulica, enquanto o material a montante e a jusante confere a estabilidade
necessária à barragem, para que possa desempenhar a sua função em condições de segurança. Este
núcleo pode ter várias formas e posicionamento na barragem.
Quando o material existente não permite qualquer tipo de impermeabilização, opta-se pela
impermeabilização da superfície a montante ou de uma parede impermeável no interior desta. Estas
barreiras podem ser de diversos materiais, como, por exemplo: betão, materiais geosintéticos ou
betuminosos.
As barragens de aterro são responsáveis por 2/3 dos incidentes em barragens [ICO95], das quais as
6
principais causas são: i) a erosão interna, devido a um inadequado controlo da percolação através do
aterro e/ou da fundação, ii) o galgamento do aterro, por uma inadequada estimativa do caudal de cheia
e consequente subestimativa dos descarregadores, provocando a formação de brechas, iii) a
instabilidade dos taludes do aterro e iv) os erros de gestão da exploração [CS15].
As grandes vantagens das barragens de aterro são a sua adaptabilidade às condições de fundação
existentes nos locais e a vasta possibilidade de utilização de diferentes tipos de solo ou rocha.
É comum haver uma divisão entre barragens de solo, de solo-enrocamento e de enrocamento [CS15].
No caso de barragens de enrocamento, o material apresenta permeabilidades elevadas, sendo, por
isso, necessário criar barreiras (por exemplo, uma parede de betão a montante ou um núcleo argiloso)
que controlem ou limitem o escoamento. As barragens de enrocamento apresentam, tipicamente,
taludes com declives mais acentuados e, por conseguinte, em geral, custos de construção menores,
sendo esta atualmente a escolha mais comum em barragens de grande dimensão.
No caso de barragens de betão estas podem tomar diversas formas, pois é possível transferir as cargas
de diferentes modos: as barragens de gravidade (Figura 2.3 - a, b) têm uma forma aproximadamente
7
triangular e funcionam de forma semelhante às barragens de aterro, pois é através do atrito da fundação
que genericamente resistem às cargas; as barragens de contrafortes (Figura 2.3 - c) consistem numa
parede de betão apoiada em contrafortes ao longo do seu desenvolvimento e as cargas são distribuídas
para os contrafortes pela parede de betão; por último, as barragens em arco ou de dupla curvatura
(Figura 2.3 - d) destacam-se pela sua esbelteza e pelo facto de as cargas serem distribuídas para os
apoios laterais e fundação através do arco de betão. Um aspeto interessante das barragens surge do
facto de serem dimensionadas essencialmente para resistir a cargas horizontais, ao contrário dos
edifícios comuns, o que resulta, em geral, num comportamento sísmico adequado [CS15].
As barragens de gravidade são essencialmente uma estrutura sólida de betão que é capaz de
assegurar bom comportamento devido à sua grande massa, à sua capacidade de resistir a efeitos
temporais de deterioração do betão e de se adaptar a locais com condições adversas [JR88]. Estas
barragens, no caso de face plana, dependem apenas do seu peso próprio para resistir às cargas,
através da ligação entre a barragem e a fundação, enquanto no caso de face inclinada pode haver
alguma otimização de materiais e de forma, fazendo uso do peso próprio da água no reservatório a
montante. No caso das barragens de gravidade as subpressões representam um dos fatores mais
importantes no dimensionamento deste tipo de barragens, por isso são utilizadas diversas opções para
mitigar este efeito, como por exemplo a utilização de sistemas de drenagem. Atualmente, devido ao
incremento de custos de mão-de-obra e materiais são pouco competitivas em comparação com as
barragens de aterro, em especial nos países em desenvolvimento, apesar de terem tido um ligeiro
crescimento nas últimas décadas do século XX devido a novos avanços na aplicação de betão
compactado [TL14].
As barragens em arco promovem a distribuição de cargas para a fundação através da sua forma,
garantindo a compressão do betão havendo, no entanto, a possibilidade de trações junto à fundação a
montante. Esta forma permite uma otimização dos materiais, embora sejam necessárias melhores
condições de fundação que nos casos anteriores. Estas barragens podem ser bastante esbeltas, sendo
a sua forma dependente das condições do local e dos raios de curvatura possíveis [TL14], esta situação
provoca que os efeitos térmicos se façam sentir mais significativamente que no caso de barragens de
gravidade, que têm uma inércia térmica muito superior. Os efeitos de deterioração do betão tomam
uma relação mais importante que no caso de barragens de gravidade, uma vez que a integridade do
betão é fundamental para garantir a estabilidade e a transmissão de cargas da barragem para a
8
fundação lateral [CS15]. Devido à otimização de recursos e avanços tecnológicos na construção de
barragens e de tratamento de fundações, atualmente são o tipo de barragem de betão mais utilizado.
A avaliação de risco divide as barragens em três classes por ordem decrescente de risco, onde são
considerados os danos potenciais em termos de vidas humanas, económicos e ambientais assim como
as características da barragem. Para isso é definido o termo de perigosidade 𝑋 definido pela equação
𝑋 = 𝐻2 × √𝑉 onde 𝐻 é a altura da barragem em metros e 𝑉 a capacidade do reservatório em
hectómetros cúbicos. Os danos potenciais são avaliados pelo termo 𝑌 que é composto pela avaliação
das edificações residenciais fixas de caracter permanente a jusante da barragem, onde uma eventual
onda de inundação as possa atingir e os danos potenciais que essa eventual onda de inundação possa
causar nas infraestruturas, instalações, bens e ambiente a jusante, sendo que a zona de jusante é
definida pela secção de rio localizada a 10 quilómetros a jusante da barragem, no caso de barragens
com 𝐻 ≤ 15 metros e 𝑋 < 100 ou definida de acordo com os resultados obtidos por aplicação de
modelos hidrodinâmicos ao estudo da onda de cheia nas outras situações, resultando na classificação
dada pela Tabela 2.1.
9
Tabela 2.1. Classificação de barragens por risco (Decreto-Lei n.º 21/2018 de 28 de março -
Regulamento de Segurança de Barragens [RSB18]).
I 𝑌 ≥ 10 e 𝑋 ≥ 1000
𝑌 ≥ 10 e 𝑋 < 1000 ou
II 0 < 𝑌 < 10, independentemente do valor de 𝑋 ou
existência de infraestruturas, instalações e bens ambientais importantes
Em termos internacionais a comissão internacional de grandes barragens (ICOLD) define como grande
barragem uma barragem que tenha uma altura superior a 15 metros desde a fundação ao coroamento
ou que tenha uma altura entre 5 e 15 metros de altura e cuja capacidade de armazenamento do
respetivo reservatório seja superior a 3 hectómetros cúbicos [ICO11].
10
Capítulo 3
Controlo de segurança de
barragens
3 Controlo de segurança de barragens
11
3.1 Aspetos gerais
As barragens apresentam risco de acidente, ou incidente, tanto na fase de sua construção como na
fase de operação, sendo estes eventos registados por diversas entidades a nível nacional e
internacional. De acordo com o registo efetuado pela comissão internacional de grandes barragens
(ICOLD), das cerca de 36000 barragens registadas, foram identificados 300 acidentes [ICOS1]. Nos
Estados Unidos da América, entre 2005 e 2013 ocorreram 173 acidentes e de 587 incidentes reportados
em barragens [DS1]. Neste mesmo país, de 2010 a 2019 as principais causas de incidentes em
barragens deveram-se a galgamento ou nível da albufeira a montante demasiado elevado, erosão
interna, falhas nos descarregadores, problemas na fundação ou condições geotécnicas envolventes e
conservação e manutenção desadequadas, como é indicado na Figura 3.1. Essencialmente, estes
incidentes têm origem quer em falhas no planeamento ou previsão dos elementos de dimensionamento
e projeto, na construção ou na operação da barragem.
Figura 3.1. As principais causas de incidentes em barragens nos EUA de 2010 a 2019 [DS1].
Qualquer acidente numa barragem pode eventualmente ter um efeito destrutivo bastante significativo.
Dependendo da avaliação de risco subjacente que apresentam (as diversas condições presentes a
montante e jusante da barragem) e das características do reservatório. Dos acidentes mais importantes
registados, as consequências podem apresentar alguns milhares ou até muitos milhões de euros em
danos [BM20] e, principalmente, danos ambientais e humanos. Essencialmente devidos à onda de
cheia provocada pela rotura ou galgamento [EB93] [DS1], que provoca a destruição quer da própria
estrutura da barragem quer das infraestruturas e estruturas na área de impacto.
12
Como já mencionado no ponto 2.2.1, as barragens de aterro contam aproximadamente 70% dos casos
de acidentes, no entanto também existem alguns casos de acidentes em barragens de betão, sendo
os mais conhecidos Malpasset [DF1] e Vajont [DF2] ambos essencialmente provocados devido a
problemas geotécnicos e falta de monitorização [DP13]. Enquanto no caso da barragem de Malpasset
houve rotura da estrutura, no caso da barragem de Vajont apenas o topo da barragem foi danificado
apesar do galgamento e onda de cheia terem causado vítimas mortais e destruição de múltiplas
infraestruturas e meio ambiente a jusante [GR05].
Em Portugal até ao momento não correu nenhum acidente em barragens de betão, no entanto já
ocorreram situações de deterioração principalmente devido a efeitos relacionados com o
envelhecimento do betão, por exemplo através da ocorrência de reações alcali-agregado como ocorreu
nas barragens de Alto Ceira, que originou a sua demolição, ou outras [EDP1], que obrigaram a
intervenções quer no corpo da barragem quer na fundação [MJ13]. O que prova a necessidade da
constante observação do comportamento estrutural das barragens, em especial devido à idade
avançada da maior parte destas barragens, as quais encontram-se em operação por um período
superior ao previsto na fase de projeto [MJ13].
De modo que haja um menor risco de incidentes e acidentes nestas infraestruturas, diversos países
têm regulamentação e códigos normativos de dimensionamento e de monitorização destas
infraestruturas. De modo a implementar medidas normalizadas entre as infraestruturas equivalentes
dentro do próprio país que possam responder de uma forma consistente e integrada a problemas
semelhantes. A regulamentação continua a ser atualizada à medida que novos desenvolvimentos
teóricos, práticos e técnicos são alcançados, como é o caso português, através do Regulamento de
Segurança de Barragens em que a última versão data de 2018 [RSB18]. A referência base a nível
internacional é dada pelo guia desenvolvido pela comissão internacional de grandes barragens (ICOLD)
que aborda os processos de inspeção, monitorização e avaliação do comportamento estrutural da
barragem entre outros aspetos relevantes no controlo de segurança de barragens [ICO12].
As fases de vida de uma barragem dividem-se em fase de projeto, construção, primeiro enchimento,
período de exploração inicial, período de exploração normal, e abandono e demolição [CA98]. Em todas
estas fases o conceito de controlo de segurança está sempre presente e a vários níveis,
nomeadamente, a nível ambiental, a nível estrutural e a nível hidráulico/operacional (Figura 3.2). A
definição do controlo de segurança é dada pelo Regulamento de Segurança de Barragens [RSB18]
como “o conjunto de medidas a tomar nas várias fases da vida da obra, contemplando aspetos
estruturais, hidráulico-operacionais e ambientais, com vista a assegurar as suas condições de
segurança e que, nas fases de primeiro enchimento e de exploração, deve permitir um conhecimento
adequado e continuado do estado da barragem, a deteção oportuna de eventuais anomalias e uma
intervenção eficaz sempre que necessário” [RSB18].
13
Figura 3.2. Fases de vida da obra (adaptado de [MJ07]).
14
Figura 3.3. Principais atividades de controlo de segurança de barragens (adaptado de [MJ13]).
As principais ações que afetam o comportamento estrutural de uma barragem são o peso próprio, os
efeitos da água, a temperatura, ações dinâmicas, o comportamento e interações físico-químicas do
betão [ICO12]. Estas ações encontram-se representadas simplificadamente na Figura 3.4.
Figura 3.4. Algumas das principais ações que afetam a segurança estrutural nas barragens (adaptado
de [MJ13]).
Estas ações e interações provocam um comportamento estrutural da barragem que pode ser modelado
deterministicamente, estatisticamente ou incorporarem propriedades de ambos os modelos [AF09]
[PF10] [SF15]. Os modelos determinísticos tentam representar o comportamento estrutural da
15
barragem através das leis constitutivas e fundamentais dos materiais, da geometria e das condições
fronteira do conjunto estrutura-fundação-reservatório que compõem a barragem para estados limite
último e de serviço com base nas ações/deformações impostas/expectáveis [PA13] [MR16]. Estes
métodos são maioritariamente utilizados na fase de projeto (modelos de elementos finitos [FEMA14]) e
nos períodos iniciais de exploração. Enquanto os modelos estatísticos são utilizados a partir do
momento em que se começa a recolher dados dos instrumentos de monitorização estrutural e se criam
bases de dados que são utilizadas para descrever o comportamento estrutural [SCD03] [SF17]. Um
importante aspeto desta temática é o controlo de qualidade dos dados e o seu tratamento [CC14]
[LM13]. Esta dissertação foca-se essencialmente em alguns aspetos dos modelos estatísticos de
descrição do comportamento estrutural da barragem aplicáveis ao caso de estudo.
Através deste método existe a criação de um modelo de previsão baseado nos efeitos previstos (𝑈) e
no valor observado (saída, 𝑀) e pelo resíduo (𝜀) que é dado pela diferença entre os valores previstos
pelo modelo e os valores observados, em função do tempo (𝑡) e das ações ambientais (𝑎𝑚𝑏). Existem
duas formulações típicas deste tipo de modelos aplicados ao comportamento estrutural de barragens,
uma abordagem em que se separam os efeitos reversíveis e irreversíveis (equação (3.1)) e outra em
que se separam os efeitos instantâneos e os efeitos diferidos no tempo (equação (3.2)) [SCD03].
𝑀(𝑡, 𝑎𝑚𝑏) = 𝑈𝑟 (𝑡, 𝑎𝑚𝑏) + 𝑈𝑖𝑟 (𝑡, 𝑎𝑚𝑏) + 𝜀(𝑡, 𝑎𝑚𝑏)) (3.1)
Nos modelos estatísticos usualmente utilizados os efeitos são considerados linearmente independentes
e são representados através do somatório de cada variável independente (𝑋𝑗 ) representativa de uma
ação multiplicada por um coeficiente (𝛽𝑗 ) e a soma de uma constante (𝛽0 ).
𝑈 = ∑ 𝑋𝑗 × 𝛽𝑗 + 𝛽0 (3.3)
𝑗=1
16
2𝜋𝑡𝑚
componentes diárias (𝜃2 = , 𝑡𝑚 é o número de minutos desde o início do dia) e que, para barragens
1440
que se encontram no seu período de exploração normal, podem ser consideradas independentes do
tempo de vida da barragem (equação (3.5)) [MJ07].
O efeito do tempo pode ser descrito através de combinações de funções exponenciais, logarítmicas,
polinomiais ou outras [SCD03] que pretendem replicar dois tipos de evoluções, uma em que os efeitos
dos fenómenos evolutivos do tempo desde o início de vida da barragem apresentam uma assimptota
horizontal e outra em que consideram estes efeitos crescentes. Nas expressões (3.6) são apresentadas
algumas das formulações mais consideradas para modelar o efeito do tempo, que consideram as duas
hipóteses separadamente ou combinações destas.
𝛽1 × 𝑒 −𝑐𝑡 ;
𝛽1 × 𝑒 −𝑡 + 𝛽2 × 𝑒 −𝑡 ;
𝛽1 × 𝑒 −𝑡 + 𝛽2 × 𝑡;
𝑡 𝑐2 −𝑡
𝛽1 × 𝑡 + 𝛽2 × (ln (1 + )) + 𝛽3 × (1 − 𝑒 𝑐3 ) ;
𝑐1
𝑈𝑡,𝑖𝑟 (𝑡) = (3.6)
𝛽1 × log 𝑡 + 𝛽2 × 𝑒 𝑡 ;
𝛽1 × 𝑡 + 𝛽2 × ln 𝑡 ;
𝛽1 × 𝑡 + 𝛽2 × 𝑡 2 + 𝛽3 × 𝑡 3 ;
𝑡
𝛽1 × 𝑡 + 𝛽2 × 𝑡 2 + 𝛽3 × 𝑡 3 + 𝛽4 × ln (1 + ) .
{ 𝑐1
Formulações similares podem ser compostas para outro tipo de respostas da barragem [GM19], assim
como a consideração de outros efeitos [AF09] [GX18] ou de outras variáveis representativas destes
efeitos [LP07] [SCD03].
17
Capítulo 4
Métodos de aprendizagem
automática
4 Métodos de aprendizagem automática
18
4.1 Introdução
A aprendizagem automática é uma área da inteligência artificial que tem por base o estudo e
desenvolvimento de algoritmos computacionais que “aprendem” automaticamente através da
experiência [LI20]. O estudo desta área tem como foco a extração automática de informação a partir
de dados. A aprendizagem automática tem um vasto leque de aplicações desde o uso em programas
de reconhecimento de padrões que descobrem regras gerais em conjuntos de muitos dados até
sistemas de redução de informação de acordo com os objetivos do utilizador [HJ20] [SH18] [WK10].
Por exemplo, os modelos de previsão do comportamento observado que consideram os efeitos da
pressão hidrostática, da temperatura e do efeito do tempo com recurso a métodos de regressão linear
múltipla são um tipo de modelo de aprendizagem automática tradicional utilizado pelos engenheiros de
barragens [SF15]. Existem duas abordagens principais de métodos de aprendizagem de dados e
obtenção de resultados, a aprendizagem supervisionada e a aprendizagem não supervisionada ( Figura
4.1) [SK16]. No caso da aprendizagem supervisionada, um algoritmo cria um modelo a partir de um
conjunto de dados constituídos por dados de entrada e respetiva saída conhecidos (conjunto de
aprendizagem). Depois do algoritmo de aprendizagem ocorrer este modelo é aplicado a outro conjunto
de dados de entrada (conjunto de previsão) e obtém-se a saída estimada de acordo com os padrões
obtidos pelos dados de aprendizagem. Na aprendizagem não supervisionada o modelo aprende com o
conjunto de dados de entrada enquanto os dados de saída não são conhecidos. O algoritmo aglomera
os dados de entrada em grupos ou cria clusters de dados para os classificar/identificar e quando um
novo conjunto de dados de entrada é fornecido o modelo procura o melhor grupo de dados a que este
novo conjunto pode pertencer de modo a se obter a saída [HS09].
Figura 4.1. Abordagens dos métodos supervisionados (esquerda) e não supervisionados (direita).
A maior diferença entre estes dois métodos de aprendizagem é que a aprendizagem supervisionada
utilizada conjuntos de dados classificados, enquanto a aprendizagem não supervisionada utiliza
conjuntos de dados não classificados. Diversos algoritmos matemáticos podem ser adotados de acordo
com o objetivo e dados disponíveis para cada situação (Figura 4.2) [TW17]. Alguns dos algoritmos
19
utilizados em interpretação do comportamento estrutural de barragens podem ser identificados em
[SF17].
4.2.1 Introdução
𝑈 = ∑ 𝑋𝑗 × 𝛽𝑗 + 𝑘 + 𝜀 (4.1)
𝑗=1
onde,
• 𝑈 é a resposta;
• 𝑃 é o número total de variáveis;
• 𝑋𝑗 é o 𝑗 é𝑠𝑖𝑚𝑜 termo correspondente a uma variável;
• 𝛽𝑗 é o coeficiente ponderado da variável;
• 𝑘 é a constante que corresponde à ordenada na origem;
• 𝜀 é o resíduo, isto é, a diferença entre o valor estimado e o valor observado.
20
Este modelo assim constituído pretende obter uma relação entre a variável dependente e as variáveis
independentes relativamente ao período de aprendizagem, isto é, aos dados em que para o qual os
coeficientes e a constante são determinados, sendo que esta relação pode ser utilizada para realizar
uma previsão da resposta num evento futuro em que se tenha o conhecimento dos valores das variáveis
independentes. Os coeficientes e a constante são tradicionalmente obtidos através de métodos de
regressão linear múltipla tendo como critério de otimização o método dos mínimos quadrados [NO20].
Uma diferença relevante entre a regressão linear múltipla e a regressão linear simples é o número de
variáveis independentes. Como referido anteriormente, o algoritmo de minimização mais utilizado é o
método dos mínimos quadrados que nas regressões lineares múltiplas obtém uma solução única,
sendo os coeficientes 𝛽𝑗 lineares.
Para o cálculo dos coeficientes e constante a equação (4.1) pode ser reescrita deste modo:
𝑈 = 𝛽0 + 𝛽1 𝑋1 +. . . 𝛽𝑃 𝑋𝑃 + 𝜀 (4.2)
𝑼 = 𝜷. 𝑿 + 𝜺 (4.3)
onde,
𝑢1 𝑥11 . 𝑥𝑃1 1 𝛽1 𝜀1
. . . . . . .
𝑼 = [ . ],𝑿 = [ ],𝜷 = [ ],𝜺 = [ . ] (4.4)
. . . . 𝛽𝑃
𝑢𝑝 𝑥1𝑃 . 𝑥𝑃𝑛 1 𝛽0 𝜀𝑛
Para se obter os coeficientes pretende-se, usualmente, minimizar o somatório dos quadrados dos
resíduos, expresso por:
De onde resulta que os valores calculados dos parâmetros 𝛽𝑗 são dados por:
Para que esta expressão seja válida e calculável de uma forma determinística é necessário que a matriz
𝑿𝑻 . 𝑿 seja invertível, o que corresponde a que as colunas da matriz 𝑿 sejam linearmente independentes
e que o número de observações n seja superior ao número de total de variáveis independentes 𝑃
[SM14] [MJ07].
21
4.3 Redes neuronais artificiais
4.3.1 Introdução
Este capítulo tem como propósito introduzir os conceitos básicos de redes neuronais artificias e que se
aplicam no caso de estudo. Esta área é vasta, está em constante desenvolvimento e apresenta diversas
variantes.
As redes neuronais artificiais têm, como o próprio nome indica, base na estrutura de um neurónio
biológico, uma vez que tenta replicar o funcionamento e eficiência do cérebro no processamento de
informação [NNW05]. Ao longo do tempo foram criados vários métodos que tentam replicar o
comportamento biológico aplicados à resolução de problemas complexos em diversos campos de
aplicação. Tem havido um crescente interesse nesta área devido à sua capacidade de aprendizagem,
a qual é capaz de identificar relações entre os dados de entrada sem impor previamente essas relações
[MJ11]. As redes neuronais artificias podem ser utilizadas em múltiplos tipos de problemas, em geral
definidos de 4 formas [WK10]:
O elemento fundamental de uma rede neuronal artificial é o neurónio que pode ser representado
esquematicamente pela Figura 4.3, onde a cada dado de entrada é atribuído um peso que infere a
influência do dado de entrada na saída, os quais são processados por uma regra de propagação
(representada na Figura 4.3 como uma soma ponderada, mas pode tomar outra forma) em que o
resultado é transferido através de uma função de ativação para o valor de saída. [MJ07]
A função ativação pretende “filtrar” o cálculo da regra de propagação na saída, isto é, é uma função
capaz de decidir se o cálculo anterior é relevante para a saída (ou decidir quão e de que forma relevante
22
o é). Existem bastantes funções de ativação dependendo do tipo de neurónio e algoritmo utilizado,
algumas das funções de ativação mais comuns são representadas na Tabela 4.1 [MFS1] [MC1].
0, 𝑥 < 0
1
• Heaviside: f(𝑥) = { , 𝑥 = 0
2
1, 𝑥 > 0
• Linear: 𝑓(𝑥) = 𝑐 × 𝑥
*𝑐 = 2
1
• Sigmoide: 𝑓(𝑥) =
1+𝑒 −𝑥
Uma rede neuronal artificial é, em geral, composta por várias unidades de processamento que podem
tomar uma forma em série e/ou em paralelo (rede perceptrão multicamada) [HS09], estritamente diretas
ou recorrentes. No caso de redes neuronais estritamente diretas a regra de propagação apenas infere
sobre a camada seguinte enquanto numa rede neuronal artificial recorrente a regra de propagação tem
influência nas camadas anteriores (Figura 4.4) [WK10]. O tipo de rede neuronal mais utilizado é a rede
do tipo perceptrão multicamada. Este tipo de rede é constituído por múltiplas camadas intermédias de
23
neurónios e cada camada intermedia pode ter múltiplas unidades de processamento (Figura 4.5).
Figura 4.4. Esquema de rede neuronal recorrente (esquerda) e estritamente direta (direita) [MJ07].
24
para todos os padrões do conjunto de aprendizagem com a qual é possível calcular o erro quadrático
médio, que é tipicamente dado pelas equações (4.7) e (4.8). Importa referir que a cada padrão
corresponde um vetor constituído pelos valores de entrada e respetiva saída. A equação (4.8) é a
expressão que se pretende minimizar a qual é também conhecida por função de custo [MJ07].
𝑀
1 𝐿,𝑝 𝑝
𝐸 = ∑(𝑦𝑘 − 𝑑𝑘 )2
𝑝 (4.7)
2
𝑘=1
onde,
𝐿,𝑝
• 𝑦𝑘 é o valor de saída do modelo com o peso atual;
𝑝
• 𝑑𝑘 é o valor observado/expectável do período de aprendizagem;
• 𝑀 é o número de saídas.
𝑃
1
𝐸𝑡𝑜𝑡 = ∑ 𝐸𝑝 (4.8)
𝑃
𝑝=1
onde,
A minimização desta função de custo é usualmente dada pelo ajuste dos pesos através do método de
retropropagação do erro que consiste na definição dada pela equação (4.8) em função dos pesos,
sendo então ajustados pela derivada parcial de cada peso pela equação (4.9) [RE1].
𝜕𝐸 𝑝
∗ 𝑤𝑗 = 𝑤𝑗 − 𝑎 ( ) (4.9)
𝜕𝑤𝑗
onde,
• ∗ 𝑤𝑗 é o novo peso;
• 𝑤𝑗 é o peso atual;
𝜕𝐸 𝑝
• ( ) é a derivada parcial do erro quadrático médio do padrão em função do peso 𝑤𝑗 .
𝜕𝑤𝑗
Sendo este processo repetido para todos os pesos ao mesmo tempo até se atingir um determinado
nível de erro ou um número finito de iterações [BI00].
Alguns problemas dos modelos assim descritos passam por se desconhecer antecipadamente quais
25
as características do tipo de rede neuronal artificial que melhor resultado produz (Quantas camadas
intermédias são necessárias? Quantos neurónios em cada camada? Quais as funções de ativação
indicadas? Quais as regras de propagação em cada neurónio artificial? etc.), como também pelo facto
de para cada inicialização o modelo poder encontrar um mínimo local que depende do estado inicial do
modelo [SA13]. Assim sendo é vantajoso que se recorra a várias inicializações de modo a se tentar
obter o mínimo absoluto. No entanto é impossível garantir que o modelo para o qual se obtém a menor
função de custo é realmente o mínimo absoluto. O sobreajustamento é uma das questões a ter em
conta nas redes neuronais artificiais no período de aprendizagem, tendo que se garantir que o
comportamento da rede neuronal artificial mantém a capacidade de generalização, este tipo de situação
revela-se essencialmente no período de previsão [WK10]. No caso de estudo foram tentados debelar
alguns destes problemas através de iterações com diferentes inicializações e diferente número de
neurónios na camada intermédia (apenas foi testado com uma camada) e de um algoritmo já bastante
utilizado em diversos problemas disponível nas bibliotecas nnet [NNET] da linguagem R [R].
4.4.1 Introdução
Este ponto tem como propósito introduzir os conceitos básicos do algoritmo de random forest e que se
aplicam no caso de estudo. Esta área é também vasta, está em constante desenvolvimento e apresenta
diversas variantes que promovem a classificação do método em várias subcategorias e com algumas
diferenças que serão apenas abordadas ligeiramente ao longo deste texto.
O random forest é um dos métodos mais utilizados em aprendizagem automática uma vez que é
bastante versátil e apresenta bons resultados. No entanto, em geral, não apresenta a qualidade de um
algoritmo especializado [HS16]. Muito simplesmente random forest consiste em múltiplas árvores de
decisão de subconjuntos aleatórios dos dados de aprendizagem em que o resultado final é a
agregação/ponderação entre essas árvores (floresta). Este é um método de aprendizagem
supervisionada (embora existam casos que tenha sido aplicado como não supervisionado [AN16]) que
tanto pode ser aplicado a problemas de classificação como a problemas de regressão [SW17].
O elemento base de uma random forest é a árvore de decisão. A árvore de decisão é uma ferramenta
de análise de dados bastante eficiente que divide o domínio total dos dados em cada nó em dois ou
mais grupos de dados semelhantes classificando-os por variáveis independentes [GM17].
26
baseia-se na divisão de um conjunto amostral (raiz) em dois segmentos (nós intermédios)
sucessivamente até se atingir os nós terminais (folhas), tendo como referência a variável de saída e
utilizando a informação das variáveis de entrada. Estes nós terminais formam subconjuntos
homogéneos e independentes das variáveis de entrada relativamente à variável de saída [SM14]. A
ligação entre nós é denominada ramos. Na Figura 4.6 e Figura 4.7 é apresentada uma árvore binária
de regressão genérica e um possível espaço determinado para cada variável explicativa.
As árvores de regressão utilizam algoritmos de análise estatística para realizar a divisão em cada nó
(𝑡), em nó esquerdo (𝑡𝑒 ) e nó direito (𝑡𝑑 ) através da variância do nó (𝑡) (equação (4.10)), sendo 𝑦̅𝑡 a
média das observações do nó e 𝑀 o número de observações. A definição das árvores de regressão
tem por base a maximização da equação (4.11), sendo 𝑛𝑡𝑑 é o número de observações nó direito (𝑡𝑑 )
e 𝑛𝑡𝑒 é o número de observações nó esquerdo (𝑡𝑒 ) [GR20]. Outra possibilidade é a avaliação do grau
de significância estatística de uma variável [FM99] através da avaliação da soma do quadrado das
diferenças entre os valores observados e os valores expectáveis (através da função de previsão) em
que o objetivo é avaliar os subconjuntos de modo que os nós descendentes forneçam uma melhor
previsão da variável do que o nó do qual surgem [GM17].
𝑀
1
𝑉(𝑡) = ∑(𝑦𝑘 − 𝑦̅𝑡 )2 (4.10)
𝑀
𝑘=1
27
𝑛𝑡𝑒 𝑛𝑡𝑑
𝑚𝑎𝑥(𝑉(𝑡) − ( 𝑉(𝑡𝑒 ) + 𝑉(𝑡𝑑 ))) (4.11)
𝑀 𝑀
Após os subconjuntos serem criados pelos métodos indicados o erro total da árvore é calculado pela
equação (4.12) [FM99], em que todos os nós terminais são avaliados, sendo 𝑛𝑡𝑘 o número de nós
terminais. A árvore é reduzida através de um processo de poda que origina uma árvore de regressão
equivalente através do cálculo do erro de cada subárvore (𝑐𝛼 ) (equação (4.13), onde 𝛼 é um coeficiente
positivo que prioriza árvores com menos nós terminais (menor complexidade)) [GR20]. Este processo
de poda é aplicado à árvore eliminando os ramos que apresentam erros equivalentes para o mesmo
conjunto de dados e levam a uma maior aproximação à variável de saída observada, mantendo apenas
um destes ramos. Outro modo possível de fazer esta esta avaliação consiste em testar um período de
validação cruzada em que se testa a árvore e os ramos que apresentarem resultados equivalentes são
podados e apenas é mantido um deles [CA12].
𝑛𝑡𝑘 𝑀
No caso de árvores de regressão com múltiplas variáveis de entrada, as variáveis são consideradas
independentes e, portanto, podem ser utilizadas mais que uma vez nas diversas divisões ou podem
nem ser utilizadas se a sua variância não for significativa. No entanto, ao invés da regressão linear, no
caso de se criar uma relação anterior entre algumas destas variáveis, a árvore de regressão trata-a
como uma variável diferente e, portanto, obtendo-se resultados diferentes. A árvore de regressão
produz previsões que estão sempre dentro domínio dos dados de aprendizagem observados [GR20].
28
𝑞
1
ℎ̂𝑅𝐹 (𝑥) = ∑ ℎ̂(𝑥, Θ𝑙 ) (4.14)
𝑞
𝑙=1
Para que se garanta que a random forest obtenha bons resultados é necessário que o conjunto de
árvores seja tão diverso quanto possível, que o domínio do período de aprendizagem seja similar ao
do domínio do período de previsão e que cada árvore tenha individualmente uma capacidade de
previsão aceitável.
Θ
O método random forest de variáveis aleatórias (Figura 4.9) divide o domínio em 𝑞 subdomínios (ℒ𝑛 𝑞 )
em que a divisão de cada nó da árvore desse subdomínio é avaliada com um número determinado de
variáveis de entrada (𝑛) que se repetem em todos os nós da árvore entre as variáveis existentes (Θ′ ).
Ao contrário de uma árvore de regressão não é podada uma vez que a otimização não é necessária.
Em cada nó é apenas avaliada a melhor divisão entre as variáveis no subdomínio. Considera-se que a
aleatoriedade gerada promove a diversidade das árvores e logo um melhor desempenho de previsão.
Figura 4.9. Diagrama esquemático de uma random forest de variáveis aleatórias [GR20].
Os elementos que definem uma random forest de variáveis aleatórias são o número de árvores, o
número de variáveis avaliadas em cada nó de cada árvore e o número de dados mínimos num nó
terminal.
Este é um dos métodos que mais é utilizado na iniciação á aprendizagem automática e quando não se
sabe o que se esperar dos dados uma vez que tanto é capaz de expressar relações lineares como não-
lineares. No entanto, no caso de as variáveis independentes e dependentes terem uma forte relação
linear, os modelos estritamente lineares com as propriedades corretas apresentam melhores resultados
[SW17]. Uma mais-valia deste método é a sua capacidade de estimar dados em falta com bom grau
de precisão [GM17] uma vez que utiliza os valores médios dos dados que estão completos para
completar os dados em falta, nesse sentido também é capaz de ser utilizado com um conjunto muito
alargado de dados. Um dos maiores problemas deste método é a sua incapacidade de prever para
além do domínio dos dados de aprendizagem [HS16].
29
Capítulo 5
Caso estudo
5 Caso estudo
30
5.1 A barragem do Alto Lindoso
A barragem do Alto Lindoso (Figura 5.1) foi escolhida como caso de estudo para se testarem as
hipóteses e as metodologias formuladas ao longo deste texto, uma vez que é uma barragem que tem
uma base de dados representativa do comportamento estrutural observado ao longo de vários anos. O
sistema de observação da barragem está equipado com dispositivos de medição manual e com um
sistema de medição automática que está a ser alvo de melhorias [MJ13].
A barragem do Alto Lindoso é uma barragem de betão do tipo arco-abobada (isto é, a sua geometria
apresenta uma curvatura horizontal e uma curvatura vertical), cujo projeto teve início em 1983 e a sua
construção foi concluída em 1992 [CNP1]. Esta barragem está localizada no Norte de Portugal na área
de gestão dos municípios de Ponte da Barca e Arcos de Valdevez, num vale simétrico do Rio Lima
onde desaguam alguns afluentes menores e em que grande parte da sua albufeira se encontra em
território espanhol. Nos termos da classificação de risco do RSB, a barragem do Alto Lindoso foi
integrada na classe I. O corpo da barragem tem 110 metros de altura no bloco central, o coroamento
encontra-se à cota de 339,0 metros e o seu comprimento é de 298 metros. Na zona do bloco central a
espessura é de 4 metros no coroamento e de 21 metros na sua base. No interior da barragem existem
3 galerias de inspeção (GV1, GV2 e GV3) ao longo da mesma e ainda uma galeria de drenagem junto
à sua fundação. O maciço rochoso onde se encontra a fundação da barragem é de granito de boa
qualidade, no entanto com alguma heterogeneidade. As características do maciço rochoso foram
avaliadas por ensaios in situ e laboratoriais assim como por ensaios geofísicos para determinação da
velocidade de propagação das ondas longitudinais, antes e após o tratamento da fundação. O período
de construção iniciou-se em abril de 1987 com o término do corpo da barragem em julho de 1990 e a
aplicação das juntas de dilatação entre março de 1991 e maio de 1991. O primeiro enchimento da
albufeira decorreu entre janeiro de 1992 e abril de 1994, data em que se atingiu o nível de pleno
armazenamento (NPA=338,0 m) pela primeira vez. Ao longo dos anos têm sido elaborados relatórios
e pareceres relativos ao comportamento hidráulico e estrutural da barragem e da sua fundação, que
têm comprovado o adequado comportamento da obra [MJ13].
Figura 5.1. Vista de jusante da barragem (esquerda) [PN1] e vista aérea da barragem e da albufeira
(direita) do Alto Lindoso [TD1].
31
5.1.1 Monitorização do comportamento estrutural
O sistema de observação da barragem do Alto Lindoso é composto por instrumentação que permite a
medição em diversos pontos da temperatura do ar, da tensão, da deformação e da temperatura do
betão, da precipitação, da humidade, do nível do reservatório, do caudal drenado e infiltrado, das
subpressões, dos deslocamentos na barragem e na sua fundação, do deslocamento de juntas
(movimentos relativos entre blocos) e fissuras e da atividade sísmica [MJ13].
A altura de água é monitorizada de forma automática por um sensor de pressão de alta precisão com
uma célula de pressão de quartzo e de forma manual através de uma escala de níveis [MJ13].
Os deslocamentos horizontais (nas direções radial e tangencial) no corpo da barragem são obtidos em
18 bases de coordinómetros através de 5 fios de prumo (direitos e invertidos) (Figura 5.3 e Figura 5.4)
e por métodos geodésicos (planimetria). O movimento relativo entre blocos é medido por bases de
alongâmetro localizados nas paredes e por medidores de movimento de junta embebidos no corpo da
barragem. As deformações na fundação são medidas em 18 extensómetros de varas (também
32
designados por extensómetros de fundação) localizados na fundação [MJ13].
Figura 5.3. Localização dos fios de prumo e dos extensómetros de fundação (alçado).
A deformação do betão é medida pelos grupos de extensómetros de resistência elétrica atrás referidos,
permitindo a determinação do nível de tensão através do nível de deformação e da lei da
deformabilidade do betão. Os tensómetros permitem a medição direta da tensão de compressão nas
componentes normais [MJ13].
Em relação aos caudais drenados e infiltrados que são medidos individualmente, em drenos que fazem
parte do sistema de drenagem da fundação e em bicas totalizadoras que diferenciam a quantidade total
de água que escoa pela galeria de drenagem em várias zonas da barragem. Este sistema é constituído
por 52 drenos, distribuídos pela galeria de drenagem na ordem de 2 por bloco, exceto nos blocos
33
centrais 11/12, 13/14 e 18/19 onde foram instalados 4 drenos. O caudal dos drenos é recolhido e
escoado por 3 bicas (Figura 5.5), em que a “Bica 1” recolhe o caudal proveniente dos blocos 1/2 até ao
bloco 9/10 na margem esquerda da barragem, enquanto a “Bica 2” recolhe o caudal proveniente dos
blocos 14/15 até ao bloco 21/22 na margem direita da barragem e a “Bica 3” recolhe o caudal escoado
pela galeria de drenagem [MJ13].
As subpressões na fundação são medidas por uma rede piezométrica que é composta por 23
piezómetros [MJ13].
5.2.1 Introdução
O caso estudo a apresentar surge na sequência do estudo efetuado e apresentado no artigo
“Constructing statistical models for arch dam deformation” [MJ12] em que foi analisada a comparação
entre o modelo tradicional de interpretação quantitativa com a formulação da equação (4.2) que
considera o efeito térmico através da variação sazonal pelas funções sinusoidais de período anual
(modelo Hydrostatic-Season-Time (HST) tradicional) e através da consideração das medições obtidas
pelos termómetros existentes no corpo da barragem (modelo Hydrostatic-Temperature-Time (HTT)) ou
por uma transformada em componentes principais dessas mesmas temperaturas (conhecido por PCA
– Principal Component Analysis na sigla inglesa). O efeito hidrostático é representado através de um
34
termo polinomial da altura da água na albufeira. O método de minimização dos resíduos é o método
dos mínimos quadrados. Nesse estudo foi possível concluir que os modelos não tradicionais podem
apresentar um melhor desempenho em prever os deslocamentos radiais nas zonas mais altas da
barragem, isto é, mais próximas do coroamento. Uma possível interpretação para esta situação, dado
que a massa de betão é menor mais perto do coroamento, logo deverá ter uma inercia térmica menor
e, portanto, mais sensibilidade à temperatura e estas zonas estão progressivamente mais longe dos
apoios. Por outro lado, nas zonas mais próximas da fundação e com maior massa de betão os modelos
são semelhantes em termos de desempenho. Em geral é possível verificar um melhor desempenho no
modelo que utiliza as medições de temperatura dos termómetros embebidos no corpo da barragem.
Partindo desta base de investigação e outras (por exemplo, [BA19] [SF15] [KC13] [MJ11] [AF09]) foi
proposto que: i) se investigasse se é possível melhorar o desempenho dos modelos considerando
também as medições dos extensómetros de fundação, de forma a considerar o efeito da deformada da
fundação no comportamento da barragem através de um novo modelo denominado Hydrostatic-
Temperature-Foundation-Time (HTFT); ii) se aplicasse estes dados aos modelos de aprendizagem
automática indicados nos pontos 4.3 e 4.4; tendo como referência o desempenho conseguido com o
modelo tradicional (ponto 4.2). O caso de estudo propôs-se então a analisar e interpretar o
comportamento observado em barragens de betão com recurso a modelos de aprendizagem
automática, isto é, criar modelos que sejam representativos do padrão do comportamento estrutural
observado com base nas medições observadas in-situ, utilizando diferentes formulações,
nomeadamente, através da formulação do efeito da pressão hidrostática através de um polinómio
função da altura da água; do efeito térmico com base numa onda sinusoidal de período anual ou através
da consideração das temperaturas medidas em instrumentos embebidos no corpo da barragem e o
efeito das deformações na fundação.
Neste estudo foram utilizadas as medições das principais solicitações e as principais respostas
estruturais medidas no bloco 11/12 (Figura 5.6) da barragem do Alto Lindoso, nomeadamente as
referentes à altura média da água no reservatório (Figura 5.7), às temperaturas do corpo da barragem
medidas pelos extensómetros de resistência elétrica G06, G15, G34 e pelos termómetros T31 e T49
em graus celsius (Figura 5.8), assim como a variação sazonal pelas funções sinusoidais (Figura 5.9),
as deformações no maciço de fundação medidas nos extensómetros de fundação M1112-45,0m e
J1112-45,0m em que o empolamento é o sentido positivo da medição (Figura 5.10) e os deslocamentos
radiais medidos às cotas 326,5 metros (próximo do coroamento) e 232,7 metros (próximo da fundação
da barragem) no fio de prumo FP3 no qual o sentido positivo é na direção de montante (Figura 5.11).
35
Figura 5.6. Perfil e instrumentação da barragem entre a junta 11 e 12.
A análise efetuada compreende o período entre o dia 8 de janeiro de 1992 e o dia 20 de outubro de
2020. O nível da albufeira apresenta o maior número de observações com um total de 10498 registos
que corresponde à altura média da água por dia desde o início do primeiro enchimento da albufeira.
Com exceção do nível da água da albufeira e das grandezas medidas na estação meteorológica, todas
as restantes grandezas referenciadas no plano de observação são medidas com uma frequência que
pode variar, em média, entre o quinzenal e o mensal. Assim, como nem todos os dados são obtidos
com a regularidade da altura da água no reservatório e não são recolhidos na mesma data (quer sejam
obtidos de forma manual ou automática) foi necessário encontrar uma matriz de dados que fosse
compatível com as medições em questão, para isso foi criada uma rotina que aglomerasse os dados
com base em dois princípios: que a medição tenha sida realizada num prazo de +/- 3 dias da medição
de referência (neste caso, a observação do deslocamento) e que uma só matriz tenha os dados de
todos os instrumentos, sendo descartadas as linhas que contivessem dados que não preenchessem
estes requisitos. Este processo resultou numa matriz de dados com 286 campanhas de observação,
tendo como início o dia 20 de janeiro de 1992 e termino o dia 14 de janeiro de 2020. Estes dados foram
divididos em período de aprendizagem (280 campanhas de observação) e em período de previsão (6
campanhas de observação) e a divisão entre ambos se encontra a 3 de abril de 2017.
36
Figura 5.7. Observações da altura média da água no reservatório.
37
Figura 5.9. Representação da variação sazonal.
38
5.3 Metodologia proposta
Neste estudo foram definidas as grandezas a analisar os deslocamentos radiais no fio de prumo FP3 à
cota 326,5m (FP3-326,5m) e no fio de prumo FP3 à cota 232,7m (FP3-232,7m), e como ações, o efeito
hidrostático (para todos os modelos, a 4ª potência da altura média da água no reservatório no dia da
observação de referência), o efeito térmico e o efeito da deformação na fundação. O efeito térmico foi
considerado através da formulação sazonal ou através das observações diretas dos instrumentos de
medição de temperatura. Para a deformação da fundação foram utilizadas diretamente as medições
obtidas em dois extensómetros de varas (um localizado a montante e outro a jusante) com ponto fixo a
45 metros ou, em alternativa, foram utilizadas as transformadas dessas medições de forma a
representar o empolamento/assentamento (𝐸𝐹𝑇 ) e a rotação do bloco (𝐸𝐹𝑅 ) (na direção montante-
jusante), respetivamente equação (5.1) e equação (5.2). O período de aprendizagem (280 campanhas
de observação) vai desde o início do primeiro enchimento, em 8 de janeiro de 1992 até 3 de abril de
2017 e o período de previsão (6 campanhas de observação) até 14 de janeiro de 2020.
(𝐸𝐹𝑀1112_45 +𝐸𝐹𝐽1112_45 )
𝐸𝐹𝑇 = (5.1)
2
onde,
Sendo o procedimento seguinte o desenvolvimento dos modelos de regressão linear múltipla para o
período de aprendizagem, o modelo 1 com a grandeza correlacionada com a altura média da água no
reservatório e o efeito térmico definido como variação sazonal (modelo Hydrostatic-Season-Time
(HST)), o modelo 2 em que o efeito térmico foi definido pelas temperaturas medidas no bloco, o modelo
3 em que foram selecionadas as medições dos 3 instrumentos de medição de temperatura mais
importantes através do valor-p obtido no modelo de regressão linear anterior (modelos Hydrostatic-
Temperature-Time (HTT)), o modelo 4 em que corresponde ao modelo 2 com as medições das
deformações na fundação, o modelo 5 que corresponde ao modelo 3 com as medições das
deformações na fundação, o modelo 6 que corresponde ao modelo 2 com a consideração do efeito do
empolamento da fundação e da rotação na fundação e finalmente o modelo 7 que corresponde ao
modelo 3 com o efeito da empolamento e da rotação na fundação (modelos Hydrostatic-Temperature-
Foundation-Time (HTFT)). Sendo este processo repetido para as grandezas de resposta
(deslocamentos na direção radial observados às cotas 326,5 metros e 232,7 metros do fio de prumo
FP3, no bloco central) (Figura 5.12). Resultando para cada modelo as variáveis independentes
descritas na Tabela 5.1 e Tabela 5.2 para cada ponto do deslocamento observado.
39
Tabela 5.1. Variáveis independentes utilizadas para estimar o deslocamento radial no FP3-326,5m
em cada modelo.
Constante 𝑘∗ 𝑘∗ 𝑘∗ 𝑘∗ 𝑘∗ 𝑘∗ 𝑘∗
Efeito
hidrostático ℎ4 ℎ4 ℎ4 ℎ4 ℎ4 ℎ4 ℎ4
Tabela 5.2. Variáveis independentes utilizadas para estimar o deslocamento radial à cota 232,7m em
cada modelo.
Constante 𝑘∗ 𝑘∗ 𝑘∗ 𝑘∗ 𝑘∗ 𝑘∗ 𝑘∗
Efeito
hidrostático ℎ4 ℎ4 ℎ4 ℎ4 ℎ4 ℎ4 ℎ4
Para este caso de estudo, tomou-se partido das funcionalidades disponíveis nas bibliotecas de
programação em R [R], nomeadamente do pacote base stats e em particular da função lm(), que
permite o cálculo automático dos coeficientes, constante, valores estimados, resíduos e parâmetros de
desempenho do modelo de regressão linear múltipla.
40
neuronais artificias e random forest de modo a obter modelos correspondentes aos anteriores, assim
sendo, as grandezas, as correlações e o período de aprendizagem dos modelos de regressão linear
múltipla mantém-se inalterados (Figura 5.12).
Para o caso de estudo, tomou-se partido das funcionalidades disponíveis nas bibliotecas de
programação em R, nomeadamente do pacote nnet [NNET] e em particular da função nnet(), que cria
uma rede neuronal artificial de uma camada intermédia e otimiza os pesos do modelo, assim como
calcula os valores estimados para o período de aprendizagem e para o período de previsão, permitindo
a determinação dos resíduos e parâmetros de desempenho do modelo de rede neuronal artificial.
Para o caso de estudo, tomou-se partido das funcionalidades disponíveis nas bibliotecas de
programação em R, nomeadamente do pacote randomForest [RF] e em particular da função
randomForest(), que permite o cálculo automático dos resíduos e dos valores estimados e permite a
determinação dos resíduos e parâmetros de desempenho do modelo de random forest.
Como passo final, compara-se e analisa-se o desempenho dos modelos obtidos avaliando o seu
desempenho para o período de previsão e para o período de aprendizagem através da descrição
estatística dos modelos, entre o mesmo tipo de modelo de aprendizagem automática e entre os
diferentes tipos de métodos de aprendizagem automática.
Nos modelos de regressão linear múltipla (RLM), usualmente designado por modelos de interpretação
quantitativa (IQ) na engenharia de barragens, foi utilizada a 4ª potência da altura média da água no dia
da observação do deslocamento, ℎ4 , uma vez que revelou uma boa correspondência em estudos
41
anteriores, sendo a constante 𝑘 a ordenada na origem. O efeito do tempo na estrutura da barragem
pode ser considerado negligenciável, uma vez que a barragem do Alto-Lindoso tem mais de 10 anos e
não ocorrem fenómenos evolutivos significativos ao longo do tempo [MJ13]. Nos pontos seguintes
serão apresentados todos os modelos de regressão linear múltipla e no ponto 5.4.8 serão apresentadas
a Tabela 5.3, a Tabela 5.4 e a Tabela 5.5 com os principais elementos de caracterização dos modelos,
nomeadamente, as variáveis de entrada e saída, os coeficientes de regressão, significância e os
parâmetros de desempenho para o período de aprendizagem e para o período de previsão.
Através do processo mencionado anteriormente obteve-se a equação (5.4) que define o modelo de
regressão linear tendo em conta a variação sazonal.
𝛿𝐻𝑆𝑇 = −1,365 × 10−7 × ℎ4 − 5,905 × 𝑠𝑒𝑛 (𝑑) − 3,647 × 𝑐𝑜𝑠 (𝑑) + 6,983 (5.4)
Figura 5.13. Observações e resultados do modelo IQ1 para o deslocamento radial no FP3-326,5m.
42
𝛿𝐻𝑇𝑇 = 𝛽1 × ℎ4 + 𝛽2 × 𝐺06_33575_𝑇 + 𝛽3 × 𝐺15_31050_𝑇 + 𝛽4 × 𝐺34_23550_𝑇 + 𝛽5 × 𝑇31_311_𝑇
(5.5)
+ 𝛽6 × 𝑇49_278_𝑇 + 𝑘
Através do processo mencionado anteriormente obteve-se a equação (5.6) que define o modelo de
regressão linear tendo em consideração a medição das temperaturas.
Figura 5.14. Observações e resultados do modelo IQ2 para o deslocamento radial no FP3-326,5m.
Através do processo mencionado anteriormente obteve-se a equação (5.8) que define o modelo de
regressão linear tendo em consideração a medição das 3 temperaturas mais relevantes.
43
Figura 5.15. Observações e resultados do modelo IQ3 para o deslocamento radial no FP3-326,5m.
Através do processo mencionado anteriormente obteve-se a equação (5.10) que define o modelo de
regressão linear tendo em consideração a medição das 5 temperaturas e a medição das extensões de
fundação.
Figura 5.16. Observações e resultados do modelo IQ4 para o deslocamento radial no FP3-326,5m.
44
5.4.5 Modelo IQ5
O modelo IQ5 tem por base o Modelo IQ4 em que avalia o efeito térmico na estrutura da barragem
através de uma relação linear de 3 das medições das temperaturas instrumentais mais relevantes ao
longo do perfil da barragem no bloco 11/12 do estudo referido no capítulo 5.2, estes instrumentos foram
escolhidos pela ordem de grandeza do valor-p das variáveis do modelo anterior (Tabela 5.3),
nomeadamente a temperatura no instrumento G06 (𝐺06_33575_𝑇 ), G15 (𝐺15_31050_𝑇 ) e T31 (𝑇31_311_𝑇 ), como
seria expectável as medições de temperatura relevantes são iguais às do Modelo IQ3, acrescentando
a influência das medições dos deslocamentos na fundação a montante (𝐸𝐹𝑀1112_45 ) e a jusante
(𝐸𝐹𝐽1112_45 ) em que o ponto fixo está à profundidade de 45 metros, o que resulta na equação (5.11).
Através do processo mencionado anteriormente obteve-se a equação (5.12) que define o modelo de
regressão linear tendo em consideração a medição das 3 temperaturas mais relevantes e a medição
dos deslocamentos observados na fundação.
Figura 5.17. Observações e resultados do modelo IQ5 para o deslocamento radial no FP3-326,5m.
45
𝛿𝐻𝑇𝐹𝑇 = 𝛽1 × ℎ4 + 𝛽2 × 𝐺06_33575_𝑇 + 𝛽3 × 𝐺15_31050_𝑇 + 𝛽4 × 𝐺34_23550_𝑇 + 𝛽5 × 𝑇31_311_𝑇
(5.13)
+ 𝛽6 × 𝑇49_278_𝑇 + 𝛽7 × 𝐸𝐹𝑇 + 𝛽8 × 𝐸𝐹𝑅 + 𝑘
Através do processo mencionado anteriormente obteve-se a equação (5.14) que define o modelo de
regressão linear tendo em consideração a medição das 5 temperaturas e a medição dos deslocamentos
na fundação através da sua transformação em variáveis representativas do empolamento e da rotação
na fundação.
Figura 5.18. Observações e resultados do modelo IQ6 para o deslocamento radial no FP3-326,5m.
Através do processo mencionado anteriormente obteve-se a equação (5.16) que define o modelo de
regressão linear tendo em consideração a medição das 3 temperaturas mais relevantes e a medição
das deformações na fundação através da sua transformação nas variáveis representativas do
empolamento e rotação.
46
𝛿𝐻𝑇𝐹𝑇 = −1,080 × 10−7 × ℎ4 + 1,013 × 10−1 × 𝐺06_33575_𝑇 + 6,776 × 10−1 × 𝐺15_31050_𝑇
+ 7,171 × 10−1 × 𝑇31_311_𝑇 − 1,259 × 101 × 𝐸𝐹𝑇 + 1,185 × 𝐸𝐹𝑅 (5.16)
1
− 1,608 × 10
47
Tabela 5.3. Coeficientes de regressão e significância das variáveis dos modelos IQ para o deslocamento radial (em milímetros) no FP3-326,5m.
Modelos Modelo IQ1 Modelo IQ2 Modelo IQ3 Modelo IQ4 Modelo IQ5 Modelo IQ6 Modelo IQ7
Coeficiente Significância* Coeficiente Significância* Coeficiente Significância* Coeficiente Significância* Coeficiente Significância* Coeficiente Significância* Coeficiente Significância*
Variáveis
(𝜷𝒊 ) (𝑷𝒓 > |𝒕|) (𝜷𝒊 ) (𝑷𝒓 > |𝒕|) (𝜷𝒊 ) (𝑷𝒓 > |𝒕|) (𝜷𝒊 ) (𝑷𝒓 > |𝒕|) (𝜷𝒊 ) (𝑷𝒓 > |𝒕|) (𝜷𝒊 ) (𝑷𝒓 > |𝒕|) (𝜷𝒊 ) (𝑷𝒓 > |𝒕|)
-1,514 × -1,787 × -1,972 × -1,608 × -1,972 × -1,608 ×
𝑘 6,983 <2 × 10-16*** 0,000243*** <2 × 10-16*** 1,58 × 10-8*** <2 × 10-16*** 1,58 × 10-8*** <2 × 10-16***
101 101 101 101 101 101
-1,365 × 10- -1,320 × 10- -1,329 × 10- -1,083 × 10- -1,080 × 10- -1,083 × 10- -1,080 × 10-
ℎ4 7 <2 × 10-16*** 7 <2 × 10-16*** 7 <2 × 10-16*** 7 <2 × 10-16*** 7 <2 × 10-16*** 7 <2 × 10-16*** 7 <2 × 10-16***
𝐺06_33575_𝑇 6,087 × 10-2 0,442094 7,581 × 10-2 0,289 1,155 × 10-1 0,04759* 1,013 × 10-1 0,055866. 1,155 × 10-1 0,0476* 1,013 × 10-1 0,0559
𝐺15_31050_𝑇 6,862 × 10-1 1,68 × 10-6*** 6,721 × 10-1 1,97 × 10-6*** 6,676 × 10-1 4,15 × 10-10*** 6,776 × 10-1 1,93 × 10-10*** 6,676 × 10-1 4,15 × 10-10*** 6,776 × 10-1 1,93 × 10-10***
-2,766 × 10-
𝐺34_23550_𝑇 1 0,514532 3,944 × 10-1 0,26066 3,944 × 10-1 0,2607
𝑇31_311_𝑇 7,733 × 10-1 4,99 × 10-10*** 7,656 × 10-1 <2 × 10-16*** 7,236 × 10-1 7,37 × 10-15*** 7,171 × 10-1 <2 × 10-16*** 7,236 × 10-1 7,37 × 10-15*** 7,171 × 10-1 <2 × 10-16***
-7,226 × 10- -7,226 × 10-
𝑇49_278_𝑇 3,765 × 10-2 0,863910 2 0,65354 2 0,6535
* Signif.: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 (quanto menor o valor-p maior o nível de significância)
48
Através da Tabela 5.4 podemos verificar que o desempenho do modelo melhora ligeiramente ou
permanece igual sempre que existe mais informação de entrada, no entanto é curioso verificar que para
este caso estudo os modelos com 5 medições de temperatura (Modelo IQ2) não apresentam uma
vantagem significativa em relação aos modelos equivalentes de 3 medições de temperatura (Modelo
IQ3) em especial se se tivesse em conta o parâmetro 𝑅2 ajustado que tem em conta o número de
variáveis independentes, o que é relacionado com o facto de se terem retirado as variáveis de entrada
com um menor nível de significância e, portanto, que contribuem menos para a explicação do
comportamento estrutural observado. É de notar igualmente que o modelo sazonal (Modelo IQ1) nos
dá uma boa aproximação do comportamento estrutural com apenas o conhecimento do dia do ano e
da altura média da água no reservatório no dia da observação (daí continuar a ser amplamente utilizado
em todo o mundo) e que a substituição do efeito térmico pelo modelo sazonal pelas temperaturas
diretas dos instrumentos apenas apresenta um ganho residual neste caso estudo, sendo que até a
diferença entre o erro máximo e o erro mínimo seja ligeiramente superior no Modelo IQ2 e Modelo IQ3,
embora o somatório do quadrado dos resíduos seja menor. Como é natural sendo uma transformação
linear da mesma informação a solução do sistema de equações (4.6) é semelhante entre o par Modelo
IQ4-Modelo IQ6 e o par Modelo IQ5-Modelo IQ7, isto é, o modelo desenvolvido teria necessariamente
de providenciar a mesma informação e resultados, este aspeto é útil uma vez que prova a consistência
do algoritmo utilizado e da sua solução. Com a incorporação das deformações na fundação o modelo
sofre um incremento de qualidade mais substancial que anteriormente em especial no somatório do
quadrado dos resíduos totais.
Na Figura 5.20 é possível ver a representação visual da distribuição dos resíduos para o período de
aprendizagem (diferença entre a observação do deslocamento e o valor previsto pelo respetivo modelo
de regressão linear no período de aprendizagem), onde é possível constatar que a ordem de precisão
dos últimos 4 modelos é muito semelhante e que no caso do Modelo IQ3 os resíduos estão mais
concentrados que no Modelo IQ2 apesar de ter menos variáveis independentes.
49
Figura 5.20. Diagrama de extremos e quartis dos resíduos dos diversos modelos IQ para o período de
aprendizagem.
Pela análise da Tabela 5.5 o modelo sazonal aparenta apresentar melhores resultados, no entanto
verificando a Figura 5.21 (assim como nas figuras de cada modelo), podemos verificar que isto se deve
a um único ponto atípico o qual pode ter resultado de erro humano na medição da temperatura e é
igualmente verificável que para pelo menos os últimos 4 modelos apresentam um valor mais próximo
das restantes observações que o modelo sazonal do efeito térmico, de qualquer forma esta situação
apresenta uma possível desvantagem dos modelos que com mais informação necessária maior é a
possibilidade de erro humano assim como a necessidade desta informação ser efetivamente correta.
Numa análise mais fina (e até automática) seria possível identificar em pormenor qual/is o/s
instrumento/s do/s qual/is as medição/ões de temperatura que provavelmente estariam incorretas para
cada previsão e para o período de aprendizagem (é um dos aspetos que os métodos de aprendizagem
automática também se focam).
Como se pode verificar pela Figura 5.21 os resíduos estão mais bem distribuídos nos modelos com as
temperaturas para o período de previsão com exceção de uma observação.
50
Figura 5.21. Diagrama de extremos e quartis dos resíduos dos modelos IQ para o período de
previsão.
No âmbito da dissertação foram utilizados modelos de redes neuronais do tipo perceptrão multicamada,
com uma camada de entrada, uma camada intermédia e uma camada de saída. O número de entradas
depende do modelo em análise conforme apresentado na Tabela 5.1 e na Tabela 5.2; uma saída que
corresponde à grandeza em estudo (deslocamento radial no FP3-326,5m ou no FP3-232,7m); e foram
testadas redes neuronais artificiais de 8 a 12 neurónios na camada intermédia. A função de ativação
na camada intermédia é do tipo arco tangente hiperbólica e na camada de saída a função de ativação
é linear. Para cada arquitetura de rede neuronal foram consideradas 5 inicializações, isto é, 5 pontos
de partida aleatórios (atribuição aleatória de valores aos pesos w) para cada rede neuronal artificial.
Para cada inicialização foram realizadas 500 iterações, perfazendo um total de 12500 combinações de
redes neuronais artificiais para cada um dos 7 modelos propostos (Modelos NN1, NN2, …, NN7). No
final foi escolhida, para cada um dos 7 modelos, a rede com melhor desempenho, ou seja, a que
apresentava menores resíduos (diferença entre valor estimado do deslocamento e a observação do
deslocamento) para o conjunto de aprendizagem. As variáveis de entrada e saída nos modelos de
redes neuronais artificiais foram iguais às dos modelos de regressão linear múltipla para cada modelo,
em que o ℎ4 e a uma constante 𝑘 estão definidos de forma semelhante. Nos pontos seguintes serão
apresentados os resumos de cada modelo e no ponto 5.5.8 serão apresentadas a Tabela 5.6 e a Tabela
5.7 com os principais elementos de caracterização dos modelos, nomeadamente, os parâmetros de
desempenho para o período de aprendizagem e para o período de previsão.
51
5.5.1 Modelo NN1
O modelo NN1 segue a metodologia da formulação sazonal para ter em conta o efeito térmico no
comportamento estrutural observado, neste caso, a rede neuronal artificial com melhor resultado foi
obtida por um modelo com 11 neurónios na camada intermédia e, portanto, um total de 56 pesos no
total do modelo.
Figura 5.22. Observações e resultados do modelo NN1 para o deslocamento radial no FP3-326,5m.
Figura 5.23. Observações e resultados do modelo NN2 para o deslocamento radial no FP3-326,5m.
52
consideradas mais relevantes nos modelos de regressão linear de modo que os modelos sejam
equivalentes e possam ser comparados). Neste caso, a rede neuronal artificial com melhor resultado
foi obtida com 9 neurónios na camada intermédia e, portanto, um total de 49 pesos otimizados no total
do modelo.
Figura 5.24. Observações e resultados do modelo NN3 para o deslocamento radial no FP3-326,5m.
Figura 5.25. Observações e resultados do modelo NN4 para o deslocamento radial no FP3-326,5m.
53
passando às 3 mais relevantes de acordo com as informações obtidas no modelo equivalente de
regressão linear múltipla e com a metodologia proposta. Neste caso, a rede neuronal artificial com
melhor resultado foi obtida com 8 neurónios na camada intermédia e, portanto, um total de 65 pesos
otimizados no total do modelo.
Figura 5.26. Observações e resultados do modelo NN5 para o deslocamento radial no FP3-326,5m.
Figura 5.27. Observações e resultados do modelo NN6 para o deslocamento radial no FP3-326,5m.
54
acordo com a metodologia proposta e já implementada anteriormente havendo a redução das medições
de temperatura para as 3 mais relevantes de acordo com os dados obtidos nos modelos de regressão
linear e a altura média da água no dia da observação. Neste caso, a rede neuronal artificial com melhor
resultado foi obtida com 12 neurónios na camada intermédia e, portanto, um total de 97 pesos
otimizados no total do modelo.
Figura 5.28. Observações e resultados do modelo NN7 para o deslocamento radial no FP3-326,5m.
55
Tabela 5.6. Parâmetros de desempenho para os modelos NN no período de aprendizagem.
Na Figura 5.29 é possível ver a distribuição dos resíduos dos modelos de redes neuronais artificiais
para o período de aprendizagem, onde é possível constatar que a amplitude de resíduos é similar nos
pares Modelo NN4-Modelo NN6 e Modelo NN5-Modelo NN7, nestes 4 modelos 50% dos resíduos
encontram-se numa faixa entre -0,75mm e 0,75mm o que é bastante razoável para um domínio de
medições entre -20mm a 10mm, no entanto o Modelo NN5 apesar de aparentar apresentar os melhores
resultados em geral, uma vez que se obtêm os resíduos mais concentrados, tem um resíduo máximo
mais elevado que outros 4 modelos incluindo o da formulação sazonal. Os modelos com a formulação
das temperaturas medidas é ligeiramente melhor que o da formulação sazonal, mas apresenta resíduos
máximos e mínimos superiores a todos os outros modelos.
Figura 5.29. Diagrama de extremos e quartis dos resíduos dos modelos NN para o período de
aprendizagem
Na Tabela 5.7 são apresentados os parâmetros de desempenhos dos modelos NN para o período de
previsão. Para este período todos os modelos apresentam piores dados estatísticos que para o período
de aprendizagem, no entanto o Modelo NN2 apresenta um 𝑅2 da mesma ordem.
56
Tabela 5.7. Parâmtros de desempenho para os modelos NN no período de previsão.
Mais uma vez na distribuição dos resíduos apresentados na Figura 5.30 é possível identificar pontos
atípicos nos últimos 3 modelos, no entanto sendo a amostra pequena não apresenta resíduos máximos
e mínimos superiores aos verificados anteriormente, de qualquer forma é possível identificar que o
mesmo Modelo NN3 apresenta o resíduo máximo em ambos os períodos e o mínimo no período de
aprendizagem enquanto no período de previsão esse mínimo ocorre no Modelo NN6.
Figura 5.30. Diagrama de extremos e quartis dos resíduos dos modelos NN para o período de
previsão.
Os modelos de random forest têm como principais propriedades um número total de 500 árvores em
que 3 variáveis são escolhidas aleatoriamente em cada divisão e no nó terminal existe um conjunto
mínimo de 5 campanhas de observação. A importância das variáveis dos modelos de random forest
foram avaliadas tendo em conta o aumento em percentagem do erro quadrático médio em linha com o
57
obtido nos modelos de regressão linear. Como referido no ponto 4.4 o resultado final estimado para
uma determinada observação resulta da média dos valores obtidos de todas as árvores e não incorpora
a constante como nos modelos de regressão linear. Nos pontos seguintes serão apresentados os
resumos de cada modelo e no ponto 5.6.8 serão apresentadas a Tabela 5.8, a Tabela 5.9 e a Tabela
5.10 com os principais elementos de caracterização dos modelos, nomeadamente, a importância de
cada variável independente, os parâmetros de desempenho para o período de aprendizagem e para o
período de previsão. Este tipo de modelos tem demonstrado bom comportamento na resolução de
alguns problemas [HS16] [SH18] e já foi testado em estudos com o mesmo intuito que o presente
[SF17].
Figura 5.31. Observações e resultados do modelo RF1 para o deslocamento radial no FP3-326,5m.
58
Figura 5.32. Observações e resultados do modelo RF2 para o deslocamento radial no FP3-326,5m.
Figura 5.33. Observações e resultados do modelo RF3 para o deslocamento radial no FP3-326,5m.
59
Figura 5.34. Observações e resultados do modelo RF4 para o deslocamento radial no FP3-326,5m.
Figura 5.35. Observações e resultados do modelo RF5 para o deslocamento radial no FP3-326,5m.
60
Figura 5.36. Observações e resultados do modelo RF6 para o deslocamento radial no FP3-326,5m.
Figura 5.37. Observações e resultados do modelo RF7 para o deslocamento radial no FP3-326,5m.
61
Tabela 5.8. Importânica das variáveis dos modelos RF para a previsão do deslocamento radial no
FP3-326,5m.
Devido à forma como o algoritmo de random forest funciona, em que produz uma média de todas
árvores, faz com que estes modelos apresentem um valor máximo e mínimo de resíduo similares. No
entanto, para este caso os modelos RF apresentam resíduos (Tabela 5.9) mais elevados que os outros
modelos e um desempenho um pouco inferior em todos os parâmetros. Também é possível constatar
que a redução do número de variáveis com a medição da temperatura não influencia os modelos de
forma significativa, sendo até que o modelo que apresenta melhores resultados é sempre o que tem
menos medições de temperatura relativamente á contraparte com mais medições de temperatura
incorporadas no modelo, o que não acontecia nos restantes métodos de aprendizagem automática.
Constata-se igualmente que a melhoria entre os modelos com a informação sobre a deformação da
fundação reduz o somatório quadrado dos resíduos em cerca de 50% relativamente ao modelo do tipo
sazonal, enquanto os outros métodos apresentam um ganho de cerca de 55%.
62
Tabela 5.9. Parâmetros de desempenho para os modelos RF no período de aprendizagem.
A Figura 5.38 apresenta a distribuição dos resíduos para o período de aprendizagem onde ao contrário
dos outros métodos de aprendizagem automática mostra uma tendência de subestimação dos resíduos
o que reflete o comportamento das RF que obtém valores sempre dentro do domínio de aprendizagem.
Figura 5.38. Diagrama de extremos e quartis dos resíduos dos modelos RF para o período de
aprendizagem
Para o período de previsão existe uma alteração entre o desempenho do modelo sazonal para com os
modelos inicias com as medições de temperatura, revelando-se o primeiro como tendo um melhor
desempenho, algo que pode estar relacionado com a suposição anterior de que pode haver alguma
temperatura que não esteja correta. No entanto, com a implementação dos modelos com a medição
das deformações na fundação. O comportamento dos modelos para o período de previsão é muito
semelhante entre eles como é verificável pelas figuras dos respetivos modelos nos pontos anteriores,
exceto para o modelo de formulação sazonal do efeito térmico.
63
Tabela 5.10. Parâmetros de desempenho para os modelos RF no período de previsão.
A Figura 5.39 apresenta a distribuição dos resíduos para o período de previsão onde apresenta
resíduos da mesma ordem de grandeza que no período de aprendizagem. Mais uma vez se verifica
que o valor máximo de resíduo é de módulo similar ao do valor mínimo, no entanto aqui verifica-se que
existe uma menor regularidade em relação à proporção entre valores de resíduos positivos e negativos.
Figura 5.39. Diagrama de extremos e quartis dos resíduos dos modelos RF para o período de
previsão.
Neste ponto da dissertação são apresentados os resultados obtidos pela aplicação da metodologia
proposta à interpretação do comportamento do deslocamento radial do fio de prumo 3 à cota 232,7m.
É de salientar que os valores dos deslocamentos neste local da barragem são bastante inferiores (cerca
de 10%) aos valores do deslocamento radial na cota 326,5m e que neste caso a influência da precisão
dos instrumentos é superior o que conduz a uma menor fiabilidade das medições e a uma maior
variabilidade dos resultados.
64
5.7.1 Modelos de interpretação quantitativa
As figuras referentes aos modelos IQ FP3-232,7m encontram-se no Anexo A.1. Analisando estas
figuras é possível verificar que as observações sofrem um ajuste até aproximadamente ao ano 2000,
onde anteriormente a essa data apresenta deslocamentos radiais de valor superior aos verificados após
essa data, algo que estes modelos não conseguem replicar totalmente em especial tendo em conta a
formulação sazonal do efeito térmico.
Na Tabela 5.11 é possível verificar que a altura média da água tem uma influência negativa no
deslocamento no FP3-232,7m, nas restantes variáveis de entrada existe maior variabilidade da sua
influência no comportamento do deslocamento radial, uma vez que alguns termos apresentam
coeficientes positivos (deslocamento no sentido jusante-montante) e outros negativos (deslocamento
no sentido montante-jusante). Mais uma vez as medições de temperatura com maior nível de
significância são as que se encontram mais próximas do deslocamento em análise, nesse sentido
deveria ter sido considerado mais algum termómetro junto à galeria inferior em vez de por exemplo o
instrumento T31 (embora o T49 tenha mostrado uma significância menor e esteja mais perto do local
de análise). Um aspeto curioso é o que se passa entre os modelos IQ4 e IQ5 em que com a redução
do número de variáveis de entrada de medições de temperatura um dos coeficientes dos termos da
fundação altera de sinal, no entanto como têm uma significância diminuta não é expectável que sejam
muito relevantes.
65
Tabela 5.11. Coeficientes de regressão e e significância das variáveis dos modelos IQ para a previsão do deslocamento radial (em milímetros) no FP3-232,7m.
Modelo IQ1 Modelo IQ2 Modelo IQ3 Modelo IQ4 Modelo IQ5 Modelo IQ6 Modelo IQ7
8,091 × 10- 2,41 × 10- 8,347 × 10- 6,31 × 10- 8,621 × 10- 5,30 × 10- 9,303 × 10- 5,05 × 10- 8,621 × 10- 5,30 × 10- 9,303 × 10- 5,05 × 10-
𝐺34_23550_𝑇 1 15*** 1 16*** 1 14*** 1 16*** 1 14*** 1 16***
8,919 × 10- 8,941 × 10- 8,855 × 10- 2,357 × 10- 8,855 × 10- 2,357 × 10-
𝑇31_311_𝑇 2
0,00119** 3
0,444 2
0,00129** 2
0,0964. 2
0,00129** 2
0,0964.
66
A ordem de grandeza dos resíduos comparativamente aos valores observados é muito alta, chegando
em alguns modelos a ser superior aos limites do domínio do período de aprendizagem, daqui pode-se
concluir que a incerteza das medições é muito significativa e que o comportamento das observações
verificadas não é explicável de um modo linear. Pela Tabela 5.12 verifica-se que as medições da
deformação da fundação não têm efeito relevante nos parâmetros de desempenho dos modelos. O
modelo de formação sazonal não consegue explicar os deslocamentos observados na fase inicial de
enchimento, os quais são mais bem explicados pelas medições de temperatura para o período de
aprendizagem.
Ao contrário do verificado na cota superior, neste caso os resíduos não têm uma tendência tão
acentuada de subestimação (Figura 5.40). As medições das deformações da fundação quase não
produzem efeito nos modelos. As medições da temperatura melhoram ligeiramente o modelo, e a
totalidade delas têm uma influência maior que apenas 3, no entanto a melhoria não é muito substancial,
cerca de 15% do somatório dos resíduos quadrados, bastante inferior aos ganhos apresentados nos
modelos da cota superior, no entanto no parâmetro 𝑅2 apresenta uma melhoria mais substancial que
na cota superior.
Figura 5.40. Diagrama de extremos e quartis dos resíduos dos modelos IQ para o período de
aprendizagem.
67
No período de previsão verificam-se as mesmas tendências verificadas no período de aprendizagem,
sendo que neste período a consideração das deformações da fundação piora ligeiramente os modelos
de acordo com os parâmetros da Tabela 5.13, no entanto apresenta parâmetros de desempenho
superiores aos verificados para o período de aprendizagem ao contrário do que se verifica nos modelos
de cota superior em que o período de previsão apresenta um desempenho inferior que no período de
aprendizagem, embora apresentem parâmetros de desempenho superior aos dos modelos na cota
inferior.
Pela Figura 5.41 confirma-se o melhor desempenho dos modelos para o período de previsão, uma vez
que produzem gamas de resíduos bastante inferiores quer comparando com o respetivo período de
aprendizagem de cada modelo quer comparando entre a relação entre o período de aprendizagem e
período de previsão nos modelos de cota superior que apresentam uma diminuição do desempenho
em geral.
Figura 5.41. Diagrama de extremos e quartis dos resíduos dos modelos IQ para o período de
previsão.
68
5.7.2 Modelos de redes neuronais artificiais
As figuras referentes aos modelos NN FP3-232,7m encontram-se no Anexo A.2. Analisando estas
figuras revela-se novamente a incapacidade de o modelo de formulação sazonal do efeito térmico
explicar os dados até ao ano 2000, no entanto os restantes modelos permitem uma melhor adaptação
a esta situação que no caso dos modelos IQ.
Pela Tabela 5.14 confirma-se essa mesma tendência uma vez que o modelo NN1 apresenta
parâmetros de desempenho bastante inferiores aos restantes, onde quer o 𝑅2 quer o somatório dos
resíduos quadrados apresentam resultados piores em cerca de 50%. Confirma-se igualmente que as
incorporações das medições da temperatura apresentam um ganho superior á incorporação das
medições das deformações da fundação e a gama de valores de resíduos são ligeiramente inferiores
ao verificado no método anterior e estes encontram-se mais concentrados apresentando desvios
padrões menores.
Analisando a Figura 5.42 é verificável a maior concentração dos resíduos comparativamente ao método
anterior, no entanto apresenta alguns valores atípicos elevados em algumas das observações de
alguns modelos. Estes valores continuam a ser da ordem de grandeza do domínio e, portanto, para
uma determinada estimativa pode-se obter um erro superior a 100% o que revela as dificuldades de se
obter um modelo capaz de descrever o comportamento do deslocamento radial no FP3-232,7m.
69
Figura 5.42. Diagrama de extremos e quartis dos resíduos dos modelos NN para o período de
aprendizagem.
Para o período de previsão pode-se compreender que a sensibilidade das redes neuronais é superior
na medida em que para pequenas variações provocam efeitos mais acentuados podendo produzir
melhores ou piores resultados o que leva a que não haja uma avaliação clara sobre estes modelos para
este caso e que haja um grau de imprevisibilidade que não permita conclusões firmes para o período
de previsão. Na Tabela 5.15 podemos verificar esta situação em que os modelos não parecem seguir
uma ordem e apresentam valores muito dispares entre modelos comparáveis, o que pode ser causado
pelo modo como este método funciona, nomeadamente, o sobreajuste dos modelos ao período de
aprendizagem que faz com que não se crie uma regra geral para o comportamento observado, mas
sim uma situação de “decorar” dos dados.
70
Figura 5.43. Diagrama de extremos e quartis dos resíduos dos modelos NN para o período de
previsão.
Tabela 5.16 revela que para este método as variáveis que melhor explicam o comportamento do
deslocamento no FP3-232,7m são diferentes das verificadas pelo método de regressao linear multipla,
diferente do que aconteceu à cota superior em que as conclusões relativamente a esta importância se
revelaram iguais para ambos os métodos. Neste caso também se verifica que a importãncia dada às
deformações da fundação não é muito relevante assim como a maior parte das medições de
temperatura e a observação de temperatura mais importante é a verificada no instrumento G34 que é
o mais próximo do local em análise, levando a crer que a temperatura local é um dos parâmetros
fundamentais quer no deslocamento radial a esta cota como na cota superior, mas o deslocamento
radial na cota superior é mais afetado pela altura da água no reservatório.
71
Tabela 5.16. Importânica das variáveis dos modelos RF para a previsão do deslocamento radial (em
milímetros) no FP3-232,7m.
72
Pela análise da Tabela 5.17 verifica-se que os parâmetros de desempenho do modelo de formulação
sazonal são os piores dos 3 métodos utilizados, no entanto para os outros modelos apresentam um
desempenho equivalente ou superior comparativamente ao método IQ, mas pior desempenho
comparado com o método NN. Ao contrário do que acontece nos métodos anteriores, o método de
random forest parece encontrar uma relação entre este deslocamento radial e a deformação na
fundação uma vez que os modelos melhoram substancialmente para o período de aprendizagem com
a utilização destas variáveis, verifica-se igualmente que a diferença entre se utilizar 5 medições de
temperatura ou apenas 3 não é muito significativa como obtido no método IQ. A gama de resíduos é
similar ao que já foi obtido anteriormente, sendo possível encontrar resíduos de 100% ou mais. É
curioso verificar que a transformação das deformações da fundação (RF6 e RF7) produz resultados
ligeiramente inferiores aos modelos sem esta transformação (RF4 e RF5).
A Figura 5.44 apresenta a distribuição dos resíduos para cada modelo onde é possível constatar a
tendência deste método para a subestimação dos valores observados, verificando-se uma maior
concentração de resíduos abaixo de 0, enquanto nos outros métodos verifica-se o oposto, esta é uma
caraterística típica do random forest devido ao seu modo de funcionamento em que computa as médias
e estima um valor sempre dentro do domínio de aprendizagem. Verifica-se igualmente que o
desempenho é bastante reduzido no modelo RF1 em comparação com os restantes, obtendo-se
valores de resíduos menos concentrados. A análise visual desta figura confirma, igualmente, o já obtido
pelos parâmetros de desempenho da melhoria dos modelos com a inclusão dos dados da deformação
da fundação.
73
Figura 5.44. Diagrama de extremos e quartis dos resíduos dos modelos RF para o período de
aprendizagem.
A Tabela 5.18 mostra o que já tinha acontecido nos métodos anteriores uma vez que apresenta
melhores parâmetros de desempenho para o período de previsão que para o período de aprendizagem,
esta situação pode levar a concluir-se que a partir de determinada data os deslocamentos comportam-
se de uma forma mais regular. Comparativamente os modelos do método de random forest apresentam
resultados bastante interessantes para este período de previsão, até superiores aos dos modelos NN,
em todos os parâmetros, além de não apresentar a imprevisibilidade destes modelos.
A Figura 5.45 mostra a tendência de subestimação decorrida deste método no cálculo das estimativas
de observações, no entanto apresentam uma concentração bastante superior ao dos outros métodos,
e, portanto, uma maior fiabilidade. É facilmente observável que não existe uma diferença significativa
entre a consideração das 5 medições de temperatura em vez de apenas 3 mais importantes, e até em
dois dos casos apresenta melhor desempenho, e que a transformação das deformações da fundação
não introduz ganhos no modelo.
74
Figura 5.45. Diagrama de extremos e quartis dos resíduos dos modelos RF para o período de
previsão.
Nos pontos anteriores foi possível identificar algumas das diferenças entre os vários modelos, entre os
vários métodos de aprendizagem automática e os resultados obtidos em cada um deles.
Para o caso do deslocamento radial FP3-326,5m, foi possível concluir que este deslocamento é bem
caraterizado pela sobreposição de efeitos através da consideração das variáveis de entrada e que
todos os métodos proporcionam modelos que representam de forma adequada o padrão de
comportamento das grandezas em estudo. Neste primeiro caso foi possível constatar que o método
tradicional, com base em métodos de regressão linear múltipla também denominado por interpretação
quantitativa, representa de modo adequado os fenómenos envolvidos no deslocamento radial em
causa, tanto para o período de aprendizagem como para o período de previsão. Para este método os
parâmetros de desempenho são similares entre os dois períodos. Os modelos de redes neuronais
artificiais, apresentaram uma melhoria relativamente aos modelos de interpretação tradicional no
período de aprendizagem, no entanto, para o período de previsão o seu desempenho foi ligeiramente
inferior. Algo que leva a questionar se houve alguma sobre-aprendizagem do modelo ou se existe algum
erro de medição no registo das temperaturas medidas no corpo da barragem no período de previsão,
tarefas que não fizeram parte deste trabalho por se considerar que as medições existentes foram alvo
de validação prévia. Os modelos de random forest revelaram um desempenho ligeiramente inferior no
período de aprendizagem comparativamente aos outros métodos, no entanto demonstraram um
desempenho superior para o período de previsão comparando ao respetivo período de aprendizagem.
75
dos dados comparando com os outros dois métodos. Relativamente às diferentes formulações, tanto o
método de random forest e como o método regressão linear múltipla, validaram as mesmas variáveis
independentes mais relevantes, chegando à conclusão de que as temperaturas medidas no betão são
relevantes para descrever o comportamento do deslocamento horizontal em barragens de betão, assim
como a altura média da água no reservatório. Todos os métodos sofreram melhorias com a introdução
das variáveis independentes consideradas.
A introdução das medições de temperatura como variáveis independentes dos modelos ao invés do
modelo sazonal habitual neste tipo de análise, demonstrou ser capaz de uma melhor caracterização do
comportamento. No entanto, alerta-se para o fato de ser necessário mais dados e medições e logo é
mais suscetível aos erros de medição (que podem surgir no ato da medição ou no registo do seu valor,
entre outros), como é suspeito num dos pontos do período de previsão (onde existe uma medição de
temperatura potencialmente atípica/anómala). Relativamente à introdução de variáveis independentes
relacionadas com as deformações na fundação nos modelos em que o efeito térmico é considerado
através das medições de temperatura, esta introdução apresentou um ganho superior no desempenho
em comparação com os passos anteriores apresentando alguma relevância nos resultados de acordo
a análise efetuada, em particular, no somatório dos resíduos quadrados que mostrou reduções bastante
acentuadas em especial nos modelos NN e IQ e em menor escala nos modelos RF. No futuro, seria
interessante testar o modelo sazonal do efeito térmico juntamente com os dados das deformações da
fundação e compará-los com os dados obtidos.
76
bastante superior ao que acontece no outro caso (estudo do deslocamento a uma cota superior). Estas
condicionantes levam a que o padrão de comportamento não seja facilmente identificável através dos
métodos e formulações utilizados, no entanto é possível retirar algumas conclusões.
Para este caso, os métodos de interpretação quantitativa e de random forest não validaram como mais
relevantes as medições de temperatura dos mesmos instrumentos para as formulações do modelo 2 e
modelo 4. No que toca aos métodos, mais uma vez o método de redes neuronais artificias apresentou
o melhor desempenho para o período de aprendizagem. Pelo contrário, o método random forest
revelou-se como bastante consistente e com um nível de desempenho bastante elevado para ambos
os períodos, sendo superior no período de previsão. O método de random forest apresentou diferenças
relativamente ao desempenho do modelo sazonal uma vez que os parâmetros de desempenho foram
inferiores comparando com os outros métodos. Para além disso foi o único método que apresentou um
ganho considerável no desempenho com a consideração das deformações da fundação. Para este
caso, o método de interpretação quantitativa apresentou um desempenho consistente, embora inferior
ao dos métodos referidos anteriormente para o período de aprendizagem. No entanto, para o período
de previsão apresenta um desempenho bastante superior ao verificado para o período de
aprendizagem (um pouco à semelhança do método de random forest). Estes modelos aproximaram-se
mais aos dados após 2000 (mais campanhas de observação e um período mais longo) que tenderá a
ser o comportamento futuro. Mostrando que os fenómenos subjacentes ao deslocamento observado
são identificados pelos métodos apresentados.
Para esta grandeza de comportamento estrutural da barragem o modelo sazonal do efeito térmico não
demonstrou ser uma solução eficaz para a descrição do deslocamento radial em todos os métodos de
aprendizagem automática, uma vez que apresentou o pior desempenho em ambos os períodos e, pelo
contrário, a consideração das medições das temperaturas para descrever o efeito térmico no
comportamento estrutural demonstrou ser uma melhor opção.
Mais uma vez não se revelaram diferenças significativas na redução do número de medições de
temperatura a ter em conta nos modelos para o seu desempenho, mas ao contrário do verificado
anteriormente as deformações da fundação só tiveram influência no desempenho dos modelos no
método de random forest, enquanto nos outros métodos não teve efeito relevante.
77
Capítulo 6
Considerações finais e
desenvolvimentos futuros
6 Considerações finais e desenvolvimentos
futuros
78
Este estudo teve como objetivos: i) explorar a aplicação de métodos de aprendizagem automática ao
controlo de segurança estrutural de barragens; ii) testar possíveis variantes às formulações tradicionais
de modelação do comportamento estrutural e que têm como base o princípio da separação de efeitos
(hidrostático, térmico e tempo).
Estes objetivos partiram de estudos anteriores, sendo que o trabalho aqui desenvolvido trouxe
inovação:
Ao longo deste trabalho foi possível concretizar os objetivos propostos através do caso de estudo que
teve como incidência a caracterização do comportamento estrutural da barragem do Alto Lindoso
através da elaboração de modelos para a interpretação do comportamento do deslocamento radial no
fio de prumo FP3 à cota 326,5 metros e à cota 232,7 metros. A metodologia de trabalho adotada
consistiu no desenvolvimento e comparação de modelos do tipo HST (Hydrostatic-Season-Time), HTT
(Hydrostatic-Temperature-Time), já consolidados no estado da arte, e HTFT, proposto no âmbito da
dissertação. Cada uma destas formulações foi desenvolvida através da utilização do método de
regressão linear múltipla (método tradicionalmente utilizado em Engenharia de Barragens) e do método
de redes neuronais artificiais e do método random forest. Para cada método foram desenvolvidos sete
modelos, numerados de um a sete: um do tipo HST, dois do tipo HTT e quatro do tipo HTFT. Os
modelos HTFT consideram, para o efeito das deformações na fundação, os deslocamentos medidos
em extensómetros de varas localizados a montante e a jusante no bloco da barragem em estudo. As
variantes apresentadas no HTFT resultam de transformações lineares das variáveis associadas à
deformação da fundação.
Dos resultados obtidos e analisados podemos concluir que o método tradicional de regressão linear
múltipla é eficaz e consistente na elaboração de modelos em ambos os deslocamentos analisados e
apresenta as vantagens de ser simples, além de já ter a sua qualidade comprovada devido à sua longa
utilização nesta área. Os restantes métodos (redes neuronais artificiais e random forest) apresentaram
desempenhos bastante interessantes e comparáveis ao método tradicional. Esta possibilidade de
desenvolver e comparar modelos com recursos a diversas técnicas de aprendizagem é uma mais-valia
já que permite ter uma certa redundância de modelos. Um aspeto de particular importância é que os
modelos de redes neuronais e os de random forest aparentam ser mais sensíveis ao domínio de
aprendizagem. Isto pode ser ainda mais relevante em grandezas que apresentem fenómenos
79
evolutivos ao longo do tempo.
O modelo que considera o efeito térmico através de uma função sinusoidal de período anual (modelos
tipo HST) apresentou bons resultados para a interpretação do deslocamento radial à cota superior. Os
modelos HST apresentam também a vantagem de se poder caracterizar o comportamento observado
conhecendo o dia do ano da observação e a altura da água no reservatório. Este é um dos principais
motivos de serem a formulação expedita mais utilizada nas atividades de acompanhamento do
comportamento estrutural de barragens, embora se verifiquem ganhos quando se altera para modelos
que considerem medições das temperaturas (modelos do tipo HTT e HTFT). Foi também possível
demonstrar para ambos os casos que é possível selecionar/identificar um número reduzido de variáveis
independentes (neste caso, associadas ao número de medições de temperatura a considerar no
modelo) sem alterações significativas de desempenho através de uma análise de
relevância/importância (por exemplo através da análise do nível de significância da variável
independente). No modelo HTFT verificou-se que a consideração das medições das deformações da
fundação originou uma melhoria nos desempenhos, no entanto também implica um aumento de dados
necessários e a sua importância nos modelos é superior para a cota superior. Para isso são necessárias
campanhas de medições completas, nas quais as grandezas devem, preferencialmente, ser medidas
no mesmo momento.
Os resultados permitiram atingir os objetivos propostos e dar mais um passo na exploração do uso
destes métodos e formulações na área de observação de comportamento estrutural de barragens.
Na continuação desta dissertação seria interessante abordar a exploração de novas formulações para
descrever o comportamento estrutural, realizar uma análise de sensibilidade entre as diferentes
variáveis nos diferentes modelos, potencialmente utilizar estes métodos para a identificação de
situações atípicas de forma automática, quer ao nível de dados quer ao nível do comportamento
estrutural observado. Podem ainda serem testados outros métodos de aprendizagem automática ou
variações dos utilizados que têm dado provas de consistência e qualidade como por exemplo redes
neuronais artificias recorrentes, modelos autorregressivos ou máquina de vetores de suporte [YJ19]
[SH18] [SF17]. Apesar de neste trabalho não ter sido realizada uma análise em termos computacionais,
seria interessante verificar estas questões para casos em que o poder computacional se torne mais
relevante devido á quantidade de dados e analisar ajustes aos métodos utilizados a nível de parâmetros
para identificar a melhor combinação. Num futuro, este conhecimento adquirido poderá potenciar novos
estudos que permitam tirar partido de forma mais integrada das relações das diversas grandezas
observadas neste sistema que é constituído pela albufeira, a barragem e a sua fundação.
80
Referências Bibliográficas
Referências Bibliográficas
[AF09] Amberg, F. (2009). Interpretative models for concrete dam displacements. 23rd ICOLD
Congress, Maio 25-29 2009, Brasília, Brasil.
[AN16] Afanador, N.; Smolinska, A.; Tran, T. (2016). Unsupervised random forest: a tutorial with
case studies. Journal of chemometrics, Volume 30, Issue 5, Maio 2016, p232-241.
[BA19] Belmokre, A.; Mihoubi, M.; Santillan, D. (2019). Seepage and dam deformation analyses
with statistical models: support vector regression machine and random forest. Procedia
Structural Integrity, Volume 17, Setembro 2019, p698-703.
[BI00] Basheer, I.; Hajmeer, M. (2000). Artificial neural networks: fundamentals, computing,
design, and application. Journal of Microbiological Methods, Volume 43, Issue 1,
Dezembro 2000, p3-31.
[BM20] Bharti, M.; Sharma, M.; Islam, N. (2020). Study on the Dam & Reservoir, and Analysis of
Dam Failures: A Data Base Approach. International Research Journal of Engineering and
Technology, Volume 7, Issue 5, Maio 2020, p1661-1669.
[BP14] Bukenya, P.; Moyo, P.; Beushausen, H.; Oosthuizen, C. (2014). Health monitoring of
concrete dams: A literature review. Journal of Civil Structural Health Monitoring, Volume 4,
Issue 4, Novembro 2014, p235-244.
[CA12] Cutler, A.; Cutler, D.; Stevens, J. (2012). Random Forests. p157-175 In: Zhang C., Ma Y.
(eds) Ensemble Machine Learning. Springer, Nova Iorque, ISBN: 978-1-4419-9325-0.
[CC14] Curt, C.; Gervais, R. (2014). Approach to improving the quality of data used to analyse
dams - Illustrations by two methods. European Journal of Environmental and Civil
Engineering, Volume 18, Issue 1, Janeiro 2014, p87-105.
[DP13] Duffaut, P. (2013). The traps behind the failure of Malpasset arch dam, France, in 1959.
81
Journal of Rock Mechanics and Geotechnical Engineering, Volume 5, Issue 5, Outubro
2013, p.335–341.
[EB93] Ellingwood B.; Corotis, R.; Boland, J.; Jones, N. (1993). Assessing Cost of Dam Failure.
Journal of Water Resources Planning and Management, Volume 119, Issue 1, Janeiro
1993, p64-82.
[FEMA14] Federal Emergency Management Agency (2014). Selecting Analytic Tools for Concrete
Dams to Address Key Events Along Potential Failure Mode Paths. Federal Emergency
Management Agency, Denver, Colorado, Julho 2014.
[GM17] Gates, M. (2017). Machine Learning: For Beginners – Your Definitive guide For Neural
Networks, Algorithms, Random Forests and Decision Trees Made Simple (eBook Kindle).
Amazon, ISBN: 978-1547039043.
[GM19] Granrut, M.; Simon, A.; Dias, D. (2019). Artificial neural networks for the interpretation of
piezometric levels at the rock-concrete interface of arch dams. Engineering Structures,
Volume 178, Janeiro 2019, p616-634.
[GR05] Genevois, R.; Ghirotti, M. (2005). The 1963 Vajont Landslide. Gironale di Geologia
Applicata, Volume 1, Janeiro 2005, p 41-52.
[GR20] Genuer, R; Poggi, J (2020). Random forests with R. Springer, Cham. ISBN 978-3-030-
56484-1.
[GX18] Guo, X.; Baroth, J.; Dias, D.; Simon, A. (2018). An analytical model for the monitoring of
pore water pressure inside embankment dams. Engineering Structures, Volume 160, Abril
2018, p356-365.
[HAT00] Hodge, A. (2000). Handbook of Ancient Water Technology. Series: Technology and
Change in History. 2. Wikander, Örjan (ed.). Leiden, ISBN: 978-9004111233
[HJ20] Hedge, J.; Rokseth, B. (2020). Applications of machine learning methods for engineering
risk assessment – A review. Safety Science, Volume 122, Fevereiro 2020, 104492.
[HS09] Haykin, S. (2009). Neural Networks and Learning Machines, 3rd Edition, Pearson Education
Inc., Nova Jersey. ISBN 978-0-13-147139-9.
[HS16] Hartshorn, S (2016). Machine Learning With Random Forests And Decision Trees: A Visual
Guide For Beginners (eBook Kindle). Amazon, ASIN: B01JBL8YVK.
[HSW77] Helms, S. (1977). Jawa Excavations 1975: Third Preliminary Report. Levant, Volume 9,
Janeiro 1977, p21-35.
[ICO11] International Commission on Large Dams (2011). Constitution Status, ICOLD, Paris, Julho
2011.
82
[ICO12] ICOLD (2012). Dam Surveillance guide (Bulletin No. 158). ICOLD, Paris, 2012.
[ICO95] ICOLD (1995). Dam failures: statistical analysis (Bulletin No. 99). ICOLD, Paris, 1995.
[JR88] Jansen, R. (1988). Advanced dam engineering for design, construction, and rehabilitation.
Van Nostrand Reinhold (1st edition), Nova Iorque, ISBN:978-1-4612-8205-1.
[KC13] Kao, C.; Loh, C. (2013). Monitoring of long-term static deformation data of Fei-Tsui arch
dam using artificial neural network-based approaches. Structural Control and Health
Monitoring, Volume 20, Issue 11, Novembro 2013, p282-303.
[KF19] Kang, F.; Li, J.; Zao, S.; Wang, Y. (2019). Structural health monitoring of concrete dams
using long-term air temperature for thermal effect simulation. Engineering Structures,
Volume 180, Fevereiro 2019, p642-653.
[KV09] Karbhari, V.; Ansari, F. (2009). Structural health monitoring of civil infrastructure systems.
CRC Press, Nova Iorque, ISBN 978-1-4398-0131-4.
[LI20] Lee, I.; Shin, Y. (2020). Machine learning for enterprises: Applications, algorithm selection,
and challenges. Business Horizons, Volume 63, Issue 2, Março-Abril 2020, p157-170.
[LM13] Ljunggren, M.; Logan, T.; Campbell, P. (2013). Is your dam as safe as your data suggest?.
NZSOLD/ANCOLD Conference,13-15 Novembro 2013, Rotorua, Nova Zelândia.
[LP07] Léger, P.; Leclerc, M. (2007). Hydrostatic, Temperature, Time-Displacement Model for
Concrete Dams. Journal of Engineering Mechanics, Volume 133, Issue 3, Março 2007,
p267-277.
[MJ11] Mata, J. (2011). Interpretation of concrete dam behaviour with artificial neural network and
multiple linear regression models. Engineering Structures, Volume 33, Issue 3, Março
2011, p903-910.
[MJ12] Mata, J.; Castro, A.; Costa, J. (2012). Constructing statistical models for arch dam
deformation. Structural. Control Health Monitoring, Volume 22, Issue 3, Março 2014, p.423-
437.
[MJ13] Mata, J. (2013). Structural Safety Control Of Concrete Dams Aided By Automated
Monitoring Systems. Dissertação de Doutoramento em Engenharia Civil, Instituto Superior
Técnico, Universidade de Lisboa.
[MR16] Malm, R.; Nordström, E.; Nilsson, C.; Tornberg, R.; Blomdahl, J. (2016). Analysis of
potential failure modes and reinstrumentation of a concrete dam. ICOLD Symposium -
Appropriate Technology to Ensure Proper Development, Operation and Maintenance of
Dams in Developing Countries, 15-20 Maio 2016, Joanesburgo, Africa do Sul.
[NNET] Venables, W.N., Ripley, B. D. (2002). Modern Applied Statistics with S. Fourth edition.
83
Springer, Nova Iorque, ISBN 0-387-95457-0, https://www.stats.ox.ac.uk/pub/MASS4/.
[NO20] Nelles, O. (2020). Nonlinear System Identification - From Classical Approaches to Neural
Networks, Fuzzy Models and Gaussian Processes. 2nd Edition, Springer, Cham, ISBN:
978-3-030-47439-3.
[PA13] Popovici, A.; Ilinca, C.; Ayvaz, M. (2013). The performance of the neural networks to model
some response parameters of a buttress dam to environment actions. 9th ICOLD European
Club Symposium, "Sharing Experience for Safe and Sustainable Water Storage", 10-12
Abril 2013, Veneza, Itália.
[PF10] Perner, F.; Obernhuber, P. (2010). Analysis of arch dam deformations. Frontiers of
Architecture and Civil Engineering in China, Volume 4, Issue 1, Março 2010, p102-108.
[PG18] Prakash, G.; Sadhu, A.; Narasimhan, S.; Brehe, J. (2018). Initial service life data towards
structural health monitoring of a concrete arch dam. Structural Control and Health
Monitoring, Volume 25, Issue 1, Janeiro 2018, p20-36.
[PJ02] James, P.; Chanson, H. (2002). Historical Development of Arch Dams. From Roman Arch
Dams to Modern Concrete Designs. Australian Civil Engineering Transactions, Institution
of engineers, Volume CE43, 2002, p39–56.
[QAC86] Quintela, A.; Cardoso, J.; Mascarenhas, J. (1986). Aproveitamentos Hidráulicos Romanos
a Sul do Tejo. Contribuição para a sua inventariação e caracterização. EPAL – Empresa
Portuguesa das Águas Livres, Lisboa.
[R] R Core Team (2020). R: A language and environment for statistical computing. R
Foundation for Statistical Computing, Viena, Austria, https://www.R-project.org/.
[RF] Liaw, A.; Wiener, M. (2002). Classification and Regression by randomForest. R News,
Volume 2/3, Dezembro 2002, p18-22.
[SA13] Simon, A.; Royer, M.; Mauris, F.; Fabre, J. (2013). Analysis and Interpretation of Dam
Measurements using Artificial Neural Networks. 9th ICOLD European Club Symposium,
"Sharing Experience for Safe and Sustainable Water Storage", 10-12 Abril 2013, Veneza,
Itália.
[SCD03] Swiss Committee on Dams (2003). Methods of analysis for the prediction and the
verification of dam behaviour. 21st ICOLD Congress, 16-20 Junho 2003, Montreal, Canadá.
[SF15] Salazar, F.; Toledo, M.; Oñate, E.; Morán, R. (2015). An empirical comparison of machine
learning techniques for dam behaviour modelling. Structural Safety, Volume 56, Setembro
2015, p9-17.
[SF17] Salazar, F. (2017). A machine learning based methodology for anomaly detection in dam
behaviour. Dissertação de doutoramento em Análise Estrutural, Universitat Politecnica de
84
Catalunya.
[SH18] Salehi, H.; Burgueño, R. (2018). Emerging artificial intelligence methods in structural
engineering, Engineering Structures, Volume 171, Setembro 2018, p170-189.
[SK16] Smarsly, K.; Dragos, K.; Wiggenbrock, J. (2016). Machine learning techniques for structural
health monitoring. 8th European Workshop On Structural Health Monitoring, 5-8 Julho
2016, Bilbau, Espanha.
[SW17] Sullivan, W. (2017). Machine Learning for beginners: Algorithms, decision tree & random
forest introduction (eBook Kindle). Healthy Pragmatic Solutions Inc, ASIN : B074YJYWDY.
[TL14] Tanchev, L (2014). Dams and Appurtenant Hydraulic Structures (2nd edition). CRC
Press/Balkema, Leiden, ISBN: 978-1-138-00006-3.
[TW17] Taffese, W.; Sistonen, E. (2017). Machine learning for durability and service-life
assessment of reinforced concrete structures: Recent advances and future directions.
Automation in Construction, Volume 77, Maio 2017, p1-14.
[UG13] Uyanik, G.; Güler, N. (2013). A Study on multiple linear regression analysis. Procedia -
Social and Behavioral Sciences, Volume 106, Dezembro 2013, p234-240.
[WK10] Worden, K.; Staszewski, W; Hensman, J. (2010). Natural computing for mechanical
systems research: A tutorial overview. Mechanical Systems and Signal Processing,
Volume 25, Issue 1, Janeiro 2011, p4-111.
[YJ19] Yang, J.; Qu, X.; Chang, M. (2019). An intelligent singular value diagnostic method for
concrete dam deformation monitoring, Water Science and Engineering, Volume 12, Issue
3, Setembro 2019, p205-212.
[NNW05] Wolfram Research, Inc (2005). Mathematica: Neural Networks Train and analyze neural
networks to fit your data A language and environment for statistical computing. Wolfram
Research, Inc, Illinois, EUA. https://www.wolfram.com/
[CNP1] https://cnpgb.apambiente.pt/gr_barragens/gbportugal/FICHAS/AltoLindosoficha.htm,
consultado a 10 de Janeiro de 2021.
[EDP1] https://www.edp.com/pt-pt/partilha-do-conhecimento/reabilitacao-de-barragens,
85
consultado a 5 de Maio de 2021.
[MC1] https://medium.com/the-theory-of-everything/understanding-activation-functions-in-
neural-networks-9491262884e0/, consultado a 16 de Março de 2021.
[TD1] http://portugalfotografiaaerea.blogspot.com/2012/08/barragem-do-alto-lindoso.html,
consultado a 9 de Janeiro de 2021.
86
Anexo A
87
A.1 Gráficos dos modelos de IQ dos deslocamentos radiais no
FP3 à cota 232,7m
Figura A.1. Observações e resultados do modelo IQ1 para o deslocamento radial no FP3-232,7m.
Figura A.2. Observações e resultados do modelo IQ2 para o deslocamento radial no FP3-232,7m.
Figura A.3. Observações e resultados do modelo IQ3 para o deslocamento radial no FP3-232,7m.
Figura A.4. Observações e resultados do modelo IQ4 para o deslocamento radial no FP3-232,7m.
88
Figura A.5. Observações e resultados do modelo IQ5 para o deslocamento radial no FP3-232,7m.
Figura A.6. Observações e resultados do modelo IQ6 para o deslocamento radial no FP3-232,7m.
Figura A.7. Observações e resultados do modelo IQ7 para o deslocamento radial no FP3-232,7m.
89
A.2 Gráficos dos modelos de NN dos deslocamentos radiais no
FP3 à cota 232,7m
Figura A.8. Observações e resultados do modelo NN1 para o deslocamento radial no FP3-232,7m.
Figura A.9. Observações e resultados do modelo NN2 para o deslocamento radial no FP3-232,7m.
Figura A.10. Observações e resultados do modelo NN3 para o deslocamento radial no FP3-232,7m.
Figura A.11. Observações e resultados do modelo NN4 para o deslocamento radial no FP3-232,7m.
90
Figura A.12. Observações e resultados do modelo NN5 para o deslocamento radial no FP3-232,7m.
Figura A.13. Observações e resultados do modelo NN6 para o deslocamento radial no FP3-232,7m.
Figura A.14. Observações e resultados do modelo NN7 para o deslocamento radial no FP3-232,7m.
91
A.3 Gráficos dos modelos de RF dos deslocamentos radiais no
FP3 à cota 232,7m
Figura A.15. Observações e resultados do modelo RF1 para o deslocamento radial no FP3-232,7m.
Figura A.16. Observações e resultados do modelo RF2 para o deslocamento radial no FP3-232,7m.
Figura A.17. Observações e resultados do modelo RF3 para o deslocamento radial no FP3-232,7m.
Figura A.18. Observações e resultados do modelo RF4 para o deslocamento radial no FP3-232,7m.
92
Figura A.19. Observações e resultados do modelo RF5 para o deslocamento radial no FP3-232,7m.
Figura A.20. Observações e resultados do modelo RF6 para o deslocamento radial no FP3-232,7m.
Figura A.21. Observações e resultados do modelo RF7 para o deslocamento radial no FP3-232,7m.
93