Escolar Documentos
Profissional Documentos
Cultura Documentos
1. Introdução
1.1. Motivação
Com o passar dos anos, a meteorologia vem se tornando uma ciência mais quantitativa e vin-
culada a Tecnologia da Informação (TI). As técnicas utilizadas na previsão do tempo evoluíram
consideravelmente, focando na aplicação de modelos acessíveis e mais precisos para a tomada
de decisão. O surgimento dos sistemas numéricos de previsão do tempo é resultado da rela-
ção do uso da tecnologia com o estudo dos fenômenos meteorológicos, contudo, esses sistemas
são muito sensíveis à variação dos dados. Eles consideram um grande volume de variáveis na
forma de parâmetros microfísicos, esquemas convectivos, interações atmosféricas, interações
solo-superfície e comportamento de radiação. Uma ligeira alteração em qualquer um desses
parâmetros, tem a capacidade modificar significativamente o resultado do modelo de previsão.
Mudanças climáticas são fenômenos naturais de diferentes proporções, que impactam
diretamente a sociedade e o ecossistema. Elas podem abranger pequenas áreas territoriais como
cidades, até faixas territoriais mais extensas, podendo ocorrer até a nível global. As estatísticas
apontam que eventos climáticos extremos, tais como: tempestades, secas intensas, dentre outros
estão cada vez mais frequentes e intensos em todo planeta.
Desse modo, a sociedade precisa se adaptar a esta realidade, criando ferramentas que
permitam antecipar fenômenos climáticos severos, como grandes tempestades. Isso permite que
a Defesa Civil se prepare e seja capaz de amenizar as consequências provocadas por fenômenos
climáticos de grande intensidade, tendo um perfil mais preditivo ao invés de reativo.
Como exemplo, no ano de 2021, o município de Patos de Minas em Minas Gerais,
enfrentou a maior quantidade de chuvas em 20 anos, e consequentemente, um dos maiores re-
gistros pluviométricos de toda sua história. Dessa forma, se a Defesa Civil do município tivesse
a sua disposição um sistema computacional inteligente, que através de "padrões"fosse capaz de
detectar com alta margem de antecedência fenômenos climáticos de grande magnitude, o muni-
cípio seria capaz de mitigar a quantidade de desgastes naturais, ambientais, perdas financeiras e,
principalmente, de vidas que são acometidas todos os anos.
Dessa forma, esse trabalho tem como motivação, contribuir para a mitigação de danos e
desastres provocados por tempestades. Estudos e descobertas no campo da Inteligência Artificial
podem contribuir significativamente no enfrentamento desse problema, como por exemplo, a
aplicação de Regras de Associação, sendo utilizadas na identificação de padrões, que possam
ajudar a Defesa Civil, não somente do município de Patos de Minas - MG, na atenuação e
redução de desastres.
Considerando os impactos causados por tempestades e a falta de padrões que permitam os agen-
tes públicos a identificar esses fenômenos em tempo hábil, com possibilidade de mitigar os
danos ambientais, econômicos e sociais decorridos, o uso de Regras de Associação se apresenta
como uma alternativa viável para encontrar padrões através da análise de conjunto de dados
climatológicos.
Assim, o objetivo geral desse trabalho é identificar Regras de Associação que permitam
identificar com precisão e boa margem de antecedência o surgimento de mudanças climáticas
recorrentes de grande impacto, como tempestades, municiando a Defesa Civil de informação e
recursos que possam auxiliar a prevenção de desastres provocados por esses fenômenos. Para
tal, este estudo se propõe a desenvolver métodos de seleção para otimização dos padrões encon-
trados.
Os objetivos específicos são:
* Construir um sistema computacional inteligente que faça a geração de Regras de As-
sociação utilizando conjuntos de dados de clima;
* Construir os conjuntos de dados que serão utilizados no desenvolvimento do sistema
computacional inteligente;
* Otimizar o sistema computacional inteligente utilizando Algoritmos Genéticos (AGs)
na busca de resultados mais assertivos;
* Fornecer para a Defesa Civil de Patos de Minas - MG conhecimento que possa ser
utilizado na tomada de decisão.
1.3. Hipótese
Para efeito, o município de Patos de Minas - MG foi selecionado como referência para os estudos
e experimentos realizados nessa pesquisa, pois o orientador dessa pesquisa, o Prof. Dr. Laurence
Rodrigues do Amaral, é o diretor acadêmico do Centro Universitário de Estudos de Pesquisas
sobre Desastres e Mudanças Climáticas (CEPED) da Defesa Civil de Patos de Minas - MG. O
CEPED surgiu com o propósito de contribuir para prevenção, redução, mitigação, resposta e
recuperação de desastres na região do Alto Paranaíba e Noroeste Mineiro. O CEPED/Patos de
Minas foi criado através do Decreto nº 4452 de 24 de abril de 2018, baixado pelo Prefeito José
Eustáquio Rodrigues Alves, que institui o sistema Simpdec - Sistema Municipal de Proteção e
Defesa Civil.
Perguntas associadas a hipótese do trabalho:
Os dados climáticos de municípios vizinhos são bastante pertinentes para pesquisa, visto
que eventos meteorológicos em regiões próximas, tem grande possibilidade de estarem correla-
cionados com o surgimento de tempestades e outras alterações climáticas em uma região.
A aplicação de regas de associação em diversos datasets, (desde datasets com dados
climáticos do município de Patos de Minas, quanto em municípios vizinhos) permite a identifi-
cação de padrões. Desse modo, justifica-se a necessidade de uma pré-seleção, visando selecionar
os padrões mais eficazes para o objetivo da pesquisa.
Nesse ponto, os Algoritmos Genéticos serão de grande utilidade, através de testes e
regulagem dos parâmetros de ajuste dos métodos. A expectativa é conseguir filtrar padrões
confiáveis que apresentam resultados significativos para serem utilizados em situações reais.
1.4. Contribuições
2. Geração de regras de alto nível (SE-ENTÃO) para o município de Patos de Minas à partir
dos datasets analisados.
2.1. Meteorologia
Temperatura e Calor são outros dois termos distintos, que em muitas situações do quotidiano
são erroneamente utilizados de maneira semelhante.
A definição de temperatura extrapola o campo da meteorologia, sendo proveniente da
Física. A temperatura de um corpo é caracterizada pelo grau de agitação de suas moléculas
(MIRANDA, 2001).
Já o calor, retrata uma troca de temperaturas. Mais precisamente, calor se refere ao fluxo
de energia de um corpo mais quente para um corpo mais frio. Quando o calor se transfere de
um corpo para outro, a temperatura do corpo mais quente cai, enquanto a temperatura do corpo
mais frio sobe, buscando um equilíbrio térmico entre os dois corpos (CUNHA, 2003).
2.2. Tempestades
Embora o clima, tempo, temperatura, umidade entre outros elementos climáticos sejam essen-
ciais na compreensão dos fenômenos meteorológicos, o grande foco da meteorologia reside nas
técnicas de previsão do tempo. Todo o conjunto de processos físicos capazes de provocar alte-
rações atmosféricas (umidade e formação de nuvens, movimento das massas de ar, as mudanças
de estações do ano, a influência da lua e de outros corpos celestes, etc...) compõem o conjunto
de fenômenos que são analisados para se chegar a previsão do tempo Ahrens e Henson (2018).
Seguindo estes conceitos, a análise da previsão do tempo considera uma faixa de período futuro
em que se pretende dimensionar as alterações atmosféricas. Entre as diferentes faixas de pe-
ríodo de tempo, podemos destacar: nowcast (previsões de poucas horas), short-range forecast
(previsões de 12 a 72 horas) e medium-range forecast (previsões de 3 até 8 dias) (AHRENS;
HENSON, 2018). A previsão do tempo possui o intuito de prover informações úteis e preci-
sas que auxiliem a tomada de decisões da sociedade, em relação aos efeitos e consequências
causadas pelas mudanças climáticas.
A previsão do tempo consiste na combinação de um diagnóstico com um prognóstico
(DOSWELL, 1991). Os modelos de previsão atuais se baseiam em associar os prognósticos
sinópticos com a previsão numérica. Inicialmente, os meteorologistas diagnosticam o estado
atmosférico atual analisando vários parâmetros climáticos. O diagnóstico da situação atual é
combinado com a saída de um modelo numérico com a intenção de gerar uma tendência (prog-
nóstico) (DOSWELL, 1991). Os prognósticos trabalham com cartas isobáricas de superfície
(nível de 1000 mb), com indicação de frentes de massas de ar, cartas de vento (na superfície e
em altitude), de temperatura, de divergência de umidade, diagramas adiabáticos da atmosfera
entre outros indicadores (SENTELHAS et al., 2007).
O reconhecimento de padrões é um processo de alta relevância para a previsão do tempo.
O reconhecimento de padrões é utilizado para determinar a complexidade das previsões climá-
ticas. Este processo combina todos os dados disponíveis (independentemente de sua relevância
para as equações utilizadas no modelo numérico), experiência, teoria e conceitos em uma ima-
gem quadridimensional da atmosfera (MOLLER, 2001). O grande desafio da previsão do tempo
é realizar previsões com alta margem de antecedência (bem a frente do tempo atual), possuindo
baixa qualidade e precisão de dados (depende muito das condições do ambiente e das tecnolo-
gias utilizadas).
2.3. Computação
Podemos definir a Inteligência Artificial (IA), como o sub-ramo das Ciência da Computação
capaz de executar tarefas, e analisar problemas de maneira análoga a inteligência humana. Pro-
gramas de computador, máquinas e diferentes tipos de dispositivos “inteligentes” são utilizados
em conjunto com algoritmos e técnicas de IA.
O conceito de Inteligência Artificial (IA) foi proposto por John McCarthy, professor
de matemática, ao convocar um grupo de cientistas para um seminário no Dartmouth College,
em Hanover, no estado americano de New Hampshire no ano de 1956. O estudo proposto no
seminário era para prosseguir com a conjetura básica de que cada aspecto da aprendizagem ou
qualquer outra característica da inteligência pode, em princípio, ser descrita tão precisamente a
ponto de ser construída uma máquina para simulá-la (RUSSELL et al., 2010).
Do ponto de vista de uma máquina de Turing, os programas e métodos da IA são em
grande parte, parcialmente ou totalmente não determinísticos. Isso é, para uma dada pergunta
ou conjunto problema, o caminho de resolução dificilmente será percorrido da mesma maneira
em uma nova execução, mas trará sempre um resultado semelhante.
É uma área de estudos multidisciplinar que envolve principalmente a computação e ro-
bótica, mas que vem ganhando novas vertentes como a bioinformática e a nanotecnologia. Algu-
mas novas e promissoras tecnologias surgiram a partir da IA, como o Aprendizado de Máquina,
Aprendizagem Profunda, Processamento de Linguagem Natural e Ciência de Dados.
2.4. Redes Neurais
As Redes Neurais (RN) são uma parte da IA que buscam resolver os problemas simulando o
funcionamento do cérebro humano, utilizando estruturas análogas aos neurônios e suas ligações
(axônios). Haykin e Engel (2001) definem uma rede neural como uma máquina de proces-
samento paralelo que transforma conhecimento experimental em informações úteis. As redes
neurais se comportam como redes entrelaçadas, onde cada neurônio analisa uma vertente ou
variável do problema. O resultado de cada um é ponderado usando-se pesos definidos para cada
grupo ou cada etapa de avaliação.
Segundo (LECUN; BENGIO, 1995) a rede neural parte de um conjunto de neurônios
artificiais agrupados em diversas camadas com ou sem subníveis, e instanciados com pesos
aleatórios que são ajustados a cada época de treinamento com base na retro propagação do erro
calculado entre a saída da rede e valor do rótulo que deveria ser obtido.
Existem subclasses de redes neurais, cada uma especializada em determinada tarefa. As
redes neurais convolucionais (CNNs) são um subgrupo de redes neurais criadas por LeCun e
Bengio com a proposta de aplicar operações lineares e não lineares por meio de filtros convo-
lucionais dispostos entre as camadas da rede neural. Esses modelos de redes recentemente vêm
ganhando destaque nas etapas de processamento e análise de imagens digitais por causa da sua
capacidade de extrair características e avaliar nativamente as informações espaciais.
O conceito inicial de Algoritmos Genéticos (AGs) foi elaborado pelo pesquisador John Henry
Holland (1968) e posteriormente aprimorado pelo pesquisador David E. Goldberg (1988). Os
conceitos evolutivos estabelecidos por Charles Darwin serviram como a principal inspiração.
De acordo com Darwin, os indivíduos que possuem características favoráveis têm mais chances
de sobreviver e se reproduzir do que aqueles com características menos favoráveis, e também
com inspiração na biologia genética,
Os AGs se baseiam num processo coletivo de aprendizagem dentro de uma população de
indivíduos, cada um dos quais representando um ponto no espaço de busca de soluções para um
dado problema. A população é inicializada e evolui através de gerações com o uso de operadores
de seleção, reprodução e mutação (FILHO, 2001).
AGs aplicam técnicas de busca, otimização e seleção, com ampla gama de possibilidades
em diversas áreas de aplicação. Eles podem ser utilizados em robótica, na determinação da
trajetória de movimento de braços mecânicos e no projeto e controle de robôs (DAVIS, 1991), na
otimização de funções matemáticas (CHEN et al., 2015), em roteamento de pacotes (BUENO;
OLIVEIRA, 2016), na bioinformática (POND et al., 2006), entre outras aplicabilidades.
No contexto das tarefas de previsão de tempo e clima, feitas por redes neurais artificiais,
os AGs podem ser usados para otimizar os parâmetros dessas redes como demostra (TORMO-
ZOV et al., 2020) e no estudo de séries temporais em dados hidrológicos temos (HUANG;
WANG, 2011). Segundo (PULIDO et al., 2011), é possível a otimização dos modelos (ensem-
bles) de redes neurais pelos AGs, para análise e predição de séries temporais complexas.
3. Método de Pesquisa
O primeiro passo da pesquisa aqui proposta é a coleta de dados (construção do dataset). Será
considerado os dados meteorológicos do município de Patos de Minas, MG. O objetivo, é iden-
tificar padrões nos dados climáticos que permitam identificar o surgimento de tempestades na
região. É importante ressaltar, que os dados utilizados não se limitarão às fronteiras do muni-
cípio, visto que chuvas, ventos fortes e demais indícios de temporais podem ser oriundos do
deslocamento de massas de ar, mudanças de temperatura, umidade, entre outros fenômenos cli-
máticos detectados há vários quilômetros de distância. Portanto, o dataset utilizado na pesquisa
irá abranger dados climáticos coletados por estações meteorológicas espalhadas no raio de mu-
nicípios limítrofes.
O processo de coleta de dados será iniciado pela escolha dos dados que serão utilizados.
Existe uma vasta quantidade de variáveis e parâmetros meteorológicos formatados de modo in-
congruente, não validados, encontrados em diferentes tipos de bases de dados. A tarefa de coleta
de dados apresentará diversos problemas. Embora se consiga obter dados de diferentes períodos
históricos, algumas bases de dados apresentam informações esparsas, períodos históricos sem
registro, dados não padronizadas e em muitos casos, há um grande volume de dados desnecessá-
rios. Desse modo, as tarefas de organizar, agrupar e filtrar dados relevantes a pesquisa se mostra
uma etapa árdua, com alta demanda computacional e difícil de otimizar.
Considerando todos os pontos levantados acerca da escolha da fonte de dados, duas
fontes de dados se apresentam como as mais viáveis a serem utilizadas: a rede INMET e RE-
DEMET. Em relação a estas duas fontes de dados, serão priorizados os dados das estações
climáticas da REDEMET em detrimento aos dados da rede INMET. A razão da escolha, é por-
que as estações da rede INMET em Patos de Minas estão há um bom período de tempo sem
manutenção. Os datasets do Instituto Nacional de Meteorologia (INMET) são organizados por
ano (datasets anuais, obtidos durante décadas de coleta e medição), sendo um arquivo também
para cada estação. Dessa forma, algumas estações da rede INMET localizadas na faixa geográ-
fica da pesquisa possuem lapsos temporais sem registro de captação de informações climáticas,
o qual problema não ocorre com dados da REDEMET. Contudo, no decorrer da pesquisa, caso
for necessário maior volume de dados ou outra fonte de dados além dos dados da REDEMET,
poderão ser utilizados os dados meteorológicos da rede INMET ou outra fonte de dados.
A REDEMET possui uma API para comunicação com seus dados meteorológicos. As-
sim, o primeiro passo é desenvolver uma aplicação para consumir dados da API REDEMET
e gerar datasets com as informações relevantes. A Figura 1 ilustra o funcionamento do pro-
cesso. Esse passo é muito importante porque ao acessar a API da REDEMET, a aplicação será
responsável por extrair apenas dados pertinentes a pesquisa e formatá-los, caso estejam despa-
dronizados.
4. Resultados Esperados
Através do progresso dos estudos desse trabalho, espera-se, que seja construído um sistema
computacional que seja capaz de identificar um conjunto de regras de associação que deter-
minem padrões relacionados ao surgimento de fenômenos climáticos de grande intensidade na
região. Esse sistema computacional deve ser capaz de detectar e alertar sobre a iminência de
tempestades, vendavais e demais fenômenos climáticos que possam gerar danos a sociedade,
a fim de que as medidas de segurança necessárias sejam tomadas em tempo hábil pela Defesa
Civil. Por fim, espera-se que seja possível otimizar os resultados computacionais, com o uso de
Algoritmos Genéticos.
5. Cronograma de Execução
Na Tabela 1 são apresentadas o cronograma de atividades previstas para a conclusão deste pro-
jeto. O cronograma está dividido em 4 tópicos.
Em setembro de 2022, o meu pai, Vicente de Paula Coelho, foi diagnosticado com um sério
problema de saúde. Ele estava apresentando fortes dores abdominais e já apresentava sintomas
de problemas renais há algum tempo, porém esses sintomas se intensificaram e procuramos
auxílio médico. O resultado dos exames ultrassonográfico dos rins, abdômen e próstata (que se
encontra em anexo) detectou a presença de aneurisma da artéria aorta abdominal com diâmetro
5,6 cm. (A próstata também está com tamanho acima do normal, porém não é um problema
tão urgente quanto o aneurisma) Além da presença do aneurisma, o exame detectou trombose
na região do aneurisma, havendo início de rompimento de vasos sanguíneos. O aneurisma na
artéria aorta é um problema sério, visto que o seu rompimento causa morte instantânea. A
presença de vazamento de sangue e trombose é um péssimo agravante. O médico que analisou
o caso nos indicou realizar um procedimento cirúrgico para remover o aneurisma, contudo esta
cirurgia indicada por ele é de alto risco e possui complicações devido à idade do meu pai e o fato
dele ser tabagista. O médico orientou que o deveríamos procurar tratamento cirúrgico o mais
rápido possível (em um prazo de máximo 6 meses) pois após esse prazo, o risco de rompimento
seria alto. Decidimos procurar a opinião de outros médicos para avaliar o melhor procedimento.
Nós residimos em Patos de Minas, procuramos opções de tratamento em Patos de Minas,
Uberlândia e Belo Horizonte. Eu acompanhei o meu pai nas consultas e exames que ele realizou
no período. O meu pai foi orientando a manter repouso absoluto e evitar pegar qualquer tipo
de peso, o que me exigiu dirigir, acompanhá-lo e ajuda-lo com cuidados pessoais durante o
período. Além disso, todo o ocorrido causou um grande impacto emocional e psicológico em
mim, no meu pai e em todos da família. Portanto, todos os acontecimentos e desdobramentos do
problema de saúde do meu pai, me impossibilitaram de conseguir terminar o projeto no prazo
estipulado em dezembro de 2022.
Eu também tinha alguns problemas de saúde que necessitavam de cirurgia há algum
tempo e devido ao problema de saúde mais emergencial do meu pai, eu fui obrigado a adiar
estas cirurgias. Há muito tempo eu sofro com problema de hemorróidas, o qual, o médico que
me acompanhava já havia me indicado fazer cirurgia para o problema. Além disso, eu sofro
problema de baixa visão, e já me havia sido indicada cirurgia refrativa, pois os óculos já não
estavam corrigindo a minha visão a um nível aceitável.
Eu já havia adiado o máximo de tempo que eu podia, e no dia 28/12/22 eu realizei a
Hemorroidectomia conforme atestado em anexo. Já no dia 18/01/2023, eu realizei cirurgia de
correção visual conforme atestado também em anexo. Durante o prazo do atestado de ambas ci-
rurgias, eu não consegui trabalhar no projeto. A cirurgia refrativa da visão tem uma recuperação
lenta e progressiva. A visão demora estabilizar e conforme explicado pelo médico, nos primei-
ros meses eu apresento uma alta sensibilidade na visão (resistência e incômodo a luz como a luz
do sol e a luz UV das telas de computadores, celulares e afins) o que dificulta ficar por muito
tempo a frente do computador. O tratamento aconselhável do pós-operatório é evitar contato
com fontes luminosas (manter um uso moderado) aliado ao uso de colírios e acompanhamento
médico constante nos primeiros meses até a estabilização da visão.
Durante os meses de fevereiro e março, eu tive problemas relacionados a recuperação
desta cirurgia. Eu apresentei visão ofuscada, escurecimento das vistas, muita dor de cabeça, e
dificuldade de enxergar devido a minha rotina de trabalho e de estudos que me exigiam utilizar o
computador por várias horas no dia. Assim, eu precisei me ausentar das minhas atividades para
descansar a visão seguindo orientação médica. Em anexo apresento os atestados relacionados.
Por fim, no final de março, eu tive dengue, o qual eu apresento atestado também em anexo.
Apesar de todo atraso na entrega do projeto, o planejamento feito pelo orientador e por
mim será realizado em 2023 conforme o cronograma, não prejudicando a conclusão do trabalho
de mestrado.
Referências
LECUN, Y.; BENGIO, Y. Convolutional networks for images, speech, and time-series. In: AR-
BIB, M. A. (Ed.). The Handbook of Brain theory and Neural Networks. [S.l.]: MIT Press,
1995. Citado na página 9.
MOLLER, A. R. Severe local storms forecasting. In: Severe Convective Storms. Boston,
MA: American Meteorological Society, 2001, (Meteorological Monographs). p. 433–480. ISBN
1935704060. Citado 2 vezes nas páginas 7 e 8.
POND, S. L. K.; POSADA, D.; GRAVENOR, M. B.; WOELK, C. H.; FROST, S. D. GARD: a
genetic algorithm for recombination detection. Bioinformatics, v. 22, n. 24, p. 3096–3098, dez.
2006. ISSN 1367-4803, 1460-2059. Disponível em: <https://academic.oup.com/bioinformatics/
article-lookup/doi/10.1093/bioinformatics/btl474>. Citado na página 10.
PULIDO, M.; MELIN, P.; CASTILLO, O. Genetic optimization of ensemble neural networks
for complex time series prediction. In: The 2011 International Joint Conference on Neural
Networks. San Jose, CA, USA: IEEE, 2011. p. 202–206. ISBN 978-1-4244-9635-8. Disponível
em: <http://ieeexplore.ieee.org/document/6033222/>. Citado na página 10.
RUSSELL, S. J.; NORVIG, P.; DAVIS, E. Artificial intelligence: a modern approach. 3rd
ed. ed. Upper Saddle River: Prentice Hall, 2010. (Prentice Hall series in artificial intelligence).
ISBN 978-0-13-604259-4. Citado na página 8.