Você está na página 1de 19

PLANO DE TRABALHO

Programa de Mestrado em Ciência da Computação


Universidade Federal de Uberlândia

Aluno: Guilherme Antonio Coelho Neto

Orientador: Prof. Dr. Laurence Rodrigues do Amaral

Título: Utilizando Regras de Associação para a Mitigação de Desastres


Provocados por Fenômenos Climáticos

Data de Início como Aluno Regular: Março de 2022


Previsão da Defesa: Fevereiro de 2024

1. Introdução

A meteorologia é um campo de pesquisa em constante evolução e aprimoramento científico. Na


atualidade, os modelos de previsão de tempo desempenham um importante papel na sociedade.
A dinâmica da vida moderna exige planejamento das pessoas, e a previsão do tempo permite
que a sociedade planeje suas atividades considerando os impactos provocados pelas mudanças
climáticas, possibilitando melhores tomadas de decisões.
No Brasil, os sistemas de previsão do tempo do INMET e da REDEMET são iniciativas
tecnológicas que fornecem dados e modelos estatísticos voltados a previsão climática. Estes
modelos de previsão se baseiam na coleta de dados atmosféricos por estações meteorológicas,
localizadas em locais estratégicos, espalhadas por todo país. Contudo, na iminência de grandes
temporais, tais ferramentas não emitem alertas em tempo real para proteção da população. Isso
é causado pelo fato dos dados meteorológicos não serem conectados aos sistemas da Defesa
Civil, e também os municípios não possuírem um sistema capaz de identificar temporais através
da análise de dados climáticos por métodos de inteligência artificial.
Desse modo, o ideal seria que o município tivesse um próprio sistema inteligente que
através do histórico de dados climáticos coletados na região, conseguisse identificar antecipa-
damente o surgimento de tempestades, alertando a Defesa Civil para que sejam tomadas as
medidas necessárias para impedir prejuízos materiais, econômicos e em determinados casos de
vidas humanas.

1.1. Motivação

Com o passar dos anos, a meteorologia vem se tornando uma ciência mais quantitativa e vin-
culada a Tecnologia da Informação (TI). As técnicas utilizadas na previsão do tempo evoluíram
consideravelmente, focando na aplicação de modelos acessíveis e mais precisos para a tomada
de decisão. O surgimento dos sistemas numéricos de previsão do tempo é resultado da rela-
ção do uso da tecnologia com o estudo dos fenômenos meteorológicos, contudo, esses sistemas
são muito sensíveis à variação dos dados. Eles consideram um grande volume de variáveis na
forma de parâmetros microfísicos, esquemas convectivos, interações atmosféricas, interações
solo-superfície e comportamento de radiação. Uma ligeira alteração em qualquer um desses
parâmetros, tem a capacidade modificar significativamente o resultado do modelo de previsão.
Mudanças climáticas são fenômenos naturais de diferentes proporções, que impactam
diretamente a sociedade e o ecossistema. Elas podem abranger pequenas áreas territoriais como
cidades, até faixas territoriais mais extensas, podendo ocorrer até a nível global. As estatísticas
apontam que eventos climáticos extremos, tais como: tempestades, secas intensas, dentre outros
estão cada vez mais frequentes e intensos em todo planeta.
Desse modo, a sociedade precisa se adaptar a esta realidade, criando ferramentas que
permitam antecipar fenômenos climáticos severos, como grandes tempestades. Isso permite que
a Defesa Civil se prepare e seja capaz de amenizar as consequências provocadas por fenômenos
climáticos de grande intensidade, tendo um perfil mais preditivo ao invés de reativo.
Como exemplo, no ano de 2021, o município de Patos de Minas em Minas Gerais,
enfrentou a maior quantidade de chuvas em 20 anos, e consequentemente, um dos maiores re-
gistros pluviométricos de toda sua história. Dessa forma, se a Defesa Civil do município tivesse
a sua disposição um sistema computacional inteligente, que através de "padrões"fosse capaz de
detectar com alta margem de antecedência fenômenos climáticos de grande magnitude, o muni-
cípio seria capaz de mitigar a quantidade de desgastes naturais, ambientais, perdas financeiras e,
principalmente, de vidas que são acometidas todos os anos.
Dessa forma, esse trabalho tem como motivação, contribuir para a mitigação de danos e
desastres provocados por tempestades. Estudos e descobertas no campo da Inteligência Artificial
podem contribuir significativamente no enfrentamento desse problema, como por exemplo, a
aplicação de Regras de Associação, sendo utilizadas na identificação de padrões, que possam
ajudar a Defesa Civil, não somente do município de Patos de Minas - MG, na atenuação e
redução de desastres.

1.2. Objetivos e Desafios da Pesquisa

Considerando os impactos causados por tempestades e a falta de padrões que permitam os agen-
tes públicos a identificar esses fenômenos em tempo hábil, com possibilidade de mitigar os
danos ambientais, econômicos e sociais decorridos, o uso de Regras de Associação se apresenta
como uma alternativa viável para encontrar padrões através da análise de conjunto de dados
climatológicos.
Assim, o objetivo geral desse trabalho é identificar Regras de Associação que permitam
identificar com precisão e boa margem de antecedência o surgimento de mudanças climáticas
recorrentes de grande impacto, como tempestades, municiando a Defesa Civil de informação e
recursos que possam auxiliar a prevenção de desastres provocados por esses fenômenos. Para
tal, este estudo se propõe a desenvolver métodos de seleção para otimização dos padrões encon-
trados.
Os objetivos específicos são:
* Construir um sistema computacional inteligente que faça a geração de Regras de As-
sociação utilizando conjuntos de dados de clima;
* Construir os conjuntos de dados que serão utilizados no desenvolvimento do sistema
computacional inteligente;
* Otimizar o sistema computacional inteligente utilizando Algoritmos Genéticos (AGs)
na busca de resultados mais assertivos;
* Fornecer para a Defesa Civil de Patos de Minas - MG conhecimento que possa ser
utilizado na tomada de decisão.

1.3. Hipótese

Para efeito, o município de Patos de Minas - MG foi selecionado como referência para os estudos
e experimentos realizados nessa pesquisa, pois o orientador dessa pesquisa, o Prof. Dr. Laurence
Rodrigues do Amaral, é o diretor acadêmico do Centro Universitário de Estudos de Pesquisas
sobre Desastres e Mudanças Climáticas (CEPED) da Defesa Civil de Patos de Minas - MG. O
CEPED surgiu com o propósito de contribuir para prevenção, redução, mitigação, resposta e
recuperação de desastres na região do Alto Paranaíba e Noroeste Mineiro. O CEPED/Patos de
Minas foi criado através do Decreto nº 4452 de 24 de abril de 2018, baixado pelo Prefeito José
Eustáquio Rodrigues Alves, que institui o sistema Simpdec - Sistema Municipal de Proteção e
Defesa Civil.
Perguntas associadas a hipótese do trabalho:

1. O conjunto de dados climáticos coletados nos municípios limítrofes permite identificar


regras de associação com alto grau de confiabilidade na previsão e mitigação de desastres?

2. O uso de AGs permitirá atingir um grau de precisão de otimização apropriado as expecta-


tivas e necessidades reais?

Os dados climáticos de municípios vizinhos são bastante pertinentes para pesquisa, visto
que eventos meteorológicos em regiões próximas, tem grande possibilidade de estarem correla-
cionados com o surgimento de tempestades e outras alterações climáticas em uma região.
A aplicação de regas de associação em diversos datasets, (desde datasets com dados
climáticos do município de Patos de Minas, quanto em municípios vizinhos) permite a identifi-
cação de padrões. Desse modo, justifica-se a necessidade de uma pré-seleção, visando selecionar
os padrões mais eficazes para o objetivo da pesquisa.
Nesse ponto, os Algoritmos Genéticos serão de grande utilidade, através de testes e
regulagem dos parâmetros de ajuste dos métodos. A expectativa é conseguir filtrar padrões
confiáveis que apresentam resultados significativos para serem utilizados em situações reais.

1.4. Contribuições

Com o desenvolvimento desse trabalho pretende-se realizar as seguintes contribuições:

1. Desenvolvimento de um sistema computacional baseado em conceitos e técnicas de Inte-


ligência Artificial para gerar regras de associação relacionadas a datasets meteorológicos.

2. Geração de regras de alto nível (SE-ENTÃO) para o município de Patos de Minas à partir
dos datasets analisados.

3. Otimização de regras de associação mais eficazes e precisas na detecção de fenômenos


climáticos da região através de Algoritmos Genéticos (AGs).
2. Revisão da Literatura Correlata

2.1. Meteorologia

A meteorologia é o campo da ciência que se preocupa em estudar a atmosfera e os seus fenôme-


nos correlatos (AHRENS; HENSON, 2018). Existem registros de estudos meteorológicos desde
a antiguidade. Muitos povos da antiguidade se destacaram por tentar desenvolver técnicas que
os permitissem identificar as mudanças climáticas. Entre os povos da antiguidade, os que mais
se destacaram na compreensão dos fenômenos meteorológicos foram os egípcios, os sumérios
e os gregos. Inclusive, o primeiro registro do termo meteorologia é creditado ao filósofo grego
Aristóteles.
Somente no século XV, após a invenção de instrumentos de medições como o higrôme-
tro e o barômetro, foi que meteorologia começou a ser vista como uma ciência. A meteorologia
passou por séculos de evolução e inovação até que em 1950, cientistas começaram a converter
equações matemáticas que descrevem o comportamento da atmosfera em algoritmos computa-
cionais (criação dos primeiros modelos numéricos). Estes cálculos foram a origem da previsão
do tempo. Hoje, meteorologistas avaliam os resultados de diferentes modelos numéricos e os
utilizam como ferramentas para previsão do tempo (AHRENS; HENSON, 2018).

2.1.1. Clima e Tempo

Muitos conceitos correlacionados a meteorologia ainda são mal interpretados no quotidiano,


sendo tratados sem distinção alguma, (como se fossem sinônimos), gerando confusão e acepções
errôneas. É importante conhecer os conceitos chaves relacionados a meteorologia. O exemplo
mais comum, é a distinção entre os conceitos de clima e tempo.
Segundo CUNHA (2003) o conceito de tempo representa um conjunto de pequenas
flutuações nas variáveis atmosféricas causadas por diferentes elementos meteorológicos como a
temperatura, pressão atmosférica, vento, chuva, umidade, entre outros. Já o conceito de clima
se refere a uma média das condições de tempo. Já Sentelhas et al. (2007) distinguem tempo e
clima como:

[...] Denomina-se tempo à descrição instantânea, enquanto a descrição média


é denominada de clima. Logo, tempo é o estado da atmosfera num local e ins-
tante, sendo caracterizado pelas condições de temperatura, pressão, concentra-
ção de vapor, velocidade e direção do vento, precipitação; e clima é a descrição
média, valor mais provável, das condições atmosféricas nesse mesmo local.
[...] Clima é uma descrição estática que expressa as condições médias (geral-
mente, mais de 30 anos) do sequenciamento do tempo num local. O ritmo das
variações sazonais de temperatura, chuva, umidade do ar, etc...

Assim, embora diferentes, os conceitos de tempo e clima estão intimamente ligados. O


conceito de clima engloba estados de mudanças atmosféricas que se estendem por um horizonte
cronológico bem maior do que as mudanças de tempo. Em termos práticos, o clima fica no
terreno das expectativas (o que pode acontecer) enquanto o tempo é, de fato, o que ocorre no
curto prazo (CUNHA, 2003).

2.1.2. Temperatura e Calor

Temperatura e Calor são outros dois termos distintos, que em muitas situações do quotidiano
são erroneamente utilizados de maneira semelhante.
A definição de temperatura extrapola o campo da meteorologia, sendo proveniente da
Física. A temperatura de um corpo é caracterizada pelo grau de agitação de suas moléculas
(MIRANDA, 2001).
Já o calor, retrata uma troca de temperaturas. Mais precisamente, calor se refere ao fluxo
de energia de um corpo mais quente para um corpo mais frio. Quando o calor se transfere de
um corpo para outro, a temperatura do corpo mais quente cai, enquanto a temperatura do corpo
mais frio sobe, buscando um equilíbrio térmico entre os dois corpos (CUNHA, 2003).

2.2. Tempestades

A previsão do tempo se baseia na análise de diversas variáveis climáticas: temperatura, umidade


relativa do ar, pressão atmosférica, velocidade dos ventos, entre outras. O registro de cada
uma destas variáveis é captado por estações meteorológicas (espalhadas em locais e distâncias
estratégicas), imagens de satélite e por radares meteorológicos, seguindo modelos numéricos de
previsão.
A análise da variação dos parâmetros climáticos, ocorre por faixas temporais. É comum
que as variações sejam proporcionais ao período de tempo analisado. Curtos espaços de tempo,
geralmente apresentam baixa variação de temperatura. Enquanto que registros de temperatura
abrangendo longos espaços de tempo, apresentam maior variabilidade. Contudo, há casos onde
curtos espaços de tempo apresentem alta variabilidade como mudanças bruscas de temperatura,
umidade, aumento rápido na velocidade das massas de ar, etc... Qual a relação entre variações
nas variáveis climáticas e a origem de tempestades? Será que existe alguma relação?
Através de parâmetros convectivos e modelos de mesoescala, NASCIMENTO (2005)
estudou os padrões referentes a previsão de tempestades severas no Brasil. Para ele, as regiões
de latitudes médias e subtropicais da América do Sul a leste dos Andes apresentam condições
potencialmente favoráveis à ocorrência de tempestades de grande impacto (NASCIMENTO,
2005). O surgimento, a leste dos Andes, de uma circulação atmosférica do tipo jato de baixos
níveis (JBN) de norte, especialmente entre a primavera e o outono austrais, contribuem para
convecções severas. o O transporte de umidade proveniente da Amazônia permite o acoplamento
entre escoamento de jatos de baixos e altos níveis, que é um mecanismo favorável ao surgimento
de tempestades.
As tempestades em sua maioria, são consequência de uma combinação favorável en-
tre fatores geográficos, correntes de ar e campos termodinâmicos de larga escala (DOSWELL,
1991). De acordo com Moller (2001), as tempestades de grandes proporções são as tempestades
capazes de gerar granizo grande (granizos compostos por pedras de 2 cm ou mais de diâmetro
ao atingirem a superfície) e/ou rajadas de vento com força destrutiva (velocidade de 50 kt / 26
m s-1) e/ou tornados.

2.2.1. Previsão do tempo

Embora o clima, tempo, temperatura, umidade entre outros elementos climáticos sejam essen-
ciais na compreensão dos fenômenos meteorológicos, o grande foco da meteorologia reside nas
técnicas de previsão do tempo. Todo o conjunto de processos físicos capazes de provocar alte-
rações atmosféricas (umidade e formação de nuvens, movimento das massas de ar, as mudanças
de estações do ano, a influência da lua e de outros corpos celestes, etc...) compõem o conjunto
de fenômenos que são analisados para se chegar a previsão do tempo Ahrens e Henson (2018).
Seguindo estes conceitos, a análise da previsão do tempo considera uma faixa de período futuro
em que se pretende dimensionar as alterações atmosféricas. Entre as diferentes faixas de pe-
ríodo de tempo, podemos destacar: nowcast (previsões de poucas horas), short-range forecast
(previsões de 12 a 72 horas) e medium-range forecast (previsões de 3 até 8 dias) (AHRENS;
HENSON, 2018). A previsão do tempo possui o intuito de prover informações úteis e preci-
sas que auxiliem a tomada de decisões da sociedade, em relação aos efeitos e consequências
causadas pelas mudanças climáticas.
A previsão do tempo consiste na combinação de um diagnóstico com um prognóstico
(DOSWELL, 1991). Os modelos de previsão atuais se baseiam em associar os prognósticos
sinópticos com a previsão numérica. Inicialmente, os meteorologistas diagnosticam o estado
atmosférico atual analisando vários parâmetros climáticos. O diagnóstico da situação atual é
combinado com a saída de um modelo numérico com a intenção de gerar uma tendência (prog-
nóstico) (DOSWELL, 1991). Os prognósticos trabalham com cartas isobáricas de superfície
(nível de 1000 mb), com indicação de frentes de massas de ar, cartas de vento (na superfície e
em altitude), de temperatura, de divergência de umidade, diagramas adiabáticos da atmosfera
entre outros indicadores (SENTELHAS et al., 2007).
O reconhecimento de padrões é um processo de alta relevância para a previsão do tempo.
O reconhecimento de padrões é utilizado para determinar a complexidade das previsões climá-
ticas. Este processo combina todos os dados disponíveis (independentemente de sua relevância
para as equações utilizadas no modelo numérico), experiência, teoria e conceitos em uma ima-
gem quadridimensional da atmosfera (MOLLER, 2001). O grande desafio da previsão do tempo
é realizar previsões com alta margem de antecedência (bem a frente do tempo atual), possuindo
baixa qualidade e precisão de dados (depende muito das condições do ambiente e das tecnolo-
gias utilizadas).

2.3. Computação

2.3.1. A Inteligência Artificial

Podemos definir a Inteligência Artificial (IA), como o sub-ramo das Ciência da Computação
capaz de executar tarefas, e analisar problemas de maneira análoga a inteligência humana. Pro-
gramas de computador, máquinas e diferentes tipos de dispositivos “inteligentes” são utilizados
em conjunto com algoritmos e técnicas de IA.
O conceito de Inteligência Artificial (IA) foi proposto por John McCarthy, professor
de matemática, ao convocar um grupo de cientistas para um seminário no Dartmouth College,
em Hanover, no estado americano de New Hampshire no ano de 1956. O estudo proposto no
seminário era para prosseguir com a conjetura básica de que cada aspecto da aprendizagem ou
qualquer outra característica da inteligência pode, em princípio, ser descrita tão precisamente a
ponto de ser construída uma máquina para simulá-la (RUSSELL et al., 2010).
Do ponto de vista de uma máquina de Turing, os programas e métodos da IA são em
grande parte, parcialmente ou totalmente não determinísticos. Isso é, para uma dada pergunta
ou conjunto problema, o caminho de resolução dificilmente será percorrido da mesma maneira
em uma nova execução, mas trará sempre um resultado semelhante.
É uma área de estudos multidisciplinar que envolve principalmente a computação e ro-
bótica, mas que vem ganhando novas vertentes como a bioinformática e a nanotecnologia. Algu-
mas novas e promissoras tecnologias surgiram a partir da IA, como o Aprendizado de Máquina,
Aprendizagem Profunda, Processamento de Linguagem Natural e Ciência de Dados.
2.4. Redes Neurais

As Redes Neurais (RN) são uma parte da IA que buscam resolver os problemas simulando o
funcionamento do cérebro humano, utilizando estruturas análogas aos neurônios e suas ligações
(axônios). Haykin e Engel (2001) definem uma rede neural como uma máquina de proces-
samento paralelo que transforma conhecimento experimental em informações úteis. As redes
neurais se comportam como redes entrelaçadas, onde cada neurônio analisa uma vertente ou
variável do problema. O resultado de cada um é ponderado usando-se pesos definidos para cada
grupo ou cada etapa de avaliação.
Segundo (LECUN; BENGIO, 1995) a rede neural parte de um conjunto de neurônios
artificiais agrupados em diversas camadas com ou sem subníveis, e instanciados com pesos
aleatórios que são ajustados a cada época de treinamento com base na retro propagação do erro
calculado entre a saída da rede e valor do rótulo que deveria ser obtido.
Existem subclasses de redes neurais, cada uma especializada em determinada tarefa. As
redes neurais convolucionais (CNNs) são um subgrupo de redes neurais criadas por LeCun e
Bengio com a proposta de aplicar operações lineares e não lineares por meio de filtros convo-
lucionais dispostos entre as camadas da rede neural. Esses modelos de redes recentemente vêm
ganhando destaque nas etapas de processamento e análise de imagens digitais por causa da sua
capacidade de extrair características e avaliar nativamente as informações espaciais.

2.4.1. Regras de Associação

A mineração de dados ou Data mining é o processo de explorar grandes quantidades de dados à


procura de padrões consistentes. Para atingir este objetivo, as técnicas de Data Mining focam na
segmentação de dados com o intuito de avaliar a probabilidade de ocorrência certos eventos e,
com isso, resolver problemas que não são possíveis usando apenas a capacidade mental humana.
Entre as diferentes categorias de mineração de dados, podemos destacar as regras de
associação ou sequências temporais. As regras de associação visam detectar relacionamentos
sistemáticos entre variáveis, identificando novos subconjuntos de dados. De acordo com Gold-
berg e Holland (1988), as Regras de associação se preocupam em relacionar a presença de um
conjunto de elementos com outra faixa de valores de um outro conjunto de elementos. Para isso,
é verificado a existência de um controle ou influência entre os atributos (ou valores dos atribu-
tos), no intuito de identificar, mediante a análise de probabilidades condicionais, dependências
entre esses atributos.
2.4.2. Algoritmos Genéticos

O conceito inicial de Algoritmos Genéticos (AGs) foi elaborado pelo pesquisador John Henry
Holland (1968) e posteriormente aprimorado pelo pesquisador David E. Goldberg (1988). Os
conceitos evolutivos estabelecidos por Charles Darwin serviram como a principal inspiração.
De acordo com Darwin, os indivíduos que possuem características favoráveis têm mais chances
de sobreviver e se reproduzir do que aqueles com características menos favoráveis, e também
com inspiração na biologia genética,
Os AGs se baseiam num processo coletivo de aprendizagem dentro de uma população de
indivíduos, cada um dos quais representando um ponto no espaço de busca de soluções para um
dado problema. A população é inicializada e evolui através de gerações com o uso de operadores
de seleção, reprodução e mutação (FILHO, 2001).
AGs aplicam técnicas de busca, otimização e seleção, com ampla gama de possibilidades
em diversas áreas de aplicação. Eles podem ser utilizados em robótica, na determinação da
trajetória de movimento de braços mecânicos e no projeto e controle de robôs (DAVIS, 1991), na
otimização de funções matemáticas (CHEN et al., 2015), em roteamento de pacotes (BUENO;
OLIVEIRA, 2016), na bioinformática (POND et al., 2006), entre outras aplicabilidades.
No contexto das tarefas de previsão de tempo e clima, feitas por redes neurais artificiais,
os AGs podem ser usados para otimizar os parâmetros dessas redes como demostra (TORMO-
ZOV et al., 2020) e no estudo de séries temporais em dados hidrológicos temos (HUANG;
WANG, 2011). Segundo (PULIDO et al., 2011), é possível a otimização dos modelos (ensem-
bles) de redes neurais pelos AGs, para análise e predição de séries temporais complexas.

2.4.3. Coleta de dados

A meteorologia é um campo de pesquisa em constante evolução e aprimoramento científico. O


processo de coleta de dados compele grandes desafios, iniciando pela escolha dos dados a serem
trabalhados (existe uma vasta quantidade de variáveis e parâmetros meteorológicos formatados
de modo incongruente, não validados, encontrados nas mais diversas bases de dados).
O tema impõe grandes desafios naturais como a grande quantidade de variáveis e embora
se tenha dados históricos de décadas, as bases de dados são esparsas e não padronizadas, tendo
uma grande ocorrência de missing values e outliers. A tarefa de organizar e agrupar essas bases
além de tratamento de “anomalias” será trabalhosa. Uma dificuldade extra é o grande volume
de dados, demandando alto custo computacional.
Os datasets do Instituto Nacional de Meteorologia (INMET) são organizados por ano,
sendo um arquivo para cada estação automática de medição e coleta, cada arquivo tem os dados
coletados de um ano inteiro, sendo atualmente quase 600 estações dentre as automáticas, e 20
anos de histórico. O Sistema Nacional de Informações sobre Recursos Hídricos (SNIRH), tem
um maior tempo de histórico em seu conjunto de dados, os primeiros registros datam dos anos
60, contudo não havia boa precisão e padronização.
Observou-se que existem vários vícios nas fontes de dados (séries históricas), como
dados ausentes, ou fora da faixa de valores esperados, outra questão sensível observada foi a
falta de padronização e integração.
Será preciso fazer uma preparação e criterioso ajuste para aproveitar os dados históri-
cos desde que se aplique técnicas de normalização e correção de distorções, mesmo assim não
podem ser considerados confiáveis.

3. Método de Pesquisa

O primeiro passo da pesquisa aqui proposta é a coleta de dados (construção do dataset). Será
considerado os dados meteorológicos do município de Patos de Minas, MG. O objetivo, é iden-
tificar padrões nos dados climáticos que permitam identificar o surgimento de tempestades na
região. É importante ressaltar, que os dados utilizados não se limitarão às fronteiras do muni-
cípio, visto que chuvas, ventos fortes e demais indícios de temporais podem ser oriundos do
deslocamento de massas de ar, mudanças de temperatura, umidade, entre outros fenômenos cli-
máticos detectados há vários quilômetros de distância. Portanto, o dataset utilizado na pesquisa
irá abranger dados climáticos coletados por estações meteorológicas espalhadas no raio de mu-
nicípios limítrofes.
O processo de coleta de dados será iniciado pela escolha dos dados que serão utilizados.
Existe uma vasta quantidade de variáveis e parâmetros meteorológicos formatados de modo in-
congruente, não validados, encontrados em diferentes tipos de bases de dados. A tarefa de coleta
de dados apresentará diversos problemas. Embora se consiga obter dados de diferentes períodos
históricos, algumas bases de dados apresentam informações esparsas, períodos históricos sem
registro, dados não padronizadas e em muitos casos, há um grande volume de dados desnecessá-
rios. Desse modo, as tarefas de organizar, agrupar e filtrar dados relevantes a pesquisa se mostra
uma etapa árdua, com alta demanda computacional e difícil de otimizar.
Considerando todos os pontos levantados acerca da escolha da fonte de dados, duas
fontes de dados se apresentam como as mais viáveis a serem utilizadas: a rede INMET e RE-
DEMET. Em relação a estas duas fontes de dados, serão priorizados os dados das estações
climáticas da REDEMET em detrimento aos dados da rede INMET. A razão da escolha, é por-
que as estações da rede INMET em Patos de Minas estão há um bom período de tempo sem
manutenção. Os datasets do Instituto Nacional de Meteorologia (INMET) são organizados por
ano (datasets anuais, obtidos durante décadas de coleta e medição), sendo um arquivo também
para cada estação. Dessa forma, algumas estações da rede INMET localizadas na faixa geográ-
fica da pesquisa possuem lapsos temporais sem registro de captação de informações climáticas,
o qual problema não ocorre com dados da REDEMET. Contudo, no decorrer da pesquisa, caso
for necessário maior volume de dados ou outra fonte de dados além dos dados da REDEMET,
poderão ser utilizados os dados meteorológicos da rede INMET ou outra fonte de dados.
A REDEMET possui uma API para comunicação com seus dados meteorológicos. As-
sim, o primeiro passo é desenvolver uma aplicação para consumir dados da API REDEMET
e gerar datasets com as informações relevantes. A Figura 1 ilustra o funcionamento do pro-
cesso. Esse passo é muito importante porque ao acessar a API da REDEMET, a aplicação será
responsável por extrair apenas dados pertinentes a pesquisa e formatá-los, caso estejam despa-
dronizados.

Figura 1 – Acesso aos dados da REDEMET

Após construir os datasets compostos de dados climáticos do município de Patos de


Minas e dados de estações adjacentes ao município, irá começar a etapa de análise dos dados
coletados. O processo de análise será executado por algoritmo/código-fonte desenvolvido espe-
cificamente para essa finalidade, com o propósito de encontrar elementos relacionados à outros
em uma mesma transação, "padrões"que impliquem o início da ocorrência de fenômenos cli-
máticos de maior severidade. Os relacionamentos encontrados são representados por regras de
associação.
É provável que seja encontrado um grande volume de regras de associação que eviden-
ciam o relacionamento de dados climáticos com a ocorrência de eventos severos, como tem-
pestades. Portanto, é necessário que se faça uma filtragem em busca das melhores regras de
associação. Desse modo, a última etapa da pesquisa será a otimização dos resultados encontra-
dos. Para tal, Algoritmos Genéticos (AGs) serão utilizados. A Figura 2 ilustra o ciclo de um
Algoritmo Genético. O AG será responsável em aplicar operadores de seleção que identificarão
as melhores regras de associação - padrões que detectem com maior precisão e antecedência, o
surgimento de tempestades na região.

Figura 2 – Ciclo de um Algoritmo Genético

4. Resultados Esperados

Através do progresso dos estudos desse trabalho, espera-se, que seja construído um sistema
computacional que seja capaz de identificar um conjunto de regras de associação que deter-
minem padrões relacionados ao surgimento de fenômenos climáticos de grande intensidade na
região. Esse sistema computacional deve ser capaz de detectar e alertar sobre a iminência de
tempestades, vendavais e demais fenômenos climáticos que possam gerar danos a sociedade,
a fim de que as medidas de segurança necessárias sejam tomadas em tempo hábil pela Defesa
Civil. Por fim, espera-se que seja possível otimizar os resultados computacionais, com o uso de
Algoritmos Genéticos.
5. Cronograma de Execução

Na Tabela 1 são apresentadas o cronograma de atividades previstas para a conclusão deste pro-
jeto. O cronograma está dividido em 4 tópicos.

Tabela 1 – Cronograma das atividades


Tarefa Inicio Fim Duração
Preliminares - - -
Estudos preliminares e definição do tópico de pes- 05/2022 08/2022 4 meses
quisa
0 - Continuação do estudo dos trabalhos correlatos 09/2022 03/2023 7 meses
disponíveis na literatura
1 - Implementação do Algoritmo e construção do(s) 04/2023 05/2023 2 meses
datasets(s)
1.1 - Implementação do algoritmo para consumir API 04/2023 05/2023 2 meses
da REDEMET
1.2 - Construção do dataset. filtragem, formatação e 05/2023 06/2023 2 meses
padronização dos dados
2 – Experimentos 05/2023 08/2023 4 meses
2.1 - Detecção de Regras de Associação 05/2023 08/2023 4 meses
3 - Ajustes e melhorias 08/2023 10/2023 3 meses
3.1 -Otimização utilizando algoritmos genéticos 08/2023 10/2023 3 meses
(AGs)
4 - Finalização 10/2023 02/2024 5 meses
4.1 - Escrita e submissão de artigo 10/2023 12/2023 3 meses
4.1 - Escrita da dissertação 11/2023 01/2024 3 meses
4.2 - Defesa da dissertação 02/2024 - -

6. Justificativa pelo atraso na entrega do projeto

Em setembro de 2022, o meu pai, Vicente de Paula Coelho, foi diagnosticado com um sério
problema de saúde. Ele estava apresentando fortes dores abdominais e já apresentava sintomas
de problemas renais há algum tempo, porém esses sintomas se intensificaram e procuramos
auxílio médico. O resultado dos exames ultrassonográfico dos rins, abdômen e próstata (que se
encontra em anexo) detectou a presença de aneurisma da artéria aorta abdominal com diâmetro
5,6 cm. (A próstata também está com tamanho acima do normal, porém não é um problema
tão urgente quanto o aneurisma) Além da presença do aneurisma, o exame detectou trombose
na região do aneurisma, havendo início de rompimento de vasos sanguíneos. O aneurisma na
artéria aorta é um problema sério, visto que o seu rompimento causa morte instantânea. A
presença de vazamento de sangue e trombose é um péssimo agravante. O médico que analisou
o caso nos indicou realizar um procedimento cirúrgico para remover o aneurisma, contudo esta
cirurgia indicada por ele é de alto risco e possui complicações devido à idade do meu pai e o fato
dele ser tabagista. O médico orientou que o deveríamos procurar tratamento cirúrgico o mais
rápido possível (em um prazo de máximo 6 meses) pois após esse prazo, o risco de rompimento
seria alto. Decidimos procurar a opinião de outros médicos para avaliar o melhor procedimento.
Nós residimos em Patos de Minas, procuramos opções de tratamento em Patos de Minas,
Uberlândia e Belo Horizonte. Eu acompanhei o meu pai nas consultas e exames que ele realizou
no período. O meu pai foi orientando a manter repouso absoluto e evitar pegar qualquer tipo
de peso, o que me exigiu dirigir, acompanhá-lo e ajuda-lo com cuidados pessoais durante o
período. Além disso, todo o ocorrido causou um grande impacto emocional e psicológico em
mim, no meu pai e em todos da família. Portanto, todos os acontecimentos e desdobramentos do
problema de saúde do meu pai, me impossibilitaram de conseguir terminar o projeto no prazo
estipulado em dezembro de 2022.
Eu também tinha alguns problemas de saúde que necessitavam de cirurgia há algum
tempo e devido ao problema de saúde mais emergencial do meu pai, eu fui obrigado a adiar
estas cirurgias. Há muito tempo eu sofro com problema de hemorróidas, o qual, o médico que
me acompanhava já havia me indicado fazer cirurgia para o problema. Além disso, eu sofro
problema de baixa visão, e já me havia sido indicada cirurgia refrativa, pois os óculos já não
estavam corrigindo a minha visão a um nível aceitável.
Eu já havia adiado o máximo de tempo que eu podia, e no dia 28/12/22 eu realizei a
Hemorroidectomia conforme atestado em anexo. Já no dia 18/01/2023, eu realizei cirurgia de
correção visual conforme atestado também em anexo. Durante o prazo do atestado de ambas ci-
rurgias, eu não consegui trabalhar no projeto. A cirurgia refrativa da visão tem uma recuperação
lenta e progressiva. A visão demora estabilizar e conforme explicado pelo médico, nos primei-
ros meses eu apresento uma alta sensibilidade na visão (resistência e incômodo a luz como a luz
do sol e a luz UV das telas de computadores, celulares e afins) o que dificulta ficar por muito
tempo a frente do computador. O tratamento aconselhável do pós-operatório é evitar contato
com fontes luminosas (manter um uso moderado) aliado ao uso de colírios e acompanhamento
médico constante nos primeiros meses até a estabilização da visão.
Durante os meses de fevereiro e março, eu tive problemas relacionados a recuperação
desta cirurgia. Eu apresentei visão ofuscada, escurecimento das vistas, muita dor de cabeça, e
dificuldade de enxergar devido a minha rotina de trabalho e de estudos que me exigiam utilizar o
computador por várias horas no dia. Assim, eu precisei me ausentar das minhas atividades para
descansar a visão seguindo orientação médica. Em anexo apresento os atestados relacionados.
Por fim, no final de março, eu tive dengue, o qual eu apresento atestado também em anexo.
Apesar de todo atraso na entrega do projeto, o planejamento feito pelo orientador e por
mim será realizado em 2023 conforme o cronograma, não prejudicando a conclusão do trabalho
de mestrado.
Referências

AHRENS, C. D.; HENSON, R. Essentials of meteorology: an invitation to the atmosphere.


Eighth edition. Boston, MA: Cengage Learning, 2018. ISBN 978-1-305-62845-8. Citado 2
vezes nas páginas 5 e 7.
BUENO, M. L. P.; OLIVEIRA, G. M. B. NOVAS ABORDAGENS PARA A RECONEXÃO
DE SUBÁRVORES NO ROTEAMENTO MULTICAST BASEADO EM ALGORITMOS GE-
NÉTICOS. In: Anais do 9. Congresso Brasileiro de Redes Neurais. Ouro Preto, MG: SBRN,
2016. p. 1–5. Disponível em: <http://abricom.org.br/eventos/cbrn_2009/139_CBRN2009>. Ci-
tado na página 10.
CHEN, L.; KOU, C.; MA, S.-W. Genetic Algorithm Combining Operation Tree (GAOT) for
concrete performance:. In: . Huhhot, Inner Mongolia: [s.n.], 2015. Disponível em: <https:
//www.atlantis-press.com/article/25576>. Citado na página 10.
CUNHA, G. R. da. Meteorologia: fatos & mitos-3. Passo Fundo: Embrapa Trigo, 2003., 2003.
Citado 2 vezes nas páginas 5 e 6.
DAVIS, L. D. Handbook of genetic algorithms. In: . 2. [print.]. ed. New York: Van Nostrand
Reinhold, 1991. cap. A genetic algorithm applied to robot trajectory generation, p. 144–165.
ISBN 978-0-442-00173-5. Citado na página 10.
DOSWELL, C. A. A review for forecasters on the application of hodographs to forecasting
severe thunderstorms. National weather digest, v. 16, n. 1, p. 2–16, 1991. ISSN 0271-1052.
Citado 2 vezes nas páginas 7 e 8.
FILHO, G. R. Melhoramentos no algoritmo genético construtivo e novas aplicações em
problemas de agrupamento. 129 p. Tese (Doutorado em Computação Aplicada) — Instituto
Nacional de Pesquisas Espaciais (INPE), São José dos Campos, jun. 2001. Citado na página
10.
GOLDBERG, D. E.; HOLLAND, J. H. Genetic Algorithms and Machine Learning. Machine
Learning, v. 3, n. 2, p. 95–99, oct 1988. ISSN 1573-0565. Disponível em: <https://doi.org/10.
1023/A:1022602019183>. Citado 2 vezes nas páginas 9 e 10.
HAYKIN, S.; ENGEL, P. M. Redes neurais: princípios e prática. 2. ed. ed. Porto Alegre:
Bookman, 2001. OCLC: 55921641. ISBN 978-85-7307-718-6. Citado na página 9.
HOLLAND, J. H. Hierarchical descriptions, universal spaces and adaptive systems: tech-
nical report. [S.l.]: University of Michigan, College of Literature, Science, and the Arts, Com-
puter and Communication Sciences Dept., 1968. (University of Michigan Technical Reports).
Citado na página 10.
HUANG, G.; WANG, L. Hybrid Neural Network Models for Hydrologic Time Series Fore-
casting Based on Genetic Algorithm. In: 2011 Fourth International Joint Conference on
Computational Sciences and Optimization. Kunming and Lijiang City, China: IEEE, 2011.
p. 1347–1350. ISBN 978-1-4244-9712-6. Disponível em: <http://ieeexplore.ieee.org/document/
5957900/>. Citado na página 10.

LECUN, Y.; BENGIO, Y. Convolutional networks for images, speech, and time-series. In: AR-
BIB, M. A. (Ed.). The Handbook of Brain theory and Neural Networks. [S.l.]: MIT Press,
1995. Citado na página 9.

MIRANDA, P. Meteorologia e ambiente. Universidade Aberta, 2001. Citado na página 6.

MOLLER, A. R. Severe local storms forecasting. In: Severe Convective Storms. Boston,
MA: American Meteorological Society, 2001, (Meteorological Monographs). p. 433–480. ISBN
1935704060. Citado 2 vezes nas páginas 7 e 8.

NASCIMENTO, E. d. L. Previsão de tempestades severas utilizando-se parâmetros convectivos


e modelos de mesoescala: uma estratégia operacional adotável no Brasil. Revista Brasileira de
Meteorologia, v. 20, n. 1, p. 121–140, 2005. Citado na página 7.

POND, S. L. K.; POSADA, D.; GRAVENOR, M. B.; WOELK, C. H.; FROST, S. D. GARD: a
genetic algorithm for recombination detection. Bioinformatics, v. 22, n. 24, p. 3096–3098, dez.
2006. ISSN 1367-4803, 1460-2059. Disponível em: <https://academic.oup.com/bioinformatics/
article-lookup/doi/10.1093/bioinformatics/btl474>. Citado na página 10.

PULIDO, M.; MELIN, P.; CASTILLO, O. Genetic optimization of ensemble neural networks
for complex time series prediction. In: The 2011 International Joint Conference on Neural
Networks. San Jose, CA, USA: IEEE, 2011. p. 202–206. ISBN 978-1-4244-9635-8. Disponível
em: <http://ieeexplore.ieee.org/document/6033222/>. Citado na página 10.

RUSSELL, S. J.; NORVIG, P.; DAVIS, E. Artificial intelligence: a modern approach. 3rd
ed. ed. Upper Saddle River: Prentice Hall, 2010. (Prentice Hall series in artificial intelligence).
ISBN 978-0-13-604259-4. Citado na página 8.

SENTELHAS, P. C.; PEREIRA, A. R.; ANGELOCCI, L. R. Meteorologia Agrícola. Piraci-


caba, 2007. Material de aulas. Disponível em: <http://www.leb.esalq.usp.br/leb/aulas/lce306/
lce306.html>. Citado 2 vezes nas páginas 5 e 8.

TORMOZOV, V.; ZOLKIN, A.; VASILENKO, K. Optimization of Neural Network Para-


meters Based on a Genetic Algorithm for Prediction of Time Series. In: 2020 Internati-
onal Multi-Conference on Industrial Engineering and Modern Technologies (FarEast-
Con). Vladivostok, Russia: IEEE, 2020. p. 1–4. ISBN 978-1-72816-951-4. Disponível em:
<https://ieeexplore.ieee.org/document/9271536/>. Citado na página 10.
Patos de Minas (MG), 11 de Abril de 2023.

Prof. Dr. Nome Completo do Orientador


Laurence Rodrigues do Amaral

Nome Completo do Aluno


Guilherme Antonio Coelho Neto

Você também pode gostar