TCC Lucas - Alvarenga PDFA

Lucas Fernando Alvarenga e Silva
Uso de Aprendizado Profundo em Redes 5G

através de Representações Pictóricas de Séries
Temporais
São José dos Campos - SP, Brasil

23 de Fevereiro de 2022
Uso de Aprendizado Profundo em Redes 5G através de

Representações Pictóricas de Séries Temporais
Trabalho de conclusão de curso apresentado

ao Instituto de Ciência e Tecnologia — UNI-
FESP, como parte das atividades para obten-
ção do título de Bacharel em Engenharia da
Computação.
Universidade Federal de São Paulo – UNIFESP

Instituto de Ciência e Tecnologia
Engenharia da Computação
Orientador: Prof. Dr. Jurandy Gomes de Almeida Junior

Coorientador: Prof. Dr. Bruno Yuji Lino Kimura

Elaborado por sistema de geração automática com os dados fornecidos pelo(a) autor(a).
Alvarenga e Silva, Lucas Fernando
Uso de Aprendizado Profundo em Redes 5G através de Representações
Pictóricas de Séries Temporais/ Lucas Fernando Alvarenga e Silva
Orientador(a) Jurandy Jr Gomes de Almeida; Coorientador(a) Bruno Yuji Lino
KimuraSão José dos Campos, 2021.
67 p.
Trabalho de Conclusão de CursoEngenharia da ComputaçãoUniversidade
Federal de São PauloInstituto de Ciência e Tecnologia, 2021.
1. Redes 5G. 2. Aprendizado profundo. 3. Transformação de séries temporais
em imagens. 4. Indicadores de qualidade de sinal. I. Gomes de Almeida, Jurandy
Jr, orientador(a). II. Lino Kimura, Bruno Yuji,coorientador(a). III. Título.
Uso de Aprendizado Profundo em Redes 5G através de

Representações Pictóricas de Séries Temporais
Trabalho de conclusão de curso apresentado

ao Instituto de Ciência e Tecnologia — UNI-
FESP, como parte das atividades para obten-
ção do título de Bacharel em Engenharia da
Computação.
Trabalho aprovado em 23 de Fevereiro de 2022:
Prof. Dr. Jurandy Gomes de Almeida

Junior
Orientador
Prof. Dr. Bruno Yuji Lino Kimura

Coorientador
Prof. Dr. Fábio Augusto Faria

Convidado 1
Prof. Dr. Valério Rosset

Convidado 2

Dedico este trabalho a minha família, os quais me deram toda a base e encorajamento para
continuar e terminar esta etapa da minha vida.
Agradecimentos
Agradeço primeiramente a minha família, pois sem o apoio deles nada disso seria
possível. Aos meus pais Samira Alvarenga e Angelo Pires, por todo apoio e ligações
em momentos não esperados com o coração apertado de saudade. Aos meus avós, Nilza
Maia e Ariovaldo Alvarenga, por toda criação e educação que me deram, sendo além de
avós, amigos e companheiros muito queridos que me permitiram entrar no mundo dos
“computadores” desde muito cedo, área a qual escolhi para a vida. A Manusa Leal, que
entrou na minha vida ainda na UNIFESP mas que vem me permitindo dividir uma vida,
repleta de felicidades, com ela. Também agradeço a todos os demais parentes, como meus
tios, Ludmila, Cristiano, Nádia e Henrique, e meus primos Victor e Stiven.
Em seguida, agradeço imensamente meu orientador, Prof. Dr. Jurandy Almeida,
que lá em 2017 (meu segundo semestre na universidade) com um email aberto a todo
o corpo discente anunciou uma bolsa de iniciação científica, a qual me candidatei sem
muitas expectativas, mas que acabei sendo aceito e que me introduziu a toda a comunidade
acadêmica. Essa foi apenas uma dentre todas as oportunidades que ele me proporcionou,
como ser bolsista de iniciação científica pela FAPESP; indicações a uma vaga de estágio
em uma start-up relacionada a nossa área de pesquisa; publicação de artigos, sendo um
deles sendo premiado como melhor trabalho da sessão; e, atualmente, continuar nosso
trabalho como aluno de mestrado bolsista da FAPESP. Agradecimentos especiais para
o Prof. Dr. Bruno Kimura por ser coorientador deste trabalho de conclusão de curso e
ao Prof. Dr. Henrique Paiva que me convidou a participar da escrita de um artigo, já
publicado em uma revista acadêmica.
Por fim, também agradeço imensamente aos meus amigos, anteriores a UNIFESP,
e, principalmente, aos novos que obtive a durante minha caminhada no ICT/UNIFESP,
que tornaram toda essa trajetória mais leve e divertida.
“There is no such thing as a free lunch”
Resumo
Novos padrões de consumo de dados, em sua maioria não centralizado no comportamento
humano, estão começando a esgotar os recursos de transmissão da infraestrutura de rede
móvel atual. Por conta disso redes 5G começaram a ser padronizadas e implantadas ao
redor do mundo, adotando enlaces de ondas de rádio milimétricas de alta frequência que
permitem suprir as demandas de velocidades de transferência de dados atuais. Entretanto,
a gestão das redes 5G atuais acontece de modo reativo, em que parâmetros de rede
são calculados pelos dispositivos de usuários e enviados periodicamente as estações-base,
porém isso não é ideal pois geram atrasos e lentidões na rede que podem impossibilitar
o cumprimento de seus requisitos de tempo. Assim, as redes além das redes 5G estão
sendo desenvolvidas com objetivo de apresentar sistemas mais inteligentes através do
uso de métodos de aprendizado de máquina para melhoria de tomadas de decisões e
alocações de recursos. Com base nas redes além das redes 5G, este trabalho propõe o
desenvolvimento de um arcabouço de aprendizado profundo que visa prever valores futuros
de um parâmetros de qualidade da rede, o Indicador de Qualidade de Canal, com base em
um histórico de valores passados. Espera-se que esse sistema de previsão seja executado
em infraestruturas de nuvem que pró-ativamente envia previsões para as estações-bases,
permitindo que elas escolham seu curso de ações futuro para manter a qualidade dos
canais de comunicação com os equipamentos de usuário. Na literatura existem algumas
propostas para a previsão de valores futuros de CQI, mas a maior parte delas investigam
modelos de aprendizado profundo custosos sobre ambientes simulados ou, quando em
ambientes reais, em redes móveis de gerações anteriores, como as redes 4G. Dado estas
limitações, este trabalho realiza uma comparação entre diferentes técnicas de aprendizagem
profunda em um conjunto de dados reais (registros de transmissão) obtidos da perspectiva
de um equipamento de usuário de uma operadora 5G da Irlanda. Foram usadas redes
recorrentes LSTM, modelos convolucionais tradicionais e modelos convolucionais residuais,
ambos modelos convolucionais voltadas para representações de dados unidimensionais,
usando diretamente séries temporais pré-processadas, e bidimensionais, que adicionam
uma etapa adicional de processamento séries temporais por técnicas de transformação
de séries temporais em imagens, e.g., Gráficos de Recorrência, Campos Angulares de
Gramian e Campos de Transição de Markov. Após uma extensa avaliação experimental
sobre dois padrões de movimentação distintos, estático e móvel, pôde-se verificar que a
LSTM obteve o melhor desempenho médio (aproximadamente 12% de NRSME) para
previsão, seguida pelo modelo convolucional tradicional 1D (16%) e o residual 2D (19%).
Porém, informações temporais de processamento e treinamento são vitais em redes 5G, e
nesse sentido observa-se que a LSTM apresentou o maior tempo dentre todos os modelos
avaliados, impossibilitando sua aplicação no mundo real. Assim, constatou-se que o modelo
com melhor compromisso entre desempenho e complexidade foram as redes residuais,
particularmente, a ResNet5 2D, com um erro de aproximadamente 19% NRMSE e um
tempo de inferência e treinamento aproximadamente 99% menor que LSTM.
Palavras-chaves: redes B5G, aprendizado profundo, indicadores de qualidade.
Abstract
New patterns of data consumption, generally different from human behavior, are starting
to exhaust the resources of today’s mobile network. As a result, 5G networks began to be
standardized and deployed around the world, which uses high-frequency millimeter-wave as
links to ensure the current data transfer demands. However, the current 5G networks work
in a reactive way, that is, network parameters are calculated by the user equipment and
periodically send to the base stations. Acting in a reactive manner might generate delays
that slow down the network traffic, not letting the network reach its time requirements.
Thus, beyond 5G networks have been developed to improve the smart capabilities of the
network infrastructure by the use of machine learning methods, providing smarter decision-
making and resource allocation procedures. Based on beyond 5G networks, this work
proposes a deep learning framework to predict future values of a network quality parameter,
the Channel Quality Indicator, based on its past values. This forecasting system is expected
to run in a cloud infrastructure that proactively sends forecasts to the base stations, allowing
them to choose their future action in order to maintain the quality of the communication
channel with the user equipment. In the literature, there have been some works about
network parameters forecasting, but most of them use expensive deep learning models on
computer-simulated environments or, when dealing with real environments, only above past
generations mobile networks, such as 4G networks. So, in this work, we made a comparison
between different deep learning techniques trained in a real-valued dataset composed
of transmission logs obtained from a user equipment perspective, which was attached
to a 5G operator in Ireland. We evaluated LSTM recurrent networks, two traditional
convolutional models, and three residual convolutional models, where both convolutional
models (traditional and residual methods) were further divided into one-dimensional
kernels or two-dimensional kernels. One-dimensional kernels can natively process time
series, but the two-dimensional kernel method needs an additional step of transforming the
time series into images by image-based time series transformations, e.g., Recurrence Plots,
Gramian Angular Fields, and Markov Transition Fields. Next, an extensive experimental
evaluation was performed separating two distinct movement patterns, static and mobile.
We could verify that LSTM obtained the best average performance (approximately 12% of
NRSME) for prediction, which was followed by the traditional 1D convolutional model
(16%) and, finally, the residual 2D model (19%). However, in the context of 5G networks
time metrics of training and inference are vital. When leveraging this information we can
see that LSTM had the longest time processing among all the models, which limits its
applicability in the real-world scenario. Finally, we conclude by showing that ResNet5,
the two-dimensional convolutional residual network has the best compromise between
performance and complexity, with an error of approximately 19% NRMSE and with an
inference and training time approximately 99% smaller than LSTM time metrics.
Keywords: B5G networks, deep learning, signal quality indicators.
Lista de ilustrações
Figura 1 – Capacidade de aprendizagem: Sobreajuste e Subajuste . . . . . . . . . 8

Figura 2 – Bloco de construção residual . . . . . . . . . . . . . . . . . . . . . . . . 12
Figura 3 – Bloco unitário de uma rede recorrente LSTM . . . . . . . . . . . . . . 14
Figura 4 – Perspectiva arquitetural da internet . . . . . . . . . . . . . . . . . . . . 15
Figura 5 – Estrutura base de uma rede móvel . . . . . . . . . . . . . . . . . . . . 19
Figura 6 – Estrutura de uma rede móvel 3G . . . . . . . . . . . . . . . . . . . . . 20
Figura 7 – Infraestrutura das redes 5G . . . . . . . . . . . . . . . . . . . . . . . . 22
Figura 8 – Transformação de série temporal em imagem . . . . . . . . . . . . . . . 26
Figura 9 – Estrutura geral adotada para execução do arcabouço de previsão de
CQI em redes B5G . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
Figura 10 – Estrutura geral adotada para execução do arcabouço de previsão de
CQI em redes B5G . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Figura 11 – Arquiteturas profundas plugáveis no arcabouço . . . . . . . . . . . . . 34
Figura 12 – Divisão de um registro de transmissão . . . . . . . . . . . . . . . . . . 37
Figura 13 – Inferência com modelos treinados em dados normalizados e não norma-
lizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
Figura 14 – Equivalência do CQI aplicações . . . . . . . . . . . . . . . . . . . . . . 42
Figura 15 – Previsão de valor futuro no “Download_Static_B_2019.12.16_13.40.04.csv” 44
Lista de tabelas
Tabela 1 – Sumário relacionando as principais características dos trabalhos citados 29

Tabela 2 – Atributos dos históricos de transmissão . . . . . . . . . . . . . . . . . . 32
Tabela 3 – Hiper-parâmetros de treinamento . . . . . . . . . . . . . . . . . . . . . 39
Tabela 4 – Desempenho dos métodos de aprendizado profundo para previsão de CQI 40
Tabela 5 – Comparação de desempenho entre diferentes valores de w . . . . . . . 41
Tabela 6 – Número de parâmetros e MACs dos modelos avaliados . . . . . . . . . 43
Lista de abreviaturas e siglas
2G Redes de segunda geração.
3G Redes de terceira geração.
3GPP 3ª geração de parceria de projeto (do inglês, 3rd Generation Partnership

Project).
4G Redes de quarta geração.
5G Redes de quinta geração.
B5G Além das Redes de 5ª geração (do inglês, Beyond 5G Networks).
CNN Redes Neurais Convolucionais (do inglês, Convolutional Neural Networks).
CQI Indicador de Qualidade de Canal (do inglês, Channel Quality Indicators).
DL Aprendizado Profundo (do inglês, Deep Learning).
EB Exabytes.
eMBB banda-larga móvel (do inglês, Mobile Broadband).
eNB Nó B melhorado (do inglês, evolved Node B).
EPC Núcleo Evoluído de Pacotes (do inglês, Evolved Packet Core).
FC-Layers Camadas Totalmente Conectadas (do inglês, Fully-Connected Layers).
GAF Campos Angulares Gramianos (do inglês, Gramian Angular Fields).
GADF Campos Angulares da diferença Gramianos (do inglês, Gramian Angular

Difference Field).
GASF Campos Angulares de Soma Gramianos (do inglês, Gramian Angular

Summation Field).
GGSN Roteador de Borda de Suporte GPRS (do inglês, Gateway GPRS Support
Node).
GPRS Serviço Generalizado de Pacotes de Rádio (do inglês, Generalized Packet

Radio Service).
GSM Sistema Global de comunicação Móvel (do inglês, Global System for
Mobile communications).
IoT Internet das Coisas (do inglês, Internet of Things).
ISP Provedores de Serviço de Internet (do inglês, Internet Service Providers).
LSTM memória longa de curto-prazo (do inglês, Long Short-Term Memory).
LTE Evolução de Longo Prazo (do inglês, Long Term Evolution).
MAC Operações de Multiplicação e Acumulação (do inglês, Multiply-ACcumulation

operations)
MIMO Múltiplas Entradas e Múltiplas Saídas (do inglês, Multiple Inputs Mul-
tiple Outputs).
ML Aprendizado de Máquina (do inglês, Machine Learning).
mMTC Comunicação Massiva do tipo Máquina (do inglês, Massive Machine-

Type Communication).
MSE Erro Quadrático Médio (do inglês, Mean Square Error).
MTF Campos de Transição de Markov (do inglês, Markov Transition Fields).
NF Funções de rede (do inglês, Network Functions).
NRMSE Raiz Quadrada do Erro Quadrático Médio Normalizada (do inglês,

Normalized Root Mean Square Error).
NwDAF Função de Analise de Dados de Rede (do inglês, Networks Data Analytics
function).
OSI Interconexão de sistemas Abertos (do inglês, Open Systems Interconec-

tion).
QoE Qualidade de Experiência (do inglês, Quality of Experience).
QoS Qualidade de Serviço (do inglês, Quality of Service).
RMSE Raiz Quadrada do Erro Quadrático Médio (do inglês, Root Mean Square
Error).
RP Gráficos de Recorrência (do inglês, Recurrence Plots).
RSRP Referência de Potência do Sinal Recebido (do inglês, Reference Signal

Received Power).
RSRQ Referência de Qualidade do Sinal Recebido (do inglês, Reference Signal

Received Quality).
RSSI Indicador de Força do Sinal Recebido (do inglês, Received Signal Strength
Indicator).
SDN Redes Definidas por Software (do inglês, Sofware Defined Networks)
SGSN Servidor de Nó de Suporte GPRS (do inglês, Serving GPRS support

node).
SRN Relação Sinal-Ruído (do inglês, Signal-to-Noise Ratio).
UE Equipamento de Usuário (do inglês, User Equipment).
uRLLC Comunicações Ultra-Confiáveis de baixa latência (do inglês, Ultra-

Reliable Low-Latency Communications).
VoIP Voz sobre IP (do inglês, Voice over IP).
Wifi Fidelidade sem fio (do inglês, Wireless Fidelity).

Lista de símbolos
R Conjunto dos Números reais.
RN Espaço Vetorial das N-uplas de números reais.
x Vetores.
X Matrizes.
φ Angulo entre vetores.
|·| Operação Norma-L1.
k·k Operação Norma-L2.
h, i Produto Escalar.
θ Conjunto de parâmetros.
Limiar (do inglês, threshold).
1cond Função degrau.

Sumário
1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1 Problema de pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Motivações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4 Hipótese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.5 Justificativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.6 Resultados obtidos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.7 Organização do texto . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2 FUNDAMENTAÇÃO TEÓRICA . . . . . . . . . . . . . . . . . . . . 6
2.1 Aprendizado de máquina . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.1 Capacidade, sobreajuste e subajuste . . . . . . . . . . . . . . . . . . . . . 6
2.2 Aprendizado profundo . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2.1 Camadas totalmente conectadas . . . . . . . . . . . . . . . . . . . . . . . 9
2.2.2 Camadas convolucionais . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.3 Redes convolucionais residuais – ResNet . . . . . . . . . . . . . . . . . . . 12
2.2.4 Long Short-Term Memory – LSTM . . . . . . . . . . . . . . . . . . . . . 12
2.3 Redes de Computadores . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.3.1 Núcleo da rede . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3.2 Redes não guiadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3.3 Redes 5G e para além das redes 5G . . . . . . . . . . . . . . . . . . . . . 21
2.4 Métodos de transformação de séries temporais em imagens . . . . . 23
2.4.1 Gráficos de recorrências . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4.2 Campos angulares gramianos . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.4.3 Campos de transição de markov . . . . . . . . . . . . . . . . . . . . . . . 25
3 TRABALHOS RELACIONADOS . . . . . . . . . . . . . . . . . . . . 27
4 ARCABOUÇO DE PREVISÃO DE CQI EM REDES B5G . . . . . . 30

4.1 Conjunto de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
4.2 Métodos de Aprendizado Profundo . . . . . . . . . . . . . . . . . . . 33
4.3 Predições de valores futuros . . . . . . . . . . . . . . . . . . . . . . . 35
5 AVALIAÇÃO EXPERIMENTAL . . . . . . . . . . . . . . . . . . . . . 36
5.1 Procedimento experimental . . . . . . . . . . . . . . . . . . . . . . . . 36
5.1.1 Preprocessamento dos dados . . . . . . . . . . . . . . . . . . . . . . . . . 36
5.2 Treinamento e ajuste dos parâmetros dos modelos profundos . . . . 38
5.3 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
6 CONCLUSÕES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
REFERÊNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
1
1 Introdução
Em geral, o consumo de dados esperado por seres humano costuma seguir com-
portamentos cíclicos e sazonais, apresentando em certos períodos do dia um aumento
da taxa de transmissão (e.g., períodos de pico) e uma baixa taxa de transmissão (e.g.,
períodos noturnos). Porém, novos padrões de consumo de dados móveis não centralizados
no comportamento humano estão cada vez mais presentes nas redes móveis, fazendo com
que os recursos das redes móveis atuais, como as Redes de Quarta Geração (4G), se
esgotem. Exemplos destes novos padrões de consumo são as transmissões de vídeos de
ultra-altas resolução, que precisam de grandes bandas de comunicação; e comunicações
massivas entre maquinas, com uma massiva quantidade de pequenos pacotes de dados que
inundam continuamente as redes móveis (FU et al., 2018)
Logo, como um habilitador para estes novos padrões de consumo e suas aplicações
futuras, as Redes de Quinta Geração (5G) começaram a ser padronizadas e implantadas
ao redor do mundo. Essencialmente, as redes 5G possuem uma infraestrutura heterogênea
de serviços que podem ser categorizados em três principais frentes: a de cominuição de
banda-larga móvel (do inglês, Mobile Broadband – eMBB), voltada para uso humano de
aplicações que requerem transferências de grande porte (de 10 a 100× maiores que o
4G) como aplicações multimídia de ultra-alta resolução; as comunicações ultra-confiáveis
de baixa latência (do inglês, Ultra-Reliable Low-Latency Communications – uRLLC),
voltadas para aplicações que requerem comunicações quase instantâneas (latências menores
que 5ms), referindo-se normalmente a aplicações sensíveis e que envolvem risco a vida
humana, como trens ultra-rápidos e equipamentos de telemedicina; e comunicação massiva
entre máquinas (do inglês, Massive Machine-Type Communication – mMTC), referente a
comunicação massiva dos novos dispositivos de internet das coisas e equipamentos vestíveis
que vem se conectando as redes móveis, como cidades inteligentes, industria 4.0 e relógios
inteligentes (FU et al., 2018).
As Redes 5G são Redes Definidas por Software (do inglês, Software Defined Networks
– SDN) e que adotam como enlace padrão ondas de rádio milimétricos de altas frequências.
O gerenciamento e operação de SDNs contam com uma infraestrutura em nuvem, também
denominada Núcleo 5G, que executa Funções de Rede (do inglês, Network Functions – NF)
virtualizadas. Dentre as diversas funções de rede disponíveis no núcleo 5G, este trabalho
tem como maior foco a Função de Analise de Dados de Rede (do inglês, Network Data
Analytics Function – NwDAF), definida recentemente pela agencia de padronização 3GPP
(do inglês, 3rd Generation Partnership Project). Esta função possui subfunções voltadas
para análise de dados, usadas tanto para o plano de dados (i.e., estações-base), quanto
para o próprio plano de controle (i.e., outras funções de rede) (SEVGICAN et al., 2020).
Capítulo 1. Introdução 2
1.1 Problema de pesquisa

Enlaces de rádio podem sofrer diferentes tipos de interferências, como efeitos doppler
e interferências destrutivas, fazendo com que a qualidade de seu canal tenha variações
em curtos espaços de tempo. Esse problema é ainda mais grave em enlaces de ondas de
rádio milimétricas, como as redes 5G, devido ao seu curto alcance (20 a 30 metros) e
baixa transmissibilidade em objetos densos. Assim, para se avaliar e gerenciar conexões
móveis, alguns indicadores de qualidade de sinal de rádio são fundamentais. Por exemplo,
o Indicador de Qualidade de Canal (do inglês, Channel Quality Indicators – CQI), a
Relação Sinal-Ruído (do inglês, Signal-to-Noise Ratio – SNR), a Referência de Qualidade
do Sinal Recebido (do inglês, Reference Signal Received Quality – RSRQ), a Referência
de Potência do Sinal Recebido (do inglês, Reference Signal Received Power – RSRP),
Indicador de Força do Sinal Recebido (do inglês, Received Signal Strength Indicator – RSSI),
entre outros. Estas medidas de qualidade também são usadas nas redes 5G, em que esses
indicadores são calculados pelos Equipamentos de Usuários (do inglês, User Equipment
– UE) e periodicamente compartilhados com as estações rádio-base (denominadas como
evolved Node B – eNB nas infraestruturas 5G), para que sejam processados e, por fim,
usadas como informação para possíveis correções de modulação do canal ou troca de eNB
com os UEs.
Como as eNBs das redes 5G atuais possuem comportamentos reativos, isto é,
recebem os indicadores de qualidade de sinal que foram calculados sobre eventos recentes,
para só então serem processados e avaliados em instantes futuros, isso faz com que exista
um retardo entre o estado atual do sistema e o estado que foi processado. Esse retardo
pode invalidar as ações corretivas escolhidas, levando a realização de, no pior caso, ações
extremas como o handoff (alteração da tecnologia da comunicação móvel para gerações
anteriores, como o 4G) de redes móveis quando ocorreu apenas um problema pontual. Esse
problema se torna ainda mais grave quando os dispositivos UEs referem-se a nós móveis.
Uma possível contra-medida seria tornar o gerenciamento e a operação da rede pró-ativa,
ou seja, fazer com que as informações de rede sejam preditas pelas estações eNBs (YIN et
al., 2020; PARERA et al., 2019; VANKAYALA; SHENOY, 2020; SAKIB et al., 2020).
1.2 Motivações
As novas redes Para além das Redes 5G (do inglês, Beyond 5G Networks – B5G),
estão sendo propostas para que informações de redes possam ser precisamente preditas por
modelos de Aprendizado de Máquina (do inglês, Machine Learning – ML), evitando-se,
assim, comportamentos reativos. Particularmente, seu principal habilitador refere-se a
função de rede NwDAF prevista na infraestrutura em nuvem entregue pelo núcleo 5G, o
que garante um sistema completo com os recursos necessários para a execução de modelos
de ML para previsão e/ou classificação de diferentes parâmetros e informações da rede.

Nesse sentido, o amplo uso de aprendizado Profundo (do inglês, Deep Learning – DL) vem
impulsionando o desenvolvimento científico em diversos campos de pesquisa, especialmente,
os modelos recorrentes, como as Redes Longas de Memória de Curto-Prazo (do inglês, Long
Short-Therm Memory) que permitem a aprendizagem de características globais de séries
temporais, e os modelos convolucionais, que permitem a aprendizagem de características
locais de diferentes tipos de dados de entrada. Porém, apesar da infraestrutura em nuvem
prevista no núcleo 5G permitir a escalabilidade de suas funções devido a grande quantidade
de recursos existentes, as redes 5G ainda precisam estar de acordo com seus requisitos
de tempo, e isso limita a aplicabilidade apenas a modelos de ML que alcancem estes
requisitos.
Recentes trabalhos sugerem o uso de modelos profundos como ferramentas para
redes de computadores (SEVGICAN et al., 2020; SAKIB et al., 2020; PARERA et al.,
2019; VANKAYALA; SHENOY, 2020), auxiliando, por exemplo, tomadas de decisões e
alocação de recursos. Porém, estes trabalhos possuem algumas limitações. Em sua maioria,
as abordagens são avaliadas em infraestruturas 5G simuladas computacionalmente, ou,
quando atuam sobre dados reais (PARERA et al., 2019), são voltados para redes móveis
de gerações anteriores, como a 4G.
Assim, este trabalho compara o desempenho de diferentes modelos de aprendizado
profundo para a tarefa de previsão de valores futuros do parâmetro de qualidade de
sinal CQI em redes B5G, considerando como fonte de conhecimento dos modelos séries
temporais do parâmetro de CQI obtidas de um conjunto real de dados (RACA et al.,
2020). Para isso, inicialmente foram avaliados modelos profundos recorrentes (LSTM) e
modelos profundos convolucionais de filtros unidimensionais (tradicionais e residuais),
que podem ser diretamente aplicados sobre as séries temporais pré-processadas. Em
seguida, motivados pelas grandes contribuições que a visão computacional vem recebendo
devido aos métodos profundos convolucionais, como no desafiador conjunto de dados
ImageNet (RUSSAKOVSKY et al., 2015), e seguindo os trabalhos de Faria et al. (FARIA
et al., 2016), Hatami et al. (HATAMI; GAVET; DEBAYLE, 2017) e Dias et al. (DIAS et
al., 2020) que conseguiram obter bons desempenhos com técnicas de transformação de
séries temporais em imagens, modelos convolucionais de filtros bidimensionais (tradicionais
e residuais) também foram avaliados em conjunto com técnicas de transformação de séries
temporais em imagens, e.g., as técnicas de Gráficos de Recorrência (do inglês, Recurrence
Plot – RP), Campos Angulares Gramianos (do inglês, Gramian Angular Fields – GAF)
e, também, os Campos de Transição de Markov (do inglês, Markov Transition Fields –
MTF).
1.3 Objetivos
O objetivo central deste trabalho refere-se a tornar o processo de escolha de ações
associadas a qualidade de canal entre os eNBs e os UEs pró-ativas a partir da regressão do
valor futuro (i.e., previsão) do indicador de qualidade CQI das redes B5G. Para isso, três
principais vertentes foram avaliadas: (1) uso de modelos profundos recorrentes; (2) uso de
modelos convolucionais voltados para dados unidimensionais (i.e. séries temporais); e, por
fim, (3) uso de modelos convolucionais voltados para dados representados por imagens,
obtidos por meio de técnicas de transformações de séries temporais em imagens para
aplicação direta nos modelos de visão computacional.
1.4 Hipótese
Este trabalho toma duas principais hipóteses. A primeira delas é que o uso de
infraestruturas mais inteligentes podem beneficiar as redes 5G convencionais. Outra
hipótese é que o uso de modelos profundos voltados para dados representados em forma
de imagens (modelos convolucionais de filtros bidimensionais) podem apresentar um
bom compromisso entre baixa complexidade e bom desempenho quando relacionado as
abordagens do estado-da-arte, dado que técnicas de transformação de séries temporais em
imagens podem auxiliar a percepção de comportamentos cíclicos e sazonais, de similaridades
entre pontos e, também, de comportamentos transitórios.
1.5 Justificativas
Existem diversas abordagens que atuam sobre objetivos semelhantes aos deste
trabalho, especificamente, relacionados à regressão de CQI por métodos de aprendizado
profundo também em redes B5G – maiores informações podem ser encontradas na Seção 3
deste documento. Entretanto, pode-se destacar os seguintes pontos em aberto encontrados
em outros trabalhos da literatura:
1. Ausência de conjuntos de dados reais, de tal forma que seus modelos são treinados e
avaliados somente sobre dados sintéticos e ambientes simulados;
2. O ajuste de modelos, ou mesmo a própria definição de ambientes, que adotam

somente outros tipos de redes móveis, como a rede 4G;
3. Uso de modelos profundos sem compromisso entre complexidade e desempenho, como

modelos totalmente-conectados com grande quantidade de neurônios, modelos de
LSTM com grandes tempos de processamento, e, também, modelos convolucionais
tradicionais.
Este trabalho, além de tratar a regressão de indicadores de qualidade das redes 5G,
um problema pertinente devido a característica reativa dos equipamentos atuais, busca
explorar e desenvolver exatamente estes pontos negativos por meio do uso de um conjunto
de dados desafiador composto por dados reais obtidos da perspectiva de um dispositivo de
usuário conectado a uma provedora de rede móvel 5G da Irlanda (RACA et al., 2020).
Além disso, este trabalho também se diferencia dos demais pelo fato de investigar modelos
convolucionais residuais, de baixa complexidade, e de modelos convolucionais compostos
por filtros bi-dimensionais, atuando conjuntamente com transformações de séries temporais
em imagens para aprendizagem de padrões e características hierárquicas dos dados.
1.6 Resultados obtidos

Ao final deste trabalho, obteve-se:
• Um arcabouço de aprendizado profundo para regressão do valor futuro de CQI das

redes B5G avaliado sobre dados reais.
• Um procedimento de pré-processamento de séries temporais com muitas variáveis

baseado na aplicação de janelas deslizantes e possivelmente, de transformações de
séries em imagens.
1.7 Organização do texto

O restante deste documento está organizado da seguinte forma. A Seção 2 traz
a fundamentação teórica sobre aprendizado de máquina, redes B5G e técnicas de trans-
formação de séries temporais em imagens. Em seguida, a Seção 3 apresenta os trabalhos
relacionados da literatura. Descreve-se o conjunto de dados e os métodos de aprendizado
de máquina adotados na Seção 4. Posteriormente, na Seção 5, são apresentados o proto-
colo experimental, os resultados e discussões. Por fim, a Seção 6 apresenta as principais
contribuições, considerações finais e desenvolvimentos futuros.
6
2 Fundamentação Teórica
Nesta capítulo, é apresentada uma breve fundamentação teórica, primeiramente

introduzindo e diferenciando os conceitos aprendizado de máquina e aprendizado profundo.
Em seguida, aspectos importantes das redes B5G são discutidos e as técnicas de trans-
formação de séries temporais em imagens são definidas. Por fim, apresenta-se a revisão
bibliográfica realizada até o momento, discutindo importantes trabalhos sobre a predição
de parâmetros de redes móveis com aprendizado profundo.
2.1 Aprendizado de máquina

Aprendizado de máquina (ML) refere-se a um subconjunto dos métodos de AI, em
que seus métodos conseguem automaticamente aprender as regras e o padrões da tarefa
com base na apresentação aos dados, evitando, assim, a necessidade de pessoas especialistas
no problema (GOODFELLOW; BENGIO; COURVILLE, 2016). Uma definição de ML
bem conhecida e aceita pela comunidade foi concebida por Mitchell (1997):
Métodos são ditos de ML caso, dado uma tarefa T que queremos que o sistema
aprenda, a medida de desempenho P após a etapa de aprendizagem sobre a experiência E
deve ser maior que quando o sistema não possuía nenhum conhecimento sobre a tarefa T .
Murphy (2012) agrupa os sistemas de ML em 3 principais grupos.
• Aprendizado Supervisionado. Consiste na maior parte dos métodos de ML, os

quais relacionam os vetores de características de entrada com categorias de seu
conjunto de categorias conhecido.
• Aprendizado Não-Supervisionado. Esse, por outro lado, é constituído apenas

por vetores de características, não existindo, a priori, nenhum conhecimento sobre
suas seu conjunto de categorias. Estes métodos realizam, em geral, uma busca de
agrupamentos de dados ou investigação de fatores latentes.
• Aprendizado por Reforço. Por último mas não menos importante e igualmente
desafiador, o aprendizado por reforço refere-se a agentes que devem aprender regras
e os padrões do problema com base na interação do agente com o ambiente, muitas
vezes acontecendo por tentativa e erro.
2.1.1 Capacidade, sobreajuste e subajuste

A grosso modo, métodos de ML obtém sua experiência através do ajuste de seus
parâmetros internos em uma direção que leve sua função de erro, a qual é calculada
Capítulo 2. Fundamentação Teórica 7
sobre o conjunto de dados de treinamento, ao seu ponto ótimo (mínimo). Entretanto,

encontrar o ponto de ótimo da função de erro sobre o conjunto de dados de treinamento
não significa que o método seja bom, pois, diferentemente de problemas de otimização,
métodos de ML tem como objetivo principal minimizar um erro de generalização, isto
é, o erro consequente de sua avaliação sobre conjuntos de dados de teste não vistos durante
treinamento. (GOODFELLOW; BENGIO; COURVILLE, 2016)
Em geral é esperado que o erro de generalização seja maior que o erro de treinamento,
pois é comum que primeiramente se obtenha um conjunto de treinamento, em seguida
treinar os modelos e, apenas ao final, avaliar em observações de teste que são obtidas em
momentos posteriores. Essa diferença que existe entre os instantes de obtenção dos dados
deixa que modificações ocorram na distribuição dos dados, fazendo com que o modelo
não seja totalmente adaptado a distribuição dos dados de teste. Assim, os fatores que
determinam o quão adequado os métodos de ML são para uma tarefa dependem de (1)
sua habilidade em minimizar o erro de treinamento e (2) de sua habilidade minimizar o
espaço existente entre as curvas de erro de treinamento e o erro de teste. Ambos fatores
estão intimamente ligados aos maiores desafios dos métodos de ML: Sobreajuste (do
inglês, overfitting) e Subajuste (do inglês, underfitting). (GOODFELLOW; BENGIO;
COURVILLE, 2016)
• Sobreajuste refere-se a modelos de ML que não conseguem obter erros de teste

igualmente bons aos erros de treinamento, ou seja, o espaço entre as duas curvas são
grandes.
• Subajuste refere-se ao cenário em que os modelos de ML não conseguem aprender

a experiência contida no conjunto de dados de treinamento, isto é, não possuem a
Capacidade de minimizar seu erro de treinamento.
Uma importante característica dos métodos de ML refere-se a sua Capacidade,

isto é, o subespaço do espaço de todas as funções existentes a que o modelo tem acesso a
investigação, também denominado na literatura como espaço de hipóteses do modelo. A
capacidade é diretamente associada a quantidade de parâmetros de um modelo, e, também,
a forma com estes parâmetros estão conectados, por exemplo, independente da quantidade
de parâmetros que um modelo possa ter, a composição de modelos lineares ainda será um
modelo linear. A Figura 1 apresenta exemplos de modelos com diferentes capacidades de
aprendizado aplicados sobre um conjunto de pontos que remete uma parábola (polinômio
de segundo grau). A esquerda, um modelo linear de baixa capacidade, que possui acesso a
um pequeno leque de funções, tem dificuldade em aprender as propriedades do conjunto
de treinamento e, portanto, são propensos a subajustar os dados; Ao meio usa-se um
modelo de capacidade ideal, que extrapola fielmente o padrão dos pontos; Por fim a
direita, usa-se um modelo de alta capacidade, que, por ter acesso a uma grande gama de
Em geral, as camadas fl∈1:L−1 (x; θl ) são denominadas de extrator de características, sendo

a última camada fL (x; θL ) normalmente definida por uma camada de transformação linear
usada como classificador final.
O treinamento dos métodos de DL é dividido em duas fases principais: a etapa
de encaminhamento (do inglês, feedforward) e a etapa de retro-propagação (do inglês,
backpropagation). A fase de encaminhamento faz com que os dados percorram todo o
caminho do modelo DL, começando na camada inicial até alcançar o classificador final, os
quais retornam suas predições. A etapa de retro-propagação, necessária para o treinamento
do modelo, atualiza os parâmetros internos de cada uma das camada a partir de um
otimizador, com objetivo em alcançar o ponto de ótimo de uma dada função de perda (do
inglês, loss function) definida para o problema em questão. (MURPHY, 2012)
Inicialmente, todo modelo DL deve ser treinado do princípio, onde seus pesos são
inicializados aleatoriamente e são submetidos a um primeiro e extenso processo de treina-
mento. Quando a tarefa em questão é similar a outras tarefas que foram anteriormente
avaliadas na literatura, pode-se usar como ponto de partida sua arquitetura profunda e,
caso disponível, inicializar seus parâmetros com os valores previamente treinados. Uma vez
que os parâmetros sejam inicializados, normalmente, os modelos passam por um novo e
limitado processo de treinamento, que tem como objetivo realizar um ajuste fino específico
ao domínio do problema em questão (do inglês, Domain-specific fine-tuning) (GIRSHICK
et al., 2016). Em particular para os métodos de visão computacional, comumente usa-se
arquiteturas profundas bem conhecidas na literatura (Alexnet (KRIZHEVSKY; SUTS-
KEVER; HINTON, 2012), VGG (SIMONYAN; ZISSERMAN, 2015), Resnet (HE et al.,
2016), entre outras) com os valores de seus parâmetros pré-treinados em extensos conjuntos
de dados, como o ImageNet, que são normalmente são publicamente disponibilizados na
internet.
2.2.1 Camadas totalmente conectadas

As Camadas totalmente conectadas (do inglês, fully-connected layers – FC layers),
também podendo ser encontradas na literatura como camadas lineares e camadas densas,
são blocos de construção de redes profundas que realizam uma operação de transformação
linear sobre os dados de entrada x ∈ Rn com o auxilio de seu conjunto interno de
parâmetros W ∈ Rn×m , b ∈ Rm (Equação 2.2).
F C(x; W, b) = Wx + b (2.2)
Como a operação base das camadas FC refere-se a uma multiplicação de matrizes,

toda a informação da entrada tem relevância para o calculo da saída, sendo atribuídos
pesos a todas as características das observações de entrada. Por conta disso, as camadas FC
são usualmente adicionadas ao final de CNNs, pois, como os campos receptivos das últimas
camadas convolucionais normalmente não conseguem cobrir toda a dimensão espacial das
imagens (BASHA et al., 2020), seu uso permite misturar informações de diferentes campos
receptivos, consequentemente, ponderando informações que alcançam diferentes partes
dos dados originais. As camadas FC também podem auxiliar o ajuste de dimensionalidade
dos dados, isto é, levar os dados a novos espaços de características e, também, a definir
arquiteturalmente as tarefas a partir de sua quantidade de neurônios de saída.
Entretanto, devido ao mesmo fato de ponderarem todas as informações de entrada,
sua maior desvantagem refere-se a sua grande quantidade de parâmetros (aproximadamente
89% dos parâmetros de uma VGGNet e 96% dos parâmetros de uma Alexnet estão em suas
camadas FC), o que consequentemente aumentando o custo computacional de execução
destes modelos.
2.2.2 Camadas convolucionais

Nos últimos anos, Redes Neurais Convolucionais (do inglês, Convolutional Neural
Networks – CNNs) vêm obtendo grande sucesso em diversas aplicações práticas, principal-
mente em tarefas de visão computacional. Essa notoriedade tomou grande força após o
ano de 2013, quando Krizhevsky et al. (KRIZHEVSKY; SUTSKEVER; HINTON, 2012)
revisitou as CNNs e conseguiu ganhar a competição do ImageNet (RUSSAKOVSKY et al.,
2015) por uma margem de aproximadamente 10% sobre o último ganhador. A partir desse
ponto, todos os próximos ganhadores do ImageNet foram novas abordagens de CNNs cada
vez mais profundas, como a VGG19 (SIMONYAN; ZISSERMAN, 2015) com 19 camadas,
a GoogleNet (SZEGEDY et al., 2015) com 22 camadas e a ResNet-152 (HE et al., 2016)
com 152 camadas. Como o nome sugere, as CNNs tem como principal operação o calculo
de convoluções entre os dados de entrada e os núcleos de convolução (i.e., parâmetros)
que a camada convolucional carrega.
A convolução é uma operação linear que deve ser calculada entre duas funções
de argumentos reais (a função de entrada x e o núcleo da convolução w), e resulta
em um função real (mapa de características). Em geral sua formalização matemática
pode ser dividida em duas vertentes: a convolução de tempo contínuo (Equação 2.3),
quando a entrada e o núcleo são funções contínuas, ou a convolução de tempo discreto
(Equação 2.4), quando a entrada e o núcleo são funções discretas. (GOODFELLOW;
BENGIO; COURVILLE, 2016)
Z
s(t) = (x ? w)(t) = x(a) · w(a − t)da (2.3)
∞
+∞
X
s(t) = (x ? w)(t) = x(a) · w(a − t) (2.4)
a=−∞
Pode-se entender a convolução como o deslizamento infinito da função núcleo sobre o

instante atual da função de entrada. Porém, uma vez que os recursos computacionais são
finitos e discretos, para ser possível executar convoluções em sistemas computacionais é
necessário que tanto a entrada quanto os parâmetros do núcleo também sejam finitos e
discretos. Para isso, a estratégia comumente adotada pela literatura atribui o valor zero
para todos os instantes da entrada e do núcleo (x e w) que não fazem parte do seu conjunto
finito de pontos. (GOODFELLOW; BENGIO; COURVILLE, 2016)
Segundo Goodfellow et al. (GOODFELLOW; BENGIO; COURVILLE, 2016) as
camadas convolucionais ajudam a obter três importantes propriedades que melhoram os
sistemas de aprendizado de máquina:
1. Interações esparsas: Como o núcleo das convoluções normalmente possui uma dimen-
sionalidade infinitamente menor que o tamanho de sua entrada, as interações entre o
mapa de características e a entrada são mais localizadas, melhorando a desempenho
temporal (complexidade de execução) e espacial (quantidade de parâmetro) dos
modelos profundos.
2. Compartilhamento de parâmetros: Uso de um mesmo conjunto de parâmetros (i.e.,

núcleo) em diferentes partes de uma mesma entrada. aprender um conjunto de
parâmetros extremamente reduzido,
3. Aprendizagem de representações equivariantes: Como consequência direta do compar-

tilhamento de parâmetros, a aprendizagem de representações equivariantes refere-se
a característica de que alterações translacionais que acontecem na entrada, levam
a alterações de mesma proporção nas saídas. Por exemplo, assumindo que uma
operação de convolução foi ajustada para encontrar um certo tipo de padrão na
entrada, mesmo que a localização espacial deste padrão mude nos próximos dados
de entrada, esse mesmo núcleo ainda seria funcional.
Em termos arquiteturais, dificilmente uma camada convolucional é usada isolada-

mente. Em geral, essas camadas estão dentro de blocos convolucionais que são compostos
por três etapas: Convolução, Ativação e Agrupamento. Primeiramente, a etapa de convolu-
ção consiste da execução de camadas convolucionais, que realizam diversas convoluções em
paralelo entre a entrada e cada um dos núcleos. Em seguida, suas saídas multi-dimensionais
são ativadas por uma camada de ativação (ReLU, SeLU, tanh, entre outras), transfor-
mando cada um dos elemento do mapa de características por uma função não linear.
Por fim, mapas de ativações (mapas de características ativados por camadas de ativação)
são encaminhados a uma camada de agrupamento, que tem como objetivo diminuir a
dimensionalidade de sua saída partir de alguma medida de sumarização (média, máximo,
mínimo, entre outros). (GOODFELLOW; BENGIO; COURVILLE, 2016)
for o nível de recorrência do modelo, se assemelhando, por exemplo a profundidade de

modelos profundos, maior a será a chance do modelo sofrer dos mesmos problemas de
desaparecimento e de explosão de gradientes. (HOCHREITER; SCHMIDHUBER, 1997)
Com objetivo de superar estes problemas, Hochreiter et al. (HOCHREITER;
SCHMIDHUBER, 1997) propuseram poderosos sistemas de redes neurais recorrentes,
denominadas como redes longas de memória de curto prazo (do inglês, Long short-term
memory – LSTM). Assim como ilustrado na Figura 3, cada bloco de unidade LSTM
consiste de entrada z t ; os portões de entrada it , esquecimento f t e saída ot que regulam o
fluxo de informações associadas a célula; uma célula ct , i.e., uma matriz de parâmetros
que retém informações de intervalos de tempo anteriores; e seu valor de saída y t . A cada
finalização de execução do bloco, sua saída e sua célula são recorrentemente encaminhados
a entrada do bloco referente ao próximo instante. (HOUDT; MOSQUERA; NáPOLES,
2020)
Abaixo estão listadas as equações de geração de todos os sinais internos necessários
para a execução de um bloco LSTM, sendo Wj ∀ j ∈ {z, i, f, o} os pesos associados as
entradas xt , Rj ∀ j ∈ {z, i, f, o} os pesos associados as saídas recorrentes do passo anterior
y t−1 , pj ∀ j ∈ {z, i, f, o} os pesos associados a célula recorrente do passo anterior ct−1
e bj ∀ j ∈ {z, i, f, o} os parâmetros de viés. g, σ por sua vez referem-se as funções de
ativações tanh e sigmoid, respectivamente.
• Entrada do bloco: z (t) = g(Wz x(t) + Rz y (t−1) + bz )
• Portão de entrada: i(t) = σ(Wi x(t) + Ri y (t−1) + pi ∗ c(t−1) + bi )
• Portão de esquecimento: f (t) = σ(Wf x(t) + Rf y (t−1) + pf ∗ c(t−1) + bf )
• Valor da célula: c(t) = z (t) ∗ i(t) + c(t−1) ∗ f (t)
• Portão de saída: o(t) = σ(Wo x(t) + Ro y (t−1) + po ∗ c(t−1) + bo )
• Saída do bloco: y (t) = g(c(t) ) ∗ o(t)
2.3 Redes de Computadores

Nesta seção são introduzidos conceitos e características das redes de computadores,
em particular, relacionadas a rede global da internet. A maior parte da discussão deste
capítulo foi retirado e adaptado de Kurose et al. (KUROSE; ROSS, 2016), exceto quando
explicitamente referenciado por outros autores. Kurose é um renomado professor da área
de redes na universidade de Massachusetts, com seu livro “Redes de Computadores, uma
abordagem Top-Down” sendo o livro base de diversos cursos de redes ao redor do mundo.
informações de destino, tamanho da mensagem, protocolos usados e entre outras. Nos

sistemas finais de destino, conforme os pacotes vão sendo recebidos seus cabeçalhos são
descartados e, ao final, as mensagens são reconstruídas com base em suas partes. Outra
característica importante é que estes sistemas finais podem não estar próximos o suficiente
para estarem conectados por um único enlace, sendo necessário o uso de uma rede maior
composta por diversos enlaces, como a internet. A internet pode ser vista por meio de
duas perspectivas: (1) uma perspectiva arquitetural de rede, em que os Provedores de
Serviço de Internet (do inglês, Internt Service Providers – ISPs) conectam mundialmente
diversos sistemas finais através de uma rede de Roteadores (Comutadores de Pacotes) e
Comutadores de Enlaces conectados por enlaces (Figura 4); ou (2) por uma perspectiva
de serviços, que enxerga a internet apenas como uma (grande) infraestrutura que provê
serviços (i.e., comunicação) a aplicações que são distribuídas entre diferentes sistemas
finais.
Figura 4 – Perspectiva arquitetural da internet

Redes Móveis
Sistema Final
Servidor
Roteadores
ISP
Sistemas Finais Móveis
Clientes
Estações-Base
Redes Locais
Células de
redes móveis
Enlaces
ISP
Sistemas Finais
Clientes
Fonte: Adaptado de (KUROSE; ROSS, 2016)
Afim de permitir que uma conexão global e universal seja estabelecida entre os
sistemas finais e os dispositivos arquiteturais da internet, que podem ser de diferente
fabricantes, a definição de padrões e protocolos é necessária. Um protocolo define o
formato, o modo e a ordem em que as mensagens são trocadas entre duas ou mais
entidades comunicantes, com uma sequência de ações bem definida que deve ser tomada
para permitir a transmissão e o recebimento destas mensagens. Particularmente, a internet
é organizada em uma arquitetura de camadas, em que cada uma de suas camadas referem-
se a uma parcela bem definida do sistema como um todo e que executa um determinado
protocolo de rede. Esses protocolos oferecem, por sua vez, serviços as camadas subsequentes,
normalmente por meio da execução de ações sobre a mensagem recebida e o encapsulamento
de seu conteúdo para o envio as camada subsequentes. Isso provê modularidade ao sistema,
de tal forma que a realização de modificações em uma camada não altera o funcionamento
das demais camadas, desde que a entrada e a saída das camadas continuem os mesmos.
A internet pode ser dividida em 5 principais camadas, sendo elas a camada física,
a camada de enlace, a camada de rede, a camada de transporte e a camada de aplicação.
Esse conjunto de camadas é normalmente denominado como pilha de protocolo da internet.
Kurose et al. (KUROSE; ROSS, 2016) em seu livro, realiza o estudo de cada uma
das camadas de uma maneira de cima para baixo (do inglês, top-down), as quais são
apresentadas a seguir:
• Camada de aplicação: Consiste de um protocolo distribuído em diferentes sistemas

finais, o qual permite que a aplicação de um sistemas final troque mensagens com
a aplicação em outro sistema final. Exemplos de protocolos da camada de aplicação
são os protocolos HTTP, SMTP, FTP, entre outros.
• Camada de transporte: A camada de transporte carrega as mensagens advin-

das da camada de aplicação e a encapsula na forma de segmentos. Exitem dois
principais protocolos para a camada de transporte, o TCP e o UDP. O TCP provê
serviços orientados a conexão das aplicações, como a entrega garantida de mensagens,
controle de fluxo, fragmentação de mensagens e controle de congestionamento. O
UDP, por outro lado, não prove um serviço voltado a conexões, referindo-se a um
serviço mais simplificado que garante uma segurança ao invés de controle de fluxo e
congestionamento.
• Camada de rede: Esta camada tem como principal protocolo o protocolo IP e

seus protocolos de roteamento. O IP é um protocolo adotado por toda internet, que
permite a identificação e o endereçamento dos sistemas finais. O IP primeiramente
encapsula os segmentos em datagramas, que contém em seu cabeçalho diversos
campos, como o endereçamento e outras informações de controle que podem indicar
como os nós intermediários (roteadores) e finais devem agir sobre estes datagramas
recebidos.
• Camada de enlace: Apesar da camada de rede encapsular os datagramas e definir

o caminho que o pacote deve seguir, não é ela quem efetivamente envia o datagrama
ao próximo nó do caminho. Isso é feito pela camada de enlace. O datagrama recebido
é encapsulado em quadros e encaminhado pelo enlace que conecta ao próximo nó.
Os protocolos desta camada são fortemente associados a tecnologia de comunicação
do enlace (por exemplo, o protocolo de Ethernet e o protocolo WiFi), tendo como
principal função a preparação dos datagramas para serem lançados ao enlace em
questão. além disso, como datagramas podem transitar por diversos nós, diferentes
protocolos de enlaces podem ser usados ao longo do caminho de transmissão de uma
mensagem.
• Camada física: A camada física é aquela que efetivamente transmite os bits dos
quadros através dos meios físicos no mundo real (meios guiados e meio não-guiados).
Existem também outras pilhas de protocolos como o modelo de Interconexão de Sistemas

Abertos (do inglês, Open Systems Interconection – OSI) definida pela ISO, que possuem
camadas de seção e de apresentação adicionais ao modelo padrão de 5 camadas (totalizando
sete camadas). A rigor, a adição destas camadas dependem da necessidade da aplicação,
podendo, portanto, serem incluídas na camada de aplicação.
Em geral, nem todas os equipamentos que compõem a rede implementam todas
as camadas da pilha de protocolos. Sistemas finais em que as aplicações distribuídas
são executadas devem necessariamente executar todas as camadas, contudo isso não é
necessário para outros equipamentos da rede, como os comutadores de enlaces que contém
apenas a camada física de a camada de enlace e os roteadores alcançando até a camada de
rede.
2.3.1 Núcleo da rede

Pela visão de serviços, a internet é uma infraestrutura de rede que permite a troca
de mensagens entre diferentes sistemas finais, as quais são fragmentadas em pacotes e
enviadas através de uma rede. As redes são constituídas por nós (e.g., equipamentos
comutadores de pacotes como roteadores e comutadores de enlaces) conectados por enlaces
que podem ser dividas em redes de borda, para conexão dos sistemas finais a rede, e redes
de núcleo, que interligam mundialmente as diversas redes de borda e permite a conexão
do sistema final fonte ao sistema final de destino. Pode-se verificar ambos componentes
na Figura 4, com as redes locais, redes móveis (lado esquerdo da figura) e a conexão do
servidor (lado direito da figura) sendo redes de bordas; e roteadores internos ao ISP, desde
os regionais até os internacionais, se referindo as redes de núcleo.
O ideal seria que a transmissão de pacotes entre aplicações aconteça de modo
instantâneo, porém isso é impossível por meios clássicos devido a diversos fatores, como
limitações físicas, interferências externas, protocolos e congestionamento da rede. Por
exemplo, os nós da rede normalmente adotam o sistema de transmissão store and forward,
esperando o recebimento de todos os bits de um pacote antes de analisar seu cabeçalho
e o retransmitir para o próximo nó da rede. Além disso, os enlaces transmitem uma
única informação dos pacotes (bits) por vez, fazendo com que cada um dos nós mantenha
uma estrutura de fila (o primeiro que chega é o primeiro que sai) para armazenamento
dos pacotes recebidos até que o enlace de saída esteja livre para sua transmissão. Por
conta desses fatores, a transferência de pacotes podem sofrer atrasos que podem diminuir
o desempenho das aplicações. Os atrasos podem ser categorizados em atrasos nodais,
sendo aqueles que acontecem devido o modo de funcionamento dos nós, como atrasos de
processamento, de fila, de transmissão e de propagação, e em atrasos fim a fim (latência),

sendo a acumulação de todos os atrasos que venham a acontecer ao longo de todo caminho
do pacote na rede. Existem também outros atrasos que as aplicações podem adicionar
ao processo, como o atraso de empacotamento em aplicações de Voz sobre IP (do inglês,
Voice over IP – VoIP) e o atraso induzido por sistemas de transmissão multimídia.
2.3.2 Redes não guiadas

Em particular, o interesse deste trabalho está sobre as redes móveis não guiadas
5G, e, afim de se obter uma imagem mais sólida do que são as redes 5G, esta seção
adiciona novos conceitos e definições que são importantes para a infraestrutura das redes
não guiadas.
• Hospedeiros sem fio: sistemas finais não cabeados, como celulares e notebooks.
• Enlaces sem fio: Meios físicos não guiados que realizam a transmissão dos bits por
ondas eletromagnéticas.
• Estação-base: Dispositivos específicos que são responsáveis pela retransmissão e

coordenação de pacotes enviados de e para os hospedeiros sem fio que estão associados
a ela (i.e., estão conectados e, por consequência, dentro de seu alcance). Exemplo de
estações-bases são as torres celulares para redes móveis (recebendo a denominação
node B – NB para as redes 3G/4G e evolved Node B – eNB para as redes 5G) e pontos
de acesso WiFi normalmente presentes em redes locais que seguem a padronização
802.11 da IEEE.
As redes móveis foram concebidas com intuito de prover conectividade a internet aos
hospedeiros móveis, e, como a telefonia celular já estava presente em grande parte do mundo,
uma possível estratégia seria sua extensão para também lidar com a conexão e transferência
de pacotes com a rede de internet. O primeiro padrão desenvolvido foi o Sistema Global
para comunicações Móveis (do inglês, Global System for Mobile Communications – GSM),
sendo considerado o precursor das redes móveis que identificou e resolveu o problema
das comunicações incompatíveis entre as diferentes partes da Europa. Posteriormente
diversas tecnologias de comunicação celular começaram a ser definidas e implantadas,
sempre buscando aumentar a área de cobertura e prover melhores conectividades e taxas de
transferências de dados cada vez mais altas. Estas redes móveis são normalmente divididas
em gerações, as quais são: 1a geração, voltada apenas para trafego de vós; 2a geração,
também voltada para vós, mas que posteriormente foi estendida para transmissão de dados
com sua versão 2.5; 3a geração, foi a primeira geração que originalmente suportou ambas
formas de comunicação de vós e dados; 4a geração, eliminou a distinção entre redes de vós
e dados do núcleo 3G; e, atualmente, as redes de 5a geração que levam em consideração
novos padrões de consumo não centralizados no comportamento humano. Todas as gerações

atuam em faixas de frequências licenciadas, fazendo com que as operadores telefônicas
tenham que pagar grandes quantias de dinheiro para os governos.
o termo celular vem do fato que as áreas de coberturas geográficas são divididas
em varias células, normalmente ilustradas como hexágonos. Em geral, são inseridas estação-
base ao centro de cada célula, ou na intersecção de três células, as quais atuam como ponte
de transmissão entre os hospedeiros moveis que estão dentro da área de cobertura da célula
e a internet do mundo exterior. Nas redes 2G, um conjunto de estações-bases é coordenado
por um único controlador de estação-base, que tem como responsabilidade alocar canais
aos assinantes (hospedeiros móveis) e indicar a qual estação-base os hospedeiros estão
conectados. Acima dos controladores de estação base, existem também as centrais de
comutação móvel, que realizam a contabilização e autorização de usuários. A arquitetura
geral das rede móveis pode ser vista na Figura 5.
Figura 5 – Estrutura base de uma rede móvel

Células de cobertura
Central de
Comutação
Controlador de
Estação-Base
Internet
Roteador de
borda
Dispositivos de
Estação-Base Células
Usuário
As redes 3G (3a geração) foi a primeira infraestrutura de rede móvel nativamente

planejada para lidar com chamadas de voz e transmissões de dados. Para isso, duas
principais mudanças foram feitas com relação a tecnologia anterior: as redes de bordas
(células de cobertura associadas a estações-base) foram modificadas para lidar tanto com
o serviço GSM de chamada de voz quanto com a transmissão de dados pela internet e o
núcleo das redes móveis foram modificados com uma nova parte que lida especificamente
com a transferência de dados, mantendo intacta a estrutura anterior GSM para operar
apenas com as chamadas de voz. Para isso, dois novos tipos de nós foram desenvolvidos,
um servidor de nó de suporte GPRS (do inglês, Serving GPRS support node – SGSN)
e um roteador de borda de suporte GPRS (do inglês, Gateway GPRS Support Node –
GGSN), em que GPRS significa Generalized Packet Radio Service, referente ao antigo
serviço de dados das redes 2G. Nesta nova infraestrutura das redes 3G (Figura 6) SGSNs
tem a responsabilidade de entregar datagramas aos hospedeiros moveis associados a rede
de acesso sem fio enquanto que GGSNs atuam como roteadores de borda entre a SGSN e
a rede externa da internet, o que permite esconder a mobilidade dos hospedeiros da rede
de internet.
Figura 6 – Estrutura de uma rede móvel 3G

Células de cobertura Central de Roteador de
Comutação borda
Rede
Telefônica
Chamadas Telefônicas - GSM
Controlador Trafego de internet

RNC
Internet
SGSN GGSN
Dispositivos de
Estação-Base Células
Usuário
Em seguida começaram a ser desenvolvidas as redes de 4a geração, também

denominadas como redes de evolução a longo-prazo (do inglês, long-term evolution – LTE),
e que são largamente usadas até os dias atuais. Elas possuem duas principais diferenças com
relação 3G: o uso de uma rede de núcleo denominada como Núcleo de Pacotes Desenvolvido
(do inglês, Evolved Packet Core – EPC) que unifica ambas redes de voz e serviço de dados
em uma única rede regida pelo protocolo de datagramas IP; e o uso de uma rede de acesso
por rádio LTE, que combina tecnologias de multiplexação de tempo e frequência nos canais
de conexão de modo dinâmico, com uso de antenas de múltiplas entradas e múltiplas
saídas (Multiple Inputs Multiple Outputs – MIMO). Kurose et al. (KUROSE; ROSS, 2016)
adiciona que, apesar do protocolo IP não serem totalmente adequados para realização de
chamadas de voz (VoIP), espera-se que a EPC consiga controlar os recursos da rede para
oferecer um serviço de alta qualidade. Além disso, a EPC faz uma separação nítida entre
os planos de controle da rede e os planos de dados do usuário.
2.3.3 Redes 5G e para além das redes 5G

No momento a arquitetura atual das redes móveis é em sua maior parte feita pelas
redes de quarta geração (4G), que foram inicialmente concebidas para um uso humano.
Porém, nos dias atuais novas classes de dispositivos conectados à Internet estão surgindo
para os mais diversos propósitos, com diferentes tipos de tecnologias de Internet das Coisas,
equipamentos inteligentes como os modernos celulares e relógios, veículos terrestres e aéreos
autônomos, indústria 4.0 e equipamentos de telemedicina. Por conta disso, perspectivas
futuras realizadas pela Cisco diziam que o trafego de dados iria crescer mais que 3×
entre os anos de 2017 e 2022, podendo alcançar até 122 exabytes (EB) de transmissão de
dados por mês em 2022 com um total de 28, 5 bilhões de dispositivos de usuário (UEs)
conectados simultaneamente, sendo que no ano de 2017 o trafego estava por volta de 11,51
EB (PHAM et al., 2020 apud FORECAST, 2019). Taxas de transmissão nestas proporções
estão esgotando os limites da infraestrutura de rede atual, levando a congestionamentos e,
consequentemente, uma degradação de qualidade de serviço (do inglês, Quality of Service -
QoS), uma medida relacionada a velocidade de entrega (largura de banda), e de qualidade
da experiencia (do inglês, Quality of Experience - QoE), uma medida relacionada a latência
e atrasos da rede, que são entregues aos seus usuários (SEVGICAN et al., 2020). Assim,
as redes de celulares 5G foram projetadas para atender todas as novas frentes de uso da
Internet, através da garantia de uma serie de requisitos, por exemplo, provendo de altas
taxa de transferência a uma latência mínima, o que resultaria em uma substancial melhora
na QoS e QoE observada pelos seus usuários.
As redes 5G são consideradas heterogêneas, pois divide-se em três principais grupos
de usuários com padrões de consumo diferentes entre sí, sendo eles: o serviço de banda-larga
móvel melhorado (eMBB), o serviço de Comunicações Ultra-Confiáveis de Baixa Latência
(uRLLC) e a Comunicação Massiva do tipo Máquina (mMTC). O serviço de eMBB busca
prover altas taxas de transmissão, sendo um habilitador para aplicações multimídia de
alta resolução e dispositivos de realidade virtual/aumentada. uRLLC relaciona-se, em
geral, a aplicações que necessitam uma baixa latência de transmissão, por exemplo, em
equipamentos que envolvem riscos a vida humana, como carros autônomos e aplicações
de telemedicina. Por fim, o mMTC que se refere à comunicação entre máquinas (e.g.,
dispositivos de IoT), com uma grande quantidade de transferências de dados pequenos
constantemente ao longo do dia, muito diferente do comportamento humano que apre-
senta características cíclicas e sazonais com picos de consumo em determinadas horas do
dia. (SEVGICAN et al., 2020; PHAM et al., 2020)
Gerir a transferência de diferentes tipos de dados sob limitações restritas de tempo
induzem uma grande demanda tanto de recursos de comunicação quanto de computa-
ção (PHAM et al., 2020). Por conta disso, as redes 5G foram desenvolvidas como redes
definidas por software (SDNs). Por conta disso, as redes 5G possuem em sua infraestrutura
um controle centralizado de serviços de nuvem, que virtualiza tarefas através de funções

de rede (NF), diminuindo consideravelmente a necessidade de recursos nos eNBs. Mesmo
assim, as redes 5G enfrentam alguns desafios, como a mistura dos planos de dados e de
controle na entrada dos sistemas em nuvem (FU et al., 2018), e a perda de desempenho
devido ao comportamento reativo (método padrão) de seus equipamentos de borda (eNBs).
Um exemplo de infraestrutura das redes 5G é indicado na Figura 7. As eNBs
das infraestruturas atuais das redes 5G contam com tecnologias de MIMO, realizando
conexões que transmitem dados por múltiplas antenas. Porém, como ondas eletromagnéticas
milimétricas tem dificuldade de atravessar materiais densos e apresentam pequenas áreas de
cobertura (alcance de aproximadamente 30 metros), eNBs se conectam aos UEs por meio de
Células Pequenas (do inglês, Small Cells). Além disso, as redes 5G dividem a comunicação
em dois planos de comunicações, um plano de controle, onde informações de rede e sinais
de controle são transportados entre o núcleo e os equipamentos de infraestrutura, e um
plano de usuário, em que os pacotes e mensagem dos usuários são transportados de e
para a internet. Também é indicado a infraestrutura em nuvem dedicada que as redes 5G
possuem, as quais recebem requisições de eNBs e outros equipamentos e as processam
através da virtualização de NFs. (GUPTA; JHA, 2015)
Figura 7 – Infraestrutura das redes 5G
núcleo 5G
nuvem
Internet
Redes MIMO
uRLLC eMBB
Células de Conexão
pequenas
Sistemas Comunicação de
finais Sistemas Controle
finais
mMTC
Comunicação de
Dados
Sistemas
finais
Fonte: Adaptado de (GUPTA; JHA, 2015)
Porém, apresentar um comportamento reativo não é ideal, por conta disso, a

entidade de padronização 3GPP (3rd Generation Partnership Project) vem desenvolvendo
a NF de análise de dados de rede (NwDAF), usada como habilitador para o desenvolvimento

de equipamentos mais inteligentes para as redes B5G. Tal função prevê um conjunto de
algoritmos de inteligência artificial pré-implementados que podem ser invocados através de
requisições ou por consequência de resultados de outras NFs (assinantes de informações). A
saber, alguns dos serviços fornecidos pela NwDAF estão listados a seguir: comportamento
anormal, comportamento esperado, nível de carga de uma fatia da rede, desempenho de
carga da rede, análise de carga de funções de rede, informações de congestionamento,
mobilidade, qualidade de serviço, entre outros (SEVGICAN et al., 2020).
Neste contexto, este trabalho prevê o desenvolvimento de um arcabouço de apren-
dizado profundo para a previsão de valores futuros de indicadores de qualidade das redes
5G. Dessa forma, busca-se tornar o sistema que atualmente é reativo (espera o envio das
informações pelo UE) em um sistema pró-ativo consegue prever de ante-mão o estado
futuro com base no histórico passado. Para isso, assume-se um sistema virtualizado em
nuvem capaz de prover recursos computacionais para a aplicação de sistemas de ML, em
particular com uso da NF NwDAF das redes B5G.
2.4 Métodos de transformação de séries temporais em imagens

Séries temporais referem-se a uma sequência de dados organizados de uma maneira
temporal. Como os valores de transmissões das redes são observados ao longo do tempo,
a ordem em que cada um dos dados está apresentado representa um ponto fundamental.
Diversos trabalhos até o momento exploraram formas de transformar séries temporais
em representação pictórica. Por exemplo, Faria et al. (2016) explora o uso de RP para
reconhecimento fenológico de plantas; Hatami, Gavet e Debayle (2017) investiga o uso
de RP em séries temporais do repositório de dados UCR; e Dias et al. (2020) que usa as
técnicas baseadas em GAF e MTF para reconhecimento de áreas de eucaliptos em imagens
de sensoreamento remoto.
A seguir são apresentados as técnicas de transformação de séries temporais (dados
uni-dimensionais) em imagens (representação bi-dimensional) que serão exploradas durante
o desenvolvimento deste projeto de pesquisa.
2.4.1 Gráficos de recorrências

Gráficos de Recorrência (RP) é uma técnica de visualização de dados usada para
capturar repetições de eventos. Em outras palavras, RP busca capturar comportamentos
periódicos e cíclicos em séries temporais representadas em forma de vetores de alta
dimensionalidade x ∈ RN ×D ao projetá-los sob matrizes bi-dimensionais RPN ×N , i.e.,
imagens (FARIA et al., 2016). Em sua formulação mais geral (Equação 2.5), calcula-se a
norma entre duas entradas de alta dimensionalidade, as quais, em seguida, são subtraídas
por um termo de limiar e, por fim, encaminhadas uma função degrau.
RPi,j = 1>0 ( − kxi − xj k), para xi ∈ RD e i, j = 1, 2 . . . , N (2.5)
Especialmente, neste trabalho será usada a versão simplificada de RP adotada por

Faria et al. (2016), o qual usa vetores uni-dimensionais x ∈ RD , um limiar = 0 e calcula,
simplesmente, a norma-L1 do vetor uni-dimensional de entrada com relação a seus demais
pontos (Equação 2.6). Foi escolhido essa versão pois, assim como indicados por outros
trabalhos (HATAMI; GAVET; DEBAYLE, 2017; LI; KANG; LI, 2020), a adição do termo
de limiar com a função de degrau unitário leva a imagem de saída a ser binária, resultando
em uma grande perda de informações.
RPi,j = |xi − xj |, para xi ∈ R e i, j = 1, 2 . . . , D (2.6)
De modo prático, a função recebe uma série-temporal de entrada na forma de um

vetor linha x ∈ RD , em que D refere-se ao número de pontos da série-temporal, o qual
repetido ao longo da dimensão das linhas D vezes, resultando em uma matriz X ∈ RDxD .
Agora, em forma de uma matriz quadrada, subtrai-se por sua versão transposta e, por
fim, aplica-se a função módulo |X − XT | e obtém-se os gráficos de recorrências da série
temporal de entrada. Desta maneira cada coluna da matriz RP representa a distância-L1
entre um ponto i com relação a todos os demais pontos j 6= i para todo j ∈ {1, . . . , D},
permitindo, assim, a visualização gráfica da variação de cada ponto da série-temporal com
relação aos demais.
Como o RP é calculado a partir de uma diferença entre os valores da série temporal
de entrada, a imagem de saída pode apresentar valores reais RPi,j ∈ R. Porém, como as
séries temporais neste trabalho são normalizadas para valores no intervalo de [−1, 1], a
diferença entre dois pontos quaisquer também estará dentro deste intervalo.
2.4.2 Campos angulares gramianos

Campos Angulares de Gramianos (GAF) é uma técnica relacionada a matriz
Gramiana da álgebra linear, a qual é obtida a partir do produto interno entre pares de
vetores de um conjunto. Em aplicações gerais sobre o espaço euclidiano, o produto interno,
nesse caso, refere-se ao bem conhecido produto escalar, cujo qual é indicado como h, i
e é calculado como o produto da norma de dois vetores x, y ∈ RD com o cosseno do
angulo entre eles (φ), ou seja, hx, yi = kxkkyk cos(φ). Entretanto, caso todos os vetores
tenham norma unitária, o produto escalar, agora, refere-se a simplesmente o cosseno do
ângulo entre os vetores hx, yi = cos(φ), e, portanto, as matrizes Gramianas também serão
calculadas através do cosseno do angulo entre os pares de vetores. Assim, a técnica GAF
de modo temporal correlaciona todos os pontos de uma série-temporal, i.e., performa uma
medida de similaridade que é inerente ao cálculo do produto escalar, a projeção entre
vetores (DIAS et al., 2020).
A partir da definição supracitada, derivam-se os Campos Angulares de Soma Gra-
mianos (do inglês, Gramian Angular Summation Field – GASF) e os Campos Angulares
da Diferença Gramianos (do inglês, Gramian Angular Difference Field – GADF) introdu-
zidos por Dias et al. (2020) para a transformação das séries temporais em representações
pictóricas. De modo geral, enquanto GASF explora somas trigonométrica, GADF explora
diferenças trigonométricas entre o angulo dos vetores. Na prática, para aplicar a transfor-
mação GASF/GADF sobre séries temporais x, primeiramente normaliza-se seus valores
para corresponder a Imagem das funções trigonométricas básicas (cosseno e seno), ou seja,
para valores dentro do intervalo [−1, 1] através de uma normalização por mínimo/máximo.
Denotaremos a série-temporal normalizada por x̂. Em seguida, transforma-se seus valores
para ângulos através da aplicação da função inversa da função trigonométrica cos, o arccos,
para cada um de seus valores, resultando, então, em x̂ ˆi = φi = arccos(x̂i ). Uma vez
obtido os valores em ângulos, por fim, pode-se construir as matrizes GASF e GADF,
respectivamente, através do cosseno da soma de ângulos e do seno da diferença entre
ângulos:
GASFi,j = cos(φi + φj ), (2.7)

GADFi,j = sin(φi − φj ). (2.8)
Como as funções trigonométricas cos(·) e sin(·) são funções R → [−1, 1], as imagens
de saída para ambas transformação GADF e GASF também estão no intervalo [−1, 1]
2.4.3 Campos de transição de markov

Enquanto RP ressalta as informações variacionais das séries temporais e GAF
a similaridade entre as séries temporais, os Campos de Transição de Markov (MTF)
codificam em forma de imagem estatísticas de transição entre estados. Segundo Dias et al.
(2020), a codificação de séries temporais em imagens através da técnica MTF acontece da
seguinte forma:
1. Discretiza-se os valores da série-temporal em K “bins” de mesmo tamanho. De

modo prático, primeiramente encontra-se o intervalo de valores da série-temporal x,
dado por [min(x), max(x)], e o divide em K intervalos de mesmo tamanho. Por fim,
itera-se sobre os valores da série-temporal alterando cada um deles para a numeração
do sub-intervalo k ∈ {1, 2, . . . , K} que ele pertence, permitindo, assim, representar
os estados possíveis que a série pode assumir.
27
3 Trabalhos relacionados
Os principais trabalhos da literatura voltados para previsão de parâmetros em

redes móveis por métodos de aprendizado profundo são descritos nesta Seção. Atribuindo
especial atenção aos métodos que envolvam a predição de CQI sobre as redes B5G. Porém,
na literatura também pode-se encontrar métodos de predição para as redes móveis LTE,
também conhecidas como 4G, como em (PARERA et al., 2019), ou sobre outros parâmetros
de rede, como em (SAKIB et al., 2020).
Yin et al. (2020) propuseram o uso do método LSTM com um módulo de treinamento
online para predição do indicador de qualidade de sinal CQI em redes 5G, com objetivo
principal de reduzir o impacto de valores desatualizados de CQI. Primeiramente, foi
avaliado o impacto do uso de CQI desatualizado em sistemas 5G, e, posteriormente, a
partir da geração de dados de simulações no ambiente NS-3, introduziu e avaliou a melhora
de desempenho da sua proposta treinada sobre dados de simulação. Em seu arcabouço, é
usado o valor de CQI predito pelo modelo no lugar do valor de CQI retornado pelos usuários
como entrada para a camada de acesso médio (MAC) dos eNBs. Em geral, os autores
realizam comparações de desempenho entre sua proposta de uso de LSTM e algoritmos de
predição de CQI baseados em Feedforward Neural Networks a partir do mesmo sistema
de simulação. Para tanto, foram explorados dois modelos distintos: o LSTM, com uma
camada fully-connected com 40 neurônios, uma camada intermediária com 30 unidades
LSTM e uma camada de saída que soma as saídas da camada intermediária; e uma Rede
Neural Profunda, com 40 neurônios de entrada, NH neurônios escondidos, e 30 neurônios
de saída. Ambos modelos recebem janelas contendo 40 valores de CQI como entrada
e usam a função de ativação SeLu para evitar a explosão de gradientes. São treinados
modelos individuais para cada usuários, os quais ficam ativos por um determinado período
de tempo, dado que os usuários possuem padrões de comportamentos distintos. Assim,
quando o sistema começar a diminuir seu desempenho rapidamente, um novo modelo é
gerado e treinado do zero para se adaptar corretamente ao novo padrão de características.
Sakib et al. (2020) investigam o uso de múltiplas bandas em nós de retrans-
missão para melhorar a eficiência espectral. Os autores visam desenvolver um sistema
baseado em aprendizado profundo para a predição da relação de qualidade de canal
Signal-to-Interference-plus-noise (SINR) em sistemas de muitas bandas. São comparados
o desempenhos de 5 modelos de aprendizado profundo diferentes treinados sobre dados
advindos de ambientes simulados, sendo eles: (1) modelos de regressão; (2) redes neurais
rasas; (3) redes neurais profundas; (4) CNNs uni-dimensionais rasas; e também (5) CNNs
uni-dimensionais profundas. Para as CNNs foram usadas camadas de ativação ReLu,
camadas de normalização de lote, para auxiliar o processo de aprendizagem, camadas de
Capítulo 3. Trabalhos relacionados 28
agrupamento para diminuir o tamanho do fluxo de características, e, também, camadas

totalmente conectadas para saída do modelo. A diferença entre a versão rasa e profunda
refere-se, principalmente, a quantidade e tamanho de cada uma das camadas. As entradas
dos modelos são obtidas a partir da técnica de janela-deslizante, em que uma janela de
tamanho fixo (200 pontos) é obtida a partir da série-temporal de valores anteriores (pas-
sado) de qualidade de canal, de tal modo que os modelos devem predizer corretamente os
próximos 50 pontos (futuro) da série-temporal. Dentre os modelos investigados, observou-se
que as CNNs-rasas foram as que mais se destacaram, visto que os nós de retransmissão
sofrem com restrições de recursos.
Vankayala e Shenoy (2020) afirmam que a solicitação de CQI por parte dos eNB
gera latência e além disso não são sempre necessárias. Assim, os autores, buscam classificar
o estado do estimador de CQI associado as UEs, ou seja, uma vez que é constatado que o
sistema está divergindo dos valores reais, é necessário a requisição de novos valores de CQI
por parte da UE que serão usados para o ajuste do preditor. Os autores motivam o porquê
da escolha de classificar o momento de requisição de novos CQI enunciando conceitos de
teoria da informação e probabilidade através de lemas que reforçam o fato que: aumentar
a quantidade de observações de uma amostra, por exemplo de CQI, não significa melhorar
a capacidade de predição de um modelo. Para o classificador, os autores adotam uma
topologia de rede neural mais simples com Pi,k entradas, onde i refere-se ao i-ésimo UE
dentre I UEs e k refere-se a k-ésima sub-banda do eNB dentre K possíveis sub-bandas,
3 camadas escondidas e, por fim, uma camada de saída de mesma dimensionalidade da
entrada, de tal modo que, caso a saída seja o valor 1, deve-se solicitar seu valor de CQI.
Entretanto, em seus experimentos, apesar de enunciarem essa topologia do classificador,
os autores adotam o método de requisição de CQI por escolha aleatória. Por outro lado,
para o modelo estimador, foi adotado uma topologia de rede profunda e complexa, o
qual recebe um vetor de valores de CQI com o valor 0 nos CQIs desconhecidos e que
resulta, por sua vez, em um vetor de mesmo tamanho mas com os valores estimados dos
CQIs faltantes. São comparadas duas redes neurais distintas para o estimador, uma com
4 camadas escondidas e outra com 5 camadas escondidas, todas seguidas de funções de
ativação ReLu e otimizadas a partir do otimizador Adam. Os autores concluem que a rede
neural com 5 camadas, que é mais complexa e com uma maior quantidade de parâmetros,
gera resultados melhores.
Parera et al. (2019) tomam como base o cenário de várias células de comunicação
4G, operando com múltiplas frequências portadoras, e buscam predizer CQI sobre cada
portadora através da aplicação de aprendizado profundo quando pouca ou nenhuma
informação está disponível. Os autores adotam dois principais cenários. O primeiro acontece
quando é realizado uma transferência de aprendizado de modelos referentes a portadoras
de uma mesma célula. O segundo, quando realiza-se transferência de aprendizado sobre
modelos atuando sobre a mesma frequência portadora porém de células vizinhas. São
Capítulo 3. Trabalhos relacionados 29
avaliados, como linha de partida, dois métodos preditivos não relacionados a aprendizado
profundo: por média, em que o próximo CQI é predito como a média dos CQI anteriores,
e por auto-ARIMA, uma implementação automática da técnica Auto-Regressiva de média
móvel integrada (do inglês, Auto-Regressive Integrated Moving Avergage – ARIMA). Em
seguida, os resultados obtidos através da linha de partida são comparados com os resultados
de uma CNN uni-dimensional constituída por 3 camadas convolucionais e uma camada
totalmente conectada ao final, e também com os resultados de um modelo LSTM, com
sua camada de entrada composta por unidades LSTM e ao final uma camada totalmente
conectada. Os modelos são treinados sobre dados provenientes de uma rede móvel 4G
em aplicação real, com seus dados espaçados de hora em hora se referindo a média da
variação do CQI neste período. Estas séries temporais são inicialmente normalizadas e,
posteriormente, sub-divididas através de janelas deslizantes de tamanho fixo em 24 pontos.
Considerando esses trabalhos, a Tabela 1 apresenta um sumário das principais
características de cada um. Pode-se destacar que a proposta deste trabalho se diferencia
dos demais por adotar um cenário real, com uso de parâmetros de infraestrutura de
rede calculados por um UE conectado a uma rede 5G em funcionamento e, também, por
investigar o uso de CNN-2D sobre representações pictóricas de séries temporais.
Tabela 1 – Sumário relacionando as principais características dos trabalhos citados

Características
Trabalhos
B5G Dados Reais CNN-1D CNN-2D LSTM Redes Neurais CQI
(YIN et al., 2020) X X X X
(SAKIB et al., 2020) X X X
(VANKAYALA; SHENOY, 2020) X X X
(PARERA et al., 2019) X X X X
Abordagem proposta X X X X X X
30
4 Arcabouço de previsão de CQI em redes

B5G
Neste capitulo descreve-se o arcabouço profundo desenvolvido neste trabalho,

voltado para a previsão de valores futuros do Indicador de Qualidade de Canal (CQI) em
redes B5G. O arcabouço geral é ilustrado nas Figuras 9 e 10. Na Figura 9 apresenta-se
o panorama esperado para execução do arcabouço, assumindo-se uma UE (estático ou
veicular) conectada a rede 5G que envie periodicamente valores de CQI através de sinais de
controle para o eNB. Seus valores de CQI são recebidos pelas estações eNBs e encaminhados
para o núcleo em nuvem 5G, que mantém um histórico em forma de séries temporais
destes valores. Em seguida (Figura 10), esses históricos são pré-processados e usados para
o treinamento de modelos de aprendizado profundo, que, ao final, são extrapolados para
inferência de valores futuros de CQI com base em novos valores que chegam ao núcleo 5G.
Entretanto, como os autores não possuem acesso a uma infraestrutura real de
nuvem 5G, históricos de transmissão reais obtidos de um conjunto de dados real (RACA
et al., 2020) foram usados para simular a etapa de transmissão de CQI do arcabouço. A
seguir são apresentados (1) as características do conjunto de dados adotado, (2) os modelos
de aprendizado profundo avaliados e (3) o modo de obtenção de suas predições finais.
Figura 9 – Estrutura geral adotada para execução do arcabouço de previsão de CQI em

redes B5G
núcleo 5G
nuvem
Sinais de Pacotes Internet

Controle
Roteadores
de Borda
UE
eNB
Pacotes
Capítulo 4. Arcabouço de previsão de CQI em redes B5G 31
4.1 Conjunto de dados

Sendo um dos diferenciais dos demais trabalhos citados na Seção 3, este trabalho usa
como fonte de conhecimento e meio de avaliação dos modelos de ML um conjunto de dados
real que contém informações de rede 5G obtidas pela perspectiva de um usuário (RACA
et al., 2020). Esse conjunto de dados contém 83 registros de transmissão dos parâmetros
de rede enviados por um dispositivo de usuário. Esses parâmetros foram capturados por
uma aplicação Android (G-NetTrack v18.7) em um celular com conexão 5G (Samsung
S10) conectado a uma operadora móvel da Irlanda. No total existem 3142 minutos de
histórico de transmissão obtidos do lado do usuário, os quais estão organizados em três
diferentes padrões de consumo de dados, sendo eles: (Download de Arquivo, Amazon Prime,
e Netflix); e em dois diferentes padrões de mobilidade (Estático e Veicular). Ainda, para os
padrões de consumo referente a Amazon Prime e Netflix, também são descritos o conteúdo
consumido pelo usuário. Cada um dos registros são capturados até o limite do plano de
dados (80GB), evitando que os dados registrados sejam afetados pela redução da taxa de
download.
Cada um dos históricos de transmissões estão salvos em arquivos em formato csv
(comma-separated-values), em que suas linhas contém os instantes de tempo e suas colunas
os atributos calculados pelo UE (seus nomes e descrições estão disponíveis na Tabela 2).
Figura 10 – Estrutura geral adotada para execução do arcabouço de previsão de CQI em

redes B5G
Nucleo 5G - Infraestrutura em nuvem
Pré processamento
Entrada de CQI
Séries Temporais
de CQI
Treinamento de
Modelos de previsão
NwDAF
Previsões
Previsão de valor futuro CQI

Inferência
NwDAF
Capítulo 4. Arcabouço de previsão de CQI em redes B5G
Tabela 2 – Atributos dos históricos de transmissão
Atributo Descrição Unidade
Carimbo de data Instante de tempo em que obteve-se as medidas Data e hora
Coordenadas geográficas Coordenadas de GPS Latitude e longitude
Velocidade velocidade de deslocamento do UE km/h
Operadora telefônica Nome da operadora de rede móvel 5G (anonimizado) -
Identificação da célula Número de identificação da célula -
Padrão de comunicação Tecnologia de conexão das redes móveis (2G/3G/4G/5G) -
Taxa de download e upload Taxa de transferência em downlink e uplink mensuradas pelo UE kbps
Estado Estado atual do processo de download (idle ou em download) -
Estatísticas de Latência Valores médios e de incerteza do ping mensurado -
CQI Indicador de qualidade com base na taxa de transmissão do canal [0, 16)
RSSI Potência recebida de banda-larga [−100, 0] dBm
RSRQ Relação entre RSRP e RSSI [−43, 20] dB
RSRP Potência média do sinal em uma célula específica [−140, −44] dBm
SNR Relação Sinal-Ruído [−23, 40] dB
Métricas para células vizinhas RSRP e RSRQ de células vizinhas dBm
Fonte: (RACA et al., 2020)
32
4.2 Métodos de Aprendizado Profundo

O teorema “não existe almoço grátis” voltado para aprendizado de máquina diz
que não existe um algoritmo de aprendizado de máquina melhor que todos os demais para
uma determinada tarefa, e, por conta disso, uma pratica comum para a escolha de um
método de ML com relação aos demais refere-se a realização de uma comparação entre suas
medidas de desempenho (GOODFELLOW; BENGIO; COURVILLE, 2016). Por conta
disso, este trabalho investigado 6 diferentes modelos de aprendizado profundo, sendo cinco
deles CNNs e o restante uma rede recorrente LSTM.
1. PareraLSTM (Figura 11a): A pareraLSTM refere-se ao outro modelo de previsão

de CQI em redes 4G proposto por Parera et al. (PARERA et al., 2019) em que
foram usados unidades recorrentes de LSTM para a aprendizagem de características
temporais de longa e de curta permanência (vide Seção 2). Para isso, usou-se blocos
LSTM com retenção de estados (do inglês, stateful) de uma profundidade de 24
pontos e um espaço de características de saída de tamanho 24. Ao final da recorrência,
o vetor de características do último bloco é encaminhado a uma camada FC, voltada
para a tarefa de regressão (1 neurônio de saída).
2. PareraCNN-1D (Figura 11b): a CNN PareraCNN-1D foi retirada do trabalho

de Parera et al. (PARERA et al., 2019), a qual foi originalmente desenvolvida para
a previsão de CQI de redes 4G em instantes de tempos futuros. Sua arquitetura
consiste de 3 camadas convolucionais unidimensionais, atuando como extrator de
características, seguida por uma camada FC de saída, voltada para a tarefa de
regressão (1 neurônio). Devido ao uso de camadas convolucionais unidimensionais, o
modelo recebe como entrada sequências finitas de dados em uma dimensão, como
vetores ou séries temporais e resulta, ao final, em um valor de CQI futuro.
3. PareraCNN-2D (Figura 11b): Versão da ParareCNN-1D com suas camadas

convolucionais 1D alteradas para 2D. Ajustes de dimensionalidade também foram
feitos na camada FC de saída do modelo profundo.
4. ResNet5-2D (Figura 11c): Pode-se dizer que a PareraCNN e a HatamiCNN

são arquiteturas clássicas de CNNs, as quais possuem uma maior quantidade de
parâmetros, devido as suas grandes camadas FC de saída, e que podem também sofrer
com os problemas de desaparecimento e explosão de gradientes (veja a Seção 2 para
maiores informações). Assim, com objetivo de investigar o desempenho de modelos
com menor quantidade de parâmetros, os autores propuseram a CNN ResNet5,
um modelo profundo composto por uma camada convolucional 2D, sucedida por
dois blocos de construção com conexões residuais (cada um com duas camadas
convolucionais 2D) e, por fim uma camada FC de saída voltada para a tarefa
4.3 Predições de valores futuros

Para as CNNs, uma vez que estejam ajustadas sobre o conjunto de dados de
treinamento, a predição sobre os dados de teste acontece de forma natural através de um
procedimento de encaminhamento de dados ao longo do modelo profundo (Seção 2.2).
Para a LSTM, por outro lado, como seu processo de encaminhamento acontece através de
um laço de recorrência, em que cada um dos passos dessa recorrência libera uma saída,
define-se como predição do modelo a saída de seu último bloco de recorrência.
Assim, em um cenário real, uma vez que o modelo comece a apresentar a geração de
valores de CQI degradados, essa informação pode ser enviada de antemão aos eNBs para
que eles tomem ações corretivas afim de manter os requisitos esperados pelas conexões 5G.
36
5 Avaliação Experimental
Neste capítulo, descreve-se o protocolo experimental usado para a avaliação do

arcabouço proposto e os resultados obtidos pela execução do protocolo experimental.
Inicialmente, detalha-se o procedimento experimental, descrevendo as etapas do pré-
processamento dos registros de transmissão, a estratégia de treinamento dos modelos
profundos e a definição dos hiper-parâmetros usados. Por fim, os resultados obtidos são
apresentados e discutidos.
5.1 Procedimento experimental

Em cada experimento, afim de se treinar os modelos profundos sobre as informações
do conjunto de dados, eles devem ser primeiramente pré-processados. Em seguida, os
modelos são treinados do princípio sobre o subconjunto de treinamento dos conjuntos
de dados e parcialmente avaliados sobre o conjunto de validação. Ao final, os melhores
modelos obtidos na etapa de treinamento são restaurados para serem avaliados sobre o
subconjunto de dados de teste.
5.1.1 Preprocessamento dos dados

Como descrito na Seção 4.1, o conjunto de dados é composto por 83 registros de
transmissão separados entre padrão de movimentação (estático ou veicular) e aplicações
(Download, Amazon Prime e Netflix). Primeiramente, sanitiza-se cada um dos registros
de transmissão para eliminar valores não avaliados (NaNs) através de um procedimento
de interpolação linear aplicado em seus pontos vizinhos. Em seguida, filtra-se os registros
apenas em pontos conectados a rede 5G. A filtragem em pontos 5G, para cada um dos
registros, gera um conjunto intervalos de pontos contíguos, em que cada intervalo não é
adjacente aos outros e, por exemplo, caso esses diferentes intervalos fossem novamente
concatenados, descontinuidades seriam inseridas na série temporal resultante. Por conta
disso, cada um dos intervalos de pontos contíguos (desde que tenham uma quantidade
mínima de pontos) são tratados como conjuntos de dados independentes, sendo extraídos
series temporais do Indicador de Qualidade de Canal (CQI) para cada um destes intervalos
de pontos independentes. Um exemplo deste procedimento é apresentado na Figura 12,
onde uma série temporal de CQI ilustrativa é dividida em intervalos contíguos de pontos
conectados a rede 5G.
Após a obtenção das séries temporais, primeiramente divide-se seus pontos em um
conjunto de treino, referente aos primeiros 80% dos pontos, e conjunto de teste, com os
Capítulo 5. Avaliação Experimental 38
Figura 13 – Inferência com modelos treinados em dados normalizados e não normalizados
Predições com um modelo treinado com dados não normalizados
Predições com um modelos treinado sobre dados normalizados
transformadas em uma representação bidimensional (i.e., imagens). Para isso, as janelas

são transformadas por cada uma das técnicas de transformação de séries temporais em
imagens descritas na Seção 2.4 (RP, GADF, GASF e MTF) e são agrupadas sobre uma
mesma dimensão de canal, formando ao final uma imagem bidimensional de 4 canais. Por
fim, agora que os dados estão devidamente ajustados para a dimensionalidade de entrada
dos modelos profundos, o conjunto de treinamento é mais uma vez dividido entre um
(novo) conjunto de treinamento (80% dos dados de treino) e um conjunto de validação
(20% finais dos dados de treinamento), como boa prática de se evitar avaliar os modelos
diretamente sobre o conjunto de teste durante a etapa de treinamento.
5.2 Treinamento e ajuste dos parâmetros dos modelos profundos

Uma vez que os dados estejam disponíveis em sua dimensionalidade correta, mo-
delos profundos individuais são construídos para cada um dos conjuntos de janelas
dos intervalos contíguos de tempo e treinados do princípio sobre seu subconjunto de
treinamento. O processo de treinamento sobre os dados de treinamentos são repetidos por
e épocas, em que para cada época o modelo realiza uma passagem completa sobre todos os
dados do subconjunto de treinamento, realizando seus procedimentos de encaminhamento
de dados, para geração de predições e o calculo da função de perda, e de retro-propagação,
para o ajuste de seus pesos internos em direção da minimização da função de perda. Em
cada época, após a etapa de treinamento (encaminhamento e retro-propagação) os modelos
são intermediariamente avaliados sobre o conjunto de dados de avaliação, servindo como
uma verificação intermediária da habilidade de generalização dos modelos.
Em particular, modelos de aprendizado de máquina são em geral direcionados
a funções de objetivo, as quais traduzem o problema em uma formula matemática que
será minimizada ou maximizada. Como o arcabouço proposto é voltado para previsão de
valores futuros, ou seja, regressão, uma função objetivo comum neste caso refere-se ao
Erro Quadrático Médio (do inglês, Mean Squared Error – MSE), uma função de perda
definida pela média dos erros ao quadrado (Equação 5.1).
N
1 X
M SE(ŷ, y) = (yi − ŷi )2 (5.1)
N i=1
O MSE possui a característica de penalizar valores de erros (diferença entre o valor
esperado e o valor predito) grandes com pesos ainda maiores, pois a penalização não
é proporcional ao erro, mas ao seu quadrado. Além disso, os valores do MSE não são
diretamente relacionados a unidade de medida dos dados de entrada, sendo necessário
realizar a operação de raiz quadrada (do inglês, square Root) sobre o MSE (RMSE)
para-se verificar a média do erro na mesma unidade do problema, no caso do arcabouço
desenvolvido, em unidades de CQI. Neste trabalho adotou-se como função de perda o
RMSE.
O melhor modelo encontrado durante o processo de treinamento, tomando como base
o desempenho sobre o conjunto de dados de validação, é recuperado ao final para inferência
sobre o conjunto de dados de teste, tendo seus valores de desempenho apresentados e
discutidos na Seção 5.3 de resultados.
A rigor, o processo de treinamento de modelos profundos requer a definição de
alguns hiper-parâmetros. Durante a avaliação de todos os modelos profundos foram usados o
mesmo conjunto de hiper-parâmetros de treinamento propostos por Parera et al. (PARERA
et al., 2019), os quais estão presentes na Tabela 3.
Tabela 3 – Hiper-parâmetros de treinamento
Hiper-parâmetros CNNs LSTM

Tamanho da janela w* 24 24
Tamanho de mini-lote 128 1
Épocas 300 300
Otimizador Adam Adam
Função de perda RMSE RMSE
Taxa de Aprendizado 0,001 0,001
*A princípio, seguindo o trabalho de (PARERA et al., 2019) usou-se tamanho w = 24 para todos os
experimentos, porém para o modelo ResNet5-2D também verificou-se w ∈ {30, 60, 120}.
5.3 Resultados
A seguir são apresentados os resultados obtidos pelos métodos de aprendizado
profundo a partir da execução do procedimento experimental descrito anteriormente.
Primeiramente, foram-se avaliados os modelos 1D (PareraLSTM e PareraCNN-1D)
como resultados de ponto de partida. Em seguida, com objetivo de verificar a eficácia
do emprego de técnicas de transformação de séries em imagens, fez-se a transformação

direta do modelos PareraCNN-1D para sua versão 2D, o qual espera receber as imagens
de quatro canais (um canal para cada transformação) obtidas a partir do janelamento das
séries temporais. Afim de comparação com os resultados do ponto de partida, outras redes
profundas também foram avaliadas, como as ResNet5-1D, ResNet5-2D e a HatamiCNN-2D.
A Tabela 4 contém os resultados obtidos para cada um dos modelos profundos separados
entre os dois diferentes padrões de movimentação (Estático e Veicular). Os resultados são
apresentados em forma de média e o desvio padrão, obtido sobre os valores de RMSE
normalizados pelo alcance dos valores da séries temporal entrada max x − min x (NRMSE)
para cada um dos modos de movimentação. Neste caso a medida de variação (desvio
padrão) refere-se a variância de resultados que um mesmo modelo apresentou em diferentes
conjuntos de dados do mesmo padrão de movimentação, não refere-se, por exemplo, a
robustez do modelo para um mesmo experimento.
Tabela 4 – Desempenho dos métodos de aprendizado profundo para previsão de CQI
Técnica Padrão de movimento

Métodos
de Aprendizado Profundo Usuário Estático Usuário Veicular
Redes Recorrentes PareraLSTM 12.17 ± 7 26.17 ± 13
PareraCNN-1D 15.82 ± 12 27.86 ± 14
ResNet5-1D 19.53 ± 11 46.78 ± 44
CNNs
PareraCNN-2D 19.02 ± 10 30.58 ± 14
ResNet5-2D 19.22 ± 8 34.12 ± 16
HatamiCNN-2D 22.53 ± 12 32.58 ± 14
Os valores estão apresentados em NRMSE (%).
Verifica-se que a PareraLSTM é o modelo que melhor gerou previsões dos valores
futuros de CQI, com uma taxa de aproximadamente 12% de erro (NRMSE) durante a
inferência no conjunto de dados de teste. Entretanto, apesar de possuir o menor valor dentre
as demais abordagens, devido a escolha de hiper-parâmetros sugerida por Parera et al. (PA-
RERA et al., 2019) seu uso em produção para problemas 5G seria limitado, visto que seu
tempo de treinamento e teste foi o maior entre os modelos, possivelmente devido a sua
estrutura recorrente e a escolha de mini-lotes de tamanho 1. Pode-se também perceber
que a ResNet5-2D possui uma porcentagem de erro um pouco menor que sua versão
1D, permitindo verificar que existe alguma melhora no uso de representações pictóricas
de séries temporais caso o modelo profundo correto seja usado. Com relação ao padrão
de movimentação veicular, pode-se verificar que seus resultados foram majoritariamente
piores que os valores estáticos, o que é esperado visto que os indicadores de qualidade
de sinal sofrem maiores flutuações devidos a efeitos doppler e o desvanecimento rápido
que nós veiculares estão expostos. Por conta disso, os registros de transmissão veiculares
possuem muito mais instantes não conectados a redes 5G, o que quebra o conjunto de
dados original em diversos conjuntos de pontos adjacentes menores que estão conectados a
rede 5G.
Parera et al. (PARERA et al., 2019) usa em seu trabalho uma série temporal que
contém valores da média de CQI espaçados de hora em hora, sendo um dos motivos que fez
os autores escolheram usar janelas de tamanho w = 24, pois assim cada janela conseguiria
conter pontos referentes ao período de uma dia. Entretanto, os registros de transmissão
usados neste trabalho possuem valores de CQI espaçados em aproximadamente 1 valor por
segundo, o que remove a motivação em usar uma janela de tamanho 24. Por conta disso,
avaliou-se a CNN ResNet5-2D, que obteve o menor erro dentre os métodos convolucionais
de filtros 2D para o padrão de movimento estático, com diferentes valores de janelas, sendo
eles w ∈ {30, 60, 120} referindo-se, respectivamente, intervalos de meio minuto, 1 minuto e
2 minutos. Os resultados estão presentes na Tabela 5, onde pode ser visto que uma janela
de meio minuto (w = 30) permitiu melhorar ainda mais seu desempenho.
Tabela 5 – Comparação de desempenho entre diferentes valores de w
valores de w NRMSE (%)

24 19.22 ± 8
30 18.66 ± 10
60 19.84 ± 13
120 21.20 ± 12
Estes valores foram obtidos apenas para o tipo de movimentação estática pela CNN
ResNet5-2D.
Apesar dos conjuntos de dados serem subdivididos entre aplicações (Download,

Amazon Prime e Nexflix), as quais apresentam diferentes comportamentos de consumo que
podem afetar diretamente as taxas de transmissões de dados, os indicadores de qualidade
de sinal, por outro lado, não dependem diretamente do tipo de aplicação pois são métricas
calculadas pela camada física da rede. Isso pode ser também observado nos gráficos da
Figura 14, que contém valores próximos de média NRMSE (em particular, gerado pelo
modelo PareraCNN-1D) por aplicação.
Além disso, uma vez que o objeto de estudo refere-se a parâmetros de redes 5G,
o custo computacional de tempo dos modelos profundos não podem ser negligenciados,
dado que podem afetar diretamente toda a QoS e a QoE entregue aos usuários. Cada um
dos modelos profundos contém uma certa quantidade de parâmetros, custo computacional
de espaço medido em número de variáveis float de 32 bits e, também, uma quantidade
de operações matemáticas (custo computacional de tempo), medido em quantidade de
operações de multiplicação-acumulação (do inglês, Multiply-ACcumulate operations – MAC)
que o modelo faz em uma operação de encaminhamento. A Tabela 6 associa a quantidade
Tabela 6 – Número de parâmetros e MACs dos modelos avaliados
Custo de execução Número de Tempo de Tempo de

Método
em (mil) MACs parâmetros (mil) treinamento (s) inferência (s)
PareraLSTM 67.4 2.62 38.1 6.18
PareraCNN-1D 7110 396 0.49 0.08
ResNet5-1D 526 43.7 0.20 0.03
PareraCNN-2D 426000 1190 4.33 2.59
ResNet5-2D 5030 33.2 0.24 0.09
HatamiCNN-2D 1320 10.9 0.11 0.05
As coluna de tempo de treinamento e tempo de inferência referem-se a média do tempo de

processamento total (i.e., geração de mini-lotes, transferência para GPU, encaminhamento
pelo modelo, obtenção de predições e etapa de otimização, caso seja treinamento) para
5 épocas em uma série temporal sintética de 2048 pontos separados em mini-lotes de
tamanho 128 para CNNs e 1 para LSTM.
Figura 15 – Previsão de valor futuro no “Download_Static_B_2019.12.16_13.40.04.csv”

PareraLSTM
PareraCNN-1D
ResNet5-1D
PareraCNN-2D
ResNet5-2D
HatamiCNN-2D
45
6 Conclusões
Recentemente, vem acontecendo um grande esforço na pesquisa e desenvolvimento

das redes B5G, com objetivo de melhorar sua eficiência de operação através da realização
de ações mais inteligentes. Em geral, são empregados métodos de ML e/ou DL para
predição de parâmetros de rede futuros que podem ser usados posteriormente na tomada
de decisão, por exemplo, de alocação de recursos.
Para isso, a principal contribuição deste trabalho foi o desenvolvimento de um
arcabouço de aprendizado profundo voltado para previsão de valores futuros de indicadores
de qualidade de sinal, em particular, o CQI. O arcabouço possui três principais etapas: (1)
pré-processamento dos registros de transmissão obtidos pela perspectiva do usuário; (2)
construção e treinamento de modelos de aprendizado profundo; e, ao final, (3) inferência
sobre janelas de dados não vistas anteriormente para previsão de seus valores futuros.
Foram avaliados 6 diferentes modelos profundos, uma rede recorrente LSTM (PareraLSTM),
2 CNNs 1D (PareraCNN-1D e ResNet5-1D) e 3 CNNs 2D (PareraCNN-2D, ResNet5-2D e
HatamiCNN-2D). A execução do arcabouço com cada um destes modelos permitiu obter
resultados qualitativos, através da avaliação visual dos gráficos de predição, e quantitativos
devido a uma comparação de desempenho pelo NRMSE retornado. Dentre eles, modelos
recorrentes (PareraLSTM) ou com o maior números de parâmetros (PareraCNN) foram os
melhores para dados unidimensionais, enquanto que para os dados 2D (transformação de
séries temporais em imagens) a ResNet2D com w = 30 foi a que se saiu melhor.
Dessa forma, em um cenário real de implantação deste arcabouço, o eNB deve
primeiramente receber valores de CQI e armazenar em forma de séries temporais. Em
seguida, estas séries temporais são pré-processadas e transformadas em conjuntos de dados
de treinamento para modelos profundos individuais para cada UE. De acordo com os
resultados obtidos, os modelos apresentaram melhores compromisso entre desempenho e
complexidade foram as ResNet5, representando as melhores escolhas para uso no arcabouço.
Uma vez que o modelo adotado seja treinado sobre o conjunto de dados de treinamento
construído, ele é usado para inferência das novas janelas de CQI que o UE envia, resultando,
ao final de seu processamento, em uma predição para o valor futuro de CQI, entregue ao
eNB que o usa de forma pró-ativa para a definição de estratégias para garantir a qualidade
do sinal.
Em particular, as técnicas de transformação de séries temporais em imagens usadas
neste trabalho costumam ser exploradas na literatura para tarefas de classificação, como
em (HATAMI; GAVET; DEBAYLE, 2017). Assim, tem-se como perspectivas futuras a
investigação de formas de alteração da tarefa de regressão usada neste trabalho para a
Capítulo 6. Conclusões 46
tarefa de classificação sobre esse mesmo conjunto de dados real, por exemplo, buscando
classificar o melhor momento para se realizar handoff de rede (alteração da tecnologia de
conexão de rede) ou o melhor momento para mudança de associação do UE para outros
eNBs.
47
Referências
BASHA, S. H. S. et al. Impact of fully connected layers on performance of convolutional

neural networks for image classification. NC, 2020. Citado na página 10.
CHOLLET, F. Deep Learning with Python. [S.l.]: Manning Publications Company, 2017.
ISBN 9781617294433. Citado na página 8.
DIAS, D. et al. Image-based time series representations for pixelwise eucalyptus region
classification: A comparative study. IEEE Geosci. Remote. Sens. Lett., 2020. Citado 4
vezes nas páginas 3, 23, 25 e 26.
FARIA, F. A. et al. Fusion of time series representations for plant recognition in phenology
studies. Pattern Recognit. Lett., 2016. Citado 3 vezes nas páginas 3, 23 e 24.
FORECAST, C. V. Cisco visual networking index: Global mobile data traffic forecast
update, 2017–2022 white paper. Cisco Public Information, 2019. Citado na página 21.
FU, Y. et al. Artificial intelligence to manage network traffic of 5g wireless networks.
IEEE Netw., 2018. Citado 2 vezes nas páginas 1 e 22.
GIRSHICK, R. et al. Region-based convolutional networks for accurate object detection
and segmentation. 2016. Citado na página 9.
GOODFELLOW, I.; BENGIO, Y.; COURVILLE, A. Deep Learning. [S.l.]: MIT Press,
2016. ISBN 9780262035613. Citado 6 vezes nas páginas 6, 7, 8, 10, 11 e 33.
GUPTA, A.; JHA, R. K. A survey of 5g network: Architecture and emerging technologies.
IEEE Access, 2015. Citado na página 22.
HATAMI, N.; GAVET, Y.; DEBAYLE, J. Classification of time-series images using deep
convolutional neural networks. In: ICMV’2017. [S.l.: s.n.], 2017. Citado 6 vezes nas
páginas 3, 23, 24, 26, 34 e 45.
HE, K. et al. Deep residual learning for image recognition. In: CVPR’2016. [S.l.: s.n.],
2016. Citado 3 vezes nas páginas 9, 10 e 12.
HOCHREITER, S.; SCHMIDHUBER, J. Long Short-Term Memory. NC, 1997. Citado
na página 13.
HOUDT, G. V.; MOSQUERA, C.; NáPOLES, G. A review on the long short-term
memory model. Artificial Intelligence Review, 2020. Citado 2 vezes nas páginas 13 e 14.
KRIZHEVSKY, A.; SUTSKEVER, I.; HINTON, G. Imagenet classification with deep
convolutional neural networks. 2012. Citado 3 vezes nas páginas 9, 10 e 12.
KUROSE, J. F.; ROSS, K. W. Computer Networking: A Top-Down Approach. 7. ed. [S.l.]:
Pearson, 2016. ISBN 978-0-13-359414-0. Citado 6 vezes nas páginas 13, 14, 15, 16, 19
e 20.
LI, X.; KANG, Y.; LI, F. Forecasting with time series imaging. Expert Syst. Appl., 2020.
Citado na página 24.
Referências 48
MITCHELL, T. Machine Learning. [S.l.]: McGraw-Hill, 1997. ISBN 9780071154673.

MURPHY, K. P. Machine Learning: A Probabilistic Perspective. [S.l.]: MIT Press, 2012.

ISBN 9780262018029. Citado 3 vezes nas páginas 6, 8 e 9.
PARERA, C. et al. Transfer learning for channel quality prediction. In: ISMN’2019. [S.l.:
s.n.], 2019. Citado 9 vezes nas páginas 2, 3, 27, 28, 29, 33, 39, 40 e 41.
PHAM, Q.-V. et al. A survey of multi-access edge computing in 5g and beyond:

Fundamentals, technology integration, and state-of-the-art. 2020. Citado na página 21.
RACA, D. et al. Beyond throughput, the next generation: a 5g dataset with channel and
context metrics. In: MMSys’2020. [S.l.: s.n.], 2020. Citado 5 vezes nas páginas 3, 5, 30, 31
e 32.
RUSSAKOVSKY, O. et al. Imagenet large scale visual recognition challenge. 2015.

Citado 2 vezes nas páginas 3 e 10.
SAKIB, S. et al. A deep learning method for predictive channel assignment in beyond 5g
networks. IEEE Netw., 2020. Citado 4 vezes nas páginas 2, 3, 27 e 29.
SEVGICAN, S. et al. Intelligent network data analytics function in 5g cellular networks

using machine learning. J. Commun. Networks, 2020. Citado 4 vezes nas páginas 1, 3, 21
e 23.
SIMONYAN, K.; ZISSERMAN, A. Very deep convolutional networks for large-scale image
recognition. In: ICLR’15. [S.l.: s.n.], 2015. Citado 2 vezes nas páginas 9 e 10.
SZEGEDY, C. et al. Going deeper with convolutions. In: CVPR’15. [S.l.: s.n.], 2015.
VANKAYALA, S. K.; SHENOY, K. G. A neural network for estimating CQI in 5g

communication systems. In: WCNC’2020. [S.l.: s.n.], 2020. Citado 4 vezes nas páginas 2,
3, 28 e 29.
WANG, Z.; OATES, T. Imaging time-series to improve classification and imputation. In:
IJCAI’2015. [S.l.: s.n.], 2015. Citado na página 26.
YIN, H. et al. Predicting channel quality indicators for 5g downlink scheduling in a deep
learning approach. CoRR, 2020. Citado 3 vezes nas páginas 2, 27 e 29.

TCC Lucas - Alvarenga PDFA

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

TCC Lucas - Alvarenga PDFA

Enviado por

Direitos autorais:

Formatos disponíveis

Lucas Fernando Alvarenga e Silva

Uso de Aprendizado Profundo em Redes 5G

São José dos Campos - SP, Brasil

Uso de Aprendizado Profundo em Redes 5G através de

Trabalho de conclusão de curso apresentado

Universidade Federal de São Paulo – UNIFESP

Orientador: Prof. Dr. Jurandy Gomes de Almeida Junior

São José dos Campos - SP, Brasil

Uso de Aprendizado Profundo em Redes 5G através de

Trabalho de conclusão de curso apresentado

Trabalho aprovado em 23 de Fevereiro de 2022:

Prof. Dr. Jurandy Gomes de Almeida

Prof. Dr. Bruno Yuji Lino Kimura

Prof. Dr. Fábio Augusto Faria

Prof. Dr. Valério Rosset

São José dos Campos - SP, Brasil

Figura 1 – Capacidade de aprendizagem: Sobreajuste e Subajuste . . . . . . . . . 8

Tabela 1 – Sumário relacionando as principais características dos trabalhos citados 29

2G Redes de segunda geração.

3G Redes de terceira geração.

3GPP 3ª geração de parceria de projeto (do inglês, 3rd Generation Partnership

4G Redes de quarta geração.

5G Redes de quinta geração.

B5G Além das Redes de 5ª geração (do inglês, Beyond 5G Networks).

CNN Redes Neurais Convolucionais (do inglês, Convolutional Neural Networks).

CQI Indicador de Qualidade de Canal (do inglês, Channel Quality Indicators).

DL Aprendizado Profundo (do inglês, Deep Learning).

eMBB banda-larga móvel (do inglês, Mobile Broadband).

eNB Nó B melhorado (do inglês, evolved Node B).

EPC Núcleo Evoluído de Pacotes (do inglês, Evolved Packet Core).

FC-Layers Camadas Totalmente Conectadas (do inglês, Fully-Connected Layers).

GAF Campos Angulares Gramianos (do inglês, Gramian Angular Fields).

GADF Campos Angulares da diferença Gramianos (do inglês, Gramian Angular

GASF Campos Angulares de Soma Gramianos (do inglês, Gramian Angular

GPRS Serviço Generalizado de Pacotes de Rádio (do inglês, Generalized Packet

ISP Provedores de Serviço de Internet (do inglês, Internet Service Providers).

LSTM memória longa de curto-prazo (do inglês, Long Short-Term Memory).

LTE Evolução de Longo Prazo (do inglês, Long Term Evolution).

MAC Operações de Multiplicação e Acumulação (do inglês, Multiply-ACcumulation

ML Aprendizado de Máquina (do inglês, Machine Learning).

mMTC Comunicação Massiva do tipo Máquina (do inglês, Massive Machine-

MSE Erro Quadrático Médio (do inglês, Mean Square Error).

MTF Campos de Transição de Markov (do inglês, Markov Transition Fields).

NF Funções de rede (do inglês, Network Functions).

NRMSE Raiz Quadrada do Erro Quadrático Médio Normalizada (do inglês,

OSI Interconexão de sistemas Abertos (do inglês, Open Systems Interconec-

QoE Qualidade de Experiência (do inglês, Quality of Experience).

QoS Qualidade de Serviço (do inglês, Quality of Service).

RP Gráficos de Recorrência (do inglês, Recurrence Plots).

RSRP Referência de Potência do Sinal Recebido (do inglês, Reference Signal

RSRQ Referência de Qualidade do Sinal Recebido (do inglês, Reference Signal

SGSN Servidor de Nó de Suporte GPRS (do inglês, Serving GPRS support

SRN Relação Sinal-Ruído (do inglês, Signal-to-Noise Ratio).

UE Equipamento de Usuário (do inglês, User Equipment).

uRLLC Comunicações Ultra-Confiáveis de baixa latência (do inglês, Ultra-

VoIP Voz sobre IP (do inglês, Voice over IP).

Wifi Fidelidade sem fio (do inglês, Wireless Fidelity).

R Conjunto dos Números reais.

RN Espaço Vetorial das N-uplas de números reais.

φ Angulo entre vetores.

|·| Operação Norma-L1.

k·k Operação Norma-L2.

 Limiar (do inglês, threshold).

Limiar (do inglês, threshold).

RPi,j = 1>0 ( − kxi − xj k), para xi ∈ RD e i, j = 1, 2 . . . , N (2.5)