Você está na página 1de 15

Projeto de Monografia BCC502

Utilização de self-learning e multitasking


para detecção de arritmias cardíacas
Nome: Arthur Negrão de Faria Martins da Costa
Matrícula: 21.1.4001
16 de março de 2024

1 Introdução
A arritmia cardíaca é uma doença que causa a alteração da frequência natural dos ba-
timentos cardíacos, seja através da aceleração, desaceleração ou até mesmo irregularidade da
mesma. Além de poder dar origem a outras doenças, a própria arritmia pode levar a casos
de morte súbita, o que a torna uma verdadeira preocupação para os coordenadores da saúde
pública do país. De acordo com a SOBRAC (Sociedade Brasileira de Arritmias Cardíacas),
essa doença atinge mais de 20 milhões de brasileiros e cerca de 320 mil desses vem a óbito a
cada ano. (EMPRESA BRASIL DE COMUNICAÇÃO - EBC, 2016)
A preocupação para com esta doença cresce ainda mais ao observar mais dados estatísticos
relativos à morte súbita por arritmias cardíacas: 50% dos casos são assistidos por adolescen-
tes/crianças sem nenhum adulto por perto - que muitas vezes são incapazes de prestar o socorro
devido; 86% dos casos ocorrem em ambiente domiciliar, dificultando o atendimento médico de
prontidão; e a cada minuto passado sem a prestação de socorro aumenta-se de 7% a 10% a
probabilidade de morte da vítima.(SOBRAC, 2023)
Em posse de tais informações, é trivial compreender a importância da realização de di-
agnósticos prévios em intuito de mitigar os problemas decorrentes das arritmias. Para tal, a
identificação de sintomas é essencial, sendo as palpitações cardíacas, tonturas e desmaios alguns
possíveis exemplos destes. Entretanto, em muitos casos, a doença pode ser completamente si-
lenciosa, sem manifestação alguma de sintomas. (SECRETARIA DA SAÚDE DO ESTADO
DO CEARÁ, 2023) Nestes casos os riscos aumentam muito, já que medidas preventivas con-
tra a doença provavelmente não serão tomadas devido o desconhecimento por parte de seus
portadores - abrindo um espaço indesejado para o crescimento das taxas de mortalidade dessa
enfermidade.
Dentro deste ambiente, a utilização da inteligência artificial e suas ferramentas para cria-
ção de modelos capazes de processar dados de eletrocardiogramas surge como uma ideia interes-
sante. Isso porque tais modelos muito auxiliariam o trabalho de médicos e outros profissionais
da área da saúde, contribuindo como uma via alternativa ou ferramenta de sugestão para os
métodos já existentes na medicina, além de ser uma poderosa ferramenta de análise para os
casos silenciosos da doença. Tais fatos são enfatizados por Lobo (2017), que ressalta a im-
portância do computador e seus métodos para segurança da saúde pública do país. Alguns
bons exemplos desses métodos e modelos podem ser vistos nos trabalhos submetidos à 2022
ACM/IEEE TinyML Design Contest, onde foram criados alguns destinados à integração com
sistemas embutidos. (TINYML CONTEST, 2022)
Adentrando às vias de inteligência artificial, uma técnica interessante e não tão popular
é o multitasking. Sua premissa é de fácil entendimento: ao invés de treinar o modelo para
classificar os dados em uma tarefa única, são criadas várias tarefas que compartilham um corpo
de modelo comum, se diferenciando apenas em suas camadas finais classificatórias (RUDER,

UFOP Última modificação: 16 de março de 2024 1


Projeto de Monografia BCC502
2017). Dessa forma, o modelo é treinado de forma mais generalista, já que seus pesos não serão
atualizados de acordo com uma só fonte de dados, mas sim com diversas. Além disso, outra
vantagem é tornar o modelo mais enxuto e fácil de treinar, já que não é necessária redundância
para a parte compartilhada do modelo.
Aliado ao multitasking, o self-learning surge como uma técnica voltada à exploração de
bases de dados em intuito de gerar labels alternativas às que são originalmente propostas.
Ou seja, dado um conjunto de dados qualquer que já apresenta tarefas específicas para o
treinamento de redes neurais, as diretivas de self-learning visam manipular esses dados para
encontrar uma nova tarefa coerente com o tema e que possa contribuir para a eficiência do
modelo como um todo. Como explicado por Dópido et al. (2013), o principal ponto dessa
técnica é que as novas amostras de treinamento podem ser facilmente obtidas das já disponíveis
sem gasto/esforço considerável.
Posto tais fatos, surge a proposta deste trabalho: construir modelos destinados a compu-
tadores convencionais utilizando de diretivas de self-learning e multitasking para aprimorar a
eficácia e precisão destes modelos já conhecidos. Isso devido ao fato de que essas técnicas apre-
sentam características como data augmentation implícito, direcionamento de foco e regulariza-
ção natural (RUDER, 2017) que são extremamente pertinentes para ampliação da capacidade
preditiva de redes neurais. Assim sendo, algumas perguntas pertinentes a este trabalho são:
o multitasking e o self-learning são técnicas eficazes para esse caso? Qual é a capacidade dos
mesmos de ampliar a eficiência dos modelos já conhecidos? Existem outros possíveis benefícios
além de aumento de precisão e acurácia que este paradigma possa trazer?

2 Revisão da literatura
A utilização de inteligência artificial e suas ferramentas para detecção de arritmias cardía-
cas já é um assunto conhecido pelo mundo acadêmico. Como visto em (LI; RAJAGOPALAN;
CLIFFORD, 2013), já existem modelos capazes de atingir a faixa de 98% de acurácia em bases
in-sample e acurácia de 96% em casos de cross-validation, e que estes constituem o estado da
arte atual. Para atingir tais resultados, diversas técnicas e métodos foram empregados, como
a filtragem dos sinais de eletrocardiograma; análises de espectro através de transformadas de
Fourier destes mesmos sinais; a seleção de features específicas sobre os dados de entrada - visto
que nem todos dados apresentam um verdadeiro poder preditivo; entre outros.
Outro estilo de trabalho presente no meio são os que se dedicam a detecção dos tipos
de arritmia. Como visto em (ALFARAS; SORIANO; ORTIN, 2019) e em (SHIMPI et al.,
2017), onde empregam-se algoritmos genéticos, regressões logísticas, clustering e modelos de
redes neurais. Estes trabalhos também apresentam métricas que atingem elevados patamares,
a exemplo do primeiro, que atinge 98% de acurácia em algumas das bases testadas.
Ainda no tema, mas relativamente menos popular, são os trabalhos que visam a criação de
redes neurais multi-task dentro do âmbito de detecção de arritmias. Em (JI et al., 2018), publi-
cado em 2018, os próprios autores enunciam que "até onde sabemos, nós somos os primeiros a
propor um esquema multitarefas para análise de dados ECG" 1 . Apesar de que outros trabalhos
posteriores a este tenham sido desenvolvidos, torna-se evidente que essa é uma sub-área de pes-
quisa mais enxuta quando comparada com as anteriormente citadas. Mesmo assim, os autores
do trabalho citado acima confirmam que "os resultados ilustram que o esquema proposto por
1
To the best of our knowledge, we are the first to propose a deep multi-task learning scheme for ECG data
analysis

UFOP Última modificação: 16 de março de 2024 2


Projeto de Monografia BCC502
nós pode melhorar a acurácia da análise de dados ECG em até aproximadamente 5.1%",2 o que
torna a proposta de multitasking extremamente interessante.
Portanto, é possível verificar que já existem modelos de redes neurais com alta capacidade
preditiva para detecção de arritmias cardíacas e considerável capacidade para classificação das
mesmas. Entretanto, muitos destes modelos são extremamente pesados e inviáveis para treina-
mento e utilização em computadores convencionais, além de que ainda há muito espaço para
ampliação de suas capacidades preditivas, principalmente no campo de classificação de arrit-
mias. Isto posto, a combinação entre o multitasking e o self-learning surge como uma solução
viável extremamente promissora, visto que o multitasking já se apresenta como uma ferramenta
eficaz (vide as referências expostas anteriormente) e, aliado ao self-learning, que se mostrou efi-
caz na classificação de imagens hiperespectrais (DÓPIDO et al., 2013), tende a potencializar
suas capacidades preditivas. Além disso, através do multitasking, os modelos construídos serão
mais enxutos no quesito de recursos computacionais gastos, ampliando suas capacidades de
dispersão para computadores e sistemas convencionais.

3 Fundamentos
3.1 Arritmia cardíaca
Como definido pela American Heart Association (2023), uma arritmia cardíaca corres-
ponde a qualquer problema relativo à frequência/ritmo dos batimentos cardíacos de uma pessoa.
Durante essa, os batimentos de uma pessoa podem ser muito rápidos, muito lentos ou descon-
tínuos, o que afeta o normal funcionamento do coração. E como este é um órgão vital para o
funcionamento dos diversos sistemas do corpo humano, as arritmias se tornam extremamente
perigosas, implicando até mesmo em risco de morte.
Por abranger vários problemas relativos aos batimentos do coração, as arritmias podem ser
classificadas de acordo com suas características. A tabela abaixo, construída com as informações
contidas em (AMERICAN HEART ASSOCIATION, 2023), sintetizam as arritmias quanto ao
seu nome e suas características.

Nome Características
Batimentos irregulares. As cavidades superiores do coração
Fibrilação atrial não são capazes de bombear sangue suficiente para fora de
si, podendo gerar perigosos coágulos.
Batimentos muito acelerados e irregulares. Similares sinto-
Flutter atrial
mas em relação à fibrilação atrial, apesar de ser mais raro.
Batimentos irregulares. As cavidades inferiores do coração
Fibrilação ven- não são capazes de bombear sangue algum para o resto do
tricular corpo, gerando colapso de órgãos e parada cardíaca. Extre-
mamente letal.
Bradicardia Batimentos muito lentos, em geral abaixo de 60bpm.
Taquicardia Batimentos muito acelerados, em geral acima de 100bpm.
Ritmo sinusal Ritmo natural de batimento do coração.

Tabela 1: Tipos de arritmia cardíaca

2
Results illustrate that our proposed scheme can improve the accuracy of ECG data analysis by up to about
5.1%

UFOP Última modificação: 16 de março de 2024 3


Projeto de Monografia BCC502
3.2 Detecção de arritmias cardíacas
O diagnóstico de arritmias cardíacas é realizado pela avaliação de batimentos cardíacos
de pacientes. Essa avaliação é feita tanto por análise clínica de um cardiologista quanto por
exames médicos. Quanto a esses exames, pode-se nomear o eletrocardiograma como um dos
principais.
O eletrocardiograma, popularmente conhecido como ECG, consiste no registro gráfico
da atividade elétrica pertinente ao coração através de eletrodos posicionados na superfície do
corpo (FYE, 1994). Através das ondas registradas, é possível que especialistas as analisem e
verifiquem se elas condizem com o que naturalmente esperado do coração.
Neste trabalho, as bases de dados utilizadas consistem em registros numéricos de exames
de ECG, os quais serão tratadas e fornecidos às redes neurais para treinamento.

3.3 Redes Neurais


Uma rede neural é um dos diversos métodos de inteligência artificial existentes. Sua es-
trutura é similar a um cérebro humano, onde neurônios interconectados em camadas processam
informações e as repassam para a camada a frente. Além disso, as redes neurais tem um cará-
ter adaptativo, onde através do reconhecimento de seus erros ela se adapta para que a mesma
melhor corresponda à realidade dos dados (AWS, 2023).

3.3.1 Neurônios e camadas


O neurônio, ou nó, corresponde à menor unidade de processamento de informações de uma
rede neural. Seu funcionamento é relativamente simples: em início ele recebe um conjunto de
dados de entrada, realiza cálculos com estes dados em cima de parâmetros numéricos (também
conhecidos como pesos) e, então, produz uma saída (COELHO, 2017).
Estes neurônios são organizados em grupos denominados camadas. Cada camada pode ter
uma quantidade variada de neurônios, de forma que uma determinada camada recebe dados de
sua antecessora e encaminha sua saída para camada seguinte. A primeira camada é conhecida
como camada de entrada, e é a partir dela que os dados a serem processados adentram o
sistema. A última camada é denominada camada de saída, sendo que através dela os dados
gerados realizam a predição que determinado modelo se propõem, seja ele um problema de
classificação, regressão, etc. E, por fim, as camadas intermediárias são as camadas escondidas,
observando que nelas se realiza o trabalho de processamento de dados necessários para atingir
o objetivo da rede. A imagem abaixo ilustra conceitualmente uma rede neural, onde neste caso
os nós amarelos representam a camada de entrada, os nós azuis as camadas escondidas e os nós
laranjas a camada final.

3.3.2 Função de ativação e função loss


Como explicado por Coelho (2017), uma função de ativação é uma função matemática
utilizada por um neurônio para calcular sua saída. Esta função é dependente dos pesos de um
nó para o cálculo de seu valor resultado, de forma que a atualização destes pesos influencia nos
valores produzidos por esta função. Outro importante ponto das funções de ativação é que elas
introduzem a não-linearidade aos modelos de rede neural, ampliando a capacidade de aprender
padrões e obter informações em cima dos dados alimentados ao modelo. Abaixo seguem dois
exemplos de funções de ativação, respectivamente ReLU e sigmóide:

UFOP Última modificação: 16 de março de 2024 4


Projeto de Monografia BCC502
Figura 1: Esquema de uma rede neural

Créditos: (COELHO, 2017)

(
x, x > 0
f (x) =
0, x ≤ 0
1
f (x) =
1 + e−x
Já a função loss, apesar de também ser uma função matemática, tem um propósito dis-
tinto: calcular a eficiência de um determinado modelo em uma predição realizada. E essa ope-
ração é feita comparando a predição obtida com o real resultado esperado, almejando portanto
reduzi-la o máximo possível. É interessante pontuar que, para diferentes tipos de problemas,
existem diferentes tipos de função loss. Abaixo seguem dois exemplos: o primeiro é da cross-
entropy loss, característica de problemas de classificação; e o segundo é da mean squared error
(MSE), característica de problemas de regressão.
n
X
f (x) = − ti log(pi )
i=1

Onde n representa o número de classes, t o valor verdadeiro e p a predição

n
1X
f (x) = (yi − ŷi )2
n i=1

Onde y representa o valor verdadeiro e ŷ a predição

3.3.3 Forward propagation e back propagation


Forward propagation e back propagation são os dois processos básicos essenciais para
existência de qualquer rede neural. O primeiro se refere ao momento em que os dados percorrem
os nós de uma rede, passando pelas funções de ativação até que se chegue na previsão final do

UFOP Última modificação: 16 de março de 2024 5


Projeto de Monografia BCC502
modelo. Nesse momento os pesos dos neurônios são utilizado para cálculo das funções de
ativação, mas não são alterados para incremento de performance.
Tal alteração ocorre durante a back propagation, que corresponde ao momento em que o
modelo calcula as alterações que os pesos dos neurônios devem sofrer para que a função loss
seja minimizada. Esse cálculo consiste na construção das derivadas parciais de cada nó em
relação à função loss, de forma a se obter o gradiente da função e, consequentemente, a direção
de maior crescimento. Dessa forma, o modelo atualiza seus pesos seguindo a direção oposta do
gradiente, assegurando a minimização do erro (LIU, 2022).

3.4 Multitasking
Multitasking é um método de construção de redes neurais. Sua premissa básica é es-
pecializar um determinado modelo em múltiplas tarefas ao invés de apenas uma. Para tal,
constrói-se um modelo base formado por camadas compartilhadas entre as tarefas - onde os
pesos são atualizados de maneira conjunta - e camadas especializadas para cada tarefa ao final.

Figura 2: Rede neural multitask

Créditos: (RUDER, 2017)

O paradigma multitask apresenta diversas vantagens. Um primeiro ponto a se comentar


é a sua capacidade para redução de overfitting - que consiste em especializar o modelo tão
intensamente até que ele perca sua capacidade de generalização e se torne eficiente apenas para
a base de dados em que fora treinado. Isso porque, através dele, os pesos compartilhados de
uma rede são alterados de acordo com n tarefas e não apenas uma, onde cada uma tem seus
próprios pontos de foco e características únicas. Dessa forma, evita-se estes sejam atualizados
de forma tendenciosa, garantindo a capacidade de generalização do modelo.
Outro importante ponto do multitasking é a capacidade de direcionamento de foco do
mesmo. Ruder (2017) explica que existem casos em que aprender uma tarefa pode ser muito
difícil, como por exemplo quando ela tem saídas de grandes dimensões ou quando os dados tem
muito ruído. O paradigma multitask ataca este problema subdivindo uma tarefa grande em
pequenos problemas mais simples de serem resolvidos, ampliando a capacidade dos modelos de
fazerem boas predições.
Por fim, por apresentar camadas compartilhadas, o multitask também reduz considera-
velmente a quantidade de pesos existentes dentro de um modelo. Dessa forma, o modelo passa
a ocupar menos memória e o tempo gasto para forward propagation e back propagation é inten-

UFOP Última modificação: 16 de março de 2024 6


Projeto de Monografia BCC502
samente reduzido, facilitando a disseminação deste para os sistemas embutidos e computadores
convencionais.

3.5 Self-learning
Self-learning é constituído por técnicas que permitem um modelo aprender e produzir
informações alternativas e/ou complementares às já existentes na base de dados em questão.
Em seu escopo, não é necessário consulta a bases externas ou novas fontes de informação,
realizando seu serviço em cima dos próprios dados originais.
É elementar entender que de quanto mais fontes de dados/informações um modelo se
alimente melhor é - visto que assim ele provavelmente se tornará mais generalista e eficaz.
Entretanto, muitas vezes obter essas novas fontes pode ser um processo muito custoso ou até
mesmo inviável/impossível. Dessa forma, o self-learning torna-se muito interessante, já que é
capaz de produzir essas novas informações sem necessidade de fontes externas e a um baixo
custo.
Em (DÓPIDO et al., 2013) é possível ver o self-learning em ação no contexto de classifi-
cação de imagens hiperespectrais: a alta dimensionalidade dos dados e a sua escassez (devido a
necessidade de equipamento extremamente especializado e de alto custo) muito dificultam essa
tarefa de classificação. Entretanto, através do self-learning, foi possível gerar dados e tarefas
para os modelos treinados, permitindo que estes atingissem patamares de acurácia acima de
90%.

4 Métodos
4.1 Descrição dos materiais
• Os experimentos foram realizados utilizando uma máquina do Google Colab (GOOGLE,
2023), utilizando a versão lançada no dia 23 de junho de 2023, configurada com:

1. Acelerador GPU do tipo T4


2. 12.7 GB de RAM
3. 15 GB de RAM da GPU
4. 78.2 GB de disco

• O código foi construído utilizando os seguintes frameworks e bibliotecas:

1. Tensorflow versão 2.12.0 (MARTIN ABADI et al., 2015)


2. SKLearn versão 2.2.0 (PEDREGOSA et al., 2011)
3. Numpy versão 1.22.4 (HARRIS et al., 2020)

• O dataset utilizado foi o da TinyMl Contest (2022), caracterizado por:

1. Dados de ECG organizados em valores numéricos armazenados em arquivos ".txt"


2. Cada uma dessas entradas é composta por uma gravação de 5 segundos a uma
frequência de 250Hz
3. Tais entradas são pré-processadas com um filtro de pass-band de 15Hz e um filtro
de stop-band de 55Hz

UFOP Última modificação: 16 de março de 2024 7


Projeto de Monografia BCC502
4. Tais entradas possuem duas labels cada uma:
(a) Uma indicando a presença ou não de risco de morte.
(b) Uma indicando a qual tipo de arritmia tal entrada pertence.
5. 30215 entradas ao total, distribuídas em:
(a) 24589 entradas de treino (85% da base)
(b) 5626 entradas de teste (15% da base)

4.2 Método de coleta de dados


Em intuito de coletar dados, informações e ideias para construção dos modelos, alguns
trabalhos já existentes foram consultados. Em (SILVA; SILVA, 2022), observou-se um modelo
caracterizado em cima de convoluções 2D e tasks de classificação entre risco de vida ou não e
regressão linear sobre o valor da média dos dados de ECG. Já em (GATECH-EIC, 2022), os au-
tores apresentam uma abordagem diferente: sem utilização do paradigma multi-task, os autores
construíram um modelo com algumas características interessantes, como: data augmentation
através da inversão de picos e tempo, adição de noise, utilização do stochastic weight averaging,
e utilização do decaimento do learning rate baseado na função cosseno.

4.3 Procedimentos experimentais


Para os procedimentos experimentais, treinou-se um modelo de rede neural multitask
composto por 3 tarefas: classificação de arritmias de acordo com risco de vida; classificação de
arritmias quanto ao tipo de arritmia; regressão linear de valor médio dos valores de entrada. A
arquitetura e as características do modelo são sumarizados na Figura 4 (presente no final do
arquivo).
Para o processo de treinamento, utilizou-se do otimizador Adam com um learning rate
inicial de 0.0002 e de batches com o tamanho de 32 itens. Ao total, o treinamento foi realizado
por 20 epochs. Sobre as funções loss, utilizou-se, respectivamente, da binary crossentropy e da
categorical crossentropy para as tarefas de classificação de risco de vida e classificação de tipo
de arritmia. Para as tarefas de regressão linear, todas utilizaram a mean squared error. Além
disso, vale mencionar que o modelo foi treinado em 5 instâncias com diferentes pesos para cada
tarefa, sendo estes sumarizados na tabela a seguir:

Tabela 2: Pesos de cada tarefa para cálculo da loss em cada instância de treinamento

Tarefa 1 Tarefa 2 Tarefa 3


Teste 1 0.5 0.25 0.25
Teste 2 0.6 0.2 0.2
Teste 3 0.7 0.2 0.1
Teste 4 0.8 0.1 0.1
Teste 5 0.85 0.1 0.05

4.4 Métricas de avaliação


Para avaliar a eficiência de um modelo de maneira clara, concisa e desambigua é extrema-
mente importante definir quais métricas serão utilizadas para tal. Dessa forma torna-se possível

UFOP Última modificação: 16 de março de 2024 8


Projeto de Monografia BCC502
comparar modelos e verificar se as modificações realizadas realmente incrementaram a perfor-
mance do mesmo ou não. Como o multitask combina tarefas de diferentes tipos, é interessante
entender os diferentes tipos de métrica existentes para cada estilo de problema. Vale ressaltar
que, para os cálculos destas, utilizou-se da própria implementação interna do Tensorflow, que
as calcula em momento de treino e teste.

4.4.1 Problemas de classificação


Os problemas de classificação consistem em rotular uma determinada entrada como ele-
mento pertencente a uma classe. Uma determinada instância pode: ser classificada correta-
mente como verdadeira; ser classificada corretamente como falsa; ser erroneamente classificada
como verdadeira; ser erroneamente classificada como falsa. A matriz de confusão abaixo sinte-
tiza de maneira clara tais possibilidades:
Figura 3: Matriz de confusão para problemas de classificação

Créditos: (DANG, 2022)

De posse dessa informação, três importantes métricas que serão utilizadas neste trabalho
são a acurácia, a precisão e o recall, que podem ser respectivamente definidos como:
TP + TN
AC =
P +N
TP
PR =
TP + FP
TP
RE =
TP + FN

4.4.2 Problemas de regressão


Os problemas de regressão, diferentemente dos de classificação, não tentam rotular ins-
tâncias como pertencentes a classes. Seu objetivo é, em realidade, estimar um valor numérico

UFOP Última modificação: 16 de março de 2024 9


Projeto de Monografia BCC502
de acordo com a instância de entrada. Dessa forma, as métricas de um problema de regressão
em geral visam analisar o quão próxima essa predição realmente foi do valor real. Para este
trabalho, a métrica de regressão utilizada será a mean squared error (MSE), que é definida
como:
n
1X
M SE = (yi − ŷi )2
n i=1

4.5 Considerações éticas & Limitações


É importante ressaltar que, obtendo bons resultados ou não, o modelo construído não
deve ser entendido como uma forma de substituir o trabalho médico humano. Sua proposta é,
em realidade, servir como uma ferramenta auxiliar a diagnósticos de arritmia. Isso porque, por
tratar de vidas humanas, cuja perda é irreparável e o valor imensurável, e por se tratar de uma
doença que apresenta um verdadeiro risco para tal, a presença de um profissional capacitado
no diagnóstico é indispensável. Isso porque ele irá assegurar a transparência e precisão do
processo, corrigindo eventuais erros que o modelo possa gerar, adequando cada diagnóstico às
características pessoais de cada indivíduo e garantindo o tratamento dos pacientes de forma
humana e respeitosa.
Também ressalta-se que, apesar de ser um modelo multitask, o foco principal continua
sendo a tarefa original: detecção de arritmias cardíacas com risco de vida aos seus portadores.
Assim sendo, não se deve esperar do modelo o desempenho ótimo para todas as tarefas que ele
propõem realizar, visto que elas visam aprimorar o desempenho e eficácia da tarefa principal.

5 Resultados
Realizados os experimentos, os dados obtidos podem ser relacionados de acordo com a
task em específico e a configuração dos pesos. Para tal, foi construída a tabela a seguir, em que
em cada entrada consta a média entre acurácia, precisão e recall, com exceção da task 3 que é
um problema de regressão (onde está presente o MSE).

Tabela 3: Resultados da experimentação

Task 1 Task 2 Task 3


Teste 1 96% 83% 1.49e-06
Teste 2 96% 82% 1.49e-06
Teste 3 95% 82% 1.49e-06
Teste 4 96% 83% 1.49e-06
Teste 5 96% 83% 1.49e-06

Foi possível notar que a alteração dos pesos exerceu pouca influência sobre os resulta-
dos finais, fato facilmente observável nos testes 1, 4 e 5, que apresentaram - com ressalva às
diferenças das aproximações - o mesmo resultado.
Em seguida, prosseguiu-se com a realização de testes T para verificar se o multitasking
e o self-learning de fato promoveram ampliação da capacidade preditiva do modelo. Para
conseguir as amostras sem utilização do multitask, utilizou-se de um modelo com a mesma
arquitetura e configuração, mas sem as diferentes branches para cada tarefa, apenas a tarefa
original (presença de risco de vida ou não); e para as amostras do multitask, escolheu-se,

UFOP Última modificação: 16 de março de 2024 10


Projeto de Monografia BCC502
arbitrariamente, a composição de pesos do teste 5. Por fim, sobre a configuração do teste
T, utilizou-se um teste pareado com 95% de confiança e com amostras de tamanho 20. Os
resultados são sumarizados abaixo:

1. t = 1,714

2. 19 graus de liberdade

3. p-valor = 0.1028 (duas caudas)

4. Por critérios convencionais, essa diferença não é considerada estatisticamente sig-


nificante

Tabela 4: Métricas das amostras

Com Multitask Sem Multitask


Média 0.954 0.958
Desvio padrão 0.007 0.004

Em primeiro ponto, observou-se que o modelo multitask na arquitetura descrita atingiu um


patamar de qualidade considerável, atingindo a marca de 96% de acurácia na task originalmente
proposta - lembrando que o estado da arte em (LI; RAJAGOPALAN; CLIFFORD, 2013)
atingiu 98%. Além disso, em comparação com o trabalho desenvolvido por Silva e Silva (2022)
(que também atingiu 98%), o tempo médio de treinamento por epoch era de 20 segundos,
enquanto que no modelo multitask essa média caiu para 12 segundos - uma diminuição de 40%
no tempo gasto.
Entretanto, como visto através do teste T, o multitask e o self-learning não foram capazes
de promover uma ampliação de significância estatística na capacidade preditiva do modelo,
mantendo proximidade com o modelo de mesma arquitetura composto por apenas uma tarefa.
Algumas hipóteses podem ser levantadas sobre esse fato observado para justificá-lo, como por
exemplo:

1. As tarefas escolhidas podem ser de pouca relevância;

2. A natureza dos dados ECG pode não favorecer o cenário multitask ;

3. Devido não levarem em consideração a temporalidade dos dados, as camadas de convo-


lução podem limitar o modelo e impedir que o multitask se mostre eficaz.

Os resultados encontrados apresentam uma importância para o cenário de pesquisa atre-


lado a ECG’s e machine learning. Isso porque eles evidenciam que ou o multitasking não traz
melhoria clara aos resultados gerais, ou que é necessário outro paradigma arquitetural sobre o
sistema multitask construído para que o mesmo evidencie suas potencialidades.
Desta maneira, ao fim, alguns questionamentos podem ser feitos para motivar trabalhos
futuros: existem outras tarefas no escopo de análise de ECG que podem ser mais eficazes para
o multitask ? Arquiteturas que levam a temporalidade em questão, como por exemplo a de
redes neurais recorrentes, podem permitir que o multitask se torne mais expressivo? Existe
alguma forma de comprovar que os dados de ECG são, por intrínseca natureza, não propensos
ao multitasking?

UFOP Última modificação: 16 de março de 2024 11


Projeto de Monografia BCC502
6 Conclusão
O trabalho desenvolvido consistiu em uma experimentação empírica de redes neurais
imersas na temática de detecção de arritmias cardíacas. Com o objetivo de verificar se o
multitasking e o self-learning são capazes de ampliar as capacidades preditivas de uma rede
neural, foi construído um modelo (cuja arquitetura pode ser vista na figura 4) utilizando-se
dessas duas técnicas.
Após essa construção, realizou-se uma experimentação através do treinamento desse mo-
delo com variações nos pesos atribuídos a cada tarefa - como pode ser observado na tabela 2. Os
resultados obtidos nessa fase indicaram que as alterações nos pesos foram pouco significativas
para variação real de performance do modelo.
Em seguida, selecionou-se arbitrariamente a configuração de pesos 5 para realização de
um teste T, onde comparou-se a eficácia do modelo multitask com outro modelo de mesma
arquitetura mas sem o multitask. Em suma, os resultados apontaram que não há nenhuma
diferença significativa entre os modelos, indicando a falha das técnicas propostas para ampliar
a capacidade preditiva geral da rede.
Por fim, algumas hipóteses foram levantadas sobre o porquê desta falha: as tarefas do
multitask podem ter sido de pouca relevância; os dados de ECG são propensos a não favorecer o
multitask ; os modelos de convolução podem limitar a capacidade do multitask por não levar em
conta a temporalidade inerente dos dados ECG. Espera-se que essas hipóteses possam fomen-
tar trabalhos futuros que contribuam para o aumento das capacidades de modelos preditivos
imersos nesta temática de arritmias, visto que as descobertas oriundas destas obras seriam de
imensa contribuição para a saúde pública do país.

Referências
ALFARAS, Miquel; SORIANO, Miguel C; ORTIN, Silvia. A fast machine learning model for
ECG-based heartbeat classification and arrhythmia detection. Frontiers in Physics,
Frontiers, p. 103, 2019.
AMERICAN HEART ASSOCIATION. What is an Arrhythmia? Disponível em:
<https://www.heart.org/en/health-topics/arrhythmia/about-arrhythmia>. Acesso
em: 15 jun. 2023.
AWS. O que é uma rede neural? Disponível em:
<https://aws.amazon.com/pt/what-is/neural-network/>. Acesso em: 16 jun. 2023.
COELHO, Mateus. Fundamentos De Redes Neurais. 2017. Disponível em:
<http://www2.decom.ufop.br/imobilis/fundamentos-de-redes-neurais/>. Acesso em:
16 jun. 2023.
DANG, Tommy. Guide to accuracy, precision, and recall. 2022. Disponível em:
<https://www.mage.ai/blog/definitive-guide-to-accuracy-precision-recall-for-
product-developers>. Acesso em: 16 jun. 2023.
DÓPIDO, Inmaculada et al. Semisupervised self-learning for hyperspectral image
classification. IEEE transactions on geoscience and remote sensing, IEEE, v. 51, n. 7,
p. 4032–4044, 2013.

UFOP Última modificação: 16 de março de 2024 12


Projeto de Monografia BCC502
EMPRESA BRASIL DE COMUNICAÇÃO - EBC. Arritmias cardíacas causam 320 mil
mortes súbitas por ano, alerta entidade. 2016. Disponível em:
<https://agenciabrasil.ebc.com.br/geral/noticia/2016-11/arritmias-cardiacas-
causam-320-mil-mortes-subitas-por-ano-alerta-entidade>. Acesso em: 16 mai. 2023.
FYE, W Bruce. A history of the origin, evolution, and impact of electrocardiography. The
American journal of cardiology, Elsevier, v. 73, n. 13, p. 937–949, 1994.
GATECH-EIC. TinyML-Contest-Solution. 2022. Disponível em:
<https://github.com/GATECH-EIC/TinyML-Contest-Solution/>. Acesso em: 30 jun.
2023.
GOOGLE. Google Colab. Disponível em: <https://colab.research.google.com/>.
Acesso em: 30 jun. 2023.
HARRIS, Charles R. et al. Array programming with NumPy. Nature, Springer Science e
Business Media LLC, v. 585, n. 7825, p. 357–362, set. 2020. DOI:
10.1038/s41586-020-2649-2. Disponível em:
<https://doi.org/10.1038/s41586-020-2649-2>.
JI, Jinlong et al. A deep multi-task learning approach for ECG data analysis. In: IEEE. 2018
IEEE EMBS International Conference on Biomedical & Health Informatics (BHI). [S.l.: s.n.],
2018. P. 124–127.
LI, Qiao; RAJAGOPALAN, Cadathur; CLIFFORD, Gari D. Ventricular fibrillation and
tachycardia classification using a machine learning approach. IEEE Transactions on
Biomedical Engineering, IEEE, v. 61, n. 6, p. 1607–1613, 2013.
LIU, Clare. 5 Concepts You Should Know About Gradient Descent and Cost
Function. 2022. Disponível em: <https://www.kdnuggets.com/2020/05/5-concepts-
gradient-descent-cost-function.html>. Acesso em: 29 jun. 2023.
LOBO, Luiz Carlos. Inteligência artificial e medicina. Revista Brasileira de Educação
Médica, SciELO Brasil, v. 41, p. 185–193, 2017.
MARTIN ABADI et al. TensorFlow: Large-Scale Machine Learning on
Heterogeneous Systems. [S.l.: s.n.], 2015. Software available from tensorflow.org.
Disponível em: <https://www.tensorflow.org/>.
PEDREGOSA, F. et al. Scikit-learn: Machine Learning in Python. Journal of Machine
Learning Research, v. 12, p. 2825–2830, 2011.
RUDER, Sebastian. An overview of multi-task learning in deep neural networks. arXiv
preprint arXiv:1706.05098, 2017.
SECRETARIA DA SAÚDE DO ESTADO DO CEARÁ. Arritmia cardíaca: conheça mais
sobre a doença e saiba como tratá-la. Disponível em:
<https://www.saude.ce.gov.br/2019/11/06/arritmia-cardiaca-conheca-mais-sobre-
a-doenca-e-saiba-como-trata-la-corretamente/>. Acesso em: 29 jun. 2023.
SHIMPI, Prajwal et al. A machine learning approach for the classification of cardiac
arrhythmia. In: IEEE. 2017 international conference on computing methodologies and
communication (ICCMC). [S.l.: s.n.], 2017. P. 603–607.
SILVA, Guilherme; SILVA, Pedro. Modelo multitask para arritmias cardíacas.
[S.l.: s.n.], 2022. Disponível em: <https://codeshare.io/wnBRRx>. Acesso em: 30 jun. 2023.

UFOP Última modificação: 16 de março de 2024 13


Projeto de Monografia BCC502
SOBRAC. DADOS SOBRE MORTE SÚBITA. Disponível em:
<https://www.sobrac.org/campanha/arritmias-cardiacas-mortes-subita/>. Acesso
em: 29 jun. 2023.
TINYML CONTEST. 2022 ACM/IEEE TinyML Design Contest at ICCAD. 2022.
Disponível em:
<https://tinymlcontest.github.io/TinyML-Design-Contest/index.html>. Acesso em:
16 mai. 2023.

UFOP Última modificação: 16 de março de 2024 14


Projeto de Monografia BCC502

Figura 4: Arquitetura do modelo construído

UFOP Última modificação: 16 de março de 2024 15

Você também pode gostar