Você está na página 1de 9

TÍTULO: DETECTION OF APNEA EVENTS FROM ECG

SEGMENTS USING FOURIER DECOMPOSITION


METHOD
REFERÊNCIA BIBLIOGRÁFICA: Fatimah, B.; Singh, P.; Singhal, A.; Pachori, R. Detection
of apnea events from ECG segments using Fourier decomposition method.
Biomedical Signal Processing and Control, 2020, vol. 61.
INTEGRANTES:

André Tiago - 20189045624

Antonio Evaldo – 20189036053

Giovana Delmondes – 20189035412

Maria Eugênia – 20189056637

Vitor Araújo - 20189035216

I. CONTEXTUALIZAÇÃO
• Apneia do Sono
Apneia do Sono é uma doença caracterizada pela perda ou diminuição de níveis de
oxigênio no sangue em períodos relativamente curtos, mas significativos, do sono, sendo
causado pela ausência do fluxo de ar nas vias respiratórias. Quando isso acontece, o
cérebro do indivíduo aciona um sinal para acordá-lo a fim de que a respiração seja
retomada para que, então, ele possa dormir. Esse episódio pode acontecer várias vezes
durante a noite mesmo que ele não perceba ter acordado.
Existem três tipos de apneia que variam de acordo com o fator desencadeador para
esse distúrbio. A primeira delas é denominada Apneia Obstrutiva do Sono (AOS),
caracteriza-se por um bloqueio nas vias respiratórias superiores causada, geralmente, por
desvio de septo, adenoide ou pólipos nasais; a segunda é chamada de Apneia Central do
Sono (ACS) e ocorre quando há uma deficiência na comunicação entre o tronco cerebral
com os músculos respiratórios, o que impede a respiração de ser iniciada; já a terceira e
última é a junção dos dois tipos anteriores, chamada de Apneia Mista do Sono, geralmente
bem rara de se ter mas ainda preocupante.
• Problemática principal e Objetivos
Para detectar esse distúrbio, é utilizado um exame chamado de Polissonografia, em
que o indivíduo terá que dormir em uma sala monitorada, onde em seu corpo serão fixados
sensores para a coleta de informações como atividade respiratória, cerebral e muscular,
as quais serão analisadas através de computadores por uma equipe médica. Esse
procedimento é caro já que demanda equipamentos especializados, uma equipe para
monitoramento dos vários sinais captados e uma sala exclusiva para tal exame, além de
ser um exame desconfortável ao paciente, que terá algumas exigências para que seja feita
de forma correta, como estado de saúde normal e não ingestão de bebida alcoólica.
Tendo em vista essa questão, estudos estão sendo realizados para a melhor
substituição e/ou aprimoramento do método de identificação da apneia de uma forma
eficiente e acessível. Um deles utiliza um método computacionalmente eficiente para a
detecção em tempo real, nesse artigo objetiva identificar períodos de apneia do sono
através da análise de sinal de Eletrocardiograma (ECG) de três bancos de dados distintos,
por meio da técnica de Transformada de Fourier e em algoritmos de Machine Learning,
com o intuito de apresentar os resultados e compará-los com demais estudos presentes na
literatura.
• Justificativa para a utilização do Método de Decomposição de Fourier
O método de decomposição de Fourier se demonstra eficaz na decomposição de sinais
não lineares e não estacionários, sendo desse tipo os sinais obtidos pelo
Eletrocardiograma, além disso, é também utilizado em demais aplicações como a análise
de energia de tempo frequência (TFE). Com esse método, é possível analisar um conjunto
de funções de banda intrínseca de Fourier (FIBFs) com frequência de cortes necessárias,
tornando-se o principal componente para a análise de episódios de apneia em certos
intervalos de tempo.

II. CONCEITOS IMPORTANTES


• Eletrocardiograma (ECG)
Eletrocardiograma (ECG) é o registro dos fenômenos elétricos que se originam
durante a atividade cardíaca e auxilia no diagnóstico de grande número de cardiopatias e
outras condições patológicas.
O eletrocardiograma normal é composto por uma onda P, um complexo QRS, uma
onda T e uma onda U. O complexo QRS é comumente formado por três ondas distintas,
a onda Q, a onda R e a onda S.
A onda P é produzida por potenciais elétricos gerados à medida que os átrios se
despolarizam, antes de contrair-se. O complexo QRS deve-se aos potenciais gerados
quando os ventrículos se despolarizam, antes de contrair-se, isto é, conforme a onda de
despolarização, propaga-se por meio dos ventrículos. Assim, tanto a onda P quanto os
componentes do complexo QRS são ondas de despolarização. A onda T é em razão dos
potenciais gerados durante a recuperação dos ventrículos do estado de despolarização, e
a onda U pode ser encontrada pode ser observada no final da onda T, e é observada
frequentemente em indivíduos normais.

Figura 1. Caracterização esquemática do ECG com todas as suas ondas (P, Q, R, S, T e U).
• Banco de dados (Datasets)
Neste artigo, foram utilizados 3 (três) banco de dados que estão disponíveis no MIT
Physionet, são eles: Apnea-ECG dataset, MIT-BIH Polysomnographic datas e University
College Dublinsleep apnea database (UCDDB). Esses bancos de dados são utilizados para
treinar e testar os algoritmos, obter os resultados e comparar com os dos métodos
atualmente utilizados na medicina.
A base de dados Apnea-ECG, é a mais popular e amplamente utilizada no qual muitos
estudos foram realizados, tornando o estudo comparativo mais relevante. Além disso, as
três bases de dados possuem diferentes taxas de amostragem dos sinais de ECG.
• Classificadores
Para construir o modelo (preditivo) de classificação necessário, foi utilizado o
método de validação cruzada denominado k-fold. Em resumo, o conjunto de dados vai
ser particionado aleatoriamente em k vezes de tamanho igual. Um desses conjuntos de
dados será selecionado para ser o conjunto de teste, enquanto os outros são utilizados para
treinamento do modelo, como mostra a figura a seguir.

Figura 2. Exemplo do esquema de particionamento e execução do método k-fold com k = 3.

Ao final da utilização desta técnica, os resultados são então calculados para obter
um único modelo preditivo. Como neste trabalho os conjuntos de dados utilizados são
rotulados, fez-se possível a utilização de algoritmos de aprendizagem supervisionada para
construir um modelo preditivo usando o conjunto de dados selecionado. O desempenho
da técnica de detecção depende do modelo preditivo e do classificador selecionado. Em
busca do melhor classificador para o problema proposto, comparamos o desempenho dos
seguintes classificadores, k-vizinho mais próximo (kNN), Support Vector Machine
(SVM), bagging (agregação bootstrap) e LogitBoost.
Para medir a eficiência do algoritmo de classificação proposto, foram utilizadas quatro
métricas de desempenho, são elas:
› Acurácia: Verifica a porcentagem de acerto de um classificador.
› Precisão: Porcentagem de exemplos classificados como positivos que são
realmente positivos.
› Sensibilidade: Porcentagem de exemplos positivos classificados como positivos.
› Especificidade: Porcentagem de exemplos negativos classificados como
negativos.
Além destas métricas, analisou-se também a área sob a curva de característica de
operação do receptor (AUC), que é um indicador da capacidade do classificador de
distinguir entre duas classes, no caso deste estudo, um sinal de ECG com apneia ou
normal.
• Decomposição de Fourier
O método de decomposição de Fourier (FDM) é uma abordagem de decomposição
adaptativa de sinal baseada na teoria de Fourier. Este método decompõe intrinsecamente
qualquer sinal em um pequeno número de funções ortogonais de média zero limitadas por
banda, chamadas de funções de banda intrínseca de Fourier (FIBFs), por meio de filtros
passa-banda ideais de fase zero, e pode representar o sinal por essas funções
completamente. As FIBFs são locais, adaptativas, completas e com preservação de
energia (LACE).
O FDM fornece uma representação generalizada de Fourier de um sinal que tanto a
amplitude quanto a frequência variam com o tempo, ou seja, cada FIBF é um sinal
modulado em amplitude e em frequência (AM-FM) e, portanto, o FDM fornece uma
análise local de um sinal não linear e não estacionário. Para preservar a energia de um
sinal s[n], o FDM o decompõe em um conjunto linearmente independente, não-ortogonal
porém com preservação de energia (LINOEP) ou em FIBFs ortogonais com bandas de
frequência exigidas, empregando o seguinte modelo de decomposição de sinal:

onde a0 é o valor médio do sinal, sm[n] e vm[n] são m-ésimos FIBFs ortogonais e LINOEP,
respectivamente.

Figura 3. Diagrama de bloco da transformada discreta de Fourier e da transformada discreta


de cosseno baseado no método de decomposição de Fourier, para decompor um sinal em um
conjunto de FIBFs ortogonais com bandas de frequência desejadas.

A abordagem do método de decomposição de Fourier com transformada discreta


de Fourier (DFT) e transformada discreta de cosseno (DCT) com base no banco de filtros
de fase zero, é mostrado na Fig. 3. Além disso, a decomposição do sinal s[n] em um
conjunto de FIBFs ortogonais desejados {s1[n], s2[n] ,. . ., sM[n]} também é ilustrado. O
m-ésimo FIBF sm[n] usando o inverso da transformada discreta de Fourier (IDFT) pode
ser derivado como,

onde Hm[k] denota o m-ésimo filtro de fase zero e S[k] é o comprimento N da


transformada discreta de Fourier do sinal s[n]. Observando que sm[n] é um sinal período,
pois deriva do ECG, então a equação acima é a própria série de Fourier, sendo a
multiplicação do filtro Hm[k] pela função S[k] correspondente aos coeficientes 𝑎𝑘 .

III. APLICAÇÃO DA ANÁLISE DE FOURIER


• Metodologia Proposta
O diagrama de bloco dado para a metodologia proposta é dado na Fig. 4. No primeiro
passo, os autores dividem os sinais ECG em segmentos de 1 minuto, que são então
decompostos em M sinais FIBFs utilizando o FDM. Sinais FIBFs que contém ruído ou
interfeririam na análise são removidos, e a análise estatística é realizada com os (M – 2)
FIBFs restantes. Apenas as características estatísticas relevantes são selecionadas para
construir o modelo de classificação utilizando diferentes classificadores.

Figura 4. Diagrama de bloco da metodologia proposta para detecção automática de apneia do


sono, decompondo o sinal ECG em M FIBFs.
Os autores utilizaram tanto a DFT-FDM (Transformada Discreta de Fourier baseada no
FDM) quanto a DCT-FDM (Transformada Discreta de Cosseno baseada no FDM) para
obter os sinais FIBFs, e uma vez que os resultados encontrados foram bastante similares,
apenas a DCT-FDM foi apresentada. É possível ver na Fig. 5 uma representação de sinal
ECG para um segmento de apneia e sua decomposição em 9 sinais FIBFs. Os segmentos
utilizados para a análise têm duração de 1 minuto, mas para melhor visualização dos
sinais, os autores apresentaram os sinais em segmentos de 10 segundos.

Figura 5. Representação em função do tempo de um segmento ECG de apneia, com duração de


10 segundos, amostrada em 100 Hz, e sua decomposição em um conjunto de 9 FIBFs usando o
FDM.

• Extração das características


As características calculadas dos sinais processados foram entropia (En) e o
desvio médio absoluto (MAD). Essas características foram obtidas para as (M – 2) FIBFs
de frequências relevantes.
A entropia referida no artigo é a Entropia de Shannon, conhecida como entropia
de informação, que se trata de uma medida da dispersão dos dados de uma informação,
como um sinal. Aplicada às FIBFs, os autores obtiveram a seguinte equação:

Onde En é a entropia de Shannon naquela para a probabilidade discreta 𝑝(𝑠𝑖 [𝑛]), para o
sinal 𝑠𝑖 [𝑛].
Já o desvio médio absoluto nos fornece a noção de variabilidade em um conjunto
de informação, neste caso, conjuntos de FIBFs. Aplicado ao sinal decomposto em estudo:
Onde 𝜇𝑖 é o valor médio a i-éssima FIBF.
• Testes Estatísticos
A partir das características calculadas supracitadas, foi selecionado um
subconjunto em que foram desprezadas as FIBFs com características muito desviantes.
Passo importante para melhorar a eficiência do algoritmo classificador. Para identificar
as FIBFs estatisticamente mais relevantes, os autores utilizaram o teste de Kruskal-
Wallis.
• Classificação
Foi usada a validação cruzada para a construção do modelo preditivo, conforme
explicada no tópico II, que, em suma, é a utilização de um subconjunto como o teste e os
demais como dados de treinamento, repetindo de modo que cada subconjunto seja usando
como teste. Esse modelo preditivo é então usado para classificar os sinais de ECG de teste
por minuto como “apneia” ou “normal”. O estudo comparou quatro algoritmos
classificadores: kNN, SVM, bagging e LogitBoost, colocando-os em teste nos três bancos
de dados já citados: Apneia-ECG, MIT-BIH e UCDDB. Para determinar o desempenho
do método proposto, a comparação foi feita aferindo-se a sensibilidade, especificidade,
precisão e área sob a curva de característica de operação do receptor. Analisaram, ainda,
o número ótimo de FIBFs, que levaram à escolha do melhor classificador.

IV. SIMULAÇÕES, RESULTADOS E DISCUSSÕES


• Conjunto de dados Apneia-ECG
Para este conjunto de dados, os melhores resultados de desempenho são obtidos com o
classificador SVM, conforme mostrado na Tabela 1 a seguir.
Classificador Precisão (%) ±faixa Sensibilidade Especificidade Precisão AUC
de variação (%)
Bagging 91,44±0,68 91,61 92,52 88,20 0,9700
kNN 90,57±0,55 89,13 91,66 86,90 0,9589
LogitBoost 85,84±0,57 79,17 89,97 83,04 0,9259
SVM 92,59±1,06 89,70 94,67 91,27 0,9701
Tabela 1: Medidas de desempenho da metodologia proposta usando vários classificadores para o conjunto de dados
de Apnéia-ECG

Para encontrar o número ótimo de FIBFs a partir do classificador SVM no banco


de dados Apneia-ECG, comparam-se a especificidade, a sensibilidade, a precisão e a área
sobre a curva de característica de operação do receptor (AUC), analisados para números
diferentes de FIBFs. Os resultados encontrados são mostrados na Tabela 2 a seguir:

Número de FIBFs Especificidade (%) Sensibilidade (%) Precisão (%) AUC


6 92,63 88,5 91,03±0,82 0,9629
8 93,48 88,43 91,58±0,63 0,9667
10 93,34 87,79 91,28±0,80 0,9665
14 93,57 86,74 90,99±0,46 0,9614
8 92,04 87,09 90,25±0,55 0,9576
10 92,39 87,46 90,37±0,62 0,9582
14 93,36 87,84 91,26±0,63 0,9621
20 93,46 89,01 91,78±0,52 0,9660
28 94,67 89,70 92,59±1,06 0,9701
30 94,68 88,10 92,30±0,63 0,9679
Tabela 2: Medida de desempenho da metodologia proposta usando o SVM para diferentes números de FIBFs para
conjunto de dados de apneia-ECG

A partir da análise da tabela, inferiu-se que 28 FIBFs é o número ótimo, uma vez que
este valor apresenta a maior precisão.

• Conjunto de dados MIT-BIH


Seguindo a mesma metodologia supracitada, os autores encontraram o número ótimo de
FIBFs a partir do classificador SVM no banco de dados MIT-BIH. Verifica-se que a
mesma quantidade é tida como ideal, 28 FIBFs, apresentando maior taxa de precisão,
conforme mostram os resultados disposto na Tabela 2 a seguir:
Número de FIBFs Especificidade (%) Sensibilidade (%) Precisão (%) AUC
8 89,23 87,86 88,53±1,12 0,9373
10 89,23 87,83 88,54±0,79 0,9232
14 88,146 87,07 87,65±1,75 0,9321
8 88,57 88,00 88,34±1,70 0,9320
10 89,23 87,48 88,40±1,31 0,9343
14 89,73 87,38 88,81±1,82 0,9383
20 89,20 87,59 88,49±1,43 0,9366
28 89,56 87,79 88,56±1,19 0,9393
30 88,90 88,07 88,48±1,14 0,9396
Tabela 3: Medida de desempenho da metodologia proposta usando o classificador SVM para o conjunto de dados
MIT-BIH.

• UCDDB
Na Tabela 4 a seguir, são comparados os resultados obtidos neste trabalho para UCDDB
com outros algoritmos de detecção da literatura.
Autores Especificidade (%) Sensibilidade (%) Precisão (%)
Xie e Minn 80,29 69,82 77,74
Willeman et al. - 62,30±21,18 75,90±8,75
Wang et al. 86,90 26,60 71,80
Papini et al. 84,00 50,60 74,70
Proposto no trabalho 87,59 68,89 80,44
Tabela 4: Comparação do desempenho do algoritmo proposto com as técnicas existentes para UCDDB.

Em seguida, são apresentadas discussões referentes aos resultados encontrados pelos


três conjuntos de dados considerados para detecção da apneia.
• Conjunto de dados Apneia-ECG:
Para este conjunto de dados, o conjunto de recursos SVM com kernel gaussiano foi tido
como o melhor classificador do algoritmo proposto como foi mostrado na Tabela 5 a
seguir e anteriormente na Tabela 2 com o resultado de 28 FIBFs como valor ideal
encontrado por meio desde conjunto.
Autores Especificidade (%) Sensitividade (%) Precisão (%)
Tripathy 74,67 78,02 76,37
Chen et al. 80,24 83,23 82,07
Hassan e Haque 82,79 85,20 83,77
Nguye et al. 83,47 86,37 85,26
Hassan e Haque - - 85,37
Hassan e Haque 86,83 84,14 85,97
Hassan 90,72 81,99 87,33
Hassan e Haque 91,49 87,58 88,88
Janbakhshi e Shamsollahi 91,80 89,60 90,90
Proposto no trabalho 94,67 89,70 92,59
Tabela 5: Comparação do desempenho do algoritmo proposto com as técnicas existentes para o conjunto de dados
Apneia-ECG.

O desempenho do método proposto é melhor para sinais não lineares e não estacionários,
uma vez que a mistura não degrada a resolução tempo-frequência dos sinais de sub-banda
obtidos. Portanto, o método proposto (método de decomposição de Fourier-FDM) tem
um desempenho superior às metodologias existentes, tendo este uma precisão de 92,59%.
• Conjunto de dados MIT-BIH:
Sulistyo et al. usaram recursos HRV para detectar o sinal ECG segmentado como
evento de apneia e não apneia para este conjunto de dados. Foi obtida uma precisão de
70,12% com o classificador SVM, enquanto o algoritmo proposto dá uma precisão de
88,56%, apresentando assim um melhor desempenho.
• Conjunto de dados UCDDB:
Usando a classificação proposta na metodologia para o conjunto de dados de ECG
fornecido em UCDDB, o algoritmo em estudo obteve uma precisão de 80,44% e
sensibilidade de 68,89%, como foi mostrado na Tabela 4, o que é muito superior às
demais metodologias existentes.

V. COMENTÁRIOS FINAIS
Os resultados simulados obtidos do conjunto de dados através desse método além de alcançar
os objetivos esperados, também se mostrou eficiente quando comparados aos outros já aplicados.
Como proposta para trabalhos futuros, destaca-se a utilização de modelos de aprendizagem não
supervisionada, explorando mais as propriedades de Machine Learning com o intuito de
selecionar melhor um subconjunto de características e reduzir informações redundantes no estudo.
Além disso, é mencionada a utilização de outros tipos de sinais, diferentemente de ECG, como
por exemplo, sinais biomédicos que consigam captar padrões respiratórios.

Você também pode gostar