Escolar Documentos
Profissional Documentos
Cultura Documentos
I. CONTEXTUALIZAÇÃO
• Apneia do Sono
Apneia do Sono é uma doença caracterizada pela perda ou diminuição de níveis de
oxigênio no sangue em períodos relativamente curtos, mas significativos, do sono, sendo
causado pela ausência do fluxo de ar nas vias respiratórias. Quando isso acontece, o
cérebro do indivíduo aciona um sinal para acordá-lo a fim de que a respiração seja
retomada para que, então, ele possa dormir. Esse episódio pode acontecer várias vezes
durante a noite mesmo que ele não perceba ter acordado.
Existem três tipos de apneia que variam de acordo com o fator desencadeador para
esse distúrbio. A primeira delas é denominada Apneia Obstrutiva do Sono (AOS),
caracteriza-se por um bloqueio nas vias respiratórias superiores causada, geralmente, por
desvio de septo, adenoide ou pólipos nasais; a segunda é chamada de Apneia Central do
Sono (ACS) e ocorre quando há uma deficiência na comunicação entre o tronco cerebral
com os músculos respiratórios, o que impede a respiração de ser iniciada; já a terceira e
última é a junção dos dois tipos anteriores, chamada de Apneia Mista do Sono, geralmente
bem rara de se ter mas ainda preocupante.
• Problemática principal e Objetivos
Para detectar esse distúrbio, é utilizado um exame chamado de Polissonografia, em
que o indivíduo terá que dormir em uma sala monitorada, onde em seu corpo serão fixados
sensores para a coleta de informações como atividade respiratória, cerebral e muscular,
as quais serão analisadas através de computadores por uma equipe médica. Esse
procedimento é caro já que demanda equipamentos especializados, uma equipe para
monitoramento dos vários sinais captados e uma sala exclusiva para tal exame, além de
ser um exame desconfortável ao paciente, que terá algumas exigências para que seja feita
de forma correta, como estado de saúde normal e não ingestão de bebida alcoólica.
Tendo em vista essa questão, estudos estão sendo realizados para a melhor
substituição e/ou aprimoramento do método de identificação da apneia de uma forma
eficiente e acessível. Um deles utiliza um método computacionalmente eficiente para a
detecção em tempo real, nesse artigo objetiva identificar períodos de apneia do sono
através da análise de sinal de Eletrocardiograma (ECG) de três bancos de dados distintos,
por meio da técnica de Transformada de Fourier e em algoritmos de Machine Learning,
com o intuito de apresentar os resultados e compará-los com demais estudos presentes na
literatura.
• Justificativa para a utilização do Método de Decomposição de Fourier
O método de decomposição de Fourier se demonstra eficaz na decomposição de sinais
não lineares e não estacionários, sendo desse tipo os sinais obtidos pelo
Eletrocardiograma, além disso, é também utilizado em demais aplicações como a análise
de energia de tempo frequência (TFE). Com esse método, é possível analisar um conjunto
de funções de banda intrínseca de Fourier (FIBFs) com frequência de cortes necessárias,
tornando-se o principal componente para a análise de episódios de apneia em certos
intervalos de tempo.
Figura 1. Caracterização esquemática do ECG com todas as suas ondas (P, Q, R, S, T e U).
• Banco de dados (Datasets)
Neste artigo, foram utilizados 3 (três) banco de dados que estão disponíveis no MIT
Physionet, são eles: Apnea-ECG dataset, MIT-BIH Polysomnographic datas e University
College Dublinsleep apnea database (UCDDB). Esses bancos de dados são utilizados para
treinar e testar os algoritmos, obter os resultados e comparar com os dos métodos
atualmente utilizados na medicina.
A base de dados Apnea-ECG, é a mais popular e amplamente utilizada no qual muitos
estudos foram realizados, tornando o estudo comparativo mais relevante. Além disso, as
três bases de dados possuem diferentes taxas de amostragem dos sinais de ECG.
• Classificadores
Para construir o modelo (preditivo) de classificação necessário, foi utilizado o
método de validação cruzada denominado k-fold. Em resumo, o conjunto de dados vai
ser particionado aleatoriamente em k vezes de tamanho igual. Um desses conjuntos de
dados será selecionado para ser o conjunto de teste, enquanto os outros são utilizados para
treinamento do modelo, como mostra a figura a seguir.
Ao final da utilização desta técnica, os resultados são então calculados para obter
um único modelo preditivo. Como neste trabalho os conjuntos de dados utilizados são
rotulados, fez-se possível a utilização de algoritmos de aprendizagem supervisionada para
construir um modelo preditivo usando o conjunto de dados selecionado. O desempenho
da técnica de detecção depende do modelo preditivo e do classificador selecionado. Em
busca do melhor classificador para o problema proposto, comparamos o desempenho dos
seguintes classificadores, k-vizinho mais próximo (kNN), Support Vector Machine
(SVM), bagging (agregação bootstrap) e LogitBoost.
Para medir a eficiência do algoritmo de classificação proposto, foram utilizadas quatro
métricas de desempenho, são elas:
› Acurácia: Verifica a porcentagem de acerto de um classificador.
› Precisão: Porcentagem de exemplos classificados como positivos que são
realmente positivos.
› Sensibilidade: Porcentagem de exemplos positivos classificados como positivos.
› Especificidade: Porcentagem de exemplos negativos classificados como
negativos.
Além destas métricas, analisou-se também a área sob a curva de característica de
operação do receptor (AUC), que é um indicador da capacidade do classificador de
distinguir entre duas classes, no caso deste estudo, um sinal de ECG com apneia ou
normal.
• Decomposição de Fourier
O método de decomposição de Fourier (FDM) é uma abordagem de decomposição
adaptativa de sinal baseada na teoria de Fourier. Este método decompõe intrinsecamente
qualquer sinal em um pequeno número de funções ortogonais de média zero limitadas por
banda, chamadas de funções de banda intrínseca de Fourier (FIBFs), por meio de filtros
passa-banda ideais de fase zero, e pode representar o sinal por essas funções
completamente. As FIBFs são locais, adaptativas, completas e com preservação de
energia (LACE).
O FDM fornece uma representação generalizada de Fourier de um sinal que tanto a
amplitude quanto a frequência variam com o tempo, ou seja, cada FIBF é um sinal
modulado em amplitude e em frequência (AM-FM) e, portanto, o FDM fornece uma
análise local de um sinal não linear e não estacionário. Para preservar a energia de um
sinal s[n], o FDM o decompõe em um conjunto linearmente independente, não-ortogonal
porém com preservação de energia (LINOEP) ou em FIBFs ortogonais com bandas de
frequência exigidas, empregando o seguinte modelo de decomposição de sinal:
onde a0 é o valor médio do sinal, sm[n] e vm[n] são m-ésimos FIBFs ortogonais e LINOEP,
respectivamente.
Onde En é a entropia de Shannon naquela para a probabilidade discreta 𝑝(𝑠𝑖 [𝑛]), para o
sinal 𝑠𝑖 [𝑛].
Já o desvio médio absoluto nos fornece a noção de variabilidade em um conjunto
de informação, neste caso, conjuntos de FIBFs. Aplicado ao sinal decomposto em estudo:
Onde 𝜇𝑖 é o valor médio a i-éssima FIBF.
• Testes Estatísticos
A partir das características calculadas supracitadas, foi selecionado um
subconjunto em que foram desprezadas as FIBFs com características muito desviantes.
Passo importante para melhorar a eficiência do algoritmo classificador. Para identificar
as FIBFs estatisticamente mais relevantes, os autores utilizaram o teste de Kruskal-
Wallis.
• Classificação
Foi usada a validação cruzada para a construção do modelo preditivo, conforme
explicada no tópico II, que, em suma, é a utilização de um subconjunto como o teste e os
demais como dados de treinamento, repetindo de modo que cada subconjunto seja usando
como teste. Esse modelo preditivo é então usado para classificar os sinais de ECG de teste
por minuto como “apneia” ou “normal”. O estudo comparou quatro algoritmos
classificadores: kNN, SVM, bagging e LogitBoost, colocando-os em teste nos três bancos
de dados já citados: Apneia-ECG, MIT-BIH e UCDDB. Para determinar o desempenho
do método proposto, a comparação foi feita aferindo-se a sensibilidade, especificidade,
precisão e área sob a curva de característica de operação do receptor. Analisaram, ainda,
o número ótimo de FIBFs, que levaram à escolha do melhor classificador.
A partir da análise da tabela, inferiu-se que 28 FIBFs é o número ótimo, uma vez que
este valor apresenta a maior precisão.
• UCDDB
Na Tabela 4 a seguir, são comparados os resultados obtidos neste trabalho para UCDDB
com outros algoritmos de detecção da literatura.
Autores Especificidade (%) Sensibilidade (%) Precisão (%)
Xie e Minn 80,29 69,82 77,74
Willeman et al. - 62,30±21,18 75,90±8,75
Wang et al. 86,90 26,60 71,80
Papini et al. 84,00 50,60 74,70
Proposto no trabalho 87,59 68,89 80,44
Tabela 4: Comparação do desempenho do algoritmo proposto com as técnicas existentes para UCDDB.
O desempenho do método proposto é melhor para sinais não lineares e não estacionários,
uma vez que a mistura não degrada a resolução tempo-frequência dos sinais de sub-banda
obtidos. Portanto, o método proposto (método de decomposição de Fourier-FDM) tem
um desempenho superior às metodologias existentes, tendo este uma precisão de 92,59%.
• Conjunto de dados MIT-BIH:
Sulistyo et al. usaram recursos HRV para detectar o sinal ECG segmentado como
evento de apneia e não apneia para este conjunto de dados. Foi obtida uma precisão de
70,12% com o classificador SVM, enquanto o algoritmo proposto dá uma precisão de
88,56%, apresentando assim um melhor desempenho.
• Conjunto de dados UCDDB:
Usando a classificação proposta na metodologia para o conjunto de dados de ECG
fornecido em UCDDB, o algoritmo em estudo obteve uma precisão de 80,44% e
sensibilidade de 68,89%, como foi mostrado na Tabela 4, o que é muito superior às
demais metodologias existentes.
V. COMENTÁRIOS FINAIS
Os resultados simulados obtidos do conjunto de dados através desse método além de alcançar
os objetivos esperados, também se mostrou eficiente quando comparados aos outros já aplicados.
Como proposta para trabalhos futuros, destaca-se a utilização de modelos de aprendizagem não
supervisionada, explorando mais as propriedades de Machine Learning com o intuito de
selecionar melhor um subconjunto de características e reduzir informações redundantes no estudo.
Além disso, é mencionada a utilização de outros tipos de sinais, diferentemente de ECG, como
por exemplo, sinais biomédicos que consigam captar padrões respiratórios.