Você está na página 1de 8

https://pubmed.ncbi.nlm.nih.

gov/31466261/

Detecção e classificação automatizada de nódulo pulmonar usando


aprendizado profundo combinado com várias estratégias

1. INTRODUÇÃO
O câncer de pulmão é uma das principais causas de mortes relacionadas ao câncer
devido à sua natureza agressiva e diagnósticos tardios, já em estágios avançados. A
detecção precoce do câncer de pulmão melhora significativamente a chance de
sobrevivência do indivíduo e é um dos principais problemas atualmente; o desafio é predizer
a probabilidade de malignidade para os nódulos pulmonares nos estágios iniciais.
Radiografias de tórax (Raio-X) e tomografia computadorizada (TC) são usados
​inicialmente para o diagnóstico de doenças malignas, mas diagnósticos e decisões erradas
ocorrem com uma certa frequência, já que nos estágios iniciais os nódulos benignos e
malignos são muito semelhantes entre si. Métodos bastante invasivos como biópsias ou
cirurgias são usados para diferenciar os nódulos pulmonares entre benignos e malignos.
Para um órgão tão frágil e sensível, esses métodos invasivos envolvem muitos riscos para o
paciente.
Além disso, pesquisas demonstram que somente 68% das vezes os nódulos são
diagnosticados corretamente quando um único radiologista analisa as imagens dos exames
e esse número aumenta para 82% quando dois radiologistas analisam - necessitando uma
maior demanda profissional para um único diagnóstico. Com isso, sistemas de detecção
auxiliada por computador (CAD) foram inicialmente projetado para reduzir a carga de
trabalho dos radiologistas e aumentar a taxa de detecção desses nódulos; hoje os CAD
também ajudam no processo de triagem, diferenciando entre nódulos benignos e malignos.
Nesse processo de triagem com uso dos CAD, alguns erros levam a diagnósticos
errados e ou tardios resultando em uma alta mortalidade, como erros de digitalização, por
falha na captura da área da lesão, erro de reconhecimento e erro de tomada de decisão,
que acontece devido à compreensão incorreta do benigno/maligno e as estruturas normais.
2. TRABALHOS RELACIONADOS
Após a invenção da unidade de processamento gráfico (GPU) e redes neurais
convolucionais (CNN), o desempenho de análise de imagem baseada em computador
e o sistema de apoio à decisão teve um grande impulso. Muitas análises de imagens
médicas baseadas em modelos de aprendizado profundo foram propostas por alguns
pesquisadores e após a popularidade das redes neurais convolucionais (CNNs) na análise
de imagens, diferentes tipos de padrões de conectividade foram propostos para aumentar o
desempenho de CNNs profundas (ResNet, DenseNet, DPNs e MixNet, por exemplo).

3. MOTIVAÇÕES
Dr. Silvestri e sua equipe de pesquisa propuseram classificadores proteômicos para
diferenciar entre nódulos benignos e malignos de pequeno tamanho. Duas proteínas,
denominadas LG3BP e C163A, foram identificadas como biomarcadores para identificação
de nódulos pulmonares cancerígenos. O nível dessas proteínas no plasma, junto com cinco
fatores de risco (idade, tamanho do nódulo, tabagismo, características da borda e
localização), foram usados ​como classificadores e obtiveram resultados muito bons em
nódulos de 8-30 mm e biópsias reduzidas em nódulos benignos em 40%.
Esses resultados aliados às características dos nódulos são essenciais para
diagnóstico e melhores resultados através de métodos de deep learning baseados em
computador. Isso tudo motivou os pesquisadores a combinarem os resultados de um
modelo de deep learning eficiente com biomarcadores para reduzir os resultados falsos
positivos; essa combinação de vários biomarcadores fornece alta capacidade de detecção e
diagnóstico dos nódulos.

4. SISTEMA PROPOSTO - DETECÇÃO E CLASSIFICAÇÃO AUTOMATIZADA DE


NÓDULOS PULMONARES
O artigo propõe um sistema (Figura 1) que funciona utilizando tomografias
computadorizadas de pulmão tridimensionais (3D), junto com os sintomas fisiológicos e os
biomarcadores clínicos, para reduzir os resultados falso-positivos e, em última análise,
evitar métodos invasivos. A redução suprema de falsos positivos foi alcançada por meio da
combinação de várias estratégias sobre os resultados suspeitos do modelo de
aprendizagem profunda.
O sistema de classificação e detecção automatizada de nódulos pulmonares
proposto funciona em múltiplas estratégias para diminuir os resultados do falso-positivo;
executa decisões com base em vários pontos: sintomas fisiológicos, CT, análise de
varredura e biomarcadores clínicos - biomarcadores clínicos, especialmente proteínas
plasmáticas e exames de sangue, são muito úteis para a classificação de nódulos
pulmonares em estágio inicial.

Figura 1. Modelo do sistema de detecção e classificação automatizada de nódulo pulmonar

https://pubmed.ncbi.nlm.nih.gov/33156792/

Implementação de hardware de aceleradores de rede profunda para


aplicações biomédicas e de saúde

4.1 MONITORAMENTO DE SINTOMAS FISIOLÓGICOS


É de interesse para o monitoramento fisiológico de pacientes em fase inicial ou avançada
de câncer de pulmão, a utilização de aparelhos que possam estar fiscalizando durante o dia
a dia os sintomas que este possa estar sentindo, pois através disso consegue-se ter um
parâmetro mais coerente para um diagnóstico e tratamento.
A maioria dos sintomas costumam aparecer quando o câncer já se encontra em fase
metastática ou sob presença de nódulos pulmonares malignos, com isso esses sintomas
fisiológicos são um indicativo muito interessante para o direcionamento do tratamento e isso
demonstra que os dispositivos de monitoramento são importantes para deter o avanço da
doença. Estes dispositivos têm como função o direcionamento de informações para o
computador ou smartphone, para que então o médico possa receber em tempo real a
sintomatologia e a partir disso gerar um melhor direcionamento ao paciente.
4.2 ANÁLISE DE TOMOGRAFIA COMPUTADORIZADA USANDO DEEP LEARNING
Associação da tomografia computadorizada e utilização do Deep Learning ocorrem para
fazer uma detecção e classificação de nódulos com objetivo de maior precisão e eficácia.

4.2.1 DETECÇÃO DE NÓDULOS COM 3D FASTER R - CNN CMIXNET


O principal motivo de se querer fazer uma integração de procedimentos de identificação
seria pela alta utilização da tomografia computadorizada, porém o baixo diagnóstico de
nódulos pulmonares menores, logo que a partir deste diagnóstico antecipado se possa ter
um tratamento menos invasivo e mais preciso.
A utilização de uma arquitetura de conexão como a CNN pode fazer uma melhor
codificação e decodificação de forma rápida e eficiente na classificação dos nódulos.
- MIXNET atinge desempenho superior em termos de eficiência de parâmetros e resultados
BLOCOS COM CAMADAS (L)
C CONEXÃO
H1 FUNÇÃO NÃO LINEAR DE TRANSFORMAÇÃO( NÚMERO DEMONSTRA
ÍNDICE DA CAMADA)
S1 SAÍDA DA CONEXÃO
UTILIZADO PARA HAVER CONEXÃO ENTRE CAMADAS, ATUAIS E
ANTERIORES ENTRE SI, COMO UM CRUZAMENTO DE INFORMAÇÕES.

-RESNET SE UTILIZA DE OUTRO RECURSO: ELE SOMENTE ADICIONA A


INFORMAÇÃO A ÚLTIMA SAÍDA

- R CNN FOI O MÉTODO DE DETECÇÃO DO NÓDULO


Possui três estágios ao qual são importantes para eficácia: extração de recursos, proposta
de região e detecção
Quando o CMixNet e U-Net são associados, isso torna mais robusto a extração e geração
de recursos relativo ao nódulo.
Caixa delimitadora e classificação funcionam como âncoras para definir tamanho do nódulo,
que por sua vez tem funções de perda para a presença ou não do nódulo, bem como
função de perda relativa ao diâmetro e coordenadas do nódulo.

4.2.2 CLASSIFICAÇÃO DE NÓDULO USANDO GBM E CMIXNET


Deep Learning é importante para conseguir identificar e diferenciar nódulo benignos de
malignos através de técnicas avançadas, enquanto na tomografia computadorizada o
procedimento faz o processo de corte e centralização do nódulo.
CMixNet fará extração e caracterização do nódulo para identificar como benigno ou
maligno. E GBM também será utilizado como recurso para detalhar e classificar nódulo,
gerando aumento na precisão da previsão da doença.

4.3 PRINCIPAIS BIOMARCADORES CLÍNICOS


Biomarcadores são importantes para diagnóstico precoce de câncer, logo que os testes
sanguíneos comuns não conseguem identificar com tanta eficácia a malignidade da doença.
Biomarcadores moleculares ou clínicos podem estar presentes no sangue ou saliva, em que
marcadores de proteína são os que aderem a uma maior sensibilidade. A recomendação é
que seja utilizado como outro parâmetro para definição do nódulo como maligno ou
benigno.

5. RESULTADOS, DISCUSSÃO E CONCLUSÃO


Vários experimentos foram feitos para treinar e validar os modelos. Como o ten-fold
Cross validation, que tem como objetivo avaliar o desempenho de modelos de deep
learning, particionando dados em conjuntos de treino e teste. Isso foi feito tanto para o
dataset LUNA16, que foi usado para detecção dos nódulos, como para o LIDC-IDRI, usado
para classificação. Além disso, o sistema criar foi avaliado tanto no nível de diagnóstico de
pacientes quanto de diagnóstico de nódulos e implementado em NVIDIA TESLA K80 GPU
com memória gráfica de 12 GB em PyTorch.

5.1 DATASETS
Os datasets usados, LUNA16 e LIDC-IDRI, são de domínio público e como foi dito,
foram usados para detecção e classificação, respectivamente. O LUNA16 é um subset do
LIDC-IDRI que somente possui anotações de detecções confirmadas por três ou quatro
radiologistas, somente tomografias computadorizadas com fatias uniformes e imagens
organizadas de 888 TC de baixa dose de pulmões, com um total de 754,976 candidatos que
foram classificados como '0' quando não possuíam nódulos e '1' quando possuíam. Entre
esses, 36,378 eram confirmados como nódulos por radiologistas. O dataset LIDC-IDRI
contém todas as informações relacionadas aos nódulos, como tamanhos, localização,
resultados de diagnósticos de médicos experientes em TC de baixa dose em XML arquivos
e todo tipo de imagem relacionada, totalizando 1,018 TC torácicas de baixa dose.
O modelo ouro de classificação de nódulo foi obtido pelas anotações dos datasets
LIDC-IDRI e LUNA16 e mapas de médicos.

5.2 PRÉ PROCESSAMENTO


TC torácicas são um conjunto de imagens que precisam ser compreendidas e pré
processadas para ser possível encontrar e classificar os nódulos pulmonares. Sem isso não
é possível localizar áreas de interesse para serem analisadas pelo sistema. Outro motivo
para esse pré processamento é por motivos de memória do sistema, já que as imagens de
TC são muito grandes, além dos datasets necessários.

5.3. TREINAMENTO
O modelo de detecção foi treinado pelo dataset LUNA16 e o modelo de classificação
foi treinado com o LIDC-IDRI.
Os modelos foram treinados usando SGD com tamanho de mini batch e 150 epochs.
Três diferentes taxas de treinamento foram usadas em todo processo, que inicialmente
estava em 0.01 para 100 epochs, depois em 0.001 para os próximos 30 epochs e depois
em 0.0001 para os últimos 20 epochs. Para melhorar o processo de treinamento e
performance, foi usado ResNeXt com pré ativação no máximo, o que levou a menos erros
de treinamento e peso de inicialização apropriado.
O dataset LIDC-IDRI foi submetido a um ten-fold cross validation, tendo seus dados
separados em 10 conjuntos para isso, e então repartido novamente em grupos de treino,
validação e teste para poder avaliar o treino do sistema. Os pesos foram aprendidos com
SGD.
O propósito do treino é minimizar a diferença entre o dado de entrada e o modelo ouro
e existem dois motivos pelos quais um treino pode ser parado: se a network atingir o menor
nível de erro possível e se a função de perda nos dados de validação não mudarem mais.

5.4. DETECÇÃO DE NÓDULOS


Como foi dito, a função de detecção do sistema foi treinado com o dataset LUNA16,
com 10-fold cross-validation e separação de níveis de paciente. Para validar o método
proposto, foi usado a matriz de avaliação oficial FROC (Free Response Receiver Operating
Characteristic. O FROC retrata a sensibilidade versus falsos positivos em uma varredura do
sistema proposto.
A fase de teste foi performada com a detecção da probabilidade de entrada de -2
antes da aplicação da função sigmóide. Depois, um NMS (non-maximum supression) com
IoU (intersection over union) foi performada pela operação de entrada.

5.5. CLASSIFICAÇÃO DE NÓDULOS


A classificação de nódulos do sistema proposto foi treinado pelo dataset LIDC-IDRI,
nos mesmas condições que o dataset LUNA16. Para esse treino foram usados 3250
nódulos que contém números iguais de positivos e negativos.
Os nódulos detectados de tamanhos 32 x 32 x 32 foram preenchidos para 36 x 36 x
36. Os nódulos preenchidos com zero foram recortados aleatoriamente para aumento de
dados. Devido à diferença mínima entre nódulos benignos e malignos, 1000 epochs fora.
Usadas com três taxas de aprendizagem diferentes de 0,01, 0,001 e 0,0001. Resultados
mostraram que o modelo proposto exibiu maior acurácia que outros já existentes.
A performance do sistema proposto foi avaliado com base na queda da taxa de falsos
positivos e outras medidas estatísticas como sensibilidade, especificidade, acurácia e o
AUC ( area under tudo receiver operative cure. Essa valor varia entre 0,5 e 1, quanto maior,
mais significância na performance do sistema.

5.6. COMPLEXIDADE COMPUTACIONAL


Todos os experimentos foram conduzidos em NVIDIA TESLA K80 GPU com gráficos
de memória de 12 GB in PyTorch. O custo computacional foi avaliado em termos de
números de parâmetros e tempo de treino em milissegundos por amostra.

6. CONCLUSÕES
O sistema multi estratégico de detecção e classificação de nódulos pulmonares
proposto teve como objetivo a redução de falsos positivos em estágios iniciais da doença.
A detecção e classificação de nódulos pulmonares de forma automática tem uma grande
taxa de detecção e falsos positivos, enquanto biomarcadores clínicos tem baixa detecção e
alta especificidade. Assim, o uso de ambos de forma complementar diminui o número de
falsos positivos. Além disso, foi constatado que a detecção de nódulos na presença de
evidências clínicas aumenta a chance de ser maligno, enquanto a detecção de nódulos sem
evidência clínica será necessária uma análise morfológica antes da decisão final. Os
resultados mostram uma superioridade do sistema proposto em relação a outros já
existentes com menor custo computacional.

Você também pode gostar