Escolar Documentos
Profissional Documentos
Cultura Documentos
gov/31466261/
1. INTRODUÇÃO
O câncer de pulmão é uma das principais causas de mortes relacionadas ao câncer
devido à sua natureza agressiva e diagnósticos tardios, já em estágios avançados. A
detecção precoce do câncer de pulmão melhora significativamente a chance de
sobrevivência do indivíduo e é um dos principais problemas atualmente; o desafio é predizer
a probabilidade de malignidade para os nódulos pulmonares nos estágios iniciais.
Radiografias de tórax (Raio-X) e tomografia computadorizada (TC) são usados
inicialmente para o diagnóstico de doenças malignas, mas diagnósticos e decisões erradas
ocorrem com uma certa frequência, já que nos estágios iniciais os nódulos benignos e
malignos são muito semelhantes entre si. Métodos bastante invasivos como biópsias ou
cirurgias são usados para diferenciar os nódulos pulmonares entre benignos e malignos.
Para um órgão tão frágil e sensível, esses métodos invasivos envolvem muitos riscos para o
paciente.
Além disso, pesquisas demonstram que somente 68% das vezes os nódulos são
diagnosticados corretamente quando um único radiologista analisa as imagens dos exames
e esse número aumenta para 82% quando dois radiologistas analisam - necessitando uma
maior demanda profissional para um único diagnóstico. Com isso, sistemas de detecção
auxiliada por computador (CAD) foram inicialmente projetado para reduzir a carga de
trabalho dos radiologistas e aumentar a taxa de detecção desses nódulos; hoje os CAD
também ajudam no processo de triagem, diferenciando entre nódulos benignos e malignos.
Nesse processo de triagem com uso dos CAD, alguns erros levam a diagnósticos
errados e ou tardios resultando em uma alta mortalidade, como erros de digitalização, por
falha na captura da área da lesão, erro de reconhecimento e erro de tomada de decisão,
que acontece devido à compreensão incorreta do benigno/maligno e as estruturas normais.
2. TRABALHOS RELACIONADOS
Após a invenção da unidade de processamento gráfico (GPU) e redes neurais
convolucionais (CNN), o desempenho de análise de imagem baseada em computador
e o sistema de apoio à decisão teve um grande impulso. Muitas análises de imagens
médicas baseadas em modelos de aprendizado profundo foram propostas por alguns
pesquisadores e após a popularidade das redes neurais convolucionais (CNNs) na análise
de imagens, diferentes tipos de padrões de conectividade foram propostos para aumentar o
desempenho de CNNs profundas (ResNet, DenseNet, DPNs e MixNet, por exemplo).
3. MOTIVAÇÕES
Dr. Silvestri e sua equipe de pesquisa propuseram classificadores proteômicos para
diferenciar entre nódulos benignos e malignos de pequeno tamanho. Duas proteínas,
denominadas LG3BP e C163A, foram identificadas como biomarcadores para identificação
de nódulos pulmonares cancerígenos. O nível dessas proteínas no plasma, junto com cinco
fatores de risco (idade, tamanho do nódulo, tabagismo, características da borda e
localização), foram usados como classificadores e obtiveram resultados muito bons em
nódulos de 8-30 mm e biópsias reduzidas em nódulos benignos em 40%.
Esses resultados aliados às características dos nódulos são essenciais para
diagnóstico e melhores resultados através de métodos de deep learning baseados em
computador. Isso tudo motivou os pesquisadores a combinarem os resultados de um
modelo de deep learning eficiente com biomarcadores para reduzir os resultados falsos
positivos; essa combinação de vários biomarcadores fornece alta capacidade de detecção e
diagnóstico dos nódulos.
https://pubmed.ncbi.nlm.nih.gov/33156792/
5.1 DATASETS
Os datasets usados, LUNA16 e LIDC-IDRI, são de domínio público e como foi dito,
foram usados para detecção e classificação, respectivamente. O LUNA16 é um subset do
LIDC-IDRI que somente possui anotações de detecções confirmadas por três ou quatro
radiologistas, somente tomografias computadorizadas com fatias uniformes e imagens
organizadas de 888 TC de baixa dose de pulmões, com um total de 754,976 candidatos que
foram classificados como '0' quando não possuíam nódulos e '1' quando possuíam. Entre
esses, 36,378 eram confirmados como nódulos por radiologistas. O dataset LIDC-IDRI
contém todas as informações relacionadas aos nódulos, como tamanhos, localização,
resultados de diagnósticos de médicos experientes em TC de baixa dose em XML arquivos
e todo tipo de imagem relacionada, totalizando 1,018 TC torácicas de baixa dose.
O modelo ouro de classificação de nódulo foi obtido pelas anotações dos datasets
LIDC-IDRI e LUNA16 e mapas de médicos.
5.3. TREINAMENTO
O modelo de detecção foi treinado pelo dataset LUNA16 e o modelo de classificação
foi treinado com o LIDC-IDRI.
Os modelos foram treinados usando SGD com tamanho de mini batch e 150 epochs.
Três diferentes taxas de treinamento foram usadas em todo processo, que inicialmente
estava em 0.01 para 100 epochs, depois em 0.001 para os próximos 30 epochs e depois
em 0.0001 para os últimos 20 epochs. Para melhorar o processo de treinamento e
performance, foi usado ResNeXt com pré ativação no máximo, o que levou a menos erros
de treinamento e peso de inicialização apropriado.
O dataset LIDC-IDRI foi submetido a um ten-fold cross validation, tendo seus dados
separados em 10 conjuntos para isso, e então repartido novamente em grupos de treino,
validação e teste para poder avaliar o treino do sistema. Os pesos foram aprendidos com
SGD.
O propósito do treino é minimizar a diferença entre o dado de entrada e o modelo ouro
e existem dois motivos pelos quais um treino pode ser parado: se a network atingir o menor
nível de erro possível e se a função de perda nos dados de validação não mudarem mais.
6. CONCLUSÕES
O sistema multi estratégico de detecção e classificação de nódulos pulmonares
proposto teve como objetivo a redução de falsos positivos em estágios iniciais da doença.
A detecção e classificação de nódulos pulmonares de forma automática tem uma grande
taxa de detecção e falsos positivos, enquanto biomarcadores clínicos tem baixa detecção e
alta especificidade. Assim, o uso de ambos de forma complementar diminui o número de
falsos positivos. Além disso, foi constatado que a detecção de nódulos na presença de
evidências clínicas aumenta a chance de ser maligno, enquanto a detecção de nódulos sem
evidência clínica será necessária uma análise morfológica antes da decisão final. Os
resultados mostram uma superioridade do sistema proposto em relação a outros já
existentes com menor custo computacional.