Escolar Documentos
Profissional Documentos
Cultura Documentos
1
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022
Resumo
Abstract
Pneumonia is an inflammatory condition of the lung that primarily affects the small air
sacs known as alveoli. Diagnosis can be made through chest X-ray, blood tests, sputum
culture, and symptom analysis. The analysis of radiographic images requires specialized
professionals to be performed. With this, this work aims to apply and evaluate how Deep
Learning models perform in the detection of the presence or absence of pneumonia from chest
x-ray images. Convolutional Neural Networks and Dense Neural Networks were tested for
training and image classification, with the aim of separating them into images with and without
pneumonia, in addition to the intensity of the disease. From the Convolutional Neural Networks
it was possible to obtain an accuracy of 97% in the classification of images.
Keywords: radiography; analysis; classification; neural networks.
Introdução
2
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022
3
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022
Assim este trabalho tem como objetivo aplicar e avaliar como os modelos de Deep
Learning atuam na detecção de presença ou não de pneumonia a partir de imagens de raio-
x de tórax.
Material e Métodos
Base de dados
Nesta pesquisa foi utilizada uma base de dados encontrada no site Kaggle,
denominada Chest X-Ray Images (Pneumonia), a qual contém imagens de raio-x do tórax
com e sem pneumonia, como mostrado na Figura 1. Todas as figuras possuem o mesmo
tamanho.
A base de dados no total conta com 624 imagens para teste, 5216 para treino e 16
para validação, sendo um número igual de imagens com e sem pneumonia.
Data Augmentation
Para evitar que o modelo de Deep Learning perca sua capacidade de generalização,
ou seja, que não consiga avaliar efetivamente dados diferentes do utilizado durante o
4
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022
Uma Rede Neural Artificial é um tipo de modelo de deep learning para processamento
de dados que possui um padrão de grade, como imagens, que é inspirado na organização do
córtex visual animal e projetado para aprender de forma automática e adaptativa hierarquias
espaciais de recursos, para padrões de baixo a alto nível (Fukushima, 1980).
Uma CNN é uma construção matemática que normalmente é composta por três tipos
de camadas: convolução, pooling e camadas totalmente conectadas. As duas primeiras,
camadas de convolução e pooling, realizam a extração de recursos, enquanto a terceira
mapeia os recursos extraídos no final (Yamashita et al., 2018). A Figura 2 mostra uma
representação dessas camadas.
Nas imagens digitais, os valores dos pixels são armazenados em uma grade
bidimensional (2D), ou seja, uma matriz de números, e uma pequena grade de parâmetros
chamada kernel, um extrator de recursos otimizável, é aplicada em cada posição da imagem,
o que torna as CNNs altamente eficientes para processamento de imagens, uma vez que um
recurso pode ocorrer em qualquer lugar da imagem (Fukushima, 1980). À medida que uma
camada alimenta sua saída na próxima camada, os recursos extraídos podem se tornar
hierarquicamente e progressivamente mais complexos. O processo de otimização de
parâmetros como o kernel é chamado de treinamento, que é realizado de forma a minimizar
a diferença entre as saídas e os rótulos de verdade por meio de um algoritmo de otimização
como o backpropagation e o gradiente descendente, entre outros.
5
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022
Métricas de avaliação
Para esta pesquisa foram utilizadas as métricas matriz de confusão, precisão, recall e
f1-score para avaliação dos modelos de deep learning.
Todas as métricas se utilizam da frequência de classificação para cada classe do
modelo, sendo elas: Verdadeiro Positivo (TP), quando a classe buscada foi predita
corretamente, Falso Positivo (FP), quando a classe buscada é predita incorretamente, Falso
Verdadeiro (TN), quando a classe que não está sendo buscada é predita corretamente, e
6
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022
Falso Negativo (FN), quando a classe que não está sendo buscada é predita incorretamente
(Carvalho et al. 2019).
A partir dessas frequências foi possível calcular a precisão dos modelos, isto é, a razão
entre a quantidade de exemplos classificados corretamente como positivos (TP + FP) e o total
de exemplos classificados como positivos (TP).
O recall trata-se da razão entre a quantidade de exemplos classificados corretamente
como positivos (TP) e a quantidade de exemplos que são realmente positivos (TP + FN).
Enquanto a f1-score é calculada pela média harmônica entre a precisão e a recall. A Figura 4
mostra a equação para calcular a f1-score.
Figura 4. F1-score
Fonte: Chico e Jurman (2020)
Por fim, a matriz de confusão faz um comparativo do que foi predito com o que
realmente deveria ter ocorrido, trazendo a quantidade de cada frequência de classificação,
como mostra a Tabela 1.
Softwares e pacotes
7
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022
Resultados e Discussão
A CNN foi criada utilizando uma camada de entrada, uma de saída e 20 camadas
ocultas, interpolando camadas de convolução com pooling. O treinamento foi realizado com
12 épocas, ciclo de execução da CNN.
A Figura 5 demonstra a variação da acurácia e perda em cada época no treino e
validação. É possível observar que a cada época, a acurácia aumenta e as perdas diminuem,
com a acurácia em torno de 97% e as perdas próximo a zero depois de 12 épocas, o que se
aproxima do resultado esperado. Como comentado por Zurada (1992), o fato das perdas na
validação não aumentarem ao longo das épocas demonstra que o modelo também não
realizou nenhum ajuste excessivo durante o treinamento.
8
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022
A DNN possui uma estrutura um pouco mais robusta que a CNN por conectar cada
camada com todas as outras, com isso foi utilizado uma DNN provida pelo pacote Keras que
possui uma camada de entrada e saída, 6 camadas de transição e 4 blocos densos, sendo
9
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022
10
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022
Assim, ao analisar os resultados obtidos, é possível constatar que este modelo DNN
foi menos efetivo para a resolução do problema do que a CNN, obtendo baixas taxas de acerto
e não sendo precisa para a identificação da presença ou não de pneumonia nas imagens.
Segundo Huang et al. (2017), as DNNS tendem a se ajustar ao conjunto de treinamento para
tarefas relativamente simples, o que pode explicar os resultados obtidos.
11
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022
Conclusão
Referências
Carvalho, D.V.; Pereira, E.M.; Cardoso, J.S. 2019. Machine learning interpretability: A survey
on methods and metrics. Electronics 8(8): 832.
Chicco, D.; Jurman, G. 2020. The advantages of the Matthews correlation coefficient (MCC)
over F1 score and accuracy in binary classification evaluation. BMC Genomics 21: 6.
Chouhan, V.; Singh, S.K.; Khamparia, A.; Gupta, D.; Tiwari, P.; Moreira, C. 2020. A novel
transfer learning-based approach for pneumonia detection in chest X-ray images. Applied
Sciences 10(2): 559.
Düntsch, I.; Gediga, G. 2019. Confusion matrices and rough set data analysis. Journal of
Physics: Conference Series 1229(1): 12-55.
Huang, G.; Liu, Z.; Van Der Maaten, L.; Weinberger, K.Q. 2017. Densely connected
convolutional networks. Proceedings of the IEEE conference on computer vision and pattern
recognition: 4700-4708.
Hubel, D.H.; Wiesel, T.N. 1968. Receptive fields and functional architecture of monkey striate
cortex. J Physiol: 215–243.
Krizhevsky, A.; Ilya, S.; Hinton, G.E. 2012. Imagenet classification with deep convolutional
neural networks. Advances in neural information processing systems 60(6): 84–90.
More, K; Prathamesh, J.; Shubham, B.; Jaychand, U. 2021. Pneumonia Detection using
Deep Learning. 2021 International Conference on Smart Generation Computing,
Communication and Networking: 1-5.
12
Trabalho apresentado para obtenção do título de especialista em Data
Science e Analytics – 2022
Schwartz-Ziv, R.; Tishby, N. 2017. Opening the black box of Deep Neural Networks via
Information.
Simonyan, K.; Zisserman, A. 2014. Very deep convolutional networks for large-scale image
recognition.
Xu, Y. 2015. Convolutional activation features for large scale brain tumor histopathology
image classification and segmentation. IEEE international conference on acoustics speech
and signal processing (ICASSP): 947-951.
Yamashita, R.; Mizuho, N.; Richard, K.G.D.; Kaori, T. 2018. Convolutional neural networks:
an overview and application in radiology. Insights into Imaging: 611–629.
13