Você está na página 1de 5

XXIII Congresso Brasileiro em Engenharia Biomdica XXIII CBEB

SEGMENTAO DE NDULO PULMONAR SOLITRIO USANDO QUALITY TRHESHOLD CLUSTER


A. O. C. Filho *, A. C. Silva*, A. C. Paiva* M. Gattass**, R. A. Nunes*** *Ncleo de Computao Aplicada - NCA / Universidade Federal do Maranho, So Lus, Brasil. ** Departamento de Informtica / Pontifcia Universidade Catlica do Rio de Janeiro, Rio de Janeiro, Brasil. ***Departamento de Cirurgia Geral / Universidade do Estado do Rio de Janeiro, Rio de Janeiro, Brasil. antoniooseas@gmail.com

Abstract: This paper presents an efficient algorithm for segmentation of solitary pulmonary nodules - NPS, including nodules of high and low contrast, small and large nodules, ranging from 3 to 30mm in diameter. The segmentation conducted by the Quality Threshold Clustering - QT is based on clustering, where groups have formed some similarity between them. SNP detection is a challenging task in medical imaging, pulmonary nodules can be difficult to detect using computed tomography (CT), due to some nodes have low intensity, small size, or location of the nodule surrounded by an area of complex anatomy. To improve the survival chances of a patient with cancer, early detection of lesions that may come to become cancer is crucial. An accurate and efficient segmentation of NPS plays an important role in the recognition of lung cancer in a system of Computer Aided Detection (Computer Aided Detection - CAD). Keywords: Quality Threshold, Segmentation, Pulmonary Nodule. Introduo Cncer uma denominao genrica para um conjunto de mais de 100 doenas que possuem em comum o crescimento desordenado de clulas que invadem os tecidos e rgos [1]. No Brasil, as estimativas para o ano de 2012 sero vlidas tambm para o ano de 2013 e apontam a ocorrncia de aproximadamente 385 mil novos casos. Destes, cerca de 27 mil sero de pulmo. O fator crucial de ocorrncia desse tipo de cncer marcado pela grande exposio ao tabagismo acometido no passado. Como mostrado em INCA[1] na maioria das populaes, cerca de 80% dos casos de cncer de pulmo esto relacionadas ao tabagismo. Comparados com os no fumantes, os tabagistas tm cerca de 20 a 30 vezes mais riscos de desenvolverem cncer de pulmo. De acordo com Chan [2] os sintomas iniciais dos ndulos pulmonares solitrios (NPS) tm as seguintes caractersticas: se dispersam por toda parte, s vezes aparecem como ndulos isolados e suas bordas so irregulares, o que

obriga a busc-lo na imagem de pulmo inteira e reconhec-lo com preciso. Para melhorar as chances de sobrevivncia, uma deteco precoce de leses que possam a vir tornaremse cncer fundamental. Deteco de NPS uma tarefa desafiadora em imagens mdicas, eles podem ser de difcil deteco usando Tomografia Computadorizada (TC) devido a alguns ndulos possurem baixa intensidade, tamanho pequeno, ou a localizao do ndulo envolto em uma rea de anatomia complexa. A fim de distinguir entre ndulos e vasos, os mdicos geralmente necessitam comparar imagens de TC para retirar os dados relevantes, contudo a carga de trabalho para esse tipo de anlise extremamente exaustiva. Essa anlise pode ocasionar o desvio da ateno, especialmente quando h outras anomalias na imagem simultaneamente, assim, a vulnerabilidade a erros aumenta. A segmentao precisa e eficiente de ndulos pulmonares desempenha um papel importante para o reconhecimento de cncer de pulmo em sistema Deteco Auxiliado por Computador (Computer Aided Detection - CAD). Esse tipo de sistema apresenta passos bsicos, como: Segmentao, Extrao de Caractersticas e Classificao para deteco de ndulos pulmonares. O presente trabalho apresenta uma metodologia para segmentao de NPS baseada em agrupamento, usando Quality Threshold Clustering (QT). Ser detalhada nas sees que se seguem os trabalhos relacionados ao tema, uma descrio de como o funcionamento do algoritmo proposto, experimentos realizados assim como seus resultados e por fim uma discusso a cerca da tcnica abordada. Trabalhos relacionados Relatada por [3] a eficcia de descritores de recursos geomtricos para reduo de falsos positivos e para classificao de ndulos pulmonares em exames de TC com baixa dosagem so fracos, para suprir essa deficincia os autores realizaram algumas combinaes

XXIII Congresso Brasileiro em Engenharia Biomdica XXIII CBEB entre os modelos por eles descritos (RAW e SIFT ou RAW e LBP) com isso um aumento a especificidade global em 2%. J o sistema CAD proposto por [4] apresenta inovaes como o uso de um novo classificador de caractersticas seletivas, descrito como Feature-Deselective Neuro-Evolving Augmenting of Topologies (FD-NEAT) esse classificador baseado em redes neurais e algoritmos genticos. O trabalho apresentado por [5] descreve sobre ndulos que geralmente tm tamanhos e escala mltipla e tm blob (forma esfrica) como a sua estrutura. Como mostra [5] um mtodo de trs passos para a deteco de ndulos pulmonares em imagens de TC. 1 usa de filtro de multi-escala 2D para detectar os candidatos, 2 distinguir entre ndulos e no-ndulos que tm sua forma como blob, usando a regio de restrio geomtrica crescente e 3 - extrair as caractersticas da forma de cada regio e aplicar um classificador para a reduo de falsos positivos. O trabalho apresentado por [6] mostra uma combinao de limiarizao de intensidade com o processamento morfolgico, para detectar candidatos a ndulo. Com base em [7] a metodologia descrita segue as seguintes etapas: de incio a regio do pulmo segmentado a partir dos dados de TC utilizando limiarizao fuzzy. Em seguida, a forma do mapa de ndice volumtrico, que se baseia na curvatura mdia da gaussiana local, e os dot (mapas baseados nos valores prprios da matriz Hessiana) so calculados para cada voxel dentro dos pulmes para melhorar os objetos de uma forma especfica (tais como ndulos). Como visto em [8] a explorao de uma tcnica de subtrao temporal, ou seja, obtida pela subtrao de uma imagem anterior a partir da atual. No presente estudo, foi desenvolvido um novo mtodo para a deteco automtica de ndulos pulmonares baseado em redes neurais artificiais de uma imagem de subtrao temporal. apresentado por [9] um algoritmo para segmentao de diferentes tipos de ndulos pulmonares, o algoritmo realiza uma adaptao de esfericidade orientada na regio do contraste, crescente no mapa de conectividade difusa do objeto de interesse. Esta regio de crescimento operada dentro de uma mscara volumtrica que criada por uma primeira aplicao de um algoritmo de segmentao local adaptativo. Conforme [10, 11] eles apresentam, primeiramente, o modelo em reconhecer o ndulo pulmonar com base na tcnica de Mumford-Shah, este mtodo dependente de informao global da imagem. Contudo a segmentao global requer muito clculo iterativo, e especialmente quando o processo executado em imagens com uma grande quantidade de informao. A fim de reduzir o clculo e economizar tempo, os autores estabeleceram um pr-processamento. J [12] mostra um algoritmo robusto e automtico proposto para segmentao de ndulos pulmonares em imagens de TC. Um mtodo de estimativa no paramtrico, chamado mean-Shift (MS) foi aplicado para segmentao de ndulos pulmonares. Eles apresentaram tambm um mtodo de escolha de uma nova largura de banda utilizando s anlises a regra de divergncia. O sistema CAD proposto em [13] possui uma nova abordagem para suprir os problemas na segmentao de ndulos pulmonares em duas etapas principais: 1 Regio de transio (TR), que definido como a regio ambgua entre ndulo e fundo, na qual determinada dependendo dos recursos estatsticos do coeficiente de wavelet. 2 Os limites precisos do ndulo so segmentados com base em uma melhoria de dois mtodos de conjuntos de nvel. Para deteco dos ndulos usado Template Matching. O CAD proposto por [14] mostra a segmentao do parnquima pulmonar realizado pelo (limiar timo de nvel de cinza), a deteco de ndulos suspeitos a candidatos (Funo Gaussiana suavizada), a extrao de caractersticas (rea, o dimetro circularidade, valor mdio de nvel de cinza, a suavidade) e por fim a classificao. Mostrado por [15] um sistema CAD que possui seu funcionamento basicamente em trs etapas: 1 Gerao de sementes 2D, por serem mais rpido computacionalmente; 2 Recursos de Computao 3D onde para cada candidato 6 caractersticas, so computados e contm as informaes em 3D. E por fim o passo 3 a classificao feito pela Mquina de Vetor de Suporte (SVM). Em [16] apresentado uma forma inovadora, baseada no mtodo Algoritmo Gentico Template Matching (GATM) para a deteco automtica de ndulos pulmonares. O processo de Algoritmo Gentico (AG) empregado como um mtodo de otimizao para promover uma procura e localizao eficaz de candidatos a ndulos dentro da rea do pulmo. Os problemas relatados pelos trabalhos descritos acima so frequentes nesta linha de pesquisa, em especial quando se trata do tamanho, localizao, e baixo contraste do ndulo, sendo que estes so os obstculos a serem contornados. Neste trabalho estamos buscando verificar a eficincia no QT para minimizar esses problemas. Segmentao usando Quality Threshold A segmentao tem como objetivo simplificar a imagem, reduzindo-a aos seus componentes bsicos (objetos). Neste contexto, temos que segmentao qualquer operao que distingue os objetos contidos na imagem, ou de alguma forma isolando-os entre si. O conceito de segmentao por agrupamento referese a um dado conjunto de objetos que sero agrupados em subconjuntos de acordo com as propriedades de cada objeto, essas propriedades so essenciais no agrupamento, isto , so elas que serviram como parmetros para formao dos grupos, entretanto esse processo de agrupamento computacionalmente elevado. Essa tcnica atua sobre um espao denominado espao de atributos onde representa um espao de dimenso elevada no qual cada ponto da imagem representado por um vetor de atributos. O algoritmo proposto nesse trabalho segue esses princpios.

XXIII Congresso Brasileiro em Engenharia Biomdica XXIII CBEB O algoritmo de clusterizao Quality Threshold Clustering (QT) citado inicialmente por [17] e [18] mostram um agrupamento de dados alternativo, proposto inicialmente para o agrupamento de genes do cromossomo humano. O QT exige como parmetros de entrada um dimetro e uma quantidade mnima de pontos, ou seja, ir determinar a partir de quantos pontos no mnimo um cluster ser formado. A mtrica que determina o grau de similaridade para o agrupamento dos clusters pode ser calculada atravs da distncia mnima entre os pontos. Ele ainda dispensa que se determine uma quantidade exata de clusters que sero formados, evitando assim problemas como, agrupamentos inadequados. Pode-se dividir em 4 os passos de seu processamento: 1. Inicialmente, necessrio escolher o dimetro mximo para cada cluster e um nmero mnimo de pontos de formao de clusters. 2. Para cada ponto, ser computada a distncia entre ele e os demais pontos, dessa forma o algoritmo ir executar o processamento e gerar cluster-candidatos para cada ponto que compe a entrada dos dados; 3. Nessa etapa ser computado o nmero de pontos que cada clusters-candidato possui, com isso ser selecionado o melhor candidato, ou seja, o que possui maior nmero de pontos, em seguida ser removido do processamento todos os pontos que o compem. 4. Repetir o novamente os passos 2 e 3 at que os demais pontos sejam agrupados, ou que os restantes no atendam a quantidade mnima de formao. O modelo resulta em um agrupamento mais preciso, uma vez que um nmero adequado de clusters formado para cada caso. Experimentos As imagens que sero utilizadas para os experimentos so provenientes do banco de imagens LIDC-IDRI (Lung Image Database Consortium Image Collection) disponveis em [19]. uma base de imagens online disponibilizada na Internet pelo Instituto Nacional do Cncer (National Cancer Institute - NCI) americano para efeitos de pesquisa e treinamento para diagnsticos de cncer de pulmo. Os testes foram realizados com 25 exames de TC. Os resultados apresentam 100% de acertos na deteco dos NPS. Para fins de ilustrao da eficincia da metodologia proposta sero demonstrados trs casos de tipos distintos de NPS, onde temos exames com ndulos grandes (20 a 30mm de dimetro), ndulos pequenos (3 a 5mm de dimetro) e ndulos pequenos e com baixo contraste. Esses testes foram realizados para mostrar que os problemas descritos por alguns autores como [22 e 6] o mtodo proposto consegue apresentar bons resultados na segmentao. Como objetivo do presente trabalho a segmentao de NPS, e os mesmos encontram-se envoltos pelo parnquima pulmonar, foi utilizada a metodologia descrita por [20] para segmentao do parnquima pulmonar. A partir desse ponto ser aplicado o mtodo proposto para segmentao de ndulos. Assim obtemos apenas clusters que realmente faam parte do nosso objeto de estudo. A seguir so ilustradas as imagens com os resultados em 2D e 3D, obtidos atravs do processamento resultante do QT. A visualizao 3D dos clusters realizada atravs de um software que se encontra em fase de desenvolvimento pelo Laboratrio de Processamento e Anlise de Imagens da Universidade Federal do Maranho [21]. O processo de formao dos clusters foi reduzido com base nos dimetros mximos e mnimos de NPS desejados. Para ndulos grandes o seu dimetro no poder ultrapassar o tamanho mximo de 30mm [15, 22], quando isso ocorre estrutura deixa de ser ndulo e passa a ser massa. E quando o ndulo possui menos de 3mm de dimetro como mostra em [6] apresentam apenas 0,2% de chances a virem desenvolver algum tipo de malignidade. Assim descartamos as formaes de clusters que apresentem dimetros maiores que 30mm e menores que 3mm. Os parmetros utilizados em cada caso variam, ou seja, so proporcionalmente variantes mediante o tamanho do ndulo em questo, assim evitamos que haja processamento com clusters que no interessam. O processamento foi realizado em imagens (fatias) de TC, essas imagens so bidimensionais, onde, o conjunto dessas, formam o volume. A ilustrao dos resultados ser descrita e composta por imagens que mostram cada etapa do processamento, desde a imagem original at a visualizao tridimensional. Caso 1 (Ndulo grande) - Os parmetros utilizados nesse teste foram: dimetro de 10 (inteiro), e tamanho mnimo do cluster 100 voxels. De incio o NPS apresentado nesse exame foi de fcil deteco, ou seja, seu contraste elevado e tamanho favorvel. A Figura 1 mostra o resultado obtido para este caso.

Figura 1: (A) fatia da imagem original de TC, figura. (B) parnquima pulmonar segmentado, (C) todos os clusters resultantes do processamento do QT, (D) apenas o cluster que representa o NPS, e (E)

XXIII Congresso Brasileiro em Engenharia Biomdica XXIII CBEB visualizao tridimensional do NPS Contudo problemas no tamanho do ndulo como relatam [6] so de difceis deteces, porm o algoritmo do QT se mostrou eficiente quanto a ndulos que apresentam dimetros pequenos. Caso 2 (Ndulo pequeno) Para o experimento ilustrado na Figura 2 foram utilizados os seguintes parmetros: dimetro de 5 (inteiro), e tamanho mnimo de cluster 18 voxels. Neste caso temos o problema do tamanho do NPS, por isso a utilizao de um dimetro menor, isto , o tamanho do dimetro pode implicar na quantidade de clusters formados, uma vez que, quanto maior o dimetro menor o numero de clusters e vice versa. Figura 3: (A) fatia da imagem original de TC, figura. (B) parnquima pulmonar segmentado, (C) todos os clusters resultantes do processamento do QT, (D) apenas o cluster que representa o NPS, e (E) visualizao tridimensional do NPS Discusso A princpio o QT no era aplicado a imagens, com isso realizou-se uma adequao para aplicao no contexto de imagens mdicas. Os trs experimentos demonstrados no presente trabalho tiveram um total de 28 imagens de TC (sendo, 15 o caso 1, 8 o caso 2 e 5 o caso 3). O tempo de processamento a cerca da aplicao do QT em cada caso variaram em torno de 2s, 20s e 35s por imagem para os casos 1, 2 e 3 respectivamente. Os tempos variam, pois os dimetros so distintos, com isso, ser formado uma quantidade maior ou menor de clusters, ou seja, mais ou menos tempo de processamento. A mdia de tempo foi de 5,68s por imagem para os 3 casos mostrados, e no geral uma mdia de 10,45s por imagem para os 25 casos analisados. O QT gera diversos clusters ao fim do seu processamento, contudo muitos desses clusters no fazem parte do objetivo do estudo que segmentao de NPS, apesar de possurem formas similares, para isso existe a necessidade da aplicao de tcnicas para de fato distinguir-se essas estruturas do NPS. Partindo desse princpio os prximos passos da pesquisa esto voltados para contornar esse problema, isto , sero realizadas etapas que compem um ciclo mostrado em todos os sistemas CAD [3, 4, 5, 13, 14, 15 e 23], onde alm da etapa de segmentao tem-se tambm as etapas de Extrao de Caractersticas e Classificao com objetivo de diferenciar as demais estruturas das que realmente possam ser NPS, ou seja, reduo de falsos positivos. Apesar de seu processamento ser computacionalmente elevado nas primeiras iteraes, podendo ento para trabalhos futuros realizar modificaes que otimizem seu desempenho e minimize esse problema. Por fim, em ambos os casos onde o QT foi aplicado ele executa com eficincia a tarefa de segmentao de NPS.

Figura 2: (A) fatia da imagem original de TC, figura. (B) parnquima pulmonar segmentado, (C) todos os clusters resultantes do processamento do QT, (D) apenas o cluster que representa o NPS, e (E) visualizao tridimensional do NPS Caso 3 (Ndulo pequeno e de baixo contraste) Finalizando a demonstrao dos resultados temos na Figura 3 onde apresenta um caso com um nvel de deteco complexa, por apresentar um tamanho pequeno e um contraste relativamente baixo. Para este experimento utilizou-se o dimetro de 4 (inteiro) e tamanho mnimo de cluster 18 voxels.

XXIII Congresso Brasileiro em Engenharia Biomdica XXIII CBEB Referncias


[1] Instituto Nacional do Cncer, INCA. Cancer de pulmo. Disponvel em: <http://www2.inca.gov.br/wps/wcm/connect/cancer/site/oquee>. Acesso em: 12 Mai. 2012. [2] Chan, T.F.; Chan, L.A. (2008) Vese Active contours without edges. IEEE Transactions on Image Processing, 10(2), p. 266 277. [3] Farag, A., Ali, A., Graham, J., farag, A., Elshazly, S. and R. Falk,. (2011) Evaluation of Geometric Feature Descriptors for Detection and Classification of Lung Nodules in Low Dose Ct Scans of the Chest, Biomedical Imaging: From Nano to Macro, IEEE International Symposium on, p. 169-172. [4] Tam, M., Bister, M., Cornelis, J. (2011) A novel computer-aided lung nodule detection system for CT images, Medical Physics. [5] Xiaomin, P., Hongyu, G., Jianping D. (2012) Computerized Detection of Lung Nodules in CT Images by use of Multiscale filters and Geometrical constraint Region Growing, IEEE Bioinformatics and Biomedical Engineering (iCBBE). p.1-4. [6] Messaya, T., Hardiea R.C.,Rogersb, S. K. (2010) A new computationally efficient CAD system for pulmonary nodule detection in CT imagery, Medical Image Analysis, v. 14, p 390 406. [7] YE, X., Lin, X., Dehmeshki, J., Slabaugh, G. (2009) Shape-Based Computer-Aided Detection of Lung Nodules in Thoracic CT Images, IEEE Transactions On Biomedical Engineering, v - 56, n. 7. [8] Miyake1, N., Kim, H., Itai, Y., Tang, J. K, Ishikawa, S., Katsuragawa, S. (2009) Automatic Detection of Lung Nodules in Temporal Subtraction Image by Use of Shape and Density Features, IEEE International Conference on Innovative Computing, Information and Contro, p. 1288 - 1292. [9] Jamshi, D., Hamdan., A. V. Manlio., and Y. Xujiong, (2008) Segmentation of Pulmonary Nodules in Thoracic CT Scans: A Region Growing Approach. IEEE Tran. Medical Imaging. [10] Nie, S., LI, S., Chen, Z., CI, A. (2009) Feature-Based Pulmonary Nodule Segmentation Using Three-Domain Mean Shift Clustering, IEEE International Conference on Wavelet Analysis and Pattern Recognition, p. 223 227. [11] Jiang X., Nie, S. (2008) Segmentation of Pulmonary nodule in CT Image Based on level Set Method. IEEE Bioinformatics and Biomedical Engineering, ICBBE. p. 2698 2701. [12] Shen-Shen, S., LI, H. (2007) Automatic Segmentation of Pulmonary Nodules in CT Images, IEEE Bioinformatics and Biomedical Engineering. ICBBE, p. 790 793. [13] Jiang, H., Cheng, Z., (2007) Segmentation of Pulmonary Nodules Based on Statistic Features of Wavelet Coefficients and Dual Level Sets, Complex Medical Engineering, CME IEEE/ICME International Conference, p. 648-651. [14] Tong, J., Da-Zhe, Z., Ying, W., Xin-Hua, Z., XU, W. (2007) Computer-Aided Lung Nodule Detection Based on CT Images, Complex Medical Engineering, CME IEEE/ICME International Conference, p. 816-819. [15] Opfer, R., Wiemker, R. (2007) Performance Analysis for Computer Aided Lung Nodule Detection on LIDC Data, Medical Imaging: Image Perception, Observer Performance, and Technology Assessment. Proceedings of SPIE, v. 6515, p. 65151C. [16] Dehmeshki, J., Ye, X., Casique, M. V., Lin, X. Y. (2006) A Hybrid Approach for Automated Detection Of Lung Nodules In Ct Images, IEEE Biomedical Imaging: Nano to Macro, 3rd IEEE International Symposium, p. 506-509. [17] Xu R., Wunsch, D. (2005) Survey of clustering algorithms. IEEE Transactions on Neural Networks, vol. 16, no. 3, pp. 645-678. [18] Jiang, D., Tang, C., Zhang, A. (2006) Cluster analysis for gene expression data: A survey. IEEE Transactions on Knowledge and Data Engineering, 16(11):13701386. [19] National Cancer Institute, NCI, (2012) Lung Image Database Consortium image collection LIDC-IDRI. Disponvel em: <https://wiki.cancerimagingarchive.net/display/Public/LIDCIDRI>. Acesso em: 12 Mai, 2012. [20] Santos, A. M. (2011) Deteco de ndulos pulmonares pequenos usando o Modelo de Mistura Gaussiana e Matriz Hessiana. Dissertao de Mestrado na rea de Cincia da Computao. Departamento de Engenharia de Eletricidade UFMA, So Lus, 43p. [21] Diniz, P. H. B. , Sousa, H. P. , Motta, S. A. C. S. , Campos, T. L. , Netto, S. M. B. , Alves, C. T. S. , Silva, A. C. , Paiva, A.C. (2011) SAIM: software para auxiliar mdicos na visualizao, deteco e diagnstico de ndulo pulmonar. Workshop on Interactive Graphics and Visualization for Industry-Driven Applied and Exploratory Research (WGARI). [22] Nejm, N. E. J. (2012) The Solitary Pulmonary Nodule. Disponvel em: <http://www.nejm.org/doi/full/10.1056/NEJMcp012290>. Acesso em: 09 Mai. 2012.

[23] Sousa, J. R. F. S., Silva, A.C., Paiva, A. C., Nunes, R. A. (2010)


"Methodology for automatic detection of lung nodules in computerized tomography images" Computer Methods and Programs in Biomedicine, v. 98, p. 1-14.