Escolar Documentos
Profissional Documentos
Cultura Documentos
Campinas
2017
UNIVERSIDADE ESTADUAL DE CAMPINAS
Faculdade de Engenharia Elétrica e de Computação
Campinas
2017
Agência(s) de fomento e nº(s) de processo(s): Não se aplica.
Ficha catalográfica
Universidade Estadual de Campinas
Biblioteca da Área de Engenharia e Arquitetura
Luciana Pietrosanto Milla - CRB 8/8129
Título em outro idioma: Segmentation of lung and its lesions in computer tomographic
images
Palavras-chave em inglês:
Image segmentation
Lung
Computed tomography
Segmentation of medical images
Área de concentração: Engenharia de Computação
Titulação: Mestra em Engenharia Elétrica
Banca examinadora:
Letícia Rittner [Orientador]
Paula Dornhofer Paro Costa
Gerberth Adín Ramírez Rivera
Data de defesa: 17-05-2017
Programa de Pós-Graduação: Engenharia Elétrica
Comissão Julgadora:
Profa Dra. Leticia Rittner (Presidente, FEEC/UNICAMP)
Profa Dra. Paula Dornhofer Paro Costa (FEEC/UNICAMP)
Prof. Dr. Gerberth Adín Ramírez Rivera (IC/UNICAMP)
1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.1 Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.2 Principais contribuições . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.3 Organização da dissertação . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2 Conceitos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1 Doenças intersticiais pulmonares . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2 Análise e acompanhamento de lesões de pulmão por computador . . . . . . 18
3 Fundamentação teórica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.1 Max-tree . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.1.1 Construção da max-tree . . . . . . . . . . . . . . . . . . . . . . . . 25
3.1.2 Filtragem da max-tree . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.2 Morfologia matemática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.2.1 Filtro de reconstrução . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.2.2 Gradiente morfológico . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.2.3 A transformada Watershed . . . . . . . . . . . . . . . . . . . . . . . 31
3.3 Local Binary Pattern . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.4 Transformada de distância Euclidiana . . . . . . . . . . . . . . . . . . . . . 33
4 Segmentação de pulmões em imagens de CT . . . . . . . . . . . . . . . . . 35
4.1 Pré-processamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2 Construção e simplificação da max-tree . . . . . . . . . . . . . . . . . . . . 36
4.3 Segmentação dos pulmões . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5 Segmentação de lesões em pulmão . . . . . . . . . . . . . . . . . . . . . . . 39
5.1 Extração dos atributos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
5.2 Segmentação das lesões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.3 Pós-processamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
6 Resultados e discussões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
6.1 Experimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
6.2 Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
6.2.1 Segmentação dos pulmões . . . . . . . . . . . . . . . . . . . . . . . 44
6.2.2 Segmentação das lesões . . . . . . . . . . . . . . . . . . . . . . . . . 47
6.2.3 Performance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
6.3 Análise da sensibilidade do método de segmentação dos pulmões à escolha
dos parâmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
6.3.1 Escolha do número de folhas para o filtro de extinção . . . . . . . . 51
6.3.2 Escolha do nó da max-tree . . . . . . . . . . . . . . . . . . . . . . . 52
6.4Análise da sensibilidade do método de segmentação das lesões à escolha
dos parâmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
6.4.1 Escolha do número de iterações do filtro de reconstrução do
pós-processamento . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
6.4.2 Escolha do gradiente utilizado como entrada no pós-processamento 54
6.4.3 Escolha do tamanho de área para filtros de abertura e fechamento . 56
7 Conclusões . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
7.1 Trabalhos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
7.2 Apresentações e publicação . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
14
1 Introdução
é o caso das doenças intersticiais pulmonares. Como diversas doenças mudam a densidade
do tecido pulmonar, isso acaba alterando as intensidades dos pixels (níveis de cinza) nas
imagens de CT, então algoritmos de segmentação focados apenas na intensidade, apesar
de geralmente serem escolhidos por sua eficiência, costumam não funcionar para esses
casos [4].
Após a segmentação dos pulmões, os sistemas CAD realizam então o processo
de distinção entre tecido normal (tecido considerado saudável) e tecido anormal (tecido
lesionado) ou entre tecido normal e as diversas categorias de lesões, como por exemplo
enfisema, nódulo, inflamação (efeito vidro fosco) ou fibrose (efeito colméia). É um processo
importante pois, realizada a distinção dos tecidos, é possível visualizar e quantificar o
tecido pulmonar ocupado por lesões para então o médico especialista ter mais segurança
ao realizar o diagnóstico e dar continuidade ao tratamento de um paciente.
Quando se trata de processamento de imagens de pulmão, grande parte da
literatura é focada em câncer, devido a alta taxa de mortalidade causada por essa doença.
Cada nódulo pulmonar geralmente encontrado nas imagens de CT costuma ser um único
componente conexo, o que não acontece com as lesões das doenças intersticiais pulmonares
que geralmente são menores e mais espalhadas (desconexas). Essa característica é um
desafio para os sistemas CAD, que devem procurar por todas as regiões de lesões e não
confundi-las com vasos sanguíneos pertencentes à região interna dos pulmões.
Em resumo, os principais desafios na segmentação de pulmões e de lesões
intersticiais são a localização das lesões e sua aparência desconexa na imagem de CT.
1.1 Objetivos
Este trabalho possui dois objetivos principais:
∙ método preocupado com lesões intersticiais pulmonares, sendo que a maioria dos
trabalhos existentes na literatura tem como foco lesões cancerígenas que possuem
outras características
2 Conceitos básicos
Esta designação para este grupo, doença intersticial, surgiu porque os primeiros
casos foram reconhecidos apenas em fases avançadas, quando mostravam grande
quantidade de tecido fibroso. Foi apenas com tempo e estudos que descobriu-se que,
mesmo nos casos de fibrose pulmonar pura, em sua fase inicial ocorreu um processo
inflamatório que foi aos poucos se agravando [3]. Entre as doenças consideradas como
parte do grupo das intersticiais pulmonares encontram-se fibrose pulmonar idiopática,
sarcoidose, pneumonite de hipersensibilidade, vasculites, entre outras [1]. Existem mais
de cento e oitenta (180) doenças que podem ser englobadas neste grupo [7].
Devido à grande variedade de enfermidades que compõem esse grupo, os médicos
especialistas buscam diferenciar o diagnóstico de diversas maneiras, como por exemplo
realizando um questionário minucioso do histórico do paciente, verificando os sintomas
(se ele se queixa de dispnéia, tosse ou sibilância) e sua duração, fazendo uma análise de
radiografias prévias, entre outros [1]. Testes de função pulmonar e relacionados devem ser
feitos para certificar-se de que os sintomas não são de outras condições como a insuficiência
cardíaca congestiva [8].
A imagem de CT é um instrumento importante para auxiliar no diagnóstico
de doenças intersticiais pulmonares devido a uma característica importante que é sua
Capítulo 2. Conceitos básicos 18
Figura 2.1 – Exemplo de images de CT do tórax com tecido saudável (à esquerda), com
inflamação (ao centro) e com fibrose (à direita)
por lesões, onde é possível visualizar a borda do pulmão lesionado irregular no resultado
da segmentação.
Figura 2.2 – Exemplo de aplicação de método de segmentação por limiar em uma fatia
de pulmão acometida por lesões nas bordas: (a) imagem original, (b) limiarização
o volume dos pulmões em 400 imagens com doenças diversas. Caso encontrasse uma
diferença significativa entre o volume estimado e o resultado da segmentação, uma segunda
parte do processo seria executada, na qual características com base em textura seriam
usadas para identificar padrões anormais na imagem, para então inclui-las no resultado
da segmentação. Ao utilizar a segmentação manual feita por 2 observadores experientes
como padrão de referência, o método obteve dice de 0,95 e 0,96 quando comparado com
cada especialista. A abordagem de Sun et al. [13] também propôs detectar as costelas,
porém empregou sua localização na definição do active shape model (ASM) no exame
dos pulmões e utilizou 30 volumes contendo tecidos normais e anormais em pacientes
com câncer de pulmão. Obteve um coeficiente Dice médio de 0, 975 ± 0, 006 ao comparar
com imagens corrigidas por 2 especialistas que foram originalmente segmentadas por um
software comercial de análise de imagens de pulmão desenvolvido por VIDA Diagnostics,
Inc.
Já outras propostas utilizam um método semi-automático como a criação de
máscaras de segmentação ou modelos de referência para os pulmões: Sluimer et al. [14]
criaram uma máscara de referência na proposta de segmentação por registro e aplicou
em exames de 7 sujeitos variando entre saudáveis e alterações severas (obteve uma
acurácia média de 0, 95 ± 0, 04 ao comparar com a segmentação manual de 5 fatias
em cada volume de avaliação); Soliman et al. [15] empregaram o delineamento manual
das bordas das imagens de treinamento para criar um modelo a ser utilizado durante o
pré-processamento e testou em 20 volumes com diferentes tipos de lesões (para um sujeito
de teste obteve um dice de 0,916 ao comparar com o delineamento manual das bordas feito
por um especialista); Kuhnigk et al. [16] utilizaram a criação de máscaras de segmentação
para cada pulmão antes de realizar a segmentação vascular, calcular a transformada de
distância e usar a transformada de watershed para obter o resultado final em 24 volumes
incluindo 4 alterações diferentes no exame pulmonar (testes preliminares de repetibilidade
intra e inter-sujeito mostram similaridade de 99,5%).
Em se tratando de segmentação e/ou classificação de lesões de pulmão,
encontram-se na literatura diversas abordagens. Distinguir tecido lesionado de não
lesionado (ou saudável) foi tema de um outro trabalho de Sluimer et al. [17] que utilizaram
657 regiões de interesse (ROIs) de 116 conjuntos de dados. Um dos autores, com auxílio
de um especialista, utilizou o mouse para definir o centro dos ROIs circulares com 80 cm
de diâmetro. Foram extraídos atributos como média, desvio padrão, assimetria e kurtosis,
e realizou-se uma etapa de normalização e seleção de atributos. Quatro classificadores
diferentes foram testados com o método: linear, quadrático, máquina de vetores suporte
(SVM) e K-vizinhos mais próximos (KNN), sendo que este último teve performance um
pouco melhor que os outros. A área sob a curva ROC para o método automático foi
calculada como sendo 0,862, sendo que 2 especialistas obtiveram os valores de 0,877 e
0,893 cada um.
Capítulo 2. Conceitos básicos 21
23
(2004) de pulmão 1 normal para regras por especialista convencional
referência segmentação por registro 0.94 ± 0.06; registro
6 para avaliação 0.95 ± 0.04
Capítulo 2. Conceitos básicos
Artigo Objetivo Base de dados Métodos Padrão-ouro Métricas
Soliman et al. Segmentação 20 volumes co-alinhamento do volume 3D no banco segmentação manual para um sujeito de
(2015) de pulmão de dados de forma por especialista teste: Dice 0.916
estimativa dos atributos do modelo
joint MGRF
segmentação
Song et al. Classificação 1458 ROIs extração de atributos anotação de ROIs taxas de verdadeiro
(2013) das lesões 95 imagens algoritmo probabilístico de pelo especialista positivo entre 80% e
5 classes classificação de patches 88% para cada classe
dicionário
Sun et al. Segmentação 30 volumes detecção e localização das costelas software para Dice médio 0.975 ±
(2011) de pulmão active shape model (ASM) segmentação, 0.006
correção por 2
especialistas
Tolouee et al. Segmentação 17 sujeitos segmentação por limiar especialista validação cruzada com
(2008) de pulmão 340 fatias suavização; remoção do fundo contornou as o método leave-one-
classificação 4 classes preenchimento de regiões patologias e out; acurácia geral
das lesões reconstrução das bordas classificou multi-classe de 96,81%
extração de atributos; SVM
Wang et al. Segmentação 31 volumes de localização da traquéia segmentação manual sobreposição média de
(2009) de pulmão casos normais identificação e eliminação das vias por especialista 96, 7% ± 2, 0%
45 de casos aéreas; threshold
anormais matriz de concorrência
combinação dos pulmões iniciais com
regiões anormais
Xu et al. Segmentação 20 sujeitos segmentação dos pulmões anotação de VOIs acurácia Bayesiano
(2006) de pulmão 5 classes segmentação das bordas pelo especialista 86.2%, SVM 83.8%
classificação extração de 24 características
das lesões volumétricas; SVM e Bayesiano
Abordagem Segmentação Segmentação pré-processamento (morfologia) segmentação manual segmentação dos
proposta de pulmões dos pulmões: construção da max-tree por especialista pulmões: Dice médio
segmentação 630 fatias de 14 filtragem da max-tree de 98%. Segmentação
das lesões sujeitos. extração dos atributos das lesões: Dice médio
24
Segmentação das Random Forest e SVM de 62% para as fatias
lesões: 360 fatias transformada Watershed com área maior de
de 6 sujeitos lesões
25
3 Fundamentação teórica
3.1 Max-tree
A max-tree é uma estrutura que procura representar todos os componentes conexos
de todos os limiares (thresholds) possíveis de uma imagem [23]. Componentes conexos são
formados quando pixels se conectam a seus vizinhos formando um conjunto dependendo
do tipo de conectividade escolhida, geralmente podendo ser de 4, 6 ou 8 [24].
Figura 3.1 – Exemplo de construção da max-tree (fonte: [23]). No alto: imagem original
com 7 zonas planas e 3 níveis de cinza. Em baixo: processo de construção da árvore; limiar
h=1 (esquerda), limiar h=2 (ao centro); limiar h=3 (esquerda).
(d) (e)
Figura 3.2 – Exemplo de representações da max-tree (fonte: [28]): (a) imagem original,
(b) visualização dos componentes conexos, (c) visualização dos componentes conexos
dentro de seus retângulos mínimos, (d) grafo da max-tree e (e) dendrograma.
Capítulo 3. Fundamentação teórica 27
Figura 3.6 – Ilustração do filtro de extinção onde cada nó é representado pela notação
identificação:valor de extinção (adaptado de Tavares [28]): (a) max-tree onde 3 as folhas
com os maiores valores de extinção estão em amarelo, (b) max-tree identificando em verde
os nós a serem preservados, (c) resultado da aplicação do filtro.
(a) (b)
Figura 3.7 – Exemplo de aplicação do filtro de extinção (fonte: [29]): (a) imagem original,
(b) imagem simplificada após a aplicação do filtro de extinção utilizando área como
atributo e preservando 8 folhas.
Capítulo 3. Fundamentação teórica 30
Figura 3.8 – Exemplo do filtro de abertura por reconstrução (fonte: [31]): (a) imagem
original, (b) abertura com elemento estruturante de disco de raio 2, (c) imagem
reconstruída.
g = (𝑓 ⊕ 𝑏) − (𝑓 Θ𝑏) (3.1)
onde ⊕ representa uma dilatação e Θ uma erosão por um elemento estruturante 𝑏. Há dois
outros tipos de gradientes: gradiente morfológico interno (Eq. 3.2) e gradiente morfológico
externo (Eq. 3.3).
g = 𝑓 − (𝑓 Θ𝑏) (3.2)
g = (𝑓 ⊕ 𝑏) − 𝑓 (3.3)
(a) (b)
(c) (d)
Figura 3.9 – Exemplo de gradientes morfológicos (fonte: [6]). (a) imagem original,
(b) gradiente morfológico interno, (c) gradiente morfológico externo, (d) gradiente
morfológico.
Figura 3.11 – O operador básico LBP: (a) imagem original, (b) zoom mostrando 9
pixels da imagem, (c) valores de intensidade de cada pixel (d) onde aplica-se um limiar
com base no pixel central, gerando como resultado um valor binário ou decimal (adaptado
de Ahonen et al. [39]).
dois pontos como sendo uma linha reta no espaço Euclidiano [43]:
√︁
d𝑖𝑠𝑡 = (𝑥2 − 𝑥1 )2 + (𝑦2 − 𝑦1 )2 (3.4)
(a) (b)
Mesmo que a função de distância Euclidiana seja a mais conhecida, outras funções
de distância para o cálculo da transformada de distância também podem ser encontradas
na literatura, como por exemplo a de Manhattan (ou city block) e a de Chebychev (ou
chessboard).
35
4.1 Pré-processamento
Como o pulmão é essencialmente uma bolsa de ar, ele aparece como região escura
em cada fatia da imagem de CT, então a primeira etapa do pré-processamento é a negação
da imagem. Com a imagem negada, há uma inversão na escala de cinza, o que pode facilitar
a discriminação do objeto de interesse em determinadas imagens médicas.
A imagem negada passa então por um filtro de reconstrução, com o objetivo de
suavizar os tons de cinza na imagem e cujos parâmetros utilizados foram um elemento
estruturante 3 × 3 (box) e o número de iterações escolhido foi 8.
A Fig. 4.2 mostra os resultados dos experimentos com o filtro de reconstrução em
uma fatia, onde é possível visualizar que após 8 iterações a imagem ficou mais suavizada
na borda inferior esquerda do que com 2 ou 4.
Capítulo 4. Segmentação de pulmões em imagens de CT 36
(a) (b)
(c) (d)
Figura 4.3 – Resultado após filtragem da max-tree: (a) após aplicar o filtro de extinção
e (b) após a escolha do nó para representar o sub-ramo.
Figura 4.5 – Exemplo de resultado final da segmentação dos pulmões. Neste exemplo, é
possível perceber que a segmentação resultante não excluiu as lesões presentes nas bordas
dos pulmão.
39
Figura 5.1 – Diagrama das etapas que compõem o método automático proposto de
segmentação das lesões
pontos claros (lesões) dos pontos escuros da imagem (resto do pulmão). O mesmo
propósito teve o atributo gradiente morfológico, para evidenciar as transições nos níveis
de cinza e separar as regiões claras das escuras.
Já o LBP foi escolhido para poder ajudar a diferenciar as texturas do tecido
lesionado do não lesionado. E finalmente, por enfatizar a distância entre os pixels e as
bordas da imagem, acredita-se que a transformada de distância Euclidiana seja um ótimo
atributo já que as lesões se concentram em regiões próximas às bordas dos pulmões.
Este atributo foi utilizado com o resultado da segmentação dos pulmões e com a imagem
original, totalizando 7 atributos (Fig. 5.2).
(d) (e)
Durante a extração dos atributos, foram utilizados apenas os atributos dos pixels
pertencentes aos pulmões (os pixels são comparados com o resultado da etapa de
segmentação). Os atributos foram então normalizados entre 0 e 1 para que os dados
ficassem igualmente distribuídos de forma a balancear os valores e fazer com cada atributo
tivesse a mesma importância durante o processo. Para isso, foram calculados os valores de
média e desvio padrão sobre os atributos do conjunto de treinamento. Esses valores foram
também armazenados para posteriormente aplicar a mesma transformação nos atributos
do conjunto de teste.
5.3 Pós-processamento
Após o resultado obtido pelo classificador, é necessário um pós-processamento
para transformar conjuntos de pixels isolados classificados como lesões em um ou mais
componentes conexos. Utilizou-se, então, a transformada Watershed.
Como entrada para o Watershed utiliza-se o gradiente de Sobel da imagem original
já suavizada com o filtro de reconstrução após 8 iterações. O resultado obtido com o
classificador foi utilizado como marcador interno, após passar por filtros de abertura e
fechamento de área: o filtro de abertura de área removeu componentes conexos com área
menor do que 3 e o filtro de fechamento de área removeu componentes conexos do plano
de fundo com área menor do que 2. O gradiente morfológico externo foi usado como
marcador externo.
Capítulo 5. Segmentação de lesões em pulmão 42
(d) (e)
Figura 5.3 – Resultado da segmentação das lesões: (a) fatia original, (b)
pulmões segmentados automaticamente, (c) lesões segmentadas manualmente, (d) lesões
segmentadas automaticamente, (e) lesões segmentadas automaticamente sobrepostas à
fatia original.
(a) (b)
(c) (d)
(e) (f)
Figura 5.4 – Resultado do pós processamento da segmentação das lesões: (a) fatia
original, (b) imagem de entrada, (c) marcadores internos e externos, (d) resultado da
transformada Watershed, (e) remoção dos objetos com área superior a 850 pixels e
resultado final do pós-processamento, (f) imagem usada como referência com lesões
segmentadas manualmente.
44
6 Resultados e discussões
6.1 Experimentos
Os experimentos foram realizados no ambiente Adesssowiki, uma plataforma
colaborativa para estudos científicos e programação Python/C/C++ utilizada para
o ensino e a pesquisa de algoritmos de processamento de imagens [46]. Todo o
desenvolvimento foi feito em Python e foram usadas a biblioteca Numpy [47], a biblioteca
de morfologia matemática SDC Morphology Toolbox [48], a toolbox max-tree educativa
iamxt [46] e também a biblioteca scikit learn de aprendizado de máquina em Python [49],
além de funções implementadas durante o processo de criação do método.
Foram utilizadas nos experimentos imagens de CT do tórax no plano transversal
de pacientes de esclerose sistêmica. As imagens são no formato DICOM e foram obtidas
através de um scanner Aquilion da marca Toshiba, com resolução de 512 x 512 pixels
e fatias de 1.0 mm de espessura. Todos os pacientes foram informados e assinaram um
termo de consentimento livre e esclarecido aprovado pelo Comitê de Ética em Pesquisa
da FCM-UNICAMP (no CEP 114069/2015; CAAE: 50830315.3.0000.5404).
De cada um dos volumes adquiridos, para o processo de segmentação dos pulmões
foram selecionadas as fatias localizadas logo abaixo da carina e acima do fígado, já que as
lesões se localizam normalmente no lobo inferior do pulmão direito e nas porções centrais
de ambos os pulmões [50]. Já para o processo de segmentação das lesões, foram escolhidas
as fatias nesta mesma localização porém apenas as que continham lesões. Cada fatia foi
processada e segmentada individualmente.
6.2 Resultados
6.2.1 Segmentação dos pulmões
Os resultados de cada pulmão segmentado foram comparados com a segmentação
manual conduzida por um especialista com o auxílio de uma ferramenta de segmentação
interativa chamada Neuroline [51]. Como segmentação dos pulmões, o especialista definiu
que não incluiria a traquéia ou qualquer outra estrutura na região externa aos pulmões.
Capítulo 6. Resultados e discussões 45
Tanto na tabela (Tab. 2) como no gráfico de caixa (Fig. 6.1) é possível visualizar
que o sujeito #3 é o que mais se distancia com relação aos valores numéricos dos outros
sujeitos. As imagens relativas a este sujeito apresentam lesões junto às bordas do pulmão
direito e algumas até adicionam estruturas não pertencentes aos pulmões como um
pedaço da traquéia (Fig. 6.2). Neste caso, o filtro de reconstrução utilizado na etapa
de pré-processamento não foi suficiente para garantir uma correta segmentação. O mesmo
pode ser observado em algumas fatias dos sujeitos #4 e #12. No geral, porém, o método
apresentou bons resultados, sendo que o menor valor de coeficiente Dice médio por sujeito
reportado foi de 0,968 e o maior chegando a 0,988, totalizando uma média geral de 0,98
para todos os sujeitos testados com desvio padrão de 0,008.
Capítulo 6. Resultados e discussões 46
Figura 6.2 – Fatia original do sujeito #3 (a), a segmentação manual (b) e segmentação
dos pulmões pelo método proposto (c), com a borda do pulmão direito irregular
Capítulo 6. Resultados e discussões 47
Mesmo que uma comparação direta com outros métodos da literatura somente
seria possível se todos utilizassem a mesma base de dados, uma visão geral (Tab. 3)
mostra os resultados obtidos pelo método proposto quando colocado lado a lado com
outros trabalhos de segmentação dos pulmões em imagens de CT que também utilizaram
métricas de sensibilidade, especificidade e/ou coeficiente Dice.
usadas 32 fatias de 1 sujeito com amostras desconhecidas para o classificador e sendo que
cerca de metade das fatias apresentou grande quantidade de lesões.
Entre os classificadores avaliados, o Random Forest obteve melhores resultados
que o SVM linear (Tab. 3 e Tab.4), principalmente ao acrescentar pesos às classes e
ao calibrar o classificador. O Random Forest conseguiu classificar corretamente 1513299
amostras, enquanto o SVM classificou corretamente 1307528 amostras. Atribuir diferentes
pesos às classes foi importante para este problema pois estas são bem desbalanceadas (ou
seja, a quantidade de pixels de não lesão, ou pixels pertencentes a regiões consideradas
normais, é bem maior do que a quantidade de pixels de lesão, ou pixels pertencentes a
regiões anormais). A calibragem associa probabilidades à saída do classificador, o que
auxilia na confiança do resultado ao evitar que o classificador tenha excesso ou falta de
certeza naquela resposta.
Valor Predito
N L
N 1484356 13775
Valor Real
L 96066 28943
Valor Predito
N L
N 1200124 298007
Valor Real
L 17605 107404
Apesar do SVM atribuir corretamente o rótulo de lesão para mais pixels que
o Random Forest, ele também atribuiu erroneamente este mesmo rótulo para uma
quantidade muito maior de pixels que não deveriam recebê-lo, mostrando que o
classificador SVM não conseguiu diferenciar os pixels com tanta certeza quanto o Random
Forest. Como se trata de uma classificação por pixel, é preferível um classificador que
saiba diferenciar bem entre os pixels pois, mesmo que retorne uma quantidade menor de
pixels com lesão, estes estão bem posicionados e podem ser usados como sementes para o
pós-processamento.
Capítulo 6. Resultados e discussões 49
Figura 6.3 – Comparação das métricas calculadas antes (em vermelho) e depois (em
verde) do pós-processamento da segmentação das lesões para todas as fatias de teste: (a)
sensibilidade, (b) especificidade e (c) coeficiente Dice.
respectivamente. Das 32 fatias de teste, a metade delas que se encontra mais próxima
ao fígado apresentou grande área de tecido lesionado (devido ao fato desta localização
ter uma maior probabilidade de encontrar lesões [50]) e para essas os valores médios
de sensibilidade, especificidade e coeficiente Dice foram 0.629 ± 0.118, 0.992 ± 0.003 e
0.632 ± 0.057 respectivamente. A Fig 6.4 mostra a diferença dos coeficientes Dice antes
e depois do pós-processamento para todas as 32 fatias à esquerda e a mesma diferença,
porém para as 16 fatias com grande área de tecido lesionado, à direita.
6.2.3 Performance
Nas imagens de CT, os diferentes níveis de cinza são importantes para prover
detalhes anatômicos dos pulmões [4], o que faz com que a alta resolução radiométrica
das imagens seja significativo ao se trabalhar com esse tipo de imagem. Também são
arquivos de alta resolução espacial (512x512 pixels), o que trouxe desafios de performance
durante a realização deste trabalho, causando erros de estouro de memória tanto no
ambiente Adessowiki como localmente. Foi também visando contornar estes problemas
que foi tomada a decisão de utilizar apenas as fatias entre a carina e o fígado ao invés
do pulmão completo. Além disso, o desempenho inferior do SVM com relação ao Random
Forest pode ser devido ao fato de não ter sido feito uma busca de hiperparâmetros (grid
search) por limitação computacional, testando assim apenas o SVM linear com parâmetro
C=1.0.
(a)
(b)
Figura 6.9 – Comparação do coeficiente Dice calculado para escolha dos parâmetros dos
marcadores internos utilizados durante o pós-processamento. O eixo horizontal mostra as
diferentes variações do tamanho de área dos filtros de abertura e fechamento seguindo a
notação (área para abertura,área para fechamento) para 5 fatias distintas.
57
7 Conclusões
Durante a realização deste trabalho foi possível perceber que quando se trata de
pulmões a maior parte dos métodos encontrados na literatura trabalha com imagens de
sujeitos com câncer, doença que causa efeitos diferentes nas imagens de CT do que as
doenças intersticiais pulmonares. Devido ao aspecto geralmente pequeno e desconexo das
lesões intersticiais e de sua localização nas bordas, as propostas que funcionam para uma
doença costumam não funcionar para outra.
As principais contribuições deste trabalho foram a proposta de um método de
segmentação dos pulmões e um método de segmentação das lesões intersticiais, ambos
completamente automáticos. Os métodos propostos não necessitam de inicialização
ou interação por parte do especialista. O método de segmentação dos pulmões
foi desenvolvido para garantir uma correta segmentação mesmo quando os pulmões
apresentam lesões nas bordas. O segundo método, ao contrário da maior parte dos métodos
da literatura, não só detecta as lesões, como segmenta toda a região acometida.
O novo método automático proposto de segmentação dos pulmões em imagens de
CT utiliza um pré-processamento morfológico e a estrutura de dados max-tree para filtrar
as imagens e possibilitar que os pulmões direito e esquerdo sejam encontrados através da
escolha de nós da estrutura. O processo para algumas fatias, porém, ainda exclui alguns
pontos de lesão, principalmente nos casos para as lesões muito desconexas. Métricas como
sensibilidade, especificidade e coeficiente Dice foram calculadas e procurou-se compará-las
com outros métodos encontrados na literatura, o que mostrou a robustez do método
automático proposto. O tempo de execução do método também foi calculado e mostrou-se
rápido ao comparar com os trabalhos que relataram esta métrica.
A partir do resultado da segmentação automática dos pulmões, foi possível elaborar
um novo método de segmentação automática das diferentes lesões encontradas nos
pulmões. Foram 7 atributos extraídos das imagens: intensidade do pixel da fatia sendo
analisada, intensidade do pixel das fatias anterior e posterior, gradiente morfológico, LBP
e transformada de distância Euclidiana da imagem original e da imagem com os pulmões
segmentados. Estes atributos serviram como entrada para um classificador Random Forest
por pixel calibrado e com diferentes pesos atribuídos a duas possíveis saídas: se o pixel
pertencia a uma área de tecido lesionado ou não.
O resultado do classificador passou então por um pós-processamento com a
transformada Watershed com o objetivo de conectar regiões desconexas do classificador
por pixel. O gradiente de Sobel da imagem suavizada serviu como entrada para a
transformada, o resultado do classificador foi modificado através de filtros de abertura e
Capítulo 7. Conclusões 58
fechamento de área para então ser usado como marcador interno e o gradiente morfológico
externo da máscara de segmentação dos pulmões foi utilizado como marcador externo.
As métricas de sensibilidade, especificidade e coeficiente Dice foram calculadas para obter
resultados quantitativos, o que mostrou que o método obteve bons resultados, mesmo
apresentando uma limitação com lesões muito pequenas e principalmente quando elas se
apresentavam na parte superior dos pulmões.
Diversos parâmetros foram variados para testar quais teriam os melhores resultados
para o conjunto de testes, tanto no método de segmentação dos pulmões como no de
segmentação das lesões. Ambos os métodos se mostraram pouco sensíveis à variação dos
parâmetros, o que também demonstra a robustez das abordagens propostas.
Referências
[4] SLUIMER, I.; SCHILHAM, A.; PROKOP, M.; GINNEKEN, B. van. Computer
analysis of computed tomography scans of the lung: a survey. IEEE Transactions on
Medical Imaging, v. 25, n. 4, p. 385–405, April 2006. ISSN 0278-0062.
[5] MANSOOR, A.; BAGCI, U.; FOSTER, B.; XU, Z.; PAPADAKIS, G. Z.; FOLIO,
L. R.; UDUPA, J. K.; MOLLURA, D. J. Segmentation and image analysis of abnormal
lungs at ct: Current approaches, challenges, and future trends. RadioGraphics, v. 35,
n. 4, p. 1056–1076, 2015. PMID: 26172351.
[8] SOCKRIDER, M.; FAN, L.; GETTYS, A.; DETERDING, R.; HAGOOD, J.;
KURLAND, G.; MCDOUGAL, J. What is interstitial lung disease in children? American
Thoracic Society. Acesso em: 2017-01-21. Disponível em: <https://www.thoracic.org/
patients/patient-resources/resources/interstitial-lung-disease-in-children.pdf>.
[10] HUA, P.; SONG, Q.; SONKA, M.; HOFFMAN, E. A.; REINHARDT, J. M.
Segmentation of pathological and diseased lung tissue in ct images using a graph-search
algorithm. In: 2011 IEEE International Symposium on Biomedical Imaging: From Nano
to Macro. [S.l.: s.n.], 2011. p. 2072–2075. ISSN 1945-7928.
[11] WANG, J.; LI, F.; LI, Q. Automated segmentation of lungs with severe interstitial
lung disease in ct. Medical Physics, v. 36, n. 10, p. 4592–4599, 2009.
[12] MANSOOR, A.; BAGCI, U.; XU, Z.; FOSTER, B.; OLIVIER, K. N.; ELINOFF,
J. M.; SUFFREDINI, A. F.; UDUPA, J. K.; MOLLURA, D. J. A generic approach to
pathological lung segmentation. IEEE Transactions on Medical Imaging, v. 33, n. 12, p.
2293–2310, Dec 2014. ISSN 0278-0062.
Referências 61
[13] SUN, S.; BAUER, C.; BEICHEL, R. Automated 3-d segmentation of lungs
with lung cancer in ct data using a novel robust active shape model approach. IEEE
Transactions on Medical Imaging, v. 31, n. 2, p. 449–460, Feb 2012. ISSN 0278-0062.
[14] SLUIMER, I. C.; NIEMEIJER, M.; GINNEKEN, B. van. Lung field segmentation
from thin-slice ct scans in presence of severe pathology. Proc. SPIE, v. 5370, p.
1447–1455, 2004.
[15] SOLIMAN, A.; ELNAKIB, A.; KHALIFA, F.; EL-GHAR, M. A.; EL-BAZ, A.
Segmentationof pathological lungs from ct chest images. In: Image Processing (ICIP),
2015 IEEE International Conference on. [S.l.: s.n.], 2015. p. 3655–3659.
[16] KUHNIGK, J.; HAHN, H.; HINDENNACH, M.; DICKEN, V.; KRASS, S.;
PEITGEN, H. Lung lobe segmentation by anatomy-guided 3d watershed transform.
Proc. SPIE, v. 5032, p. 1482–1490, 2003.
[18] DEPEURSINGE, A.; SAGE, D.; HIDKI, A.; PLATON, A.; POLETTI, P. A.;
UNSER, M.; MULLER, H. Lung tissue classification using wavelet frames. In: 2007
29th Annual International Conference of the IEEE Engineering in Medicine and Biology
Society. [S.l.: s.n.], 2007. p. 6259–6262. ISSN 1094-687X.
[19] SONG, Y.; CAI, W.; ZHOU, Y.; FENG, D. D. Feature-based image patch
approximation for lung tissue classification. IEEE Transactions on Medical Imaging,
v. 32, n. 4, p. 797–808, April 2013. ISSN 0278-0062.
[22] XU, Y.; BEEK, E. J. R. van; HWANJO, Y.; GUO, J.; MCLENNAN, G.;
HOFFMAN, E. A. Computer-aided classification of interstitial lung diseases via mdct:
3d adaptive multiple feature method (3d amfm). Acad Radiol, v. 13, p. 969–78, 2006
Aug 2006. ISSN 1076-6332.
[24] SALEMBIER, P.; SERRA, J. Flat zones filtering, connected operators, and filters
by reconstruction. IEEE Transactions on Image Processing, v. 4, n. 8, p. 1153–1160, Aug
1995. ISSN 1057-7149.
Referências 62
[25] TAVARES, L. A.; SOUZA, R. M.; RITTNER, L.; MACHADO, R. C.; LOTUFO,
R. A. Interactive max-tree visualization tool for image processing and analysis. In: 2015
International Conference on Image Processing Theory, Tools and Applications (IPTA).
[S.l.: s.n.], 2015. p. 119–124.
[27] SOUZA, R.; RITTNER, L.; MACHADO, R.; LOTUFO, R. Maximal max-tree
simplification. In: Pattern Recognition (ICPR), 2014 22nd International Conference on.
[S.l.: s.n.], 2014. p. 3132–3137. ISSN 1051-4651.
[34] GONZALEZ, R.; WOODS, R. Digital Image Processing. [S.l.]: Pearson Education,
2009. ISBN 9788131726952.
[36] KöRBES, A.; LOTUFO, R. d. A. Analysis of the watershed algorithms based on the
breadth-first and depth-first exploring methods. In: 2009 XXII Brazilian Symposium on
Computer Graphics and Image Processing. [S.l.: s.n.], 2009. p. 133–140. ISSN 1530-1834.
[38] HE, D.; WANG, L. Texture unit, texture spectrum, and texture analysis. IEEE
Transactions on Geoscience and Remote Sensing, v. 28, n. 4, p. 509–512, Jul 1990. ISSN
0196-2892.
[39] AHONEN, T.; HADID, A.; PIETIKAINEN, M. Face description with local binary
patterns: Application to face recognition. IEEE Transactions on Pattern Analysis and
Machine Intelligence, v. 28, n. 12, p. 2037–2041, Dec 2006. ISSN 0162-8828.
[40] BARKAN, O.; WEILL, J.; WOLF, L.; ARONOWITZ, H. Fast high dimensional
vector multiplication face recognition. In: The IEEE International Conference on
Computer Vision (ICCV). [S.l.: s.n.], 2013.
[41] TREFNỲ, J.; MATAS, J. Extended set of local binary patterns for rapid object
detection. In: Computer Vision Winter Workshop. [S.l.: s.n.], 2010. p. 1–7.
[42] FABBRI, R.; COSTA, L. D. F.; TORELLI, J. C.; BRUNO, O. M. 2d euclidean
distance transform algorithms: A comparative survey. ACM Comput. Surv., ACM, New
York, NY, USA, v. 40, n. 1, p. 2:1–2:44, fev. 2008. ISSN 0360-0300.
[43] YE, Q. Z. The signed euclidean distance transform and its applications. In: Pattern
Recognition, 1988., 9th International Conference on. [S.l.: s.n.], 1988. p. 495–499 vol.1.
[44] HO, T. K. Random decision forests. In: Proceedings of the Third International
Conference on Document Analysis and Recognition (Volume 1) - Volume 1. Washington,
DC, USA: IEEE Computer Society, 1995. (ICDAR ’95), p. 278–. ISBN 0-8186-7128-9.
[45] CORTES, C.; VAPNIK, V. Support-vector networks. Mach. Learn., Kluwer
Academic Publishers, Hingham, MA, USA, v. 20, n. 3, p. 273–297, set. 1995. ISSN
0885-6125.
[46] LOTUFO, R.; MACHADO, R.; KORBES, A.; RAMOS, R. Adessowiki: on-line
collaborative scientific programming platform. Proceedings of the 2009 International
Symposium on Wikis, 2009, Orlando, Florida, USA, p. 10, 2009.
[47] WALT, S.; COLBERT, S.; VAROQUAUX, G. The NumPy Array: A Structure for
Efficient Numerical Computation. Computing in Science & Engineering, v. 13, n. 2, p.
22–30, 2011.
[48] SDC Morphology Toolbox for MATLAB. Http://mmorph.com. Acesso em:
2016-05-30.
[49] PEDREGOSA, F.; VAROQUAUX, G.; GRAMFORT, A.; MICHEL, V.; THIRION,
B.; GRISEL, O.; BLONDEL, M.; PRETTENHOFER, P.; WEISS, R.; DUBOURG, V.;
VANDERPLAS, J.; PASSOS, A.; COURNAPEAU, D.; BRUCHER, M.; PERROT,
M.; DUCHESNAY, E. Scikit-learn: Machine learning in Python. Journal of Machine
Learning Research, v. 12, p. 2825–2830, 2011.
[50] GASPARETTO, E. L.; PIMENTA, R.; INOUE, C.; ONO, S. E.; ESCUISSATO,
D. L. Esclerose sistêmica progressiva: aspectos na tomografia computadorizada de alta
resolućão. Radiologia Brasileira, scielo, v. 38, p. 329 – 332, 09 2005. ISSN 0100-3984.
[51] CARNEVALLE, A.; RONDINA, J.; KOBAYASHI, E.; CENDES, F. Validation of a
semi-automated system for mri-based hippocampal volumetry in patients with temporal
lobe epilepsy. J Epilepsy Clin Neurophysiol, p. 97–104, 2003.
Referências 64