Classificação de Modelos

Diário de
Imaging
Artigo
Modelos de Classificação para Detecção de Tumor de Pele Usando Análise de

Textura em Imagens Médicas
Marcos AM Almeida 1 * e Iury AX Santos 2
1 Departamento de Eletr ô nica e Sistemas, Centro de Tecnologia, Universidade Federal de Pernambuco,
Recife-PE 50670-901, Brasil

2 Departamento de F Eu sica, Universidade Federal Rural de Pernambuco, Recife-PE 52171-900, Brasil;
iuryadones@gmail.com
* Correspondência: marcos.almeida@ufpe.br ; Tel .: + 55-81-2126-7129
Recebido: 13 de maio de 2020; Aceito: 16 de junho de 2020; Publicado: 19 de junho de 2020
Resumo: As imagens médicas deram uma grande contribuição ao diagnóstico precoce. Neste estudo, é apresentada uma nova
estratégia para analisar imagens médicas da pele com melanoma e nevo para modelar, classificar e identificar lesões na pele. O
aprendizado de máquina aplicado aos dados gerados pelos recursos estatísticos de primeira e segunda ordem, Matriz de Co-ocorrência
de Nível de Cinza (GLCM), pontos-chave e informações do canal de cores - imagens em vermelho, verde, azul e escala de cinza da pele
foram usadas para caracterizar informações decisivas para classificação das imagens. Este trabalho propõe uma estratégia para a
análise de imagens de pele, com o objetivo de escolher o melhor modelo matemático de classificação, para identificação de melanoma,
com o objetivo de auxiliar o dermatologista na identificação de melanomas, principalmente no diagnóstico precoce.
Palavras-chave: análise de textura; melanoma; glcmmatrix; aprendizado de máquina; classi fi cadores
1. Introdução
O câncer de pele está entre os tipos mais comuns de câncer no mundo [ 1 ] O melanoma é o tipo mais perigoso de câncer de pele,
causado pela produção excessiva de pigmentos de melanina que alteram a cor e a textura da pele, resultando em uma área escura na
pele [ 2 ] Os dados indicam que a incidência de melanoma, que é um tipo de câncer que se metastiza rapidamente, aumentou de forma
alarmante [ 3 ]
No entanto, a análise visual é limitada pela capacidade visual humana, assim como pela percepção e sensibilidade humanas, além
do fato de que nem todos os melanomas têm as mesmas características. O tumor é uma expansão excepcional de células humanas que
se reproduzem de maneira irrestrita e que pode ser identificada por uma variação de cor e textura do tecido humano em estudo, tornando
as informações contidas nas imagens extremamente valiosas. Texturas são padrões visuais, que possuem brilho, cor, inclinação, tamanho
e outros atributos. Quando particionados em sub-imagens por regiões de interesse, eles podem ser adequadamente classificados.
A cor é uma das características significativas no exame de lesão de pele. A distribuição dos recursos de textura e cor apresenta
informações significativas, conforme Figura 1 mostra.
J. Imagem 2020, 6 51; doi: 10.3390 / jimaging6060051 www.mdpi.com/journal/jimaging

J. Imagem 2020, 6 x PARA REVISÃO POR PARES 2 de 15
J. Imagem 2020, 6 51 2 de 15
( a) ( b)
Figura 1. Imagens de tecidos de melanoma e nevo: ( a) Lesão cutânea por imagem de melanoma; ( b) Pele de nevo.
( a) ( b)
Figura 1.
Figura 1. Imagens
Imagensde
detecidos
tecidosdede melanoma
melanoma e nevo:
e nevo: ( a)( Lesão
a) Lesão cutânea
cutânea por imagem
por imagem de melanoma;
de melanoma; ( b)de
( b) Pele Pele de nevo.
nevo.
Uma técnica de análise que se concentra na extração de características intrínsecas da imagem, como brilho e cor,
Uma técnica
fornecendo de análise
uma idéia que se concentra
da rugosidade na extração
ou suavidade, de características
entre intrínsecaséda
outras características, imagem,de
a análise como brilho A
textura. e cor, fornecendo
análise uma
de textura
idéia da rugosidade
Uma
de imagem digital ou
técnica desuavidade, entre
análisea que
refere-se seoutras
quecaracterísticas,
concentra
técnicas é a de
na extração
utilizam análise
processamento de
detextura.
características
imagem Aintrínsecas
análise de textura
para extrair de imagem
dacaracterísticas
imagem, comodigital
brilhorefere-se
e cor, a
representativas
técnicas que uma
fornecendo
das imagens utilizam processamento
idéia
estudadas, de imagem
da rugosidade
que podem ou para extrair
ter suavidade,
importância nacaracterísticas
entre representativas
outras características,
discriminação é adas
entre imagens. imagens
análise estudadas,
de textura. que podem
A análise ter
de textura
importância
de imagemna discriminação
digital refere-seentre imagens.
a técnicas que utilizam processamento de imagem para extrair características representativas
das imagens estudadas,
Isso torna que podem
possível acelerar ter importância
as decisões na discriminação
relacionadas ao diagnóstico.entre imagens.
Nesses casos, a qualidade da imagem é essencial,
Issocom
contando tornalargura
possível
deacelerar as decisões relacionadas
banda, sensibilidade, resolução eaotaxa
diagnóstico.
de sinal /Nesses casos,
ruído dos a qualidade
sistemas da imagem
de imagem. é essencial,
A inteligência contando
artificial pode
com largura depara
Issoútil
ser muito banda,
torna sensibilidade,
possível
auxiliaracelerar asresolução
oncologistasdecisõeserelacionadas
taxa deno
e radiologistas sinal / ruído
ao dosprecoce
sistemas
diagnóstico.
diagnóstico dede
Nesses imagem. aAqualidade
inteligência
casos,teciduais
regiões comda artificial
imagempode
melanoma ser muito útil
é essencial,
[4].
para auxiliar
contando comoncologistas
largura de ebanda,
radiologistas no diagnóstico
sensibilidade, precoce
resolução dede
e taxa regiões
sinal /teciduais
ruído doscom melanoma
sistemas [4]
de imagem. A inteligência artificial pode
ser muito
Na útil para2,auxiliar
Figura oncologistas egráfica
uma representação radiologistas no diagnóstico
de quase precoce
300.000 casos de regiões
previstos indicateciduais com melanoma
que o melanoma [4].tumor mais
foi o 19o
Na figura
incidente 2 umaem
no mundo representação gráfica aumentando,
2018 e continuará de quase 300.000 casos previstos
de acordo indicaGlobocan
com o estudo que o melanoma foi o 19o
da Agência tumor maisdeincidente
Internacional Pesquisano
mundo emFigura
Na
em Câncer2018 e2,continuará
(IARC) uma aumentando,
representação
da Organização de acordo
gráfica
Mundial dede com(OMS).
quase
Saúde o300.000
estudo
[5]Globocan da Agência
casos previstos Internacional
indica de Pesquisa
que o melanoma em Câncer
foi o 19o (IARC) da
tumor mais
Organização
incidente no Mundial
mundo emda Saúde
2018 e(OMS) [ 5 ] aumentando, de acordo com o estudo Globocan da Agência Internacional de Pesquisa
continuará
em Câncer (IARC) da Organização Mundial de Saúde (OMS). [5]
Figura 2. Estimativa de casos incidentes de 2018 a 2040, melanoma de pele, ambos os sexos, de todas as idades. Fonte: Agência Internacional de
Figura 2. Estimativa de casos incidentes de 2018 a 2040, melanoma de pele, ambos os sexos, de todas as idades. Fonte: Agência Internacional
Pesquisa em Câncer da Organização Mundial da Saúde.
de Pesquisa em Câncer da Organização Mundial da Saúde.
A estimativa
Figura prevêde
2. Estimativa que, neste
casos ano dede2020,
incidentes 2018 ocorram 1,81 milhão
a 2040, melanoma de novos
de pele, ambos casos de de
os sexos, câncer
todas eas9,5 milhões
idades. deAgência
Fonte: mortesInternacional
por neoplasia.
A estimativa
Prevê-se
de que um em
Pesquisa emprevê
cada que,
Câncercinco neste
homensanoe Mundial
da Organização de
uma2020, ocorram
emdacada seis 1,81
Saúde. milhão
mulheres de novos casos
desenvolvam de câncer
a doença e 9,5
ao longo milhões
da vida. Issode mortes por
contrasta comneoplasia.
a última
Prevê-sepublicada,
pesquisa que um em emcada cinco
2012, homens
quando e umaInternacional
a Agência em cada seisdemulheres
Pesquisa desenvolvam
sobre Câncer a(IARC
doença ao longo
da OMS) da vida.
previu Isso contrasta
14,1 milhões com a
de novos
últimaeApesquisa
casos estimativa
8,2 prevê que,
publicada,
milhões emneste
de mortes. 2012,ano de 2020,
quando ocorram
a Agência 1,81 milhão
Internacional dede novos casos
Pesquisa sobrede câncer(IARC
Câncer e 9,5 da
milhões
OMS)de mortes
previu por
14,1 neoplasia.
milhões de
Prevê-se que eum
novosSegundo
casos o em
8,2 cada
emcinco
milhões
IARC, de homens
mortes.
2020, e uma
espera-se que em
hajacada seis mulheres
300.000 desenvolvam
novos casos a doença
de melanoma ao longo da vida. Isso contrasta com a
no mundo.
última pesquisa publicada, em 2012, quando a Agência Internacional de Pesquisa sobre Câncer (IARC da OMS) previu 14,1 milhões de
novos casos e 8,2 milhões de mortes.
J. Imagem 2020, 6 51 3 de 15
Em 2018, o número de casos de melanoma foi de 287.723. A estimativa para 2040 será de 466.914. O número estimado de mortes de
2018 a 2040 será de 42.208, melanoma de pele, de ambos os sexos, de todas as idades.
Dado o crescimento da demanda por diagnóstico precoce, uma ferramenta como a visão computacional com uma ferramenta de aprendizado de
máquina poderia ajudar os radiologistas a produzir diagnósticos relevantes mais rapidamente e fornecer medidas quantitativas para regiões suspeitas
de câncer de melanoma. Os trabalhos relacionados a esta pesquisa revelam essa tendência.
Neste artigo, a nova estratégia é proposta através da adição de informações de textura, através dos canais de cores vermelho,
verde e azul, chamados aqui de componentes RGB. No processo de aquisição das características das texturas, use a sintaxe Python e os
algoritmos da biblioteca Python para identificar a localização da região de interesse (ROI) na imagem da pele, independentemente da
posição da imagem.
A inteligência artificial, quando aplicada ao conjunto de dados representativo das texturas características das imagens, pode auxiliar
oncologistas e radiologistas na identificação de regiões suspeitas da pele. Resultados experimentais adequados mostraram como essa
estratégia pode fornecer uma medida precisa da qualidade que corresponde às avaliações subjetivas de especialistas clínicos [ 6 ]
O olho humano, apesar de sua perfeição, não é capaz de capturar certos detalhes em uma imagem ou distinguir pequenas diferenças. ff
diferenças entre certas microtexturas. Usando o Machine Learning, esses di ff diferenças podem ser medidas, avaliadas e comparadas com
imagens padrão e, assim, identificar diferenças microtexturais. ff diferenças nas imagens dos exames médicos. Di ff parâmetros diferentes de
textura refletem ff propriedades diferentes na imagem.
O objetivo da extração de recursos é escolher um conjunto de dados representativo da imagem original, medindo certas
propriedades ou recursos que podem distinguir um padrão entre uma sub-imagem e outra.
Este é um problema de classificação binária, uma vez que as amostras pertencem a duas classes - tecido de nevo ou melanoma, de modo que
é apresentada a proposta de uma solução para essa nova estratégia de detecção de melanoma. Todas as simulações experimentais foram
implementadas e executadas usando a linguagem Python.
O artigo está organizado da seguinte forma - Seção 2 apresenta os estudos relacionados à pesquisa, apresentando as técnicas mais
comuns utilizadas para a detecção de tumores.
Seção 3 , lida com o referencial teórico nas estatísticas de primeira e segunda ordem. Seção 4 propõe estratégias e soluções usando
um aplicativo de aprendizado de máquina para a detecção de câncer de pele.
Seção 5 é dedicado a apresentar os resultados dos experimentos. Algumas discussões são apresentadas na Seção 6 e na seção 7 tiramos
conclusões dos resultados deste estudo, com sugestões para novas linhas de pesquisa e trabalhos futuros.
2. Trabalhos Relacionados
Alguns trabalhos de pesquisa estão relacionados ao nosso estudo, pois utilizam técnicas convergentes para análise de textura.
O diagnóstico de lesões de pele foi estudado por Zhang [ 7 ] A análise considerou Redes Neurais Convolucionais (CNN) para
detecção automática de câncer de pele, comparando-a com outros métodos de pesquisa. O método proposto chamado CNN / WOA
alcançou uma precisão de 91,00%, com uma sensibilidade de 95,00% e uma especificidade de 91,00%.
Pathan [ 8 ] revisou as técnicas de ponta declaradas na literatura, resumindo essas abordagens de última geração. As etapas
incluíram pré-processamento da imagem dermatoscópica, segmentação, extração e seleção de características peculiares e disposição das
lesões cutâneas. O estudo também avaliou as consequências das metodologias relatadas na literatura, além dos resultados e direções
futuras da pesquisa. O melhor resultado dos métodos e algoritmos listados foi o limite de Otsu com Active Contour usando um método de
ajuste de nível de Campo Esparso, com uma capacidade de precisão de 97,50% para a detecção de melanomas.
Lee et al. [ 9 ] propuseram a solução de classificação de doenças de pele usando redes neurais refinadas. O modelo alcançou uma precisão
de 89,90% e 78,50% no conjunto de validação e no conjunto de testes, respectivamente.
J. Imagem 2020, 6 51 4 de 15
Usando a técnica de agregação de redes neurais convolucionais robustas (CNNs) em uma estrutura, Harangi [ 10 ] alcançaram
resultados de classificação em três classes de lesões. Os resultados experimentais concluíram que a área média sob a curva de
característica operacional do receptor (AUC) foi de 89,10% para a tarefa de categorizar as 3 classes.
Li [ 11 ] propuseram dois métodos de aprendizado profundo para abordar três tarefas principais emergentes na área de processamento de
imagens de lesões de pele, ou seja, segmentação de lesões (tarefa 1), extração dermoscópica de lesões (tarefa 2) e classificação de lesões (tarefa 3).
As estruturas de aprendizagem profunda propostas foram avaliadas no conjunto de dados ISIC 2017. Resultados experimentais mostram as precisões
promissoras dessas estruturas, ou seja,
Foram alcançados 75,30% para a tarefa 1, 84,80% para a tarefa 2 e 91,20% para a tarefa 3. Um
método proposto por Abbadi [ 12 ], leva em consideração as técnicas conhecidas como
ABCD - Assimetria, Borda, Cor e Diâmetro. Para a detecção de melanoma, foi calculado o TDS métrico (Total Dermoscopy Score) para
realizar a classificação. A precisão encontrada nos resultados foi
95,45%.
Fernandez [ 3 ] propuseram em sua pesquisa a extração de características que aparecem na imagem da lesão e tratadas com o
método da Matriz de Coocorrência de Nível de Cinza (GLCM). Então, durante a fase de detecção, um conjunto de classificadores
determinou a ocorrência de um tumor maligno. Os experimentos foram realizados em imagens obtidas no repositório ISIC. O sistema
proposto fornece precisão de detecção de câncer de pele acima de 88,00%.
Ansari [ 13 ] propuseram uma estrutura de detecção de câncer de pele usando SVM para detecção precoce de câncer de pele. A
imagem dermatoscópica do câncer de pele foi obtida e submetida a di ff estratégias de pré-processamento diferentes usando imagens de
filtragem. O sistema GLCM foi usado para selecionar realces específicos na imagem que foram usados para ajudar a estabelecer o
classificador. A classificação determinou se a imagem era de um tecido canceroso ou não canceroso. A precisão da estrutura proposta é de
95,00%.
A seguir, referências de outros autores com seus respectivos trabalhos e aplicações, utilizando técnicas semelhantes para extrair
características em imagens médicas.
O diagnóstico dos subtipos de câncer de mama usando análise de textura de imagem foi estudado por Waugh [ 14 ] A análise
considerou a distribuição das intensidades de pixel nas imagens de ressonância magnética. Os parâmetros de entropia do GLCMmatrix
resultaram em contribuições significativas para a classificação de imagens, que podem ser úteis no tratamento e monitoramento da
terapêutica do câncer de mama.
Recentemente, Vamvakas [ 15 ] propuseram a solução de um desafio no diagnóstico de imagens de ressonância magnética, usando
técnicas avançadas como Di ff imagem Tensor de imagem - distinguindo imagens ambíguas na aparência de Glioblastoma Multiforme e
metástase solitária, usando recursos de textura 3D com GLCM.
Jennitta [ 16 ] usando os parâmetros GLCM e Local Standard Descriptor, aplicados às imagens de ressonância magnética do cérebro,
mostraram uma abordagem promissora para o diagnóstico médico.
Hiba Asri [ 17 ], com o objetivo de diagnosticar câncer de mama, utilizou técnicas de aprendizado de máquina, como - Support Vector
Machine (SVM), árvore de decisão, Naive Bayes e K vizinhos mais próximos, no banco de dados de Wisconsin Breast Cancer. Os
resultados provaram que o SVM teve a melhor precisão - 97,13%.
Em um estudo recente sobre câncer de pulmão, Yoon et al. [ 18 ], parâmetros selecionados para análise de textura em imagens de
ressonância magnética. A correlação entre a área e o tamanho do tumor foi calculada por regressão linear. A injeção de material de contraste
foi usada para verificar as imagens de RM e as melhorias foram registradas nos parâmetros de textura selecionados, em uma janela de
tempo entre 120-180 s.
Um modelo preditivo e dois probabilístico para a detecção de câncer no fígado humano usando imagens de tomografia
computadorizada foi mostrado por Seal [ 19 ] Haralick [ 20 ] calcularam parâmetros no GLCM de imagens do fígado com lesão e sem lesão,
conforme disponibilizados em vários modelos de classificação, como: Regressão logística (LR), Análise discriminante linear (LDA) e um
modelo preditivo usando o Multilayer Perceptron (MLP), estimar a probabilidade de um paciente ter câncer de fígado ou não. Constatou-se
que a regressão logística (96,67%) obteve a melhor acurácia quando comparada ao LDA (95,00%) e MLP (94,40%).
J. Imagem 2020, 6 51 5 de 15
Harshavardhan [ 21 ] utilizaram o SVM (Support Vector Machine) para classificar dados extraídos de imagens cerebrais para caracterizar
tumores benignos ou malignos. Para avaliar o desempenho desses recursos, vários métodos de textura foram utilizados, como o histograma, Matriz
de Co-ocorrência de Nível de Cinza (GLCM), Matriz de Comprimento de Execução de Nível de Cinza (GRLM), todos analisados separadamente. Os
resultados de desempenho variaram de
82,97% a 92,83%. Bahadure [ 22 ] demonstrou um e ffi proposta eficiente para identificar tecidos normais e anormais a partir de imagens de
ressonância magnética do cérebro. Os resultados experimentais identificaram um classi fi cado com precisão de 96,51%, especificidade de 94,20%
e sensibilidade de 97,72%. Foram utilizadas técnicas de aprendizado de máquina, com dados de textura, cor, contraste e GLCM das imagens
estudadas.
Abdel-Nasser et al. [ 23 ] propuseram um método que gera um conjunto de representações compactas de imagens de mama no
infravermelho, com resultados competitivos (AUC = 0,989), capaz de di ff entre casos normais e cancerígenos.
3. Materiais e Métodos
A seguir, é apresentada uma descrição geral dos parâmetros estatísticos utilizados na proposta deste trabalho, para a extração de
características das imagens. Essas características compõem a matriz de co-ocorrência (GLCM) e fazem parte dos pontos-chave, aplicados
a cada imagem.
Seja f ( x, y) ser uma função de duas variáveis discretas x e y x = 0, 1,. . . , N - 1 e y = 0, 1,. . . ,
M - 1. A função discreta f ( x, y) pode assumir valores para i = 0, 1,. . . , EU - 1, onde L é o número de níveis de escala de cinza. O histograma do
nível de intensidade é uma função que mostra (para cada nível de intensidade) o número de pixels na imagem inteira, que possuem esta
intensidade:
N
∑- 1 M
∑- 1
h (i) = δ ( f (x, y), j) (1)
x=00 y=00
Onde δ ( Eu, j) é a função delta do Kronecker
{1i=j
δ ( Eu, j) = 2)
0 Eu , j.
A probabilidade de ocorrência de cada pixel na imagem que aparecerá no histograma é dada por:
p (i) = h (i) i = 0, 1,. . . ., eu - 1 (3)

M,
Esses recursos são determinados automaticamente, constituindo as estatísticas de primeira ordem (Equações (4) - (7)) e utilizados
nos pontos-chave. A intensidade média da escala de cinza é calculada por:
eu - 1
∑
µ= ip (i). 4)
i=00
A variação mostra o grau de variabilidade em torno da distribuição média da escala de cinza:
eu - 1
∑
σ2= ( Eu - µ) 2 p (i). (5)
i=00
A assimetria mede a assimetria do histograma:
∑
µ 3 = σ - 3 eu - 1 ( Eu - µ) 3 p (i). (6)
i=00
J. Imagem 2020, 6 51 6 de 15
A curtose é uma medida de se os dados são de cauda pesada ou de cauda clara em relação à distribuição normal. A curtose é uma
medida da consistência do histograma.
∑
µ 4 = σ - 4 eu - 1 ( Eu - µ) 4 p (i) - 3) (7)
i=00
O histograma de segunda ordem é definido como a Matriz de Co-ocorrência no Nível de Cinza, ou seja, uma matriz quadrada é
formada por elementos que indicam a probabilidade de ocorrência de um par de pixels com intensidades que dependem da distância d e do
ângulo θ. As equações (8) a (14) compõem o conjunto de estatísticas de segunda ordem.
p (i, j, d, θ) = {(( x 1 y 1), ( x 2 y 2)): h (x 1 y 1) = i, h (x 2 y 2) = j} (8)
Onde
( x 2 y 2) = ( x 1 y 1) + ( dcos θ, dsen θ). (9)
Neste estudo, as distâncias consideradas foram d = 1, 2,. . . 5, com ângulos θ = 0 0 ◦ 45 ◦ 90 ◦ e 135 ◦

A energia derivada do segundo momento angular mede a uniformidade local dos tons de cinza.
∑ ∑
E= [ p (i, j)] 2) (10)
Eu j
A entropia mede o grau de confusão entre os pixels da imagem:
∑
H=-∑ p (i, j) log 2 [ p (i, j)]. (11)
Eu j
Correlação é uma medida de como um pixel é associado ao seu vizinho na imagem e assume valores que variam de ± 1
eu - 1 ∑
∑ eu - 1
ρ= p (i, j) (i - µ X) ( j - µ Y) . (12)
σXσY
i=00 j=00
O contraste é um di ff momento de referência do GLCM e mede a quantidade de variações locais em uma imagem:
eu - 1 ∑
∑ eu - 1
C= ( Eu - j) 2 p (i, j) (13)
i=00 j=00
Haralick [ 20 ] propôs um conjunto de quantidades escalares para resumir as informações contidas em um GLCM. Originalmente, elas
incluíam um total de 14 características, a saber, segundo momento angular, contraste, correlação, soma de variância, di- ff momento de
referência, média da soma, variância da soma, entropia da soma, entropia, di ff variância da diferença, di ff entropia de referência, medidas de
informação de correlação e coeficiente máximo de correlação ffi cient. Para obter recursos de textura, o GLCM normalizado foi calculado
para cada uma das quatro orientações (0 ◦ 45 ◦ 90 ◦ e 135 ◦)
O GLCM expressa o recurso de textura de acordo com o cálculo da probabilidade condicional do par de pixels das intensidades de
cinza, para os di ff posições espaciais diferentes [ 24 ]
p (i, j | d θ) = p (i, j d∑θ) ∑ (14)

Eu jp (i, j ∣∣∣ d θ) .
O próximo passo foi formatar uma proposta, contendo a extração de características de imagens médicas para construir uma
classificação com base em vários classificadores de última geração.
J. Imagem 2020, 6 51 7 de 15
4. Estratégia proposta
O presente estudo investiga a melhor estratégia para auxiliar no diagnóstico da presença ou ausência de melanoma através da
imagem da pele. Na estratégia proposta, que di ff O que a diferencia de outros métodos de análise de textura é a inclusão de componentes
RGB, adicionando informações de textura aos pontos-chave.
A estratégia desenvolvida envolve as seguintes etapas:
1 Seleção aleatória de um conjunto de imagens com melanoma e nevo.
2) Geração de pontos-chave contendo:
uma. informações estatísticas de primeira ordem;

b. parâmetros estatísticos de segunda ordem;
c.b. parâmetros sobre

Informações estatísticos de segunda
o componente RGB.ordem;
c. Informações sobre o componente RGB.

3) Extração de características de todas as imagens de treinamento.
3) Extração de características de todas as imagens de treinamento.
4) Fase de classificação com a modelagem usando o banco de dados de treinamento.
4) Fase de classificação com a modelagem usando o banco de dados de treinamento.
5) Aplicação do modelo selecionado a um banco de dados de imagens de teste.
5) Aplicação do modelo selecionado a um banco de dados de imagens de teste.
6 6 Resultado
Resultado do modelo aplicado ao banco de dados de teste.
do modelo aplicado ao banco de dados de teste.
Além
Alémdisso,
disso,o oalgoritmo
algoritmousado
usadopara
paralerlerosospontos-chave
pontos-chavenão
nãodepende
dependedadaposição
posiçãodadaimagem
imagemaoaocapturar
capturarinformações
informaçõesnanaregião
regiãode
interesse - ROI.- ROI.
de interesse
OOdiagrama
diagramadedeblocos
blocosnadaFigura
Figura3 3mostra
mostraa aestratégia
estratégiaproposta.
proposta.
Figura
Figura3.
3.Diagrama
Diagramade
deblocos
blocosda
daestratégia
estratégiaproposta.
proposta.
Todos
Todosososconjuntos
conjuntosde
dedados
dadosusados
usadoseestão
stãodisponíveis
disponíveis na
na Análise de lesões
Análise de lesões cutâneas
cutâneasem
emdireção
direçãoao
aomelanoma
melanoma- -International
InternationalSkin
Skin Imaging
Imaging
Collaboration
Collaboration(ISIC)
(ISIC)2019
2019[ 25 ]
[25].
OObanco
bancodededados
dadosfoifoiformado
formadopor
por2000
2000imagens
imagensde
depele
peleJPEG,
JPEG,selecionadas
selecionadasaleatoriamente.
aleatoriamente.OOprocesso
processode
deaprendizagem
aprendizagem foi
foi
realizado em
realizado 75%
em dodobanco
75% bancodededados,
dados,pois
poisnesta
nestapesquisa
pesquisaforam
foramutilizadas
utilizadas10
10amostras
amostraspor
porimagem,
imagem,analisando-se
analisando-seum
umtotal
totalde
de15.000
15.000
amostras.
amostras.NoNo
processo
processodedeteste,
teste,osos25%
25%restantes
restantesdas
dasimagens
imagensno
nobanco
bancode
dedados
dadosforam
foramutilizados,
utilizados,perfazendo
perfazendoum
umtotal
totalde
de5000
5000amostras
naamostras
fase de teste. Cada
na fase amostra
de teste. tinha
Cada uma dimensão
amostra tinha umade 6 pixels de
dimensão × 66pixels.
pixels × 6 pixels.
Para
Para aumentar
aumentar o ea ffi
eficiência nanaextração
eficiência extraçãodedecaracterísticas
característicaspara
paradiferenciação dos tecidos,
di ff diferenciação foi necessário
dos tecidos, adicionar
foi necessário parâmetros
adicionar parâmetros
como
como estatísticas
estatística de primeira
de primeira e segunda
e segunda ordem
ordem em pontos-chave,
em pontos-chave, comocomo: média,
- média, variância, curtose, assimetria, contraste, correlação,
variância,
entropia, energia, máxima e mínima. valor, bem como componentes RGB.
Após extrair as características das imagens, a modelagem foi realizada através do treinamento do banco de dados, utilizando os
classificadores mais conhecidos e suas variações, conforme encontrado na literatura acadêmica:
• Classificador de gradiente estocástico.

J. Imagem 2020, 6 51 8 de 15
curtose, assimetria, contraste, correlação, entropia, energia, valor máximo e mínimo, bem como componentes RGB.
Após extrair as características das imagens, a modelagem foi realizada através do treinamento do banco de dados, utilizando os
classificadores mais conhecidos e suas variações, conforme encontrado na literatura acadêmica:
• Classificador de gradiente estocástico. A idéia básica desse método classificador é direta - ajuste iterativamente os parâmetros θ na
direção em que o gradiente da função de custo é grande e negativo. Dessa maneira, o procedimento de treinamento garante que os
parâmetros fluam para um mínimo local da função de custo.
• Classificadora Naïve Bayes. Um classificador de Naive Bayes é um classificador probabilístico simples baseado na aplicação do teorema de Bayes
(a partir de estatísticas bayesianas) com fortes suposições de independência (ingênuas). Esse classificador está entre os métodos comuns de
aprendizado agrupados por semelhanças que utilizam o teorema da probabilidade de Bayes para construir modelos de ML, especialmente aqueles
relacionados à previsão de doenças e classificação de documentos.
• Classificador da Árvore de Decisão. Uma árvore de decisão é uma ferramenta de suporte à decisão que usa um gráfico semelhante a uma árvore e seus possíveis
resultados. É uma maneira de exibir o algoritmo.
• Classificador aleatório da floresta. As florestas aleatórias são um método de aprendizado conjunto para classificação, regressão e outras tarefas,
que operam construindo uma infinidade de árvores de decisão no momento do treinamento. Como resultado, as classes (classificação) ou
previsão média (regressão) dessas árvores geradas individualmente são agrupadas. Este método tem como objetivo calcular a média de muitas
árvores aproximadamente imparciais, mas barulhentas, para obter resultados de baixa variação. É uma coleção de decisões que, em conjunto,
forma uma floresta.
• Classificador KNN. A classificação é obtida identificando os vizinhos mais próximos de um exemplo de consulta e usando esses
vizinhos para determinar a classe da consulta.
• Classificador de máquinas de vetores de suporte. O objetivo do classificador SVM é encontrar o hiperplano que separa os pontos das
classes C 1 e C 2 com margem máxima, pontos de penalização linear na margem por meio de um parâmetro de regularização selecionado
pelo usuário. As máquinas de vetores de suporte trazem uma nova opção para o problema de reconhecimento de padrões, com
conexões claras na teoria estatística da aprendizagem. Eles di ff radicalmente de outros métodos, por exemplo, redes neurais - o
treinamento de um SVM sempre encontra um mínimo global e sua simples interpretação geométrica fornece muito espaço para
investigações mais profundas.
• Classi fi cador de regressão logística modelo. A regressão logística é classificada usando as relações logarítmicas entre a probabilidade dos
grupos dados os dados. Para os grupos g 1 e g 2:
∣∣∣ X = x)
log P (G = g 1 ∣∣∣ X = x) = β 0 + x β x = 0 (15)

P (G = g 2
O limite de decisão é o valor em que a probabilidade do grupo com base nos dados é igual. Para encontrá-lo, a função de
probabilidade de β é maximizado:
∑N
EU( β) = logPg Eu( x β). (16)
i=1
No aprendizado de máquina, a classificação identifica a qual classe um conjunto de dados observados pertence. A classificação é um exemplo
de reconhecimento de padrões. Foram utilizadas algumas variantes dos classificadores citados e disponíveis na biblioteca do ambiente Python, para
aumentar o conjunto de classificadores testados:
1 sklearn.linear_model.SGDClassi fi er;
2) sklearn.naive_bayes.GaussianNB;
3) sklearn.naive_bayes.BernoulliNB;
J. Imagem 2020, 6 51 9 de 15
4) sklearn.naive_bayes.MultinomialNB;
5) sklearn.tree.DecisionTreeClassi fi er;
6 sklearn.ensemble.ExtraTreesClassi fi er;
7) sklearn.ensemble.RandomForestClassi fi er;
8) sklearn.ensemble.GradientBoostingClassi fi er;
9 sklearn.neighbors.KNeighborsClassi fi er;
10) sklearn.svm.LinearSVC;
11) sklearn.svm.SVC;
12) sklearn.linear_model.LogisticRegression. Após o e computacional ff Para os doze classificadores, foram selecionados os cinco
melhores, com base na área de Características Operacionais do Receptor:

1 Regressão logística do modelo linear.
2)2) Reforço
Reforço de gradiente
de gradiente (Reforço
(Reforço estocástico
estocástico de gradiente).
de gradiente).
3)3) SVM
SVMLinear
LinearSVC (Support
S VC Vector
(Support Machine
Vector LinearLinear
Machine - Support Vector Classi
- Support Vectorfi Classifi
cation). cação).
4)4) Modelo
Modelo Linear
Linear Descendente
DescendenteGradiente
GradienteEstocástico
Estocástico(Modelo
(ModeloLinear
LinearSGD).
SGD).
5)5) SVM SVC
SVM SVC (Máquina
(Máquinade
devetores
vetoresde
desuporte
suporte- -Cluster
Clusterde
devetores
vetoresde
desuporte).
suporte).Os
Osresultados
resultadosdadasimulação
simulação
dodo banco
banco dede
dadossão
dados sãofornecidos
fornecidosem
emdetalhes
detalhesnas
nasseções
seçõesa aseguir.
seguir.
5.5.Resultados
Resultados
Asestatísticas
As estatísticasde
deprimeira
primeiraordem
ordem referem-se
dizem respeitoà àdistribuição
distribuiçãodos
dosníveis
níveisde
decinza
cinzaem
em uma
uma imagem,
imagem, onde o histograma
histograma de
deprimeira
primeira
ordemééusado
ordem usadocomo
comobase
basepara
paraextrair
extrair suas
suas características,
características, como
como - média,
- média, desvio
desvio padrão,
padrão, curtose
curtose e assimetria,
e assimetria, conforme
conforme mostrado
mostrado na na
Tabela11.. Estes
Tabela não énão
suficiente,
são su ffinono
entanto, para
entanto, paraa tomar
tomada de decisão
decisões entreentre
o queo éque é tecido
tecido de melanoma
de melanoma e oéque
e o que é tecido
tecido saudável.
saudável. O testeOUteste
de
U de Mann-Whitney
Mann-Whitney aplicado
aplicado aos parâmetros
aos parâmetros na 1Tabela
na Tabela mostre1 que
mostra
( p <que ( p portanto,
0,05), < 0,05), portanto, a hipótese
a hipótese nula é rejeitada.
nula é rejeitada. Significando
Significando que as que
as distribuições
distribuições de ambas
de ambas as amostras
as amostras (melanoma
(melanoma e nevo)
e nevo) nãoassão
não são as mesmas.
mesmas.
Tabela1.1.
Tabela Estatísticas
Estatísticas de primeira
de primeira ordem.
ordem.
Parâmetros
Parâmetros TecidoNevus
Tecido Nevus Tecido
Tecido Melanoma
Melanoma p- Valor
p- Valor
Intensidade média 0,4514 ± 0,14340 0.4204 ± 0.1543 0,000
Intensidade Média 0,4514 ± 0,14340 0,4204 ± 0,1543 0,000
Kurtosis
Kurtosis 3,0953± ±5.4136
3.0953 5,4136 3,6476±±6,7590
3,6476 6,7590 0,003
0,003
Skewness
Skewness 0,1935
0,1935± ±1,7280
1,7280 0,2479
0,2479±±1.8501
1,8501 0,022
0,022
O boxplot na Figura 4 mostra que não é possível diferenciar tecido de nevo de tecido com melanoma observando apenas
O boxplot na Figura 4 mostra que não é possível di ff diferencie o tecido do nevo do tecido com melanoma observando apenas os
os valores médios de intensidade.
valores médios de intensidade.
Figura 4. Boxplot com intensidades médias de imagens em escala de cinza com melanoma e nevo.
Figura 4. Boxplot com intensidades médias de imagens em escala de cinza w com melanoma e nevo.
Métricas de desempenho para classificadores
Na literatura médica acadêmica, os casos são designados como positivos, indicando a existência da doença e negativos,
indicando a ausência da doença; assim, quatro possibilidades surgem quando as imagens médicas são submetidas aos
classificadores:
J. Imagem 2020, 6 51 10 de 15
Métricas de desempenho para classificadores
Na literatura médica acadêmica, os casos são designados como positivos, indicando a existência da doença e negativos, indicando
a ausência da doença; assim, quatro possibilidades surgem quando as imagens médicas são submetidas aos classificadores:
• TP-True Positive: casos positivos classificados corretamente.
• TN-True Negative: casos negativos classificados corretamente.
• FP-False Positive: casos negativos classificados incorretamente.
• FN-Falso Negativo: casos positivos classificados incorretamente. As métricas consideradas para
avaliar os classificadores para estes foram:
1 Precisão é a proporção entre o número de instâncias classificadas corretamente e o número de todas as instâncias no conjunto de testes.
TP + TN TP + TN +
Precisão = (17)
FP + FN
2) Sensibilidade, também conhecida como recall, é a proporção de positivos previstos corretamente em relação ao número real de positivos no
conjunto de testes.
Sensibilidade = TP (18)
TP + FN
3) Especi fi cidade é a versão da sensibilidade para negativos e indica a proporção de negativos previstos corretamente em relação
ao número real de negativos.
Especi ficidade = TN (19)

TP + FP
4) O escore F é uma métrica que considera precisão e sensibilidade, considerando sua média harmônica.
F - score = 2 ∗ recordar ∗ precisão (20)

recall + precisão
O limite ideal para todas as métricas é atingir o valor da unidade. Tabela 2 mostra os cinco melhores classificadores em ordem decrescente
por Área sob as características operacionais do receptor (AUC); estes apresentaram o melhor desempenho, dos doze testados.
Neste estudo, considerando o banco de dados de testes, a AUC deste conjunto de classificadores atingiu níveis entre 95,04% e 97,46%.
Todas as experiências foram conduzidas sob a mesma configuração de software Python.
Ter uma avaliação métrica exclusiva facilita o processo de tomada de decisão para a seleção do melhor classificador entre um dos
cinco primeiros. Essa métrica é a AUC. Ele fornece uma classificação clara de preferências entre todas elas e, portanto, uma escolha clara
de direção. Assim, o melhor classificador foi o Modelo de Regressão Logística Linear.
J. Imagem 2020, 6 51 11 de 15
Mesa 2. Classificadores ordenados por Área sob as Características Operacionais do Receptor (AUC).
Classificadores AUC Recall de precisão Suporte para F1-Score
1 Regressão logística 0,9746
Melanoma 0,98 0,97 0,98 269

Nevus 0,96 0,98 0,97 231
Precisão 0,97
Média ponderada 0,97 0,98 0,97 500
2) Reforço de gradiente 0,9699
Melanoma 0,97 0,97 0,97 269

Nevus 0,97 0,97 0,97 231
Precisão 0,97
3) SVM Linear SVC 0,9659
Melanoma 0,99 0,94 0,97 269

Nevus 0,93 0,99 0,96 231
Precisão 0,96
4) Modelo linear SGD 0,9551
Melanoma 0,95 0,97 0,96 269

Nevus 0,96 0,94 0,95 231
Precisão 0,96
5) SVM SVC 0,9504
Melanoma 0,94 0,97 0,96 269

Nevus 0,96 0,93 0,95 231
Precisão 0,95
1 Regressão logística do modelo linear. 2 Reforço estocástico de gradiente. 3 Máquina de vetores de suporte linear - Classifique os vetores de suporte. 4 Modelo
linear gradiente estocástico descendente. 5 Máquina de vetores de suporte - suporta cluster de vetores.
A curva de operação do receptor (ROC) na Figura 5 é outra ferramenta comum usada com o classificador binário. Clarifica a
seleção de recursos e a precisão do classificador de regressão logística. A linha pontilhada azul representa a curva ROC de um
classificador puramente aleatório. Um bom classificador fica o mais longe possível dessa linha, como aqui, no canto superior esquerdo.
Uma medida geral adequada para a curva é a área sob a curva (AUC). A matriz de confusão do método de regressão logística que
descreve o desempenho completo do modelo é mostrada na Figura 6 . Isso gera uma sensibilidade e especificidade de 0,97. A precisão
de uma classificação pode ser avaliada calculando o número de exemplos de classe reconhecidos corretamente (verdadeiros positivos),
o número de exemplos reconhecidos corretamente que não pertencem à classe (negativos verdadeiros) e exemplos que foram
atribuídos incorretamente à classe ( falsos positivos) ou que não foram reconhecidos como exemplos de classe (falsos negativos) [ 26 ]
No modelo de regressão logística linear, o recall para identificação de melanoma foi de 97%. Assim, das 500 imagens médicas no
banco de dados de testes, 269 imagens eram de melanoma e o classificador estava 97% correto, ou seja, identificou TP = 261 imagens
corretamente, classificando incorretamente FN = 8 das imagens como nevo.
A curva de operação do receptor (ROC) na Figura 5 é outra ferramenta comum usada com o classificador binário. Ele esclarece a
seleção de recursos e a precisão do classificador de regressão logística. A linha pontilhada azul representa a curva ROC de um
classificador puramente aleatório. Um bom classificador fica o mais longe possível dessa linha, como aqui, no canto superior esquerdo.
J. Imagem 2020, 6 51 12 de 15
Uma medida geral adequada para a curva é a área sob a curva (AUC).
Figura 5. Curva de operação do receptor (ROC) da regressão logística.

Figura 5. Curva de operação do receptor (ROC) da regressão logística.
Da mesma forma, o recall para identificação de nevo foi de 98,00%. O classificador reconheceu TN = 226 imagens como nevo, classificando FP
A matriz de confusão do método de regressão logística que descreve o desempenho completo do modelo é mostrada
= 5 imagens como melanoma, para um total de 231 imagens médicas de nevo.
na Figura
J. Imagem 6.6 Isso
2020, x PARAgera uma
REVISÃO PORsensibilidade
PARES e especificidade de 0,97. 12 de 15
O mesmo raciocínio pode ser feito para os outros classificadores listados na Tabela 2 .
A precisão de uma classificação pode ser avaliada calculando o número de exemplos de classe reconhecidos corretamente
(verdadeiros positivos), o número de exemplos reconhecidos corretamente que não pertencem à classe (negativos verdadeiros) e
exemplos que foram atribuídos incorretamente à classe ( falsos positivos) ou que não foram reconhecidos como exemplos de classe
(falsos negativos) [26].
No modelo de regressão logística linear, o recall para identificação de melanoma foi de 97%. Assim, das 500 imagens médicas no
banco de dados de testes, 269 imagens eram de melanoma e o classificador estava 97% correto, ou seja, identificou TP = 261 imagens
corretamente, classificando erroneamente FN = 8 das imagens como nevo.
Da mesma forma, o recall para identificação de nevo foi de 98,00%. O classificador reconheceu TN = 226 imagens como nevo,
classificando FP = 5 imagens como melanoma, para um total de 231 imagens médicas de nevo.
O mesmo raciocínio pode ser feito para os outros classificadores listados na Tabela 2.
Figura 6. Matriz de Confusão considerando o Modelo de Regressão Logística.

Para o melhor modelo de desempenho, a curva de probabilidade é mostrada através da curva sigmóide mostrada na Figura 7 .
Para o melhor modelo de desempenho, a curva de probabilidade é mostrada através da curva sigmóide mostrada na Figura 7.
Para o melhor modelo de desempenho, a curva de probabilidade é mostrada através da curva sigmóide mostrada na Figura 7.
J. Imagem 2020, 6 51 13 de 15
Figura 7. Modelo de Regressão Logística da Estratégia Proposta.

Figura 7. Modelo de Regressão Logística da Estratégia Proposta.
Assim como a regressão linear usa o método do quadrado menos comum para minimizar erros e obter a melhor solução possível, a
Assim como a regressão linear usa o método do quadrado menos comum para minimizar erros e obter a melhor solução possível, a
regressão logística obtém os melhores resultados usando o método da máxima verossimilhança, plotando a curva de probabilidade em
regressão logística obtém os melhores resultados usando o método da máxima verossimilhança, plotando a curva de probabilidade em
função do número de amostras testadas. Quanto mais inclinada essa curva, menor o intervalo de amostras que leva à curva de
função do número de amostras testadas. Quanto mais inclinada essa curva, menor o intervalo de amostras que leva à curva de
probabilidade 0 < p < 1, para detecção de diagnóstico, p> 0,5 provavelmente o tecido será melanoma, se p < 0,5 o tecido será nevo. Uma
probabilidade 0 < p < 1, para detecção de diagnóstico, p > 0,5 provavelmente o tecido será melanoma, se p < 0,5 o tecido será nevo. Uma
curva ROC é uma ferramenta gráfica usada para entender o desempenho de um modelo de classificação. Para um modelo de regressão
curva ROC é uma ferramenta gráfica usada para entender o desempenho de um modelo de classificação. Para um modelo de regressão
logística, uma previsão pode ser positiva ou negativa. Além disso, essa previsão pode estar correta ou incorreta.
logística, uma previsão pode ser positiva ou negativa. Além disso, essa previsão pode estar correta ou incorreta.
Taxa de falsos positivos = FP = =1- . = 84,01%. (21)

(21)
TN + FP = 1 - Especificidade. = 84,01%.
A Acidade
especificidade
específicaééde
de15,99%.
15,99%.OOnúmero
númerode
deresultados
resultadospositivos
positivos ee negativos
negativos muda
muda àà medida
medida que
que alteramos o limiar
alteramos o limiar dos
dos valores
valores de
de
probabilidade
probabilidade para
para classificar
classificar umum valor
valor dede probabilidade
probabilidade como
como umum resultado
resultado positivo
positivo ou ou negativo.
negativo. Assim,
Assim, a sensibilidade
a sensibilidade e a eespecificidade
a especificidade
também
também mudarão
mudarão [27].
[ 27 ]
6.6.Discussão
Discussão
Emboraososresultados
Embora resultadostenham
tenhamsido
sidosatisfatórios
satisfatórios com
com oo uso
uso dede técnicas
técnicas estatísticas,
estatísticas, para
para estudos
estudos futuros,
futuros, deve-se
deve-se notar
notar que,
que, quando
quando
parâmetrosGLCM
parâmetros GLCMdedesegunda
segunda ordem
ordem foram
foram utilizados,
utilizados, é necessário
é necessário tomar
tomar algumas
algumas precauções
precauções emem relação
relação aoao tamanho
tamanho dada região
região dede
interesse.
interesse.
Em alguns casos, o tamanho do ROI pode alterar valores em alguns parâmetros. Por exemplo, parâmetros que descrevem a homogeneidade e
complexidade da imagem (segundo momento angular, entropia, entropia de soma e di ff entropia de referência) são exemplos de parâmetros que
dependem do tamanho do ROI, especialmente com tamanhos de ROI pequenos que se aproximam de um valor limite [ 28. ]
A AUC encontrada neste estudo, como mostra a Tabela 2 , considerando o banco de dados de teste, alcançou
entre 95,04% e 97,46%, o que corresponde a uma precisão entre 95,00% e 97,00%, respectivamente. Os classi fi cadores de regressão
logística do modelo linear foram os mais precisos.
Isso mostra o e ff eficácia das estatísticas de segunda ordem e inclusão de componentes RGB na composição dos pontos-chave
para melhorar o desempenho da estratégia proposta.
7. Conclusões
O mecanismo proposto para identificar e classificar o tecido da pele é geral; em trabalhos futuros, pode ser aplicado a outras imagens
médicas para verificar os resultados, uma vez que a estratégia analisa a textura das imagens e revela suas diferenças ff varia de acordo com os
parâmetros definidos, permitindo a classificação da imagem.
A análise de textura utiliza as alterações no valor de cinza dos pixels da imagem e seu padrão de distribuição, que podem refletir
alterações patológicas microscópicas que não são visíveis ao olho humano e podem ser usadas na análise de várias imagens. Assim, a
análise de textura em imagens médicas pode ser um suporte substancial para o processo de tomada de decisão clínica no diagnóstico e
classificação de
J. Imagem 2020, 6 51 14 de 15
tumores. Espera-se que esta metodologia se torne mais precisa do que o olho humano na detecção de desvios mínimos nas estruturas
celulares e teciduais.
Métodos estatísticos usando recursos GLCM, associados a informações de cores vermelha, verde e azul para realizar análises de
microtextura de tecidos humanos e classificação de imagens para detecção de tumores mostraram grande ffi eficiência nos resultados apresentados.
Os resultados mostram que, para a detecção de melanoma em tecidos humanos, o modelo de regressão logística foi o melhor modelo
com 97,00% de exatidão e precisão no conjunto de dados de referência e também uma sensibilidade e especificidade de 97,00%.
O segundo melhor método de classificação dos dados das imagens médicas avaliadas foi a Classificação do Gradient Boosting.
Contribuições do autor: O MAMA e o IAXS contribuíram em igual proporção para o desenvolvimento do algoritmo apresentado neste artigo, que foi escrito
pelo primeiro autor. O IAXS foi responsável pela implementação em Python do algoritmo proposto. Todos os autores leram e concordaram com a versão
publicada do manuscrito.
Financiamento: Esta pesquisa não recebeu financiamento externo.
Agradecimentos: Gostaríamos de agradecer à International Skin Imaging Collaboration (ISIC), patrocinada pela International Society for Digital Skin
Imaging (ISDIS) por disponibilizar publicamente bancos de dados no Arquivo ISIC que contém a maior coleção disponível publicamente de imagens
dermatoscópicas de lesões de pele com controle de qualidade.
Conflitos de interesse: Os autores declaram não haver conflito de interesses.
Referências
1. Fundo Mundial de Pesquisa do Câncer - Instituto Americano de Pesquisa do Câncer. Disponível: https: //www.wcrf.
org / dieta e câncer / tendências de câncer / estatísticas de câncer de pele (acessado em 1 de junho de 2020).
2) Karabulut, EM; Ibrikci, T. Análise de Textura de Imagens de Melanoma para Diagnóstico Assistido por Computador. Nos Anais da Conferência
Internacional Anual sobre Computação Inteligente, Ciência da Computação e Sistemas de Informação (ICCSIS-16), Pattaya, Tailândia, 28 a 29 de
abril de 2016; Volume 1, pp. 26–29.
3) Fernandez, HC; Ortega, OL F é lix Castro-Espinozaa e Volodymyr Ponomaryov. Um sistema inteligente para o diagnóstico de câncer de pele em
imagens digitais tiradas com dermatoscopia. Acta Polytech. Pendurado. 2017, 14,
169-185.
4) Almeida, MAM Uso de técnicas estatísticas para analisar texturas em imagens médicas para detecção e avaliação de tumores. Adv. Mol. Imaging
Interv. Radiol. 2018, 1 1–6.

5. Organização Mundial da Saúde (OMS); Agência Internacional de Pesquisa em Câncer (IARC). Disponível:
https://www.iarc.fr (acessado em 2 de maio de 2020).
6 Singh, P .; Mukundan, R .; De Ryke, R. Análise de qualidade baseada em textura de imagens de ultra-som sintético simulado usando padrões
binários locais. J. Imagem 2017, 4 3. [ CrossRef ]
7) Zhang, L .; Gao, HJ; Zhang, J .; Badami, B. Otimização das redes neurais convolucionais para detecção automática de câncer de pele. Open Med. 2020,
15 27-37. [ CrossRef ] [ PubMed ]

8) Pathan, S .; Prabhu, G .; Siddalingaswamy, P. Técnicas e algoritmos para diagnóstico auxiliado por computador de lesões cutâneas pigmentadas - Uma
revisão. Biomed. Processo de sinal. Ao controle. 2018, 39, 237-262. [ CrossRef ]
9 Lee, YC; Jung, SH; Won, HH WonDerM: Classificação de lesões cutâneas com garras de rede neurais refinadas. No Análise de lesões ISIC 2018
para detecção de melanoma; Universidade de Cornell: Ithaca, NY, EUA, 2018; pp. 1-4.
10. Harangi, B. Classificação da lesão cutânea com conjuntos de redes neurais convolucionais profundas. J. Biomed. Informar.
2018, 86, 25-32. [ CrossRef ]
11. Li, Y .; Shen, L. Análise de lesões cutâneas na detecção de melanoma usando a Deep Learning Network. Sensores
2018, 18, 556. [ CrossRef ]
12. Abbadi, NK; Faisal, Z. Detecção e Análise de Câncer de Pele de Lesões de Pele. Int. J. Appl. Eng. Res.
2017, 12 9046-9052.
13. Ansari, detecção de câncer de pele UB usando processamento de imagem. Int. Res. J. Eng. Technol. 2017, 4 2875-2881.
14. Waugh, S .; Purdie, C .; Jordan, LB; Vinnicombe, S .; Lerski, RA; Martin, P .; Thompson, AM Classificação por análise de textura por ressonância
magnética do câncer de mama primário. EUR. Radiol. 2015, 26, 322-330. [ CrossRef ]
J. Imagem 2020, 6 51 15 de 15
15. Vamvakas, A .; Tsougos, I .; Arikidis, N .; Kapsalaki, E .; Fountas, K .; Fezoulidis, I .; Costaridou, L. Explorando morfologia e textura de modelos de
tumor 3D em DTI para di ff diferenciando glioblastoma multiforme de metástases solitárias. Biomed. Processo de sinal. Ao controle. 2018, 43, 159-173. [ CrossRef
16 Jenitta, A .; Ravindran, RS Recuperação de imagens com base no padrão local de co-ocorrência de vetores de malha para diagnóstico médico fromMRI
Brain Images. J. Med. Syst. 2017, 41 1–10. [ CrossRef ] [ PubMed ]
17. Asri, H .; Mousannif, H .; Al Moatassime, H .; Noel, T. Usando algoritmos de aprendizado de máquina para previsão e diagnóstico de risco de câncer de
mama. Procedia Comput. Sci. 2016, 83, 1064-1069. [ CrossRef ]
18. Yoon, SH; Park, CM; Park, SJ; Yoon, J.-H .; Hahn, S .; Goo, JM Heterogeneidade do tumor no câncer de pulmão: avaliação com imagens de RM com
contraste dinâmico aprimorado. Radiol. 2016, 280 940-948. [ CrossRef ] [ PubMed ]
19. Seal, A .; Bhattacharjee, D .; Nasipuri, M. Modelo preditivo e probabilístico para detecção de câncer usando imagens de tomografia computadorizada. Ferramentas
multimídia Appl. 2017, 77, 3991-4010. [ CrossRef ]

20. Haralick, RM Abordagens estatísticas e estruturais da textura. Proc. IEEE 1979, 67, 786-804. [ CrossRef ]
21. Harshavardhan, A .; Babu, S .; Venugopal, T. Análise de métodos de extração de características para a classificação da detecção de tumores cerebrais. Int. J.
de Pure Appl. Matemática. 2017, 117, 147-154.
22. Bahadure, N .; Ray, AK; Thethi, Análise de imagens HP para detecção de tumores cerebrais com base em ressonância magnética e extração de recursos usando
BWT e SVM de inspiração biológica. Int. J. Biomed. Imaging 2017, 2017, 1–12. [ CrossRef ]
23. Abdel-Nasser, M .; Moreno, A .; Puig, D. Detecção de câncer de mama em imagens infravermelhas térmicas usando métodos de aprendizado de
representação e análise de textura. Elétron. 2019, 8, 100. [ CrossRef ]
24. Ayyachamy, S. Recuperação Baseada em Registro usando Medidas de Textura. Appl. Med Inform. 2015, 37, 1–10.
25) Colaboração Internacional em Imagem por Pele. Disponível: https://challenge2019.isic-archive.com/
(acesso em 2 de dezembro de 2019).
26. Ashish, K. Aprendendo Análise Preditiva com Phyton; Publicação de Pacotes - Código Aberto: Birmingham, Reino Unido,
2016; 346–352.
27. Sokolova, M .; Lapalme, G. Uma análise sistemática de medidas de desempenho para tarefas de classificação.
Inf. Processo. Manag. 2009, 45, 427-437. [ CrossRef ]

28) Sikiö, M .; Holli-Helenius, KK; Ryymin, P .; Dastidar, P .; Eskola, H .; Harrison, L. O e ff efeito do tamanho da região de interesse nos parâmetros
texturais. Nos Anais do 9º Simpósio Internacional de 2015 sobre Processamento e Análise de Imagem e Sinais (ISPA), Zagreb, Croácia, de 7 a 9 de
setembro de 2015; Instituto de Engenheiros Elétricos e Eletrônicos (IEEE): Piscataway, NJ, EUA, 2015; 149-153.
© 2020 pelos autores. MDPI licenciado, Basileia, Suíça. Este artigo é um artigo de acesso aberto distribuído sob os termos
e condições da licença Creative Commons Attribution (CC BY) (http://creativecommons.org/licenses/by/4.0/).

Classificação de Modelos

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Classificação de Modelos

Enviado por

Direitos autorais:

Formatos disponíveis

Diário de

Modelos de Classificação para Detecção de Tumor de Pele Usando Análise de

Marcos AM Almeida 1 * e Iury AX Santos 2

1 Departamento de Eletr ô nica e Sistemas, Centro de Tecnologia, Universidade Federal de Pernambuco,

Recife-PE 50670-901, Brasil

Recebido: 13 de maio de 2020; Aceito: 16 de junho de 2020; Publicado: 19 de junho de 2020

Palavras-chave: análise de textura; melanoma; glcmmatrix; aprendizado de máquina; classi ﬁ cadores

J. Imagem 2020, 6 51; doi: 10.3390 / jimaging6060051 www.mdpi.com/journal/jimaging

de câncer de melanoma. Os trabalhos relacionados a esta pesquisa revelam essa tendência.

implementadas e executadas usando a linguagem Python.

promissoras dessas estruturas, ou seja,

resultados de desempenho variaram de

Onde δ ( Eu, j) é a função delta do Kronecker

p (i) = h (i) i = 0, 1,. . . ., eu - 1 (3)

A variação mostra o grau de variabilidade em torno da distribuição média da escala de cinza:

A assimetria mede a assimetria do histograma:

p (i, j, d, θ) = {(( x 1 y 1), ( x 2 y 2)): h (x 1 y 1) = i, h (x 2 y 2) = j} (8)

Neste estudo, as distâncias consideradas foram d = 1, 2,. . . 5, com ângulos θ = 0 0 ◦ 45 ◦ 90 ◦ e 135 ◦

A entropia mede o grau de confusão entre os pixels da imagem:

p (i, j | d θ) = p (i, j d∑θ) ∑ (14)

A estratégia desenvolvida envolve as seguintes etapas:

1 Seleção aleatória de um conjunto de imagens com melanoma e nevo.

2) Geração de pontos-chave contendo:

uma. informações estatísticas de primeira ordem;

c.b. parâmetros sobre

c. Informações sobre o componente RGB.

• Classificador de gradiente estocástico.

relacionados à previsão de doenças e classificação de documentos.

resultados. É uma maneira de exibir o algoritmo.

forma uma floresta.

log P (G = g 1 ∣∣∣ X = x) = β 0 + x β x = 0 (15)

aumentar o conjunto de classificadores testados:

melhores, com base na área de Características Operacionais do Receptor:

J. Imagem 2020, 6 x PARA REVISÃO POR PARES 9 de 15

Métricas de desempenho para classificadores

Métricas de desempenho para classificadores

• TP-True Positive: casos positivos classificados corretamente.

• TN-True Negative: casos negativos classificados corretamente.

• FP-False Positive: casos negativos classificados incorretamente.

• FN-Falso Negativo: casos positivos classificados incorretamente. As métricas consideradas para

avaliar os classificadores para estes foram:

Especi ficidade = TN (19)

F - score = 2 ∗ recordar ∗ precisão (20)

Classificadores AUC Recall de precisão Suporte para F1-Score

1 Regressão logística 0,9746

Melanoma 0,98 0,97 0,98 269

2) Reforço de gradiente 0,9699

Melanoma 0,97 0,97 0,97 269

3) SVM Linear SVC 0,9659

Melanoma 0,99 0,94 0,97 269

4) Modelo linear SGD 0,9551

Melanoma 0,95 0,97 0,96 269

5) SVM SVC 0,9504

Melanoma 0,94 0,97 0,96 269

Figura 5. Curva de operação do receptor (ROC) da regressão logística.

Figura 6. Matriz de Confusão considerando o Modelo de Regressão Logística.

Figura 7. Modelo de Regressão Logística da Estratégia Proposta.

Taxa de falsos positivos = FP = =1- . = 84,01%. (21)

Financiamento: Esta pesquisa não recebeu financiamento externo.

Conflitos de interesse: Os autores declaram não haver conflito de interesses.

abril de 2016; Volume 1, pp. 26–29.

Interv. Radiol. 2018, 1 1–6.

https://www.iarc.fr (acessado em 2 de maio de 2020).