Escolar Documentos
Profissional Documentos
Cultura Documentos
Resumo: A detecção de pele é amplamente utilizada em diversas áreas tecnológicas por meio do
processamento de imagens ou da visão computacional. Suas aplicabilidades partem desde a
caracterização de imagem à detecção de doenças de pele. Em seguimento a mesma linha de contexto,
o presente artigo aborda um modelo de Classificador por regra aplicado a Detecção de Pele. Em nosso
esquema utilizamos quatros classificadores, três para classificação parcial e um para classificação final.
O nosso método combina a informação dos três classificadores parciais passando usados como entrada
para a classificação final que, por regra de votação, agrupa os pixels da imagem como pele se o resultado
for maior ou igual 2, e agrupa como “não pele”, caso contrário. A classificação parcial foi construída
com dois classificadores Bayesianos com discriminantes baseados em espaço de cores distintos (Lab e
YCbCr), e um classificador explícito de regiões de pele definido por uma regra de classificação no
espaço de cores RGB.
Abstract: Skin detection is widely used in several technological areas through image processing or
computer vision. Its applicability varies from the image characterization to the detection of skin diseases.
Following the same context line, this article presents a Classifier model per rule applied to Skin
Detection. In our approach, we used four classifiers, three for partial classification and one for final
classification. Our method combines the information from the three partial classifiers that it used as
input to the final classification. This last is did by voting rule that groups the pixels of the image as skin
if the result is greater than or equal to 2 or groups as "not skin", for otherwise. The partial classification
was constructed with two Bayesian classifiers that it uses as discriminants distinct color spaces (Lab and
YCbCr), and an explicit classifier of skin regions defined by a classification rule in the RGB color space.
1
Docente no Curso de Licenciatura em Computação pelo Centro Universitário Estácio da Amazônia,
carlos.bruno@estacio.br
2
Licenciada em Licenciatura em Computação pelo Centro Universitário Estácio da Amazônia, sil.pjm@gmail.com
-1- Revista Multidisciplinar Pey Këyo
1 INTRODUÇÃO
-2-
2 FUNDAMENTAÇÃO TEÓRICA
𝑝(𝑥|𝜔)𝑝(𝜔)
𝑝(𝜔|𝑥) = (1)
𝑝(𝑥)
onde, 𝑝(𝑥|𝜔) é a probabilidade de um evento 𝑥 ocorrer dado que 𝜔 é verdade (ou ocorre) –
Função de Densidade Probabilística (PDF); 𝑝(𝜔) e 𝑝(𝑥) são as probabilidades de 𝜔 e 𝑥 sem
considerar um ao outro – probabilidade a priori – ; e 𝑝(𝜔|𝑥) é a probabilidade de um evento 𝜔
ocorrer dado que 𝑥 é verdade – probabilidade a posterior (LOPES, 2013).
-3-
O Classificador de pele explícito é definido por um conjunto de regras aplicados
aos pixels da imagem sobre o espaço de cor RGB definido pelas seguintes regras:
onde, R, G e B são os níveis de energia (canais de cores) de um pixel avaliado; max e min são
o maior e o menor valor entre os canais, respectivamente. O classaficador define um pixel,
como pele, se a regra descrita pelas inequações e operações lógicas em (2) for verdadeira, e em
caso contrário, ele irá classifica-los como não-pele.
Figura 1 – Exemplo de detecção de pele. A imagem à esquerda é passada com entrada para algoritmo que gera
como saída a imagem à direita.
Fonte: Imagem de entrada: web, Resultado: própria
3 ABORDAGEM PROPOSTA
-4-
alcançados com a aplicação do método é demonstrado por meio da Figura 1 que ilustra a
imagem de entrada à esquerda, e sua respectiva saída após o processamento, o resultado de
detecção de pele na imagem segmentada à direita (regiões de pele dentro da imagem).
Figura 2 – Diagrama arquitetural do algoritmo. 𝐼𝑖𝑛 é a imagem de entrada (sinal) para os classificadores 𝑅1 , 𝑅2 e
𝑅3 . Os classificadores 𝑅1 , 𝑅2 e 𝑅3 realizam a classificação parcial da imagem gerando como saída imagens as
binárias 𝐼𝑏1 , 𝐼𝑏2 , 𝐼𝑏3 que são somadas gerando o sinal 𝐼Σ (imagem). Este último sinal é passado como entrada para
o classificador 𝐹 que aplica a regra de ponderação sobre 𝐼Σ para identificar quais são os pixels de pele da imagem
original resultando na saída 𝐼𝑜𝑢𝑡 (imagem segmentada em regiões de pele).
Fonte: Própria
𝑝(v
⃗ |𝜔)𝑝(𝜔)
𝐼𝑀𝑃 (𝑥, 𝑦) = (3)
⃗)
𝑝(v
1 1
(v
− ⃗ −𝜇𝜔 )𝑇 (Σ𝜔 )−1 (v
⃗ −𝜇𝜔 )
𝑝(v
⃗ |𝜔) = 1 exp
2 (4)
(2𝜋)𝑑/2 |Σ𝜔 |2
-5-
onde, 𝜔 representa a classe de interesse com os parâmetros de vetor de média 𝜇𝜔 e a matriz de
covariância Σ𝜔 que o define; v
⃗ representa o vetor bidimensional de intensidades do pixel.
O vetor v
⃗ representa os dados bidimensionais de intensidades de pixels e, são
utilizados como discriminantes para o reconhecimento dos pixels de pele em ambos os
classificadores 𝑅1 e 𝑅2 . O classificador 𝑅1 utiliza como informação discriminante os canais de
𝑎
cores a e b do espaço de cores Lab, sendo, o vetor de v ⃗ representado como v⃗ = [ ]. Já o
𝑏
classificador 𝑅2 utiliza como informação discriminante, os canais de cores cb e cr do espaço de
𝐶𝑏
cores YCbCr, sendo, o vetor de v
⃗ representado como v
⃗ =[ ].
𝐶𝑟
Figura 3 – A imagem à esquerda exibe um mapa de regiões de alta probabilidade. A imagem à direita demonstra
uma imagem binária que foi gerada após a aplicação do classificador 𝑅1 .
Fonte: Própria
-6-
1, se 𝐼𝑀𝑃 (𝑥, 𝑦) ≥ 8.0
𝐼𝑏𝑖 (𝑥, 𝑦) = { (5)
0, caso contrário
onde, 𝐼𝑀𝑃 (𝑥, 𝑦) é a imagem de alta probabilidades; e 𝐼𝑏𝑖 (𝑥, 𝑦) é a imagem binária – 𝑖 específica
de qual classificador foi gerado essa imagem; e os valores 1 e 0 representa pele e não pelo,
respectivamente. A Figura 3 ilustra o resultado da geração da uma imagem com o mapa de
regiões de alta probabilidade de pixels de pele e uma imagem binária.
onde, 𝐼𝑏𝑖 (𝑥, 𝑦) é a imagem binária, sendo que, o valor 1 representa as regiões de pele e, 0 as
regiões que não os são.
onde, 𝐼Σ (𝑥, 𝑦) é uma imagem (matriz) com a soma dos resultados das imagens binárias 𝐼𝑏1 , 𝐼𝑏2
e 𝐼𝑏3 .
1, se 𝐼Σ (𝑥, 𝑦) ≥ 2
𝐼𝐵𝐹 (𝑥, 𝑦) = { (8)
0, caso contrário
onde, 𝐼𝐵𝐹 (𝑥, 𝑦) é uma imagem binária que contém as regiões de pixels de pele indicado pelo
valor 1. A obtenção final da imagem segmentada e colorida é dado por:
onde, 𝐼𝑖𝑛 é a imagem de entrada original; 𝐼𝐵𝐹 é a imagem binária com os valores 1 representando
as regiões de pixels de pele. 𝐼𝑜𝑢𝑡 é a imagem segmentada resultante.
-7-
3.1 Treinamento dos Parâmetros do Modelo Gaussiano
-8-
É importante ressaltar que as imagens digitais selecionadas aleatoriamente eram
compostas de pessoas de diversas etnias, e, portanto com diferentes tons de pele. Além disso,
elas estão sujeitas à diferentes tipos de iluminação, foco e ângulos da visão de captura não
controlados, o que podem alterar e afetar a tonalidade real da cor de pele.
Figura 5 – Imagens usadas como amostragem para o treinamento contendo apenas regiões de pele.
Fonte: Própria
4 ANÁLISE E RESULTADOS
A avaliação da abordagem proposta para detecção de pele deu-se pela métrica de taxas
de erros dos pixels que foram classificados como Falsos Positivos (FP), Falsos Negativos (FN)
e Erro Total (ET).
Falsos positivos são pixels que foram classificados como sendo de pele, mas, não os
são. Falsos negativos são os pixels que deveriam ter sidos classificados como pele, mas, não os
foram.
Para cada imagem individualmente foi calculado as taxas de erros de falsos positivos,
falsos negativos e erro total. Além disso, calculou-se as taxas de erro médio de falsos positivos,
falsos negativos e erro total levando em consideração todas as imagens segmentadas. Para cada
imagem selecionada para segmentação gerou-se o seu conjunto verdade (groundTruth), ou seja,
segmentou-se manualmente as regiões de pele. A imagem (a) e (b) da Figura 6 ilustra uma das
imagens que foram selecionadas e o seu conjunto verdade.
- 10 -
Figura 6 – Em (a) representa a imagem de entrada. Em (b) o conjunto verdade (groundTruth) de (a). Em (c) e (d)
temos o resultado da segmentação realizado pelo detector de pele representado por uma imagem binária e por uma
colorida, respectivamente.
Fonte: Própria
PFP
TFP = (12)
Pnp
onde, PFP é quantidade de pixels detectados como pele que, no entanto, não os são; e Pnp é
quantidade total de pixels de não-pele existente na imagem avaliada.
PFN
TFN = (13)
Pp
onde, PFN é quantidade pixels que deveriam ter sidos detectados como pele, mas, não os foram;
e Pp é quantidade total de pixels de pele existente na imagem avaliada.
PFP + PFN
TET = (14)
N
A tabela 1 demonstra os resultados de taxas de erros obtidos sobre cada uma das
imagens selecionadas para teste, e informa a média desses erros sobre os FP, FN e ET.
- 11 -
Tabela 1 – Taxa de erros de Falsos Positivos, Falsos Negativos e Erro Total.
Fonte: própria
Os resultados alcançados pela Tabela 1 demonstra que a abordagem tem baixo índice
de taxa de erro médio de Falsos Positivos. O classificador tende não classificar um pixel que
não é pele como pele. Observando a taxa de erros médio de Falsos Negativos evidencia-se uma
taxa de erros em torno de 35%, o que não é um resultado muito satisfatório, pois, o classificador
tende a não identificar os pixels que são pele. Já, o erro total médio ficou em torno de 15%, no
entanto, esse índice não revela onde o classificador errou, pois, seu resultado é influenciado
pelos diferentes tamanhos de imagens selecionadas. Portanto, ele leva em consideração a
classificação de todos os pixels das imagens sem identifica se o classificador errou em não
classificar pixels como pele ou errou classificando pixels como pele sendo que eles não os são.
5 CONSIDERAÇÕES
- 12 -
a taxa média de Erro Total fica em torno de 15%. No entanto, quando analisamos os resultados
dentro dos aspectos individuais relativos aos erros de Falsos Positivos e Falsos Negativos,
averiguamos que a resultados demonstrados pela Tabela 1 da seção 4 que a combinação de
classificadores minimiza o erro de classificação de Falsos Positivos com uma taxa média de
erros 8%. No entanto, o classificador possui uma taxa razoável de acertos na classificação de
pixels como pele, pois, a taxa de erros médio de Falsos negativos possui uma taxa média de
erros em torno de 35%. Esse fato, demonstra que para trabalhos futuros pode-se focar em
métodos que possam minimizar a taxa de erros de Falsos Negativos. Dessa forma, uma possível
modificação no método que possa resolver esse problema é acoplar dois classificadores a mais
ao modelo. Esses dois novos classificadores receberiam como entrada a saída do modelo atual
e se focariam em corrigir os resultados pela identificação dos erros, ou seja, um dos
classificadores ficaria responsável em detectar os Falsos Positivos, e ou outros em detectar os
Falsos Negativos. Além disso, para trabalhos futuros poderiam aplicar um modelo de mistura
de gaussianas com função de densidade probabilística, o que poderia melhorar a fronteira de
separabilidades entres os conjuntos pele e não pele.
- 13 -
REFERÊNCIAS
LOPES, C. B. O. Detecção visual de atividade de voz com base na movimentação labial, Porto Alegre,
2013. Disponivel em: <http://hdl.handle.net/10183/72922>. Acesso em: 2014.
VEZHNEVETS, V.; SAZONOV, V.; ANDREEVA, A. A Survey on Pixel-Based Skin Color Detection
Techniques. IN PROC. GRAPHICON-2003, p. 85-92, 2003.
YANG, M.-H.; AHUJA, N. Gaussian Mixture Model for Human Skin Color and Its Applications in Image
and Video Databases. Storage and Retrieval for Image and Video Databases, v. 3656, p. 458-466,
1999.
- 14 -