Escolar Documentos
Profissional Documentos
Cultura Documentos
Dissertao apresentada
Escola de Engenharia de So
Carlos, da Universidade de So
Paulo, como parte dos
requisitos para a obteno do
ttulo de Mestre em Engenharia
Eltrica.
So Carlos
2010
ii
____________________________Dedicatria
________________________Agradecimentos
_______________________________Resumo
______________________________Abstract
________________________Lista de Figuras
Figura 1 - Imagem em vrias resolues. (a) imagem original n=1. (b) n=4. (c) n=8. (d)n=16..... 8
Figura 2 - Uma face tpica usada em mtodos baseados em conhecimento .............................. 8
Figura 3 - Projees verticais e horizontais em imagens............................................................ 9
Figura 4 - Segmentao utilizando o mtodo de proposto por Sirohey (1993) .......................... 11
Figura 5 - A caixa delimita a deteco do nariz e da boca ....................................................... 12
Figura 6 - Exemplo da estrutura parent vector. As grids representam uma pirmide de imagens
............................................................................................................................................... 14
Figura 7 - Resultados obtidos para dois ou mais clusters de face ............................................ 15
Figura 8 - (a) regio da face selecionada e (b) cluster de cores no espao de cores (RGB) ..... 16
Figura 9 - Deteco da face por meio da cor da pele: (a) Imagem face tpica. (b) Segmentao
da cor da pele. (c) Maior regio conectada de pixels de pele (BHUIYAN et al, 2003) ............... 18
Figura 10 - (a) imagem original e (b) resultado da segmentao da cor da pele na imagem
original (WANG e SUNG, 1999) .............................................................................................. 18
Figura 11 - Template utilizada por (YUILLE, 1992) para detectar olhos.................................... 21
Figura 12 - (a) Modelo utilizado para detectar a cabea (b) Modelo utilizado para detectar os
componentes faciais ............................................................................................................... 21
Figura 13 - Projees verticais e horizontais dos olhos obtida a partir da regio interna da janela
dos olhos ................................................................................................................................ 22
Figura 14 - Imagens originais e projeo delas no espao de eigenfaces ................................ 23
Figura 15 - Algoritmo de deteco de faces baseado em RNA (ROWLEY et al. 1998a) ........... 25
Figura 16 - Sequncia de passos do algoritmo de deteco de faces rotacionadas (ROWLEY et
al, 1998a)................................................................................................................................ 27
Figura 17 - HMM para a deteco e reconhecimento de faces (NEFIAN e HAYES, 1998) ....... 28
Figura 18 Estrutura do neurnio (AMORIN, 2009) ................................................................ 38
Figura 19 - Modelo no-linear de um neurnio (HAYKIN, 2001)............................................... 38
Figura 20 - Rede feedforward multicamada totalmente conectada com uma camada oculta e
uma camada de sada. ............................................................................................................ 41
Figura 21 - Grafo arquitetural de um perceptron mltiplas camadas com duas camadas ocultas
............................................................................................................................................... 42
Figura 22 Direo da propagao da funo sinal ................................................................ 43
Figura 23 Grfico da funo sigmide .................................................................................. 44
Figura 24 - Diagrama em blocos da aprendizagem supervisionada ......................................... 50
Figura 25 Fluxograma do trabalho desenvolvido ................................................................... 55
Figura 26 Algoritmo do trabalho desenvolvido ...................................................................... 56
Figura 27 Exemplo de imagens (a) adquirida na internet e (b) banco AR .............................. 57
Figura 28 Exemplo de imagens utilizadas para teste, (a) e (b) adquiridas na internet (c) e (d)
Banco AR. .............................................................................................................................. 57
vii
Figura 29 Exemplo de imagens utilizadas com caractersticas que dificultam a deteco ..... 58
Figura 30 Diagrama de blocos do pr-processamento da imagem ........................................ 58
Figura 31 Topologia da Rede Neural proposta para a segmentao de pele......................... 60
Figura 32 Diagrama de blocos da etapa de segmentao da imagem .................................. 60
Figura 33 Fluxograma do mtodo de varredura implementado ............................................. 61
Figura 34 Algoritmo do mtodo de varredura implementado ................................................. 62
Figura 35 Exemplo de imagem aps varredura..................................................................... 62
Figura 36 Diagrama de blocos da etapa de ps-processamento da imagem ......................... 63
Figura 37 Mascaras 3x3, vertical e horizontal do operador de Sobel ..................................... 63
Figura 38 Exemplo de imagem: (a) original, (b) segmentada, (c) binarizada e com (d) bordas
............................................................................................................................................... 63
Figura 39 Diagrama de blocos da etapa de extrao de caractersticas da imagem .............. 64
Figura 40 Modelo do molde utilizado para extrao de caractersticas .................................. 65
Figura 41 Topologia da Rede Neural proposta para a deteco de face ............................... 66
Figura 40 - (a), (c) e (e) imagens originais, (b), (d) e (f) imagens processadas do banco de
imagens da internet................................................................................................................. 68
Figura 41 - (a), (c) e (e) imagens originais, (b), (d) e (f) imagens processadas do banco de
imagens AR ............................................................................................................................ 68
Figura 42 - (a) imagem original (b) imagem segmentada ......................................................... 69
Figura 43 - (a) imagem original (b) imagem segmentada ......................................................... 70
Figura 44 - (a) imagem original (b) imagem processada .......................................................... 70
Figura 45 Grfico de faces localizadas e faces com eroses na imagem aps segmentao 71
Figura 46 - Resultado do algoritmo de deteco de face: (a) e (d) imagens originais e (b), (c),
(e) e (f) imagens resultantes.................................................................................................... 72
Figura 47 Grfico com o total de faces localizadas ............................................................... 73
Figura 48 Grfico de com o total de faces localizadas e total de falsos positivos................... 75
Figura 49 Artigos e peridicos utilizados na pesquisa de acordo com o ano de publicao. .. 81
viii
________________________Lista de Tabelas
Tabela 1 Tabela que apresenta a quantidade de faces identificadas e faces com eroses na
face......................................................................................................................................... 70
Tabela 2 Tabela que apresenta o resultado do teste T-Student para o total de faces
localizadas .............................................................................................................................. 71
Tabela 3 Tabela que apresenta o total de faces e o total de faces detectadas ...................... 73
Tabela 4 Tabela que apresenta o resultado do teste T-Student para o total de faces
detectadas .............................................................................................................................. 73
Tabela 5 Tabela que apresenta o total de pessoas e o total de falsos positivos nas imagens74
ix
_______________________________Sumrio
DEDICATRIA II
AGRADECIMENTOS III
RESUMO IV
ABSTRACT V
LISTA DE FIGURAS VI
LISTA DE TABELAS VIII
LISTA DE ABREVIATURAS E SIGLAS IX
1 INTRODUO 1
1.1 Objetivo ............................................................................................................................. 2
1.2 Estrutura do Trabalho ........................................................................................................ 2
2 DETECO DE FACES 5
2.1 Consideraes Iniciais ....................................................................................................... 5
2.2 Introduo ......................................................................................................................... 5
2.3 Mtodos Baseados em Conhecimento ............................................................................... 7
2.4 Mtodos Baseados em Caractersticas Invariantes .......................................................... 10
2.5 Mtodos Baseados em Templates ................................................................................... 20
2.5.1 Templates Deformveis 20
2.6 Mtodos baseados na Aparncia ..................................................................................... 23
2.6.1 Autofaces (Eigenfaces) 23
2.6.2 Redes Neurais 24
2.6.3 Modelos Ocultos de Markov 27
2.7 Consideraes Finais ...................................................................................................... 29
3 FUNDAMENTAO TERICA 31
3.1 Consideraes Iniciais ..................................................................................................... 31
3.2 Tcnicas de Deteco de Pele ........................................................................................ 31
3.2.1 Limiar de Classificao 32
3.2.2 Estatstico Histograma de Cor 33
3.2.3 Estatstico - Paramtrico 34
3.3 Redes Neurais Artificiais .................................................................................................. 35
3.3.1 Modelo de um neurnio 37
3.3.2 Funo de ativao 39
3.4 Arquitetura de rede .......................................................................................................... 40
3.4.1 Redes feedforward multicamada 40
3.5 Perceptron Multicamadas (MLP) ...................................................................................... 41
3.5.1 Algoritmo de Treinamento 44
3.6 Algoritmo de Aprendizagem ............................................................................................. 48
3.6.1 Aprendizagem Supervisionada 50
3.6.2 Consideraes finais 51
4 DETECO DE FACES HUMANAS EM IMAGENS COLORIDAS - METODOLOGIA 53
4.1 Consideraes Iniciais ..................................................................................................... 53
4.2 Mdulos Desenvolvidos ................................................................................................... 53
4.3 Metodologia ..................................................................................................................... 56
4.3.1 Pr-processamento 58
4.3.2 Segmentao de pele utilizando redes neurais 59
4.3.3 Varredura 61
4.3.4 Ps-processamento 62
4.3.5 Extrao de caractersticas 64
4.3.6 Deteco de faces utilizando redes neurais 65
4.3.7 Software de desenvolvimento 66
iii
5 RESULTADOS E DISCUSSES 67
5.1 Resultados obtidos com o algoritmo de segmentao ...................................................... 67
5.2 Resultados obtidos com o algoritmo de deteco de face ................................................ 72
6 CONCLUSES E SUGESTES PARA TRABALHOS FUTUROS 77
6.1 Sugestes para trabalhos futuros .................................................................................... 78
6.2 Trabalho Publicado.......................................................................................................... 79
REFERNCIAS BIBLIOGRFICAS 81
APNDICE A BANCO DE IMAGENS DA INTERNET 89
APNDICE B BANCO DE IMAGENS AR 95
1
1 Introduo___________________________
iluminao. Essa tarefa no fcil, pois, as faces apresentam uma grande variao
em tamanho, cor e textura. Alm disso, o fundo da imagem pode possuir detalhes
que sobrepe parcial ou totalmente a face que ser localizada, entre outros
problemas (GOUVEIA E PAIVA, 2009; WON et all, 2001; GASPAR e PAIVA, 2005).
Map), o de Nascimento (2005) que utiliza sistemas Fuzzy e o de Prado (2004) que
face.
1.1 Objetivo
Esse trabalho prope um algoritmo para deteco faces que usa RNA para
ou no numa dada imagem, onde essa imagem pode conter mais de uma face.
trabalho;
faces proposto;
2 Deteco de Faces____________________
pesquisados na literatura.
2.2 Introduo
localizao de cada face. Embora a deteco de faces seja uma tarefa fcil para os
da face.
objetos.
aparncia da face.
categorias, conforme apresentado por Yang (2002), as quais sero descritas nas
prximas sees.
7
que definem o que uma face, de acordo com uma base de conhec imento criada
pelo pesquisador Yang (2002). Sabe-se que faces humanas, em geral, possuem
identificados como face. Por outro lado, se o conjunto de regras for muito especfico,
A tcnica construda por Yang e Huang (1994) para deteco de faces, utiliza
nveis de regras. O primeiro nvel de regras tem como objetivo detectar os possveis
face como olhos, boca e nariz, necessrios para confirmar a validade dos elementos
nxn pixels, substitui-se o valor de cada pixel da janela, pelo valor mdio dos pixels
imagem, por exemplo: em baixa resoluo uma determinada regra identifica a regio
central do rosto por meio da afirmativa de que as janelas centrais, contendo olhos,
Figura 1 - Imagem em vrias resolues. (a) imagem original n=1. (b) n=4. (c) n=8. (d)n=16
em regras, similar aos que foram desenvolvidos por Kanade (1973) e Yang e Huang
n
HI ( x) y 1
I ( x, y) (1)
m
VI ( y ) x 1
I ( x, y ) (2)
componentes faciais como, por exemplo, os olhos, por meio da deteco de mnimos
locais da projeo. O mesmo tratamento dado projeo horizontal, HI, onde dois
comprometidas (figura 3b). A deteco da face feita pela anlise dos picos
al., 2002).
os mtodos discutidos nesta seo incorporam tcnicas que tem por objetivo
mtodos, tais como os que utilizam componentes faciais, textura e cor da pele.
figura 4.
11
mtodo foi aplicado para detectar e localizar apenas faces com viso frontal. A
so mais comuns nas faces do que nos fundos. O estgio de classificao intensiva
12
figura 5.
seres humanos tm de reconhecer um objeto que ora tem uma forma determinada e
13
em outro momento apresenta uma forma totalmente diferente. Como exemplo tem-
face vista de um ngulo frontal totalmente diferente quando vista de perfil (LOPES,
2005).
ser encarada como uma distribuio probabilstica, ou seja, ela gerada a partir de
imagens, onde o segmento de reta representa os pixels nos quais os valores dos
Figura 6 - Exemplo da estrutura parent vector. As grids representam uma pirmide de imagens
gaussiana piramidal aplicada sobre a imagem. Como pode ser visto na figura 6, cada
para todos os nveis da pirmide uma srie de filtros aplicada em cada pixel. Aps
ou no da face.
15
utilizadas para separar a face de outros objetos presentes em uma cena com fundo
Existe uma grande variedade de cores de pele (branca, negra, amarela, etc), e
existe um grande nmero de pesquisas que utilizam a cor da pele. Para rotular os
normalizado, CMY, YUV, YPbPr, YDbDr, HSV (ou HSI), YCrCb, YIQ, YES, CIE XYZ
e CIE LUV (YANG et al, 2002). Pode-se citar os seguintes trabalhos que usam
alguns desses espaos de cores: Jin et al. (2007), Zapata e Ruiz (2007), Feris et al.
(2000), Sobottka e Pittas (1996), Cai e Goshtasby (1999), Bhuiyan et al. (2003), Hsu
et al. (2002), Wang e Sung (1999), Saber e Tekalp (1998) e Yang e Ahuja (1998).
modelada por uma distribuio Gaussiana (figura 8), caracterstica que pode ser
utilizada para localizar faces em uma imagem colorida (WANG e SUNG, 1999;
(a) (b)
Figura 8 - (a) regio da face selecionada e (b) cluster de cores no espao de cores (RGB)
dois canais que contm as informaes para tratar cores. A matriz de transformao
Uma vez que a cor da pele tende a se aglomerar numa regio do espao de
cores, um threshold utilizado para detectar os pixels de pele (skin pixels). Nos
empiricamente, utilizado:
(60 < Y < 200) and (20 < I < 50) (4)
resultado da aplicao desta tcnica pode ser visto na figura 9. Tambm na figura 10
a segmentao das cores foi feita a partir de imagens normalizadas nesse plano de
cores. Segundo Wang e Sung (1999) a tcnica permitiu atingir resultados com 100%
Figura 9 - Deteco da face por meio da cor da pele: (a) Imagem face tpica. (b) Segmentao da cor
da pele. (c) Maior regio conectada de pixels de pele (BHUIYAN et al, 2003)
Figura 10 - (a) imagem original e (b) resultado da segmentao da cor da pele na imagem original
(WANG e SUNG, 1999)
representao das cores, ou seja, o espao de cores no qual a imagem est definida
19
cores foram propostos com o intuito de tornar mais robustos os algoritmos que
Saber e Tekalp (1998) destacam a utilizao do sistema de cores YES (definido pela
Apesar das vantagens de se utilizar a cor para detectar a pele, um problema ocorre
objeto (no caso a face), e informaes do movimento para localizar e rastrear a face
simetria entre o objeto presente na imagem e o seu template (molde) (LOPES, 2005;
face como uma elipse, como pode ser visto em Alattar e Rajala (1999) e Lee et al.
(2001), sendo tambm aplicado em seqncias de imagens, como pode ser visto em
ela pode ser utilizada para detectar qualquer objeto que possa ser representado por
formas geomtricas.
pode ser visto na figura 11. A energia uma funo de todos os parmetros do
dos parmetros.
gentico torna mais rpido o processo de busca pela face numa imagem, e permite
obter a soluo global. Uma vez que se tenha obtido a localizao da regio que
faciais. A cabea tratada como uma elipse podendo apresentar rotaes em torno
Figura 12 - (a) Modelo utilizado para detectar a cabea (b) Modelo utilizado para detectar os
componentes faciais
22
a posio dos componentes faciais segundo suas relaes geomtricas com a face
localizar, por exemplo, os olhos, uma janela retangular definida sobre a regio
referente a eles. Dentro da janela, a posio exata dos olhos calculada atravs de
Figura 13 - Projees verticais e horizontais dos olhos obtida a partir da regio interna da janela dos
olhos
23
LOPES, 2005).
utilizar esta tcnica para detectar a presena de face em uma cena, apenas
deteco de faces, pois a deteco de faces pode ser tratada como um problema de
aplicadas com sucesso (HSU et al, 2002; ROWLEY et al, 1998a; ROWLEY et al,
1998b).
percorrida por um filtro, que consiste em uma janela de 20x20, que extrai regies da
imagem onde podem existir faces. Logo aps a extrao da possvel regio de face,
25
cada sub-amostragem (figura 15). Cada bloco da imagem depois de extrado e pr-
processado enviado para uma rede neural, que decidir se nele existe ou no uma
face.
mostrado na figura 15, denominadas campos receptivos. Cada camada avalia uma
teis para determinar a presena de face. A rede apresenta como resposta um nico
uma taxa de acerto (deteco correta) da ordem de 92.7%, utilizando uma rede com
frontais ou com leves variaes na rotao. Diante desta limitao Rowley et al.
(1998b) estendeu essa tcnica de modo que a mesma seja robusta quanto a
como um vetor contendo os valores das 36 sadas, onde cada unidade de sada i
equao 5 e a direo desse vetor mdio indica o ngulo da face (ROWLEY et al,
1998b).
35 35
outputi * cos i *10 , outputi sin i *10 (5)
i 0 i 0
1998a)
reconhecimento de fala (LEE et al., 1990; RABINER, 1989). Tais modelos possuem
estatsticas de um sinal.
como apresentado em diversos trabalhos (XU et al., 2003; LE e LI, 2004; SAMARIA,
para o reconhecimento de faces frontais. Nesse trabalho, cada estado do HMM est
associado a uma regio da face (cabelo, testa, olhos, nariz e boca, sempre nesta
matriz covarincia e, atravs do uso da transformada KLT, obtm-se uma nova base
(a) (b)
17b). Para que seja possvel identificar uma face, independente de sua identidade, o
HMM deve ser treinado com um modelo genrico de face humana obtida a partir de
1994).
e COSTA, 2003).
etnias e, portanto com diferentes tons de pele, que ainda podem ser alterados por
32
diferentes tipos de iluminao, foco e ngulos de viso variada, o que pode dificultar
2002).
De acordo com Ramos Filho (2006) h trs tcnicas principais utilizadas para
i i
que pode modelado por intervalos em cada componente de cor, Cmin , Cmax onde i
representa a dimenso do espao de cor C (RAMOS FILHO, 2006; HSU et al, 2002).
(R > 95) ^ (G > 40) ^ (B > 20) ^ (max{RGB} > 15) ^ (|R G| > 15) ^ (R > G) ^ (R > B).
foi apresentada por Hsu et al. (2002). Essa tcnica baseou-se no trabalho de
33
Terrillon et al. (2000) que utiliza diversos espaos de cores para a deteco de pele,
pele com o objetivo de detectar face humana. O trabalho de Hsu et al. (2002) utiliza
agrupamento de pele na sua base treinamento. Aps obter o plano verificou-se que
agrupamento bastante compacto, podendo ser descrito por uma elipse (RAMOS
( x ecx ) 2 ( y ecy ) 2
1
a2 b2
x cos sen Cb cx
y sen cos Cr cy
cor de pele que projeta um histograma para as cores de pele e um histograma para
pele[c] n[c]
P (c | pele) e P(c | pele ) , onde pele[c] indica a contagem do histograma
Tp Tn
de cores de pele associada cor c, n[c] indica a contagem do histograma das cores
dos histogramas das cores de pele e no-pele e P(c | pele) e P(c | pele) indicam as
FILHO, 2006).
P(c | pele)
pixel de pele utiliza a equao de verossimilhana , onde 0 <= <= 1
P(c | pele)
1
r2 (x )t (x ),
35
onde x corresponde cor do pixel e o vetor de mdias. Para este mtodo foi
pele nos planos HS do espao HSV, AB do espao CIELAB e Cp 1 e Cp2 (as duas
dada por:
k
P(c | pele) wi Pi (c | pele) ,
i 0
onde wi denota o peso (numero total de pixels da classe divido pelo total de pixels da
amostra) de cada uma das gaussianas que compem a mistura (RAMOS FILHO,
2006).
motor, muitas vezes mais rapidamente do que o mais rpido computador digital
existente.
maneira como o crebro realiza uma tarefa particular ou funo de interesse. A rede
ento oferecer a seguinte definio de uma rede neural vista como uma maquina
dois aspectos:
adquirido.
37
so tarefas comuns.
algoritmos de treinamento.
que fundamental para a operao de uma rede neural. Cada neurnio recebe e
combina sinais de muitos outros neurnios e produz sinais para o axnio conduzir
morfologicamente diferentes das clulas. Um axnio tem uma superfcie lisa, poucos
Bias
bk
x1 w k1
Funo de
ativao
x2 w k2
uk Sada
Sinais de (.) yk
entrada
. .
. . Juno
. aditiva
.
w km
xm
Pesos
Sinpticos
da sada de um neurnio.
(18) e (19):
m
uk wkj x j (6)
j 1
yk uk bk (7)
de sada do neurnio.
identificar trs tipos bsicos de funes de ativao: funo de limiar, funo linear
Redes Recorrentes
ocultas, alm das camadas de entrada e de sada, como ilustrado na figura 20. Os
neurnios ocultos. A funo dos neurnios ocultos intervir entre a entrada externa
41
e a sada de uma maneira til. A adio de uma ou mais camadas ocultas, torna a
Entradas Sadas
Figura 20 - Rede feedforward multicamada totalmente conectada com uma camada oculta e uma
camada de sada.
feedforward, que contm uma ou mais camadas internas. Tem sido aplicada com
computacionais como pode ser visto na figura 21. O vetor de entrada representado
pelas variveis xi, os pesos sinpticos so denotados pela letra w k, onde k indica a
X0
Y1
X1
Y2
Sinal de Sinal de sada
entrada X2 (resposta)
(estimulo)
Y0
Xm
Figura 21 - Grafo arquitetural de um perceptron mltiplas camadas com duas camadas ocultas
camada, como ilustrado na figura 22, e dois tipos de sinais so encontrados nesta
rede.
Erro Backpropagation
prxima camada oculta e assim por diante para o resto da rede (figura 21).
funo logstica:
(8)
(vetores) de entrada.
(v)
v
Figura 23 Grfico da funo sigmide
acordo com a regra de correo de erro. Contudo, a resposta gerada pela rede
diversas vezes, at que para todas as sadas e padres de treinamento, o erro seja
erro entre a resposta desejada (alvo) e a atual resposta produzida pela rede. Este
da rede com a respectiva n-th iterao, obtm-se a seguinte funo custo ou o erro
(10)
pesos. Para as conexes wij, que ligam a camada oculta e a camada de sada,
(11)
46
(12)
Onde, ci o sinal de entrada dos pesos aplicado para o neurnio yi, e (.) a
(13)
(14)
seguinte equao:
(15)
equao:
(16)
treinamento da MLP:
seguintes:
a 90% do total);
topologias candidatas;
ir generalizar melhor;
nmero de neurnios.
48
(17)
devem ser normalizadas para a faixa [0,1] se estiver sendo utilizada a funo
aprendizagem no-supervisionada.
50
resposta real da rede (figura 2 4). Este ajuste realizado passo a passo com o
problemas de iluminao.
52
53
neural MLP;
imagem;
deteco das bordas, realizada nas reas que contem pele e que ser
sees seguintes.
Inicio
Im = Imagem
Tam_Imagem = Tamanho(Im)
Im = Pre_Processamento(Im)
Im = Segmentacao_Pele(Im)
Mascara = 80x80
Enquanto (Mascara <= Tam_Imagem) faa
Im2 = Varredura_Imagem(Im)
Im3 = Im2
Im2 = Pos_Processamento(Im2)
Im2 = Deteccao_Bordas(Im2)
Formas = Deteccao_Formas(Im2)
Caracteristicas = Extracao_Caracteristica(Formas)
Face = Detecao_Face(Caracteristicas)
Se (Face) ento
Grava(Im3)
Fim-Se
Mascara = Mascara + 20x20
Fim-Enquanto
Fim_Algoritmo
4.3 Metodologia
imagens;
(a) (b)
(a) (b)
(c) (d)
Figura 28 Exemplo de imagens utilizadas para teste, (a) e (b) adquiridas na internet (c) e (d) Banco
AR.
58
4.3.1 Pr-processamento
de rudos.
Para a implementao dessa etapa foi utilizada a filtragem por mediana 3X3,
Imagem de entrada
classificao de cores pele, utilizando o espao de cores RGB, pela sua simplicidade
implementado.
inferiores a 0.5 atribuda a cor preta para o pixel, como ilustrado na figura 32.
padres correspondentes aos pixels das regies que contm pele e no pele. Esse
conjunto foi constitudo pelas 25 imagens da internet nas quais foram utilizados 25
variando a iluminao.
Informaes referentes
ao pixel em RGB
Camada de Sada
(01 neurnio)
Pixel da Validao
Imagem da Pele
1 camada oculta
(05 neurnios) 2 camada oculta
(05 neurnios)
Imagem Imagem
pr-processada segmentada
Segmentao da Imagem
4.3.3 Varredura
iro ser processadas e testadas para verificao se existe ou no face. Para isso
utiliza-se uma mscara inicial de 80x80 pixels que ir varrer toda a imagem como
pode ser visto na figura 33 e detalhada na figura 34. Cada regio capturada por essa
execuo dos prximos mdulos (figura 35). Aps essa varredura a mscara
incrementa seu tamanho em 20x20 pixels e varre toda a imagem novamente, sendo
Inicio
Im = Imagem_segmentada
Tam_Imagem = Tamanho(Im)
Tam_Mascara = 80x80
Enquanto (Tam_Mascara <= Tam_Imagem) ento
Pos_Horizontal = 0
Enquanto (Pos_Horizontal + Tam_Mascara(Horizontal) <= Tam_Imagem(Vertical)) faa
Pos_Vertical = 0
Enquanto ((Pos_Vertical + Tam_Mascara(Vertical)) <= Tam_Imagem(Vertical)) faa
Nova_Imagem = Im[Posicao Mascara]
Nova_Imagem = Redimensiona(Nova_Imagem, 100x100)
Pos_Processamento(Nova_Imagem)
Binarizacao(Nova_Imagem)
Deteccao_Bordas(Nova_Imagem)
Extracao_Caracteristicas(Nova_Imagem)
Detecao_Face(Nova_Imagem,Encontrou_Face)
Se (Encontrou_Face) ento
Grava(Nova_Imagem)
Fim-se
Pos_Vertical = Pos_Vertical + 20
Fim-Enquanto
Pos_Horizontal = Pos_Horizontal + 20
Fim-Enquanto
Tam_Mascara = Tam_Mascara + 20x20
Fim-Enquanto
Fim-Algoritmo
4.3.4 Ps-processamento
para realar detalhes finos ou detalhes que tenham sido borrados nos passos
63
anteriores, e por fim para a deteco de bordas foi utilizando o operador Sobel na
Imagem
Segmentada
Ps-Processamento da Imagem
1 2 1 1 0 1
0 0 0 2 0 2
1 2 1 1 0 1
encontrada uma face ou no. Como entrada utilizada uma imagem, mas a sada
boca conforme a figura 40. Essas caractersticas sero utilizadas na prxima etapa
apresentado neste trabalho consiste na utilizao de uma rede neural MLP com o
face.
66
Conjunto de
caractersticas faciais
Camada de Sada
(01 neurnio)
Caracteristicas Validao da
extraidas Face
obtidos.
67
5 Resultados e Discusses_______________
mencionados no capitulo 4.
(a) (b)
(c) (d)
Figura 40 - (a), (c) e (e) imagens originais, (b), (d) e (f) imagens processadas do banco de imagens da
internet
(a) (b)
(c) (d)
Figura 41 - (a), (c) e (e) imagens originais, (b), (d) e (f) imagens processadas do banco de imagens
AR
69
o fundo das imagens que possui cores semelhantes da pele humana como pode
ser observado na imagem resultante da figura 42. Isso pode acarretar falsos
(a) (b)
Figura 42 - (a) imagem original (b) imagem segmentada
completamente a pele humana como fundo, como pode ser observado na figura 43,
na figura 44 onde a face a face parcialmente erodida por ser confundida com o
estruturais.
treinamento para a rede neural MLP utilizada e outra possibilidade seria a aplicao
(a) (b)
Figura 43 - (a) imagem original (b) imagem segmentada
(a) (b)
Figura 44 - (a) imagem original (b) imagem processada
Tabela 1 Tabela que apresenta a quantidade de faces identificadas e faces com eroses na face
Figura 45 Grfico de faces localizadas e faces com eroses na imagem aps segmentao
Tabela 2 Tabela que apresenta o resultado do teste T-Student para o total de faces localizadas
(tabela 2), apesar de algumas faces terem sido erodidas, como pode ser observado
em imagens que apresentam a face de uma mesma pessoa, o que pode contribuir
5% das faces no foi identificada (tabela 1), o que j era esperado, devido ao fato de
Internet utilizadas.
72
faces para todas as imagens dos bancos utilizados, onde se observa que mesmo
com algumas eroses nas imagens a quantidade de faces detectadas foi de 83%
para o banco de imagens da Internet, e de 88% para o Banco AR. A figura 47 mostra
Foi tambm aplicado o teste T-Student nos resultados gerados e a taxa mdia
de significncia obtida foi de 0,0248, ou seja dentro da faixa adotada (0,05). Esse
Tabela 4 Tabela que apresenta o resultado do teste T-Student para o total de faces detectadas
Banco AR 0,0028
Mdia 0,0248
foram obtidos para as imagens do Banco AR, pelo fato deste ser padronizado e no
caractersticas.
apresentados de forma grfica na figura 48. Observa-se nessa tabela que para o
Banco foram superiores aos das imagens da Internet. Para as imagens da Internet
encontradas foi menor do que o nmero de faces detectadas pelo software. Esse
na seo 5.1.
Tabela 5 Tabela que apresenta o total de pessoas e o total de falsos positivos nas imagens
dois mdulos principais: mdulo de segmentao de pele, que tem como objetivo
remover o fundo das imagens adquiridas e o mdulo de deteco de faces que tem
imagens, um com imagens padronizadas (Banco AR) e outro banco com imagens
adquiridas na Internet contendo faces com diferentes tons de pele e fundo complexo.
avaliados com o teste T-Student. O percentual de faces detectadas foi de 83% para
deste apresentar uma taxa de significncia abaixo da mdia encontrada, o que j era
ocluso.
etapa de segmentao pelo fato da rede neural considerar algumas regies de fundo
como pele, gerando assim falsos positivos, e tambm algumas regies de pele como
_________________Referncias Bibliogrficas
ALATTAR, A.; RAJALA S. (1999). Facial Features Localization in Front View Head
And Shoulders Images, IEEE International Conference on Accoustics,
Speech and Signal Processing, vol. 6, pp.3557-3560.
AMIT, Y.; GERMAN, D.; JEDYNAK B. (1997). Efficient Focusing and Face
Detection, Springer-Verlag, Face Recognition: From Theory to Applications,
pp. 143-158.
CAETANO, T. S., BARONE, D. A.; A probabilistic model for the human skin color;
Proceedings of 11th International Conference on Image Analysis and
Processing ICIAP01; IEEE; pp. 279-284; 2001.
CAI, J.; GOSHTASBY, A.; YU, C. (1999). Detecting human faces in color images,
International Workshop on Multi-Media Database Management Systems, pp.
124-131.
HSU, R.; Abdel-Mottaleb, M.; Jain, A. K. (2002). Face detection in color images,
IEEE Transactions on Pattern Analysis and Machine Intelligence, vol 5, pp.
696-706.
JIN, Z.; LOU, Z.; YANG, J.; SUN, Q. (2007), Face detection using template matching
and skin-color information, Neurocomputing, vol. 70, pp. 794800.
JONES, M., REHG, J.; Statistical color models with application to skin detection;
International Journal of Computer Vision; Kluwer; pp. 81-96; 2002.
KOVAC, J., PEER, P., SOLINA, F.; Human skin colour clustering for face detection,
EUROCON 2003 International Conference on Computer as a Tool, IEEE,
2003.
LAURENT, C., LAURENT, N., BODO, Y.; A human skin detector combining mean
shift analysis and watershed algorithm; Proc. of International Conference on
Image Processing; Vol III; IEEE.; pp. 1025-1028; 2003.
LE, H. S; LI, H. (2004). Recognizing frontal face images using Hidden Markov
models with one training image per person, International Conference on
Pattern Recognition, vol. 1, pp. 318-321.
LEE, H. W.; KIL, S.; HAN, Y.; HONG; S. H. (2001). Automatic Face and Facial
Features Detection, IEEE International Symposium on Industrial Electronics,
vol. 1, pp 254-259.
LEE, K. F.; HON, H. W.; HWANG, M. Y.; HUANG, X. (1990). Speech Recognition
Using Hidden Markov Models: A CMU Perspective, Speech Communication,
Elsevier Science Publishers B. V., vol. 9, pp. 497-508.
METZ, C. E.; Basic principles of ROC analysis; Seminars in Nuclear Medicina; pp.
283-298; 1978.
SABER, E.; TEKALP, A. M. (1998), Frontal-view Face Detection and Facial Feature
Extraction Using Color, Shape and Symmetry Based Cost Functions , Pattern
Recognition Letters, vol. 19, pp. 669-680,
SAMARIA, F.S. (1994). Face Recognition Using Hidden Markov Models, Tese,
Univ. of Cambridge, 1994.
86
VEZHNEVETS, V. (2002). Face and Facial Feature Tracking for Natural Human-
Computer Interface, disponvel em http://graphics.cs.msu.ru/en/publications/
text/gc2002vvezh.pdf, ultimo acesso em: dezembro de 2009.
WANG, J.G.; SUNG, E. (1999), Frontal-view Face Detection and Facial Feature
extraction Using Color and Morphological Operations, Pattern Recognition
Letters, vol. 20, pp. 1053-1068.
WON, K. W.; LAM; K. M., SIU, W.C. (2001). An Efficient Algorithm for Human Face
Detection and Facial Feature Extraction under Different Conditions, Pattern
Recognition Letters, vol 34, pp. 1994-2004.
XU, T. Q.; LI, B. C. Li; WANG, B. (2003). Face detection and recognition using
neural network and hidden Markov models, International Conference on
Neural Networks and Signal Processing, vol. 1, pp. 228-231.
87
YI, J., PARK, J., KIM, J., CHOI, J., Robust skin color segmentation using a 2d plane
of RGB color space, Lecture Notes in Computer Science, vol. 2869, ISCIS
2003, pp. 413-420; 2003.
ZAPATA, J.; RUIZ, R. (2007), Biometric and Color Features Fusion for Face
Detection and Tracking in Natural Vdeo Sequences, IWINAC 2007, PART II,
PP. 7280.
88
89
Imagem 1
Imagem 2
Imagem 3
Imagem 4
Imagem 5
Imagem 6
Imagem 7
Imagem 8
Imagem 9
Imagem 10
Imagem 11
Imagem 12
Imagem 13
Imagem 14
Imagem 15
Imagem 16
Imagem 17
]
Imagem 18
Imagem 19
Imagem 20
Imagem 21
Imagem 22
Imagem 23
Imagem 24
Imagem 25
Imagem 1
Imagem 2
Imagem 3
Imagem 4
Imagem 5
Imagem 6
Imagem 7
Imagem 8
Imagem 9
Imagem 10
Imagem 11
Imagem 12
Imagem 13
Imagem 14
Imagem 15
Imagem 16
Imagem 17
Imagem 18
Imagem 19
Imagem 20
Imagem 21
Imagem 22
Imagem 23
Imagem 24
Imagem 25