Você está na página 1de 11

Reconhecimento de faces empregando-se, PCA, ICA e RNA - um estudo comparativo.

Ktia Soares Moreira1, Carmen Da Moraes Pataro1


1

Centro de Pesquisa e Desenvolvimento em Engenharia Eltrica Universidade Federal de Minas Gerais (UFMG) Av. Antnio Carlos, 6627, Pampulha Belo Horizonte MG Brazil
ketia@cpdee.ufmg.br, carmen@eee.ufmg.br

Abstract. Comparing withdrawn features from human face images can generate a system for identifying people. Face recognition systems can be applied in a great variety of problems, including criminal identification, people recognition and so on. This work compares a face recognition system based in data extraction through a Principal Component Analysis (PCA) and in an Independent Component Analysis (ICA). Several studies found in the literature have demonstrated the use of eigefaces referring to the total faces features and eingefeatures referring to the special face area. In this article will be made a comparison between PCA and ICA to the face and specific face area. Resumo. Comparando-se caractersticas extradas de imagens de faces humanas pode-se criar um sistema para identificar pessoas. Sistemas de reconhecimento de faces podem ser aplicados em uma enorme variedade de problemas, incluindo identificao criminal, reconhecimento de pessoas, etc. Este trabalho compara um sistema de reconhecimento de faces baseado na extrao de dados atravs da anlise de componentes principais (PCA) e um baseado na analise de componentes independentes (ICA). Estudos tm demonstrado o uso de eigefaces, referindo-se s caractersticas totais da face, e eigenfeatures, referindo-se a reas especficas da face. No artigo ser feita uma comparao entre PCA e ICA para a face e regies especficas da face.

1. Introduo
Muitos trabalhos de extrao de caractersticas para a identificao de faces tm sido desenvolvidos. Alguns utilizam como caracterstica discriminatria dos indivduos as caractersticas geomtricas, onde se medem, por exemplo, posies da boca, do nariz, a distncia entre os olhos, tamanho do nariz, etc [Cox 1995]. Deve-se observar que estas medidas no levam em considerao os problemas de iluminao, rotao e escala dentre outros. Outra linha de pesquisa utiliza os mtodos holsticos, que propem utilizar as representaes de uma face, onde todas as caractersticas da face so automaticamente extradas da imagem de entrada [Meng and Lye 2002]. Os mtodos holsticos consideram todos os pixels da imagem, tendo como desvantagem a alta dimensionalidade dos dados, o que aumenta o custo computacional. Para resolver esse

problema podem ser utilizados mtodos estatsticos de reduo de dimensionalidade, como PCA [Kinoshita 2000] [Draper 2003], discriminantes lineares [Turk and Pentland 1991] [Wang 1991], ou redes neurais [Wang 1991] [Meng and Lye 2002] [Feitosa 1999] [Feitosa 1998]. A vantagem da utilizao deste mtodo est no fato de que pequenas variaes locais no prejudicam muito o reconhecimento, porm, variaes de iluminao podem representar problemas. Este trabalho utiliza o mtodo holstico para diferentes eigefeatures. As razes para reduzir a dimensionalidade de uma imagem so: custo de medio e preciso do classificador. Se o espao caracterstico contiver somente as caractersticas mais visveis, o classificador ser mais rpido e ocupar menos memria[Campos 2001]. Alm disso, necessrio fazer uma escolha necessria das caractersticas, pois padres arbitrrios podem ficarem similares se esses forem codificados com um nmero grande de caractersticas similares. [Watanabe 1985] O mtodo que emprega Anlise de Componentes Principais (PCA), leva em considerao que o valor de cada pixel de uma imagem (h x w) dimensional, pode ser colocado em um vetor coluna, que inserido em uma matriz X. Ou seja, dada uma matriz Ii de h linhas e w colunas representando a imagem i,

X i , j + w(k 1) = I ij ,k ,

(1)

para j = 1, 2, 3, ...,w, k = 1, 2, 3, ... , h e i = 1, 2, 3, ...,n, em que n o nmero de colunas e h . w = M Em reconhecimento de padres, desejvel que no haja covarincia entre as bases do espao de caractersticas. Porm imagens de faces so altamente redundantes, pois cada pixel altamente correlacionado com outros pixels. Para verificar se h covarincia entre as caractersticas (ou variveis), utiliza-se a matriz de covarincia dos padres. [Kennedy and Neville, 1986] Dada uma matriz de padres X conforme definida na equao 1, a matriz de covarincia de X pode ser obtida por:

= (X )(X ) ,
t

(2)

X = [ x1 , x2 , x3 ,

, xn ]

Em que a matriz M x n, em que todas suas colunas contm o valor esperado de X, o qual pode ser obtido pela mdia aritmtica das colunas de X. Ou seja:

l ,i

1 n = X l ,i n i =1

(3)

Para l = 1, 2, 3, ...,M. [Campos 2001]. No mtodo de extrao de caractersticas que emprega ICA (Anlise de Componentes Independentes), as imagens, de um determinado banco de dados, so vetorizadas e colocadas em uma matriz X. As imagens de faces presentes em X so consideradas como sendo uma mistura linear de um conjunto desconhecido de imagens de fontes independentes S, onde A uma matriz de mistura desconhecida, conforme

mostrado na Figura 1. As fontes so obtidas atravs de uma matriz de separao W, que produz sadas independentes, U [Bartlett 1997] [Bartlett 1998] [Draper 2003].

Figura 1 Modelo de Imagem Sintetizada.

Aplicando ICA sobre as N imagens de um banco de dados obtemos N imagens de fontes independentes contidas nas linhas da matriz U, de forma que podemos obter X atravs de: WX=U; X=U/W (4)

2. BASE DE DADOS
A base de dados utilizada neste trabalho foi obtida utilizando uma mquina digital instalada em um trip fixo. A base de dados original constituda de 77 imagens de 7 indivduos, todas obtidas em um mesmo dia, sendo de formato JPG. As imagens foram obtidas contra um fundo escuro homogneo com rotaes das faces, sendo utilizados dois refletores a uma mesma distncia, dando a mesma condio de iluminao para todas as imagens. O esquema pode ser visto na figura 2.

Figura 2 - Esquema empregado para as fotos

O banco de dados original apresenta 7 imagens de 11 pessoas, onde no se encontram pessoas de culos, barba ou bigode. Porm estas pessoas podem ter sexo, raa, cor e tamanhos de cabelos diferentes. Uma amostra do banco de dados pode ser vista na figura 3. Pode-se observar que nas duas primeiras fotos, a imagem frontal, seguindo-se em semiperfil esquerdo, direito, com a cabea levantada, abaixada e frontal novamente. Em todas as imagens pode-se visualizar os olhos, boca e nariz. Entretanto nas imagens de semiperfil os olhos ficam prejudicados podendo dificultar no reconhecimento.

Figura 3 - Esquema de posicionamento do rosto.

3. METODOLOGIA
O trabalho visa reconhecer imagens no utilizadas no treinamento em indivduos conhecidos pelo classificador. Um classificador consiste em mapear um conjunto de observaes no espao n-dimensional em um conjunto de classes. Estas classes so representadas por um indivduo. O classificador utilizado neste artigo uma Rede Neural de Funo de Base Radial (RBF). As redes RBFs so aproximadores universais, isto , dado um nmero suficiente de neurnios na camada escondida, as redes RBFs podem aproximar qualquer funo contnua com preciso arbitrria. O classificador de base radial toma decises baseando-se no aprendizado realizado a partir de um conjunto de treinamento, o qual contm exemplos de padres de todas as classes existentes. O classificador uma funo que possui como entrada padres desconhecidos, e como sada, rtulos que identificam a que classes estes padres pertencem. Como pode ser visto na figura 4, as imagens do banco de dados com a mesma dimenso h x w foram vetorizadas, de modo que cada imagem agora tenha uma dimenso M x 1. Estas imagens vetorizadas foram colocadas em uma matriz M x n, onde cada coluna corresponde a uma fotografia, sendo n o nmero total de amostras. Esta matriz M x n foi reduzida atravs de PCA resultando em uma matriz menor m x n, onde m so as caractersticas correspondentes s componentes principais de cada imagem n. Para reduzir a dimensionalidade foram feitas variaes no vetor caracterstica m. Um primeiro experimento empregou esta matriz m x n para treinamento de uma rede neural. Um segundo experimento efetuou o treinamento aps aplicar ICA. A entrada do classificador, RBF, ser composta pela matriz de sada (PCA ou ICA), sendo que cada coluna corresponde a uma imagem. Estas imagens sero utilizadas para treinamento da rede neural. Aps este treinamento outras imagens pertencentes s classes j treinadas, sero apresentadas rede que dever classific-las de acordo com as classes correspondentes.

4. EXPERIMENTO
Do total de 77 imagens, foram selecionadas, 55 imagens para o conjunto de treinamento e 22 imagens para o conjunto de teste, ou seja, foram consideradas 5 imagens de cada pessoa para as etapas de treinamento e 2 imagens para a validao. Para o treinamento foram selecionadas as cincos primeiras imagens de cada individuo e para o teste o

restante. Em seguida foram reduzidas as variveis de entrada atravs da extrao das caractersticas mais expressivas, utilizando-se a PCA. Um primeiro experimento empregou uma rede RBF (Radial Basis Function) para classificao com PCA. Um outro experimento foi feito, onde, s componentes principais destas mesmas imagens (a matriz de sada da PCA) foi aplicada a ICA, seguindo-se com a classificao por uma RBF, como pode ser visto na figura 5.

Figura 4 Classificador utilizando PCA.

Figura 5 - Classificador utilizando PCA e ICA

Regies especificas da face, olhos, bocas, nariz, etc, podem representar marcas que sero importantes para o reconhecimento. Por isso a PCA e ICA foram tambm utilizadas para regies restritas da imagem, obtendo pontos caractersticos da face. A este mtodo d-se o nome de eigenfaces e eigenfeature. Quando a regio caracterstica a boca, nariz e olhos chamam-se respectivamente eigenmouth, eigenoise e eigeneyes. Utilizar regies caractersticas da face pode eliminar erros provocados pelo uso de barba, bigode, variaes no comprimento do cabelo, presena de feridas na pele, etc. Na

figura 6 pode ser visto uma amostra das eigenfaces e eigenfeature do banco de dados utilizado.

Figura 6 Eigenfaces e eigenfeatures do banco de dados

Este grupos de eigefaces e eigefeatures foram usados no experimento 1 e 2. Cada grupo foi treinado separadamente, sendo que cada um tem resolues diferentes. A resoluo da imagem do grupo 1 de 220X260, do grupo 2 de 110X260, do grupo 3 de 220X140 e do grupo 4 de 220X70.

5. RESULTADOS
Os resultados quando foram utilizados somente PCA e o reconhecedor a RBF esto mostrados na tabela 1 e na figura 7, para os quatros diferentes grupos de imagens. Foram feitos experimentos variando-se tambm a dimenso do vetor caracterstica, m. Na tabela 8 encontram-se destacados os melhores resultados desta variao.
Tabela 1 - Taxa de acertos do reconhecedor utilizando-se PCA. Grupos Dimenso Caractersti ca 4 5 10 20 30 40 50 55 4 5 10 20 30 40 44 % Acertos 59.1 63.6 77.3 77.3 77.3 77.3 77.3 77.3 59.1 63.6 68.2 81.8 77.3 77.3 77.3 3 Grupos Dimenso % Caracter Acertos stica 4 63.6 5 10 20 30 40 50 55 4 4 5 10 20 30 40 50 55 68.2 59.1 63.6 63.6 63.6 63.6 63.6 63.6 54.5 45.5 50 54.5 54.5 54.5 54.5

100 Acertos(%) 80 60 40 20 0 1 2 Grupos 3 4 PCA(5)

Figura 7 Taxa de acertos do reconhecedor utilizando-se PCA.

Quando foi feito o segundo experimento, ou seja, utilizao de PCA seguida de ICA mais RBF, obtiveram-se os resultados mostrados na tabela 2 e na figura 8, para os 4 grupos. A figura 9 uma comparao entre os dois experimentos.
Tabelas 2 Taxa de Acertos utilizando-se ICA. Grupos 1 2 3 4 % Acertos 81.8 95.5 72.7 50

ICA(5) 150 100 ICA(5) 50 0 1 2 Grupos 3 4

Figura 8 - Taxa de acertos utilizando-se a ICA


120 100 80 60 40 20 0 1 2 Grupos 3 4

Acertos

Acertos(%)

PCA(5) ICA(5)

Figura 9 Comparao das taxas de acertos entre PCA e ICA.

Para um menor esforo computacional as imagens foram redimensionadas onde

suas larguras passaram a ter 64 pixels e a altura diminuiu proporcionalmente. Desde novo grupo de dados foram escolhidas trs imagens (frente, frente, baixo) para treinamento, sendo dispensadas as duas imagens de semiperfil e o individuo olhando para cima. Estas imagens de semiperfil e do individuo olhando para cima apresentam altas variaes nos olhos que podem atrapalhar no reconhecimento, por isso a deciso de descart-las. E para validao foi utilizada a ltima imagem do individuo olhando para frente. Para o primeiro experimento, somente PCA, o resultado esta mostrado na tabela 3 e na figura 10.
Tabela 3 - Taxa de acertos do reconhecedor utilizando-se PCA. Grupos Trs fotos para treinamento Dimens % Grupos Dimenso o Acertos Caracter Caracter stica stica 4 90,9 4 3 5 90,9 5 10 90,9 10 20 90,9 20 30 90,9 30 33 90,9 33 4 36,4 4 4 5 36,4 5 10 45,5 10 20 54,5 20 30 54,5 30 33 33 72,7
120 100 80 60 40 20 0 1 2 Grupos 3 4

% Acertos

81,8 90,9 90,9 90,9 90,9 90,9 81,8 100 81,8 90,9 81,8 81,8

Acertos(%)

PCA(3)

Figura 10- Taxa de acertos do reconhecedor utilizando-se PCA.

Quando foi feito o segundo experimento, ou seja, utilizao de ICA mais RBF, foram obtidos, para cada grupo, os resultados mostrados na tabela 4 e na figura 11. A figura 12 uma comparao dos melhores valores para PCA e ICA.

Tabelas 4 Taxa de Acertos utilizando-se ICA Grupos 2 3 4 5


120 100 80 60 40 20 0 1 2 Grupos 3 4

% Acertos 90.9 100 90.9 81.8

Acertos(%)

ICA(3)

Figura 11 - Taxa de acertos utilizando-se ICA


120 100 80 60 40 20 0 1 2 Grupos 3 4

Acertos(%)

PCA(3) ICA(3)

Figura 12 - Comparao das taxas de acertos entre PCA e ICA

Nas figuras 13 e 14 podemos visualizar os resultados relativos comparao entre os dois experimentos, 5 e 3 amostras de treinamento.

120 100 80 60 40 20 0 1 2 Grupos 3 4

Acertos(%)

PCA(5) PCA(3)

Figura 13 Comparao dos resultados da PCA.

120 100 80 60 40 20 0 1 2 Grupos 3 4

Acertos(%)

ICA(5) ICA(3)

Figura 14 - Comparao dos resultados da ICA.

6. CONCLUSO
O experimento no qual foram utilizadas trs amostras de cada pessoa para o treinamento tanto para PCA ou ICA consegui um melhor resultado do que o experimento que utilizou cinco amostras. Este resultado apesar de no esperado mostra que as imagens de semi-perfil e do rosto para o alto dificultou o treinamento, j que determinadas caractersticas, como por exemplos, os olhos apresentaram variaes grandes. Quando aplicado PCA para o grupo de treinamento de 5 imagens o que apresentou um melhor resultado foi a metade do rosto. J para o grupo de treinamento de 3 imagens de treinamento, o melhor resultado foi para o experimento de engeeyes. Este resultado no era esperado j que a face apresenta mais caractersticas de distino do que somente os olhos, porm quando aumenta o nmero de caracterstica aumenta a complexidade do sistema, tendo a necessidade de aumentar a base de dados. Este resultado comprova artigos como [Brunnelli 1993] , [Campos 2000] . J o fato do experimento com 5 imagens ter sido melhor para o grupo envolvendo a metade do rosto do que aquele que considera apenas os olhos, foi devido ao fato das amostras utilizadas no treinamento terem sidas comprometidas na regio dos olhos. Para a ICA utilizando-se 3 ou 5 imagens, o melhor resultado apresentado foi com a metade do rosto. Devido similaridade entre os dois lados da face, um lado pode ser descartado reduzindo o esforo computacional.

7. BIBLIOGRAFIA
[Bartlett 1998] Bartlett, M. Stewart, Lades, H. Lades and Sejnowski, Terrence (1998), Independent component represetation for face recognition, SPIE Symposium on Electronic Imaging. [Bartlett 1997] Bartlett, M. Stewart and Sejnowski, Terrence (1997), Viewpoint invariant face recognition using independent component analysis and attractor networks, Neural Information Processing Systems-Natural and Synthetic, vol. 9 , p.817-823. [Brunelli and Poggio, 1993] Brunelli, R. and Poggio, T. (1993). Face recognition: Features versus templates. IEEE Trans. on Pattern Analysis and Machine Intelligence, 15(10):1042-1052.

[Campos 2001] Campos, T. E. (2001) Tcnicas de seleo de caractersticas com Aplicaes em Reconhecimento de faces , Universidade de So Paulo, Msc. [Campos and Feris 2001] Campos, T. E., Feris, R. S. and Cesar-Jr, R. M. (2001). Eigeneyes selection using the performance of a classifier for fast face recognition. In 53a. Reunio Anual da SBPC, Salvador - BA, Brasil. [Campos 2000] Campos, T. E., Feris, R. S. and Csar Junior, R. Marcondes (2000), Eigenfaces versus eigeneyes: First Steps Toward Performance Assessment of Representations for Face Recognition, Lecture Notes in artificial Intelligence, vol 1793, pp.197-206. [Cox 1995] Cox, I. J., Ghosn, J., and Yianilos, P. N. (1995). Feature-based recognition using mixture-distance. Technical report, NEC Research Institute. [Draper 2003] Draper, Bruce A., Baek, Kyungim and Bartlett, M. Stewart (2003), Recognizing faces with PCA and ICA, Computer Vision and Image Understanding, 91, p. 115-137. [Feitosa 1999] Feitosa, R. Q., Thomaz, C. E. and Veiga A. (1999), Comparing the Performance of the Discriminant Analysis and RBF Neural Network for face Recognition, ISAS99. [Feitosa 1998] Feitosa, R. Q., Thomaz, C. E. and Veiga A. (1998), Design of Radial Basis Function Network as Classifier in Face Recognition Using Eigenfaces, SBRN98 [Kennedy and Neville, 1986] Kennedy, J. B. and Neville, A. M. (1986). Basic Statistical Methods for Engineers and Scientists. Harper and Row, Publishers, third edition. [Kinoshita 2000] Kinoshita, S. K., Marques, P. M. A. and Frere, A. F. (2000), Utilizao da Anlise de Componentes Principais e Redes Neurais Artificiais para a Classificao de Ndulos em Mamogramas Digitalizados, CBEB 2000. [Mao 1995] Mao, J. and Jain, A. K. (1995). Artificial neural networks for feature extraction and multivariate data projection, IEEE Trans. Neural Networks, vol. 6, pp. 296317. [Meng and Lye 2002] Meng Joo Er, Shiqian Wu, Juwei Lu and Hock Lye Toh (2002), Face Recognition With Radial Basis Function (RBF) Neural Networks, IEEE Trans. Neural Networks, vol. 13, pp. 697710. [Turk and Pentland 1991] Turk, M. A. and Pentland, A. P. (1991). Face recognition using eigenfaces, In Proc. of the IEEE Computer Society Conferece. [Wang 1991]Wang, Y. H., Tan, T. N. and Zhu, Y.(1991) Face Verification Based on Singular Value Decomposition and Radial Basis Function Neural Network, Chinese Academy of Sciences. [Watanabe 1985] Watanabe, S. (1985). Pattern Recognition: Human and Mecanical. New York: Wiley. Agradecemos a FAPEMIG, Fundao de Amparo a Pesquisa do Estado de Minas Gerais, pelo suporte financeiro ao projeto.

Você também pode gostar