Você está na página 1de 12

Descripcin y funcionamiento del cdigo

Este cdigo funciona con la versin de Python 2.7.6 y debe tener


instalado previamente las libreras openCV, sklearn, numpy,
matplotlib y pil.

Previamente se debe tener en la carpeta donde est guardado el


cdigo la imagen a comparar con el nombre 1.png,un archivo de
sonido mwv llamado 1.mwv y una imagen llamada cir.gif; para
correr el cdigo correr el cdigo se presiona f5 o lo corres como
cualquier cdigo normal.
El cdigo contiene una interfaz grfica que te da la posibilidad
de encender la cmara , hacer un reconocimiento facial y usar
como una cmara que detecta el movimiento
Descripcin del mtodo (pca)
Mtodo utilizado

Imgenes Preprocesado Proyeccin de Decisin Resultado


De entrada imgenes las imgenes

Base de datos
de referencia

Diagrama de bloques del sistema.

1) El sistema necesita de un set de imgenes de referencia las

cuales son procesadas y proyectadas (y = Wx) en el nuevo


subespacio para despus ser utilizadas para conocer si una

imagen pertenece o no a un individuo registrado en el

sistema (figura 12).

Esquema de proyeccin de una imagen de referencia al nuevo


subespacio

2) Cuando las imgenes de referencia estn correctamente

proyectadas, se realiza el mismo procedimiento con las

imgenes de test. Estas pueden pertenecer a personas que

estaban incluidas entre las imgenes de referencia pero

mostrando diferentes expresiones faciales o diferentes

condiciones del entorno.

Figura 13. Ejemplo de proyeccin de una imagen de test [34].

3) Finalmente se dir que ha habido reconocimiento si se

cumple alguna condicin, en general se considera que hay un

reconocimiento positivo si se cumple una condicin:


d = y y < dth , donde dth es una distancia threshold.

En concreto para el caso de este estudio, una imagen de test

pertenece a otra del conjunto de imgenes de referencia si es la

que cumple distancia mnima de manera que siempre se tiene que

asignar un sujeto a una imagen de entrada. El objetivo de este

mtodo consiste en representar una imagen en trminos de un

sistema de coordenadas ptimo reduciendo el nmero final de

componentes que tendr la imagen. Un ejemplo de PCA lo podemos

ver en la figura 14.

Componentes principales de un conjunto de puntos bidimensional.


La primera componente ofrece una reduccin lineal ptima de
dimensin de 2D a 1D en cuanto a error cuadrtico medio se
refiere.

Esta base de transformacin depende de las observaciones y se

forma a partir de los d autovalores ms significativos de la matriz


de covarianza, los cuales representan las componentes principales

que son ms comunes en imgenes de diferentes caras.

La reduccin dimensional realizada por PCA es equivalente al

nmero de autovectores que se utilicen. Por lo tanto la imagen

proyectada por PCA tendr una dimensin de valor d, como se

puede ver en la figura 15.

Figura 15. Ejemplo de reduccin dimensional al aplicar PCA.

Estos autovectores representan las componentes principales que

son ms comunes en imgenes de diferentes caras, otra forma de

verlo, es que son los ejes del subespacio donde proyectaremos las

imgenes de caras humanas los cuales se corresponden con las

direcciones de mxima varianza de los datos. La matriz de

transformacin, est formada por los autovectores

correspondientes a los d autovalores ms significativos. En la

figura 16 se muestran los primeros 7 autovectores que derivan del

uso de la base de datos ORL [18]. La imagen media

correspondiente a estos 7 autovectores la podemos ver en la


figura 17 y en la figura 18 podemos ver las imgenes

correspondientes a los 7 autovalores ms bajos. Estos ltimos se

corresponden con autovalores muy pequeos y son considerados

como ruido de manera que no se tienen en cuenta para el

reconocimiento.

Figura 16. Autovectores correspondientes a los 7 mayores


autovalores mostrados como imgenes pxp = n (Obtenidos de la
base de datos de caras ORL [18]).

Figura 17. Cara media de los 7 primeros autovectores


(Obtenidos de la base de datos de caras ORL [18]).

Figura 18. Autovectores correspondientes a los 7 menores


autovalores mostrados como imgenes pxp = n (Obtenidos de la
base de datos de caras ORL [18]).

Otra de las cualidades de PCA, es que realiza una

discriminacin entre clases, es decir, todas las caras


correspondientes a un mismo individuo estn cerca entre s,

mientras que las imgenes correspondientes a individuos

diferentes estn ms alejadas. Esta propiedad es ms

destacable en las primeras componentes de las imgenes

proyectadas

A continuacin daremos un ejemplo de cmo funciona el

mtodo

Un ejemplo de ACP paso a paso

Introduccin

Para ilustrar el procedimiento de clculo, partamos de un ejemplo

en el que disponemos de la valoracin media que han hecho los

encuestados sobre siete marcas de coche, con arreglo a tres

caractersticas. En un estudio real hubo ramos considerado no

solo tres sino diez o veinte caractersticas, ya que el ACP tiene

ventajas cuando la dimensin de la tabla que se pretende analizar

es muy grande.

La siguiente tabla recoge las valoraciones medias que han

concedido los encuestados a cada una de las marcas en las tres

caractersticas consideradas. As la marca A tiene una calificacin


media de 2 en la caracterstica elegancia, de 3 en comodidad y 6

en deportividad.

Caractersticas

Marca Elegancia Comodidad Deportividad


A 2 3 6
B 3 2 4
C 4 5 4
D 5 5 4
E 8 9 6
F 9 7 7
El objetivo del estudio es poner de relieve los factores que

diferencian al mximo las marcas entre s, determinar las marcas

que el conjunto de encuestados considera semejantes y conocer

las caractersticas causantes de este parecido o las que

diferencian. Se trata de obtener un mapa sobre el cual se

posicionan las marcas y caractersticas, permitiendo ver las

relaciones entre ellas.

Preliminares

Antes de aplicar el ACP debe comprobarse si es necesario, es

decir, si la correlacin entre las variables analizadas es lo

suficientemente grande como para justificar la factorizacin de

la matriz de coeficientes de correlacin. Esta comprobacin puede

hacerse mediante el test de Bartlett (1950), que parte de la

hiptesis nula de que la matriz de coeficientes de correlacin no


es significativamente distinta de la matriz identidad. Bartlett

calcula un estadstico basado en el valor del determinante de la

matriz de coeficientes de correlacin del siguiente modo:

Donde k es el nmero de variables de la matriz, n el tamao de la

muestra y R la matriz de correlaciones. En nuestro ejemplo la

matriz de correlaciones entre las caractersticas es:

elegancia comodidad
deportividad elegancia 1.000
0.892 0.585 comodidad
0.892 1.000 0.519
deportividad 0.585 0.519
1.000

Y la prueba de esfericidad de Bartlett para esta matriz de

correlaciones es:

Bartlett's sphericity test chi.square

= 6.341, df = 3, p-value = 0.0961431

Con este resultado no deberamos

continuar nuestro anlisis ya que con

un nivel de significacin del 0,05 no

rechazamos la hiptesis nula de

esfericidad. Sin embargo, la


distribucin ji-cuadrado asociada es

asinttica y supone la normalidad

multivariante de los datos. En

nuestro caso podemos dudar de la

normalidad conjunta y, sobre todo, el

tamao muestral es muy pequeo n =

6.

El ndice de Kiser-Meyer-Elkin o medida de adecuacin muestral

KMO tiene el mismo objetivo que el test de Bartlett, se trata de

saber si podemos factorizar las variables originales de forma

eficiente.

El punto de partida tambin es la matriz de correlaciones entre

las variables observadas. Sabemos que las variables pueden estar

ms o menos correlacionadas, pero la correlacin entre dos de

ellas puede estar influenciada por las otras. As pues, utilizaremos

la correlacin parcial1 para medir la relacin entre dos variables

eliminando el efecto del resto. El ndice KMO compara los valores

de las correlaciones entre las variables y sus correlaciones

parciales. Si el ndice KMO est prximo a 1, el ACP se puede

1 http://en.wikipedia.org/wiki/Partial_correlation
hacer. Si el ndice es bajo (prximo a 0), el ACP no ser a

relevante. Algunos autores han definido una escala para

interpretar el ndice KMO de un conjunto de datos.

El siguiente resultado nos muestra la medida de adecuacin

muestral KMO para nuestros datos y el valor en la escala.

$overall
[1] 0.6317966

$report
[1] "The KMO test yields a degree of common variance
mediocre."

$individual elegancia
comodidad
deportividad
0.58117660.59659910.8592540
Adems de la medida KMO global que en nuestro caso es

mediocre, tambin se han calculado las medidas por variable de

manera que podamos detectar aquellas que no estn relacionadas

con las dems. Para mejorar nuestro anlisis deberamos aadir

ms variables como hemos dicho al principio (y ms observaciones).

Se recomienda un mnimo de tres variables por factor.

Las componentes principales

El siguiente paso consiste en la obtencin de los valores y vectores

propios de la matriz de covarianzas maestral o de la matriz de

coeficientes de correlacin que se obtienen a partir de la matriz


de datos. La eleccin de una u otra matriz para realizar el ACP es

una cuestin controvertida. En este caso vamos a utilizar la matriz

de correlaciones.

Importance of components:
Comp.1 Comp.2 Comp.3
Standard deviation1.5312421 0.7421283 0.32333168
Proportion of Variance 0.7815674 0.1835848 0.03484779
Cumulative Proportion 0.7815674 0.9651522 1.00000000

Referencias :
http://www.ub.edu/stat/docencia/Mates/ejemploACP.PDF
http://scikit-
learn.org/stable/modules/generated/sklearn.decomposition.PCA.
html

Você também pode gostar