Você está na página 1de 11

Um Overview Sobre Reconhecimento de Padres

Nogueira, A. Azevedo, J. Baptista, V. Siqueira, S. Sistemas de Informao Associao Educacional Dom Bosco Estrada Resende-Riachuelo, 2535 Resende RJ {aislannogueira@yahoo.com.br, jfaelc@yahoo.com.br, vcb_21@hotmail.com, simarasiqueira@hotmail.com} RESUMO Este artigo tem como propsito apresentar os principais tipos de padres de reconhecimento que podem ser utilizados em aplicaes como o processo de autenticao de usurios, oferecendo maior segurana e confiabilidade a outros sistemas. Para tanto, a utilizao de mais de um tipo de padro se faz necessria, haja visto que a utilizao tradicional de login e senha, apesar de tambm serem padres ainda muito utilizados, j no so to confiveis tampouco suficientes. Palavras-Chave: Padro, biometria, mincias, invasivas. 1. INTRODUO Desde a inveno dos primeiros computadores eletrnicos digitais, a quantidade e a complexidade das tarefas sob a responsabilidade destas mquinas vm aumentando consideravelmente. O que antes era restrito gerao de tabelas de clculo de trajetrias balsticas, como foi o caso do computador ENIAC (Eletronical Numerical Integrator And Computer) durante a 2 Guerra Mundial, evoluiu para a execuo de tarefas bem mais ambiciosas. Mtodos computacionais essencialmente exatos e determinsticos passaram a dividir espao com mtodos aproximados e no determinsticos que esto mais prximos da forma como o ser humano se comporta. Tais mtodos, que procuram reproduzir determinadas habilidades dos seres humanos, so comumente denominados inteligentes e so amplamente utilizados em reconhecimento de padres. Um padro qualquer entidade da qual possvel extrair algum tipo de caracterstica, seja ela simblica ou numrica, e o que as tcnicas computacionais de reconhecimento de padres buscam, por uma maneira eficiente de, a partir destas caractersticas, organizarem estes padres em agrupamentos ou classes que compartilhem determinadas semelhanas. 2. RECONHECIMENTO DE PADRES Na natureza os padres se manifestam de diversas maneiras como, por exemplo, sons, formas, imagens, cheiros e sabores e a todo instante os seres humanos, e tambm outros animais, percebem e interagem com estes padres com extrema naturalidade. Exemplos disso so as habilidades que o ser humano tem de diferenciar o som do motor de um automvel do som de uma msica, ou ainda, a habilidade que um animal selvagem tem de distinguir uma presa de um predador. A naturalidade inerente a estas habilidades faz com que o ser humano sequer imagine as complexidades cognitivas que esto por trs

delas. Complexidades que se tornam evidentes quando se tenta reproduzi-las artificialmente em um computador, o que h muito desafia a comunidade cientfica interessada no assunto. O reconhecimento de padres por computador uma das mais importantes ferramentas usadas no campo da inteligncia de mquina. Atualmente est presente em inmeras reas do conhecimento e encontra aplicaes diretas em viso computacional, anlise ssmica, reconhecimento de locutores e de comandos a voz, classificao de sinais de radar, reconhecimento de faces, identificao de ris, identificao de digitais, anlise e entendimento de sinais eletrocardiogrficos, previso de comportamentos em mercados financeiros, reconhecimento de caracteres impressos e manuscritos, alm de outras. 2.1 RECONHECIMENTO DE CARACTERES

Dentre as modalidades de reconhecimento de padres, o reconhecimento de caracteres uma das mais conhecidas e exploradas pela comunidade cientfica. Prova disso a grande quantidade de artigos publicados anualmente em peridicos e anais de conferncias nacionais e internacionais relacionadas, e at mesmo especializadas no assunto. O reconhecimento de caracteres consiste em a partir de caractersticas extradas de um conjunto de caracteres, separ-los em 10 classes, no caso dos algarismos, ou 26 classes, no caso das letras do alfabeto ocidental. Os primeiros sistemas comerciais que surgiram foram os chamados sistemas OCR (Optical Character Recognition). Nos OCRs os caracteres a serem reconhecidos se encontram impressos em uma determinada fonte e, por isso, apresentam um formato bem comportado assim como as letras deste texto. Inicialmente os OCRs eram capazes de reconhecer apenas tipos especficos de fontes como, OCR-A, OCR-B, Pica, Elite, Courier, etc. Em seguida, surgiram os OCRs multi-fonte que permitiram que a capacidade de reconhecimento se estendesse para um conjunto maior de opes de fontes. Por fim, surgiram os OCRs omni-fonte, capazes de reconhecer qualquer fonte. O passo seguinte foi dado em direo aos sistemas ICR (Intelligent Character Recognition). Diferentemente dos OCRs, os ICRs lidam com um problema bem mais complexo, uma vez que os caracteres a serem reconhecidos so manuscritos e no mais impressos. Esta complexidade devida s variaes de estilo existentes na escrita manuscrita, pois de uma pessoa para outra um mesmo caractere pode se apresentar de diferentes formas. At uma mesma pessoa pode escrever um mesmo caractere de maneiras diferentes. A escrita manuscrita pode ainda se apresentar de duas formas, isolada e cursiva, sendo que no primeiro caso os caracteres esto dispostos de forma no conectada, enquanto que no segundo esto dispostos de forma completamente irrestrita, ou seja, conectados ou eventualmente desconectados. Os dados de entrada de um sistema de reconhecimento de caracteres podem ser provenientes da digitalizao de um documento, por meio de um scanner, ou provenientes de superfcies de cristal lquido, que capturam os caracteres escritos sobre ela com um basto que imita uma caneta. Estas duas abordagens compreendem os sistemas de reconhecimento denominados off-line e on-line, respectivamente. No caso on-line, medida que o trao do caractere delineado pelo escritor, este prontamente apresentado ao sistema, enquanto no caso off-line, somente a imagem completa do que foi escrito

previamente apresentada ao sistema. Os OCRs so essencialmente do tipo off-line, enquanto os ICRs podem ser de ambos os tipos. Hoje, ao contrrio de quando comearam a ser comercializados, os reconhecedores de caracteres apresentam desempenhos bem melhores, preos mais acessveis e so facilmente encontrados no mercado. Os OCRs esto presentes na maioria dos programas de interface dos scanners e os ICRs do tipo on-line so uma das funcionalidades encontradas nos modernos PDAs (Personal digital assistants). Os ICRs do tipo off-line esto disponveis principalmente para o reconhecimento de documentos, em especial formulrios. 2.2 RECONHECIMENTO DA ASSINATURA MANUSCRITA O ritmo necessrio para escrever uma assinatura pode ser usado em um sistema de identificao automtico. Esta tcnica j muito usada e popular, uma vez que todos os cheques so verificados usando-se as assinaturas. Existem dois mtodos de identificao: um mtodo examina a assinatura j escrita, comparando-a, como uma imagem, com um modelo armazenado. A maior desvantagem deste mtodo que ele no pode detectar fotocpias das assinaturas. O outro mtodo estuda a dinmica da assinatura. Este esquema analisa o processo dinmico da realizao de uma assinatura ritmo de escrita, contato com a superfcie, tempo total, pontos de curva, laos, velocidade e acelerao. Os dispositivos utilizados para anlise dinmica so canetas ticas e superfcies sensveis. Como todas as caractersticas comportamentais, as assinaturas esto sujeitas ao humor do usurio, ao ambiente, caneta, ao papel, e assim por diante. As assinaturas de algumas pessoas so muito consistentes, enquanto as de outras variam muito. O modelo de assinatura tem tipicamente 1Kbyte. Isto facilita seu uso on-line e com cartes inteligentes. Outras caractersticas so: possui baixa FAR (Falsa aceitao real), FRR (Falsa rejeio real) em torno de 10%, fcil de usar e tem um tempo de verificao entre 5 a 10 segundos. 2.3 RECONHECIMENTO PELO RITMO DA DIGITAO Como a assinatura, o ritmo de digitao exibe o mesmo fator neurofsico que pode ser utilizado na identificao nica de um indivduo. Esquemas de ritmo de digitao analisam o modo como um usurio digita em um terminal, monitorando o teclado 1000 vezes por segundo. O mtodo normal a utilizao das latncias de digitao o tempo entre a digitao de duas teclas, conforme ilustrado na Figura 2.1. Certos dgrafos, ou digitao de duas letras adjacentes, freqentemente, apresentam padres de tempo nicos que podem ser usados para caracterizar um indivduo.

Fig. 2.1 Representao das caractersticas observadas durante a digitao dos caracteres 1 e 2. PS o tempo em que a tecla permanece pressionada, SP o intervalo at a prxima tecla ser pressionada, PP o intervalo de tempo que o usurio leva para pressionar duas teclas consecutivas e SS o intervalo de tempo que o usurio leva para soltar duas teclas consecutivas. O procedimento geral de identificao e verificao requer que o usurio gere um perfil ou modelo. Na operao, a verificao requer a gerao de um perfil de digitao, que comparado com o modelo. Se existir uma grande diferena entre os dois perfis, o usurio ter seu acesso negado. Uma das vantagens deste mtodo que o usurio no percebe quando est sendo autenticado, ao menos que ele tenha sido informado anteriormente. Outra vantagem que o cadastro e a verificao no so invasivos. O ritmo da digitao identificado pela velocidade, espao de tempo entre o acionamento de cada tecla bem como durao de presso sobre a mesma e liberao. Dificilmente poder ser imitado por usurio ilegtimo, pois, mesmo conhecendo a senha da pessoa pela qual ele tentar passar, dificilmente haver permisso de acesso. 2.4 RECONHECIMENTO PELA IMPRESSO DIGITAL A impresso digital composta por vrios sulcos, que em sua formao apresentam diferenas chamadas de ponto de mincias Figura 2.2, ou seja, aquelas partes em que os sulcos se dividem (vales) ou onde terminam abruptamente (terminao). Cada um desses pontos tem caractersticas nicas, que podem ser medidas. Ao compararmos duas digitais podemos determinar seguramente se pertencem a pessoas distintas, baseados nos pontos de mincias. H muitos anos os institutos oficiais de identificao de diversos pases j realizam o reconhecimento de pessoas atravs do sistema de anlise da impresso digital. Na Europa, judicialmente, so necessrias 12 mincias para saber quem uma pessoa. Os leitores biomtricos so capazes de identificar mais de 40 mincias de uma impresso digital.

Fig. 2.2 Ponto de mincias A impresso digital o mtodo de biometria mais utilizado mundo afora. S para se ter uma idia, os dispositivos biomtricos por impresso digital contabilizam 50% do que foi vendido de produtos do gnero em 2001, segundo o Biometric Group. Alm de ser mais barato, sem barreiras culturais, ele tambm seguro. Existe uma chance em 100 bilhes de uma pessoa ter a mesma digital que a outra. Existem trs dispositivos que podem coletar a impresso digital: tico, capacitivo e ultrasnico. O primeiro trabalha atravs da reflexo da luz sobre o dedo. J o segundo mede o calor que sai da digital. Por ltimo, o terceiro envia sinais sonoros e analisa o retorno deles como se fosse um radar milimtrico. No preciso muito que a opo do sensor tico a mais utilizada e tambm a mais segura. Tudo porque o usurio pode estar com o dedo sujo a ainda assim ser reconhecido. Uma vez que a sua digital no ser colocada diretamente no sensor, mas em um vidro onde ela analisada por um laser. Este o mtodo que, atualmente, oferece a melhor relao entre o preo, aceitabilidade e preciso. Contudo, os ltimos resultados de avaliaes mostram que seu desempenho depende muito da qualidade das imagens adquiridas, particularmente durante a fase de cadastro. A obteno de uma amostra pode ser feita de forma voluntria/consciente (com o consentimento da pessoa) ou de forma involuntria/inconsciente (sem o consentimento da pessoa). 2.5 RECONHECIMENTO PELA GEOMETRIA DA MO A geometria da mo tem sido usada em aplicaes desde o comeo de 1970. Ela baseia-se no fato de que virtualmente no existem duas pessoas com mos idnticas e de que o formato da mo no sofre mudanas significativas aps certa idade. Existem diversas vantagens no uso da forma tridimensional da mo da pessoa como um dispositivo de identificao. Primeiramente, razoavelmente rpida. Leva menos que 2 segundos para capturar a imagem de uma mo e produzir a anlise resultante. Secundariamente, requer pouco espao de armazenamento. tambm requerido pouco esforo ou ateno do usurio durante a verificao, e os usurios autorizados so raramente rejeitados.

As dimenses da mo, tal como tamanho do dedo, largura e rea so as principais caractersticas usadas nas anlises. Para a captura, o usurio posiciona sua mo no leitor, alinhando os dedos, e uma cmara posicionada acima da mo captura a imagem. Medidas tridimensionais de pontos selecionados so tomadas e o sistema extrai destas medidas um identificador matemtico nico na criao do modelo. Um tpico modelo requer cerca de nove bytes de armazenamento. Um dos problemas com os sistemas que utilizam a geometria da mo causado pela rotao da mo quando colocada no leitor. Isto se resolve usando pinos de posicionamento dos dedos. O sistema tambm deve levar em conta os diferentes tamanhos das mos, em diferentes usurios e seu desempenho no deve ser prejudicado por sujeira e cortes na mo da pessoa. A Figura 2.3 apresenta um leitor de geometria da mo.

Fig. 2.3 - Leitor de geometria da mo 2.6 RECONHECIMENTO PELA VOZ Programas que possibilitam aos computadores reconhecer a voz humana tiveram um avano notvel nos ltimos anos. Pode no estar longe o dia em que o computador ser capaz de entender sua pergunta - ou pelo menos de pedir que voc a repita. Isso no quer dizer que o computador compreende o que falamos. Apenas que ele j capaz de ouvir e transcrever um texto com um grande ndice de acerto. Compreender a fala transcrita envolve uma inteligncia que a mquina no tem. Quando um software de reconhecimento por voz instalado no computador faz-se necessrio uma pr-calibrao do software com a voz do usurio. O programa solicita que o usurio pronuncie um conjunto de palavras de forma pausada e clara. Este conjunto de palavras ser armazenado em um banco de dados para que o mesmo possa ter um perfil de comparao vocal.

Quando o usurio fala o software identifica o timbre das palavras pronunciadas e compara com a sua base de dados para identificar com o mximo de preciso a palavra pronunciada. Pelo fato dos diferentes bitipos voclicos humanos necessria a criao de um novo perfil para cada usurio que deseje utilizar o software. O reconhecimento automtico da voz o processo de extrao automtica da informao lingstica do sinal de voz. A informao lingstica contida no sinal de voz est codificada de modo que o elevado grau de variabilidade do sinal, causada pelo ambiente e pelo locutor, praticamente no interfere na percepo da informao pelo homem. O reconhecimento de voz, porm, restringido por certos problemas que dificultam o processamento. As principais dificuldades relacionadas ao reconhecimento de voz podem ser resumidas nos seguintes aspectos: Diferenas fonticas na mesma palavra pronunciada vrias vezes; As dificuldades na segmentao da fala; As variaes nas caractersticas da fala; Com insuficiente uso do conhecimento lingstico.

As restries acima iro influenciar caractersticas como preciso, tipo de aplicao, custo, entre outras. Para contornar algumas restries foram determinados certos fatores para o reconhecimento: Dependncia do Locutor (dependendo do sistema escolhido); Tipo de fala (reconhecimento de palavras isoladas ou fala contnua); Tamanho do vocabulrio (palavras semelhantes para o algoritmo classificador).

2.7 RECONHECIMENTO PELA FACE O uso de reconhecimento de face o mtodo mais natural de identificao biomtrica. O uso das caractersticas da face para identificao automtica uma tarefa difcil porque a aparncia facial tende a mudar a todo tempo. As variaes podem ser causadas por diferentes expresses faciais, mudanas no estilo do cabelo, posio da cabea, ngulo da cmara, condies de luz, etc. Apesar das dificuldades envolvidas, o reconhecimento facial j foi abordado de diversas maneiras, variando de sistemas de reconhecimento de padres por redes neurais at varreduras infravermelhas de pontos estratgicos (como posio dos olhos e da boca) na face. Muitos sistemas de reconhecimento de face utilizam um computador com uma cmera para capturar as imagens da face. Estes sistemas utilizam medidas da face como distncias entre os olhos, nariz, queixo, boca e linha dos cabelos como meio de verificao. Alguns sistemas tambm podem executar testes "animados" para evitar que o sistema seja fraudado por uma fotografia.

Variveis como culos de sol, bigode, barba, expresses faciais entre outras, podem causar falsas rejeies nesses sistemas, no sendo, portanto, sistemas to confiveis. 2.8 RECONHECIMENTO PELA RIS Embora exista um conjunto grande de processos para reconhecimento da ris, existe um conjunto de passos comuns a todos. Na sua grande maioria os processos s diferem no algoritmo escolhido para a deteco e reconhecimento de padres na ris. As primeiras etapas, designadas por aquisio e pr-processamento do sinal so semelhantes para todos os casos. Na etapa seguinte necessrio gerar aquilo que se designa habitualmente por assinatura ou template (modelo de concepo lgica) da ris, ou seja, converter o padro numa representao binria que se possa armazenar numa base de dados para posterior comparao. Nesta fase existe um conjunto de algoritmos a considerar baseados em wavelets (pequenas ondas) transformadas e outros filtros diversos. Os equipamentos comerciais usam habitualmente o algoritmo de Daugman, que est patenteado e cuja utilizao no gratuita. Este algoritmo , entre todos, o que melhores resultados apresenta. Mas importante citar que existem ainda uma srie de alternativas que devem ser consideradas, como a de Libor Masek que apenas difere do anterior em alguns pontos. Uma outra abordagem, baseia-se numa tcnica simples que permite obter resultados bastante satisfatrios, o algoritmo de adaptive tresholding. Este algoritmo foi desenvolvido no CBSP (Center for Biometric Signal Processing) e caracteriza-se por ter um overhead computacional menor, funcionando igualmente bem com imagens de menor qualidade. As etapas para o registro ou autenticao so explicadas na Figura 2.4 abaixo e detalhadas em seguida.

Fig. 2.4 Registro ou autenticao O processo de aquisio consiste na captura e digitalizao de uma imagem completa do olho de um indivduo. A captura feita atravs de cmeras fotogrficas digitais ou leitores prprios e tem caractersticas de uma imagem fotogrfica normal. Assim

sendo, os cuidados que caracterizam esta fase tm como objetivo garantir que o sinal que vai ser processado captado com a maior perfeio possvel. Nesta fase importante dar ateno s dimenses e posies das imagens. A rea captada deve ser sempre relativamente semelhante, de forma a facilitar a identificao da zona correspondente ris. Tambm importante dar ateno ao ambiente onde ser feita a captura da imagem tomando cuidado com a luminosidade, que devem ser o mais uniforme possvel. Entre a fase de digitalizao e a fase de posterior reconhecimento conveniente que as condies sejam semelhantes, de forma a garantir que os padres sero o mais semelhante possvel. 2.9 RECONHECIMENTO PELA RETINA Algumas pesquisas tm provado que o padro de veias da retina a caracterstica com maior garantia de unidade que uma pessoa pode ter. Os analisadores de retina medem esse padro de vasos sangneos usando um laser de baixa intensidade e uma cmara. Nesta tcnica, deve-se colocar o olho perto de uma cmara para obter uma imagem focada. A anlise de retina considerada um dos mtodos biomtricos mais seguros. A FAR nula e as fraudes at hoje so desconhecidas. Olhos falsos, lentes de contato e transplantes no podem quebrar a segurana do sistema. Recentes pesquisas mdicas mostraram, entretanto, que as caractersticas da retina no so to estveis como pensava-se anteriormente: elas so afetadas por doenas, incluindo doenas das quais o paciente pode no estar ciente. Muitas pessoas ficam temerosas em colocar seu olho prximo a uma fonte de luz e aos problemas que isto possa causar. Como resultado, esta tcnica impulsionou o caminho da utilizao da anlise da ris, que menos invasiva. A Figura 2.5 apresenta um exemplo de analisador de retina.

Fig. 2.5 - Analisador de retina Este mtodo no vulnervel fraudes: falsos olhos, lentes de contato e transplantes no quebram a segurana do sistema.

3. APLICABILIDADE Voc quem diz ser? Responder rpido a esta pergunta poder implicar em algo mais do que dar uma olhada no RG. Talvez voc tenha de submeter parte da sua biologia pessoal a um scanner biomtrico. Os scanners de voz, impresso digital, rosto e ris foram, durante anos, elementos da fico cientfica, mas com o medo do roubo de identidade e o temor ao terrorismo, esto se tornando parte de nossa rotina diria. Atualmente, utiliza-se o reconhecimento facial, em aeroportos para identificar possveis terroristas. Alguns colgios empregam leitores de digitais para garantir acesso exclusivo a empregados e estudantes suas dependncias. J os scanners de ris ajudam a melhorar a segurana em alfndegas. Alguns bancos comeam a usar gravaes de voz para verificar as transaes realizadas por telefone. Tcnicas invasivas, ou seja, tcnicas trazem riscos ao ser humano, podem ser uma das maiores desvantagens ao se aplicar um sistema biomtrico, mas essa grande desvantagem pode ser suprida pelo nvel de segurana oferecido por sistemas biomtricos como esses. Outra grande desvantagem o preo do software, hardware e implantao de um sistema biomtrico, j que em alguns sistemas, como o reconhecimento pela ris, por exemplo, a patente do software e o leitor da ris chega a custar US$ 5.000 e US$ 995 respectivamente, mas em compensao o custo do software, hardware e da implantao de um sistema biomtrico baseado no reconhecimento pela impresso digital requerem um gasto muito mais baixo, j que a licena do software, na maioria das vezes j vem inclusa no pacote de compra do leitor biomtrico, e este chega a custar em mdia R$ 170,00. Teoricamente, quaisquer caractersticas humanas, fsicas ou comportamentais, podem ser utilizadas para a identificao de pessoas, desde que satisfaam os seguintes requerimentos: Universalidade: significa que todas as pessoas devem possuir a caracterstica; Singularidade: indica que esta caracterstica no pode ser igual em pessoas diferentes; Permanncia: significa que a caracterstica no deve variar com o tempo; Mensurabilidade: indica quantitativamente. que a caracterstica pode ser medida

Na prtica, existem outros requerimentos importantes: Desempenho: refere-se preciso de identificao, os recursos requeridos para conseguir uma preciso de identificao aceitvel e ao trabalho ou fatores ambientes que afetam a preciso da identificao; Aceitabilidade: indica o quanto as pessoas esto dispostas a aceitar os sistemas biomtricos; Proteo: refere-se facilidade/dificuldade de enganar o sistema com tcnicas fraudulentas.

4. Concluso
O Reconhecimento de Padres tornou-se uma realidade no ramo da segurana de redes e controle de acesso. Assim sendo, a evoluo e melhoria dos sistemas biomtricos se tornaram uma realidade dentro de um mercado amplo e em constante crescimento, tornando-se o foco das atenes do mercado que busca, constantemente, novas tecnologias de segurana eficientes e com alto nvel de qualidade. Para tanto, podemos afirmar que, a escolha do tipo de tecnologia a ser implantada depende da rea de aplicao e, principalmente do nvel de segurana exigido e do valor de sua implementao. Vale salientar que a utilizao de sistemas capazes de agregar mais de um tipo de reconhecimento, torna estes mais seguros e confiveis. Alm disso possvel desenvolvlos de modo a integr-los a sistemas j em uso. 5. REFERNCIAS BIBLIOGRFICAS 1. 2. 3. 4. 5. 6. 7. 8. Processamento de imagem para reconhecimento da ris. - Disponvel em: http://student.dei.uc.pt/~jmaltez/SII/ acesso em 27/05/2006 s 18:14. Tipos de Biometria. - Disponvel em: http://pt.wikipedia.org/wiki/Biometria acesso em 27/05/2006 s 13:17. Reconhecimento de Voz. - Disponvel em: http://www.usr.inf.ufsm.br/~santos/ artigos.html acesso em 27/05/2006 s 15:24. Biometria: Voc sua senha. Disponvel em http://www.serpro.gov.br/publi cacao /tematec/2002 acesso em 27/05/2006 s 15:40. Processamento de imagem para reconhecimento da ris. - Disponvel em: http://student.dei.uc.pt/~jmaltez/SII/ acesso em 27/05/2006 s 18:14. Tipos de Biometria. - Disponvel em: http://pt.wikipedia.org/wiki/Biometria acesso em 27/05/2006 s 13:17. Reconhecimento de Voz. - Disponvel em: http://www.usr.inf.ufsm.br/~santos/ artigos.html acesso em 27/05/2006 s 15:24. Biometria: Voc sua senha. Disponvel em http://www.serpro.gov.br/publi cacao /tematec/2002 acesso em 27/05/2006 s 15:40.

Você também pode gostar